Oefeningen beschrijvende statistiek Databestanden: susp_solids.csv: concentratie zwevende stof gemeten bij Lobith, dagelijkse metingen in 2000 (mg/l). Herkomst: landelijk meetnet waterkwaliteit Rijkswaterstaat monthly_precip_delft.csv: maandsommen van precipitatie bij het station Delft, in tienden van millimeters. Herkomst: KNMI benzo_a_pyreen.csv: concentratie benzo(a)pyreen gemeten bij de Brienenoordbrug in Rotterdam, onregelmatig gedane metingen, met als bijzonderheid dat de detectielimiet door de jaren heen steeds lager is geworden. Merk op: de bestanden kunnen zondermeer in MS Excel worden geïmporteerd. De oefeningen zijn niet bedoeld om thuis te geraken in Excel, dus de bewerkingen horen eenvoudig te zijn. Oefening 1 Gebruik de gemeten concentraties zwevende stof: Bepaal de gemiddelde concentratie, minimum en maximum Bepaal de standaarddeviatie Bepaal de mediaan en de middelbare concentratie Plot de concentratie als functie van de tijd Oefening 2 Gebruik de maandsommen voor de precipitatie: Bepaal de gemiddelde som per kalendermaand en plot deze – is er sprake van een duidelijk seizoensverloop? (Hint: maak in de plot ook gebruik van de standaarddeviatie) Bepaal per kalendermaand of er sprake is van een trend – kunnen we iets zien van klimaatverandering? (Het gaat tenslotte om 65 jaar aan gegevens!) Indien niet, wat kan daarvan de reden zijn? Bedenk in dat geval een andere methode. Oefening 3 Gebruik de gemeten concentraties zwevende stof: Bepaal de “empirische” verdeling – maak een grafiek en schat de volgende percentielen: 10%, 25%, 50%, 75% en 90% Maak een histogram en plot daarin ook een normale verdeling – is de verdeling bij benadering normaal? Oefening 4 Gebruik de maandsommen voor de precipitatie: Plot weer een histogram, met een normale verdeling die zo goed mogelijk overeenkomt. Is de verdeling bij benadering normaal? Pas ook een lognormale verdeling toe. Is dit een betere benadering? Oefening 5 Gebruik de gemeten concentraties benzo(a)pyreen: Bepaal gemiddelde en standaarddeviatie op drie verschillende manieren: o Door de waarden onder de detectielimiet te negeren o Door de waarden onder de detectielimiet op nul te zetten o Door de waarden onder de detectielimiet op de halve limiet te zetten Let op: er zijn verschillende detectielimieten te onderscheiden Is er sprake van een trend? Zo ja, welke?