Oefeningen beschrijvende statistiek

advertisement
Oefeningen beschrijvende statistiek
Databestanden:



susp_solids.csv: concentratie zwevende stof gemeten bij Lobith, dagelijkse metingen in 2000
(mg/l). Herkomst: landelijk meetnet waterkwaliteit Rijkswaterstaat
monthly_precip_delft.csv: maandsommen van precipitatie bij het station Delft, in tienden
van millimeters. Herkomst: KNMI
benzo_a_pyreen.csv: concentratie benzo(a)pyreen gemeten bij de Brienenoordbrug in
Rotterdam, onregelmatig gedane metingen, met als bijzonderheid dat de detectielimiet door
de jaren heen steeds lager is geworden.
Merk op: de bestanden kunnen zondermeer in MS Excel worden geïmporteerd. De oefeningen zijn
niet bedoeld om thuis te geraken in Excel, dus de bewerkingen horen eenvoudig te zijn.
Oefening 1
Gebruik de gemeten concentraties zwevende stof:




Bepaal de gemiddelde concentratie, minimum en maximum
Bepaal de standaarddeviatie
Bepaal de mediaan en de middelbare concentratie
Plot de concentratie als functie van de tijd
Oefening 2
Gebruik de maandsommen voor de precipitatie:


Bepaal de gemiddelde som per kalendermaand en plot deze – is er sprake van een duidelijk
seizoensverloop? (Hint: maak in de plot ook gebruik van de standaarddeviatie)
Bepaal per kalendermaand of er sprake is van een trend – kunnen we iets zien van
klimaatverandering? (Het gaat tenslotte om 65 jaar aan gegevens!) Indien niet, wat kan
daarvan de reden zijn? Bedenk in dat geval een andere methode.
Oefening 3
Gebruik de gemeten concentraties zwevende stof:


Bepaal de “empirische” verdeling – maak een grafiek en schat de volgende percentielen:
10%, 25%, 50%, 75% en 90%
Maak een histogram en plot daarin ook een normale verdeling – is de verdeling bij
benadering normaal?
Oefening 4
Gebruik de maandsommen voor de precipitatie:

Plot weer een histogram, met een normale verdeling die zo goed mogelijk overeenkomt. Is
de verdeling bij benadering normaal? Pas ook een lognormale verdeling toe. Is dit een
betere benadering?
Oefening 5
Gebruik de gemeten concentraties benzo(a)pyreen:


Bepaal gemiddelde en standaarddeviatie op drie verschillende manieren:
o Door de waarden onder de detectielimiet te negeren
o Door de waarden onder de detectielimiet op nul te zetten
o Door de waarden onder de detectielimiet op de halve limiet te zetten
Let op: er zijn verschillende detectielimieten te onderscheiden
Is er sprake van een trend? Zo ja, welke?
Download