CO2 Meten en weten?

advertisement
2008
Rijksuniversiteit
Groningen
Bart Pander
[CO2 METEN EN WETEN?]
Deze minimodule voor het bètaprofielvak NLT behandeld vanuit de context van het CO2 onderzoek de
concepten meetfout, statistiek en het trekken van conclusies uit complexe data. De duur van de
minimodule is 3 lessen.
School CO2 Net
[CO2 METEN EN WETEN?]
INLEIDING................................................................................................................................................... 3
CO2 problemen...............................................................................................................................................3
IPCC .................................................................................................................................................................3
Koolstofkringloop ...........................................................................................................................................4
Meetapparatuur ............................................................................................................................................4
SCHOOLCO2WEB METINGEN .............................................................................................................. 5
Welke conclusies kun je trekken op basis van deze gegevens? .....................................................................6
Opdracht 1 ......................................................................................................................................................6
Grafieken ........................................................................................................................................................7
Opdracht 2 .....................................................................................................................................................7
Maken van grafieken in Excel .........................................................................................................................7
Opdracht 3 ......................................................................................................................................................9
STATISTIEK ..............................................................................................................................................10
Meetfout en significantie van getallen. ........................................................................................................11
Opdracht 4 ....................................................................................................................................................11
Significantie van getallen ..............................................................................................................................11
Rekenregels ..................................................................................................................................................12
Opdracht 5 ....................................................................................................................................................12
Significantie in de statistiek ..........................................................................................................................13
Centrummaten .............................................................................................................................................14
Gemiddelde ..................................................................................................................................................14
Mediaan ........................................................................................................................................................14
Modus ...........................................................................................................................................................14
Opdracht 6 ....................................................................................................................................................15
Opdracht 7 ....................................................................................................................................................16
Gemiddelden ...............................................................................................................................................16
Correlatie ......................................................................................................................................................18
Opdracht 8 ....................................................................................................................................................19
Statistische Moord? ......................................................................................................................................20
Goede statistiek, slechte statistiek ...............................................................................................................20
Opdracht 9 ....................................................................................................................................................21
KRITISCH KIJKEN NAAR DE CO2METINGEN EN CONCLUSIES TREKKEN............................. 22
Opdracht 10 ..................................................................................................................................................22
2
Inleiding
De afgelopen jaren is de verandering van het klimaat bijna dagelijks op het nieuws geweest. Heel veel
mensen maken zich ernstige zorgen over de gevolgen van het warmer worden van de aarde. Daarom
zijn politici, wetenschappers, milieuorganisaties en ook scholieren heel erg geïnteresseerd in de sterkte
van het broeikaseffect en de concentratie van koolstofdioxide (CO2). De koolstofdioxide die de mens
uitstoot, zou ervoor kunnen zorgen dat het broeikaseffect sterker wordt, waardoor de aarde opwarmt.
We zullen in deze module zien dat het bepalen van de CO2-concentratie nog niet zo gemakkelijk is.
CO2 problemen
Het broeikaseffect betekent dat er een hogere wereldwijde evenwichtstemperatuur is dan je zou
verwachten op basis van de balans tussen eigen aardwarmte, zoninstraling en de uitstraling. De
atmosfeer houdt dus wat warmte vast. Dit wordt veroorzaakt door gassen waarvan de moleculen uit
meer dan 2 atomen bestaan. De belangrijkste in onze atmosfeer zijn water (H2O), koolstofdioxide (CO2),
methaan (CH4), ozon (O3), distikstofoxide (N2O) en stikstofdioxide (NO2). Zonder deze gassen zou het op
aarde te koud zijn om te leven, maar de planeet venus illustreert het andere uiterste: teveel
broeikasgassen en daardoor een te hoge temperatuur voor leven. Waterdamp is het gas wat het grootste
deel van het broeikaseffect veroorzaakt, daarna volgen koolstofdioxide en methaan. Waterdamp komt in
de atmosfeer door verdamping van het vloeibare water wat we in enorme hoeveelheden in zeeën en
oceanen vinden. Als de temperatuur stijgt, verdampt er meer water en ontstaat er meer waterdamp in
de atmosfeer. Deze toename van waterdamp versterkt het broeikaseffect, waardoor de temperatuur nog
verder stijgt. Een dergelijk versterkend proces noemen we positieve terugkoppeling. Koolstofdioxide
komt vrij bij verbranding van koolstofhoudende stoffen en methaan komt los voor in het heelal,maar
wordt op aarde voornamelijk bij zuurstofarme afbraak van biologisch materiaal gevormd en is het
belangrijkste onderdeel van aardgas. Door het menselijk gebruik van fossiele grondstoffen zoals olie,
steenkool en aardgas zijn deze laatste twee, en met name koolstofdioxide de laatste jaren erg gestegen.
IPCC
Er is ook een stijging in de wereldwijde temperatuur gemeten. In 2007 heeft het Intergovernemental
Panel for Climate Change (IPCC) een rapport uitgebracht waarin duidelijk naar voren kwam dat het
gebruik van fossiele brandstoffen door de mens het broeikaseffect versterkt en daardoor een belangrijke
bijdrage levert aan de temperatuurstijging op aarde. Dit versterkte broeikaseffect heeft veel invloed op
de mens en daarom zijn wetenschappers wereldwijd bezig met het meten van broeikasgassen. Met name
CO2 metingen zijn interessant, omdat de stijging van de concentratie van dit gas voornamelijk door
mensen wordt veroorzaakt. Koolstofdioxide is opgelost in natuurlijk water en bij hogere temperaturen zal
hiervan ook meer in de atmosfeer komen. Gedeeltelijk is er bij CO2 ook sprake van een positief
terugkoppelingseffect net als bij water. Dit komt omdat in warmer water minder koolstofdioxide opgelost
kan worden. Volgens het IPCC is de grootste stijging veroorzaakt door menselijke factoren.
Koolstofkringloop
CO2 is van levensbelang. In elke levende cel zit koolstof in
de moleculen van DNA, eiwit, vetten, suikers en vele
andere belangrijke stoffen. Al deze koolstof is uiteindelijk
via fotosynthese afkomstig uit CO2 aanwezig in de lucht.
Fotosynthese vind plaats in planten maar ook in heel veel
andere vaak simpele eukaryoten en prokaryoten die in
water of waterrijke plekken leven. Bij verbranding komt de
koolstof in cellen weer vrij als CO2. Het proces dat de
koolstof steeds van de levende wezens door middel van
verbranding weer in de lucht gaat en dat planten het weer
vastleggen door fotosynthese heet de koolstofkringloop.
De koolstofkringloop wordt een beetje gebroken doordat
een gedeelte van de koolstof die vastgelegd wordt in
levende wezens niet verbrand wordt maar in de bodem
langzaam fossiel wordt. In het verleden is dit in grote
hoeveelheden gebeurd. Gedurende miljoenen jaren zijn
grote pakketten dood organisch materiaal gefossiliseerd.
Het fossiele koolstof zit tegenwoordig in kalksteen en de
fossiele brandstoffen zoals bijvoorbeeld steenkool. Door
de fossiele brandstoffen te verbranden, brengen we dus
koolstof (in de vorm van CO2) in de atmosfeer die
miljoenen jaren geleden uit de atmosfeer is gehaald door
planten.
Voor fotosynthese is zonlicht nodig, waardoor het alleen
overdag plaatsvindt. Gedurende de dag wordt er dus in
theorie koolstofdioxide gebruikt in de fotosynthese
waardoor overdag de CO2 concentratie kan dalen.
Gedurende de nacht zal de CO2-concentratie stijgen,
omdat er dan wel verbranding plaatsvindt maar geen
fotosynthese. In werkelijkheid is dit verhaal te simpel. Er
kunnen grote lokale verschillen zijn: in een stad waar veel
auto’s en ander vormen van verbranding zijn, kan overdag
ook een netto koolstofdioxide uitstoot zijn. Ook tussen de
seizoenen kunnen er grote verschillen zijn en andere
factoren, zoals temperatuur, windkracht en richting en
zonnekracht, spelen ook een rol. Er zijn dus veel factoren
om rekening mee te houden als je naar de CO2concentratie in de lucht gaat kijken.
Meetapparatuur
De CO2-concentratie wordt gemeten met de zogenaamde
Vaisala Carbocap GMP343. Deze detector wordt veel gebruikt
in kassen om de luchtsamenstelling in de gaten te houden.
Voor de continue metingen is de Vaisala op het dak van de
scholen bevestigd. De Vaisala is maar 20 cm groot en is
daardoor ook uitermate geschikt om metingen op andere
plaatsen te doen, zoals in een klaslokaal of bij een weiland.
De Vaisala is een zogenaamde 'non-dispersive infra-red'
sensor. In de Vaisala zit een lamp die infrarood licht uitzendt.
Dit licht wordt door een spiegel teruggekaatst naar een
detector voor infrarood licht. Onderweg komt het licht de
CO2-moleculen in de lucht tegen, die een deel van dit licht
absorberen. De infrarooddetector zal dus een lagere
lichtsterkte meten dan de lamp heeft uitgezonden. Dit verschil
in intensiteit is een maat voor het aantal CO2-moleculen dat
het licht tegen is gekomen en dus voor de CO2-concentratie in
de lucht.
Op elke school is ook een Davis Vantage PRO weerstation
geplaatst. Dit weerstation stuurt waardes voor de luchtdruk,
temperatuur en de luchtvochtigheid door naar de Vaisala. De
Vaisala heeft deze gegevens nodig om de CO2-metingen te
compenseren. Dit is het makkelijkste uit te leggen aan de hand
van een voorbeeld. Als de luchtdruk in de Vaisala stijgt, dan
betekent dat dat er meer luchtdeeltjes in dezelfde ruimte
zitten. Dus ook meer CO2-moleculen. Hierdoor meet de
Vaisala meer CO2-moleculen bij een hogere luchtdruk. Omdat
je de CO2-concentratie onafhankelijk van de luchtdruk wilt
weten, stuur het weerstation de waarde voor de luchtdruk
naar de Vaisala. De Vaisala rekent vervolgens de CO2concentratie om naar een vaste waarde voor de luchtdruk.
Het weerstation houdt ook andere factoren bij, zoals de
hoeveelheid regen, de windrichting en de windsnelheid.
SchoolCO2web metingen
Er zijn een aantal middelbare scholen in Nederland en Europa die bezig zijn met het meten van de
koolstofdioxideconcentratie in de lucht. Deze gegevens kunnen vervolgens voor de wetenschap gebruikt
worden. In deze module gaan we kritisch kijken naar de meetwaarden die zij van hun meetstations
krijgen. De CO2 waarden die gemeten worden, variëren per uur, per dag, per seizoen en per jaar. Het is
hierdoor moeilijk om goede gemiddelden te bepalen en daarmee te kijken of de hoeveelheid CO2 in de
atmosfeer echt stijgt. Naast de koolstofdioxideconcentratie meten de stations ook windrichting,
windsnelheid, temperatuur van de buitenlucht en het station zelf en de luchtdruk. Deze factoren kunnen
allemaal invloed hebben op de gemeten CO2 waarden en moeten daarom ook gemeten worden. Laten we
eens gaan kijken naar de gemeten waarden van een van deze scholen. Je vindt deze waarden in het Excel
bestand [CO2waarden] en ze zijn hieronder afgebeeld in een grafiek. Deze grafiek bestaat uit een reeks
van metingen in de periode van 30 januari tot aan 3 april. Elke 15 minuten is er een meting uitgevoerd. In
totaal zijn er dus meer dan 3000 meetmomenten met elke keer alle eerder genoemde gemeten factoren.
In de grafiek zie je de zogenaamde ruwe data verwerkt. Deze grafiek is echter niet zo heel erg waardevol.
Waarom? Dit komt onder andere omdat er geen eenheden op de y-as staan. omdat de gegevens niet
ongeveer dezelfde orde grote hebben en omdat er gewoon teveel gegevens met elkaar samen in een
grafiek zijn afgebeeld. Om het allemaal wat duidelijker te maken, gaan we eerst eens kijken naar een
kleinere hoeveelheid informatie. De hoeveelheid is op veel verschillende manieren te verkleinen
bijvoorbeeld door naar een kleiner tijdsinterval te kijken en een aantal variabelen te verwijderen. De
grafiek van 3 dagen zie je hieronder.
Deze grafiek mag dan iets duidelijker zijn omdat er minder data in verwerkt is, je kan er niet zoveel mee.
Zeker voor klimaatonderzoek is een grafiek van 3 dagen wel erg weinig. We willen juist lange termijn
metingen hebben om te kijken of de CO2-concentratie gemiddeld genomen echt toeneemt. Toch is er in
deze korte grafiek wel iets opvallends te zien.
Welke conclusies kun je trekken op basis van deze gegevens?
Je hebt gezien dat er gedurende de dag een verandering optreedt in de CO2-concentratie. Het lijkt erop
dat gedurende de nacht het CO2-gehalte toeneemt en tijdens de dag afneemt. We gaan kijken en
bedenken waar dit aan kan liggen. Lees hiervoor ook het kader ‘de meetapparatuur’ op pagina 4.
-
Opdracht 1
Welke factoren zouden van invloed kunnen zijn op de CO2-concentratie?
-
Wat zal de grootste invloed zijn?
-
Welke factoren vind je direct terug in de meetgegevens?
-
Vind je aanwijzingen in de meetgegevens waarmee je denkt duidelijk te kunnen bewijzen wat de
grootste invloed heeft?
-
Zijn er in de meetgegevens nog andere waarden die je idee ondersteunen?
-
Zijn er ook meetgegevens die je idee juist onderuithalen?
Hoewel je misschien een aantal van deze vragen al wel kunt behandelen zul je deze module hulpmiddelen
leren bij het vinden van antwoorden en de goede onderbouwing van je antwoorden.
De grafiek loopt slechts over 3 dagen aan het begin van het jaar. De verschillen tussen dag en nacht zullen
kleiner zijn een dan paar maanden later. Dan zal het warmer zijn en de planten groeien en daarmee
koolstof uit de lucht halen. We gaan nu leren hoe je zelf zo een grafiek kunt maken in het programma
Excel.
Grafieken
Grafieken of diagrammen zijn een ideale manier om data duidelijk en overzichtelijk weer te geven. Een
goede grafiek kan duidelijkheid geven. Maar grafieken kunnen ook verkeerd gebruikt worden. De
verkeerde grafiekvorm voor het type gegevens, essentiële gegeven vergeten, verkeerde waarden,
getallen van verschillende orde grootte in een grafiek of verschillende eenheden op een as kunnen
allemaal tot verkeerde conclusies leiden. In rekenprogramma’s zoals Excel kun je vaak een groot aantal
type grafieken maken. Denk goed na welk type het best bij jouw gegevens past.
Opdracht 2
Maken van grafieken in Excel
Let op: onderstaande voorbeeld gaat uit van Excel 2007. Er zijn veel andere versies en programma’s in omloop. De meeste programma’s werken in
grote lijnen hetzelfde. Vraag hulp van een docent als je er niet uitkomt.
Open [grafiekmaken.xls]. Je ziet nu een tabel. Dit is het rekenblad of in het Engels spreadsheet. Verticaal
lopen de kolommen. Ze zijn van links naar rechts op alfabet gelabeld en horizontaal lopen de rijen die van
boven naar beneden genummerd zijn. Om een grafiek te maken, doorloop je de volgende stappen:
-
Selecteer met de muis het gedeelte van het rekenblad waarvan je de grafiek wilt maken
-
Ga naar invoegen en kies voor grafieken
-
Kies hier voor een type grafiek
-
Druk op ok
-
Bekijk het resultaat
-
Herhaal dit nu enkele malen en maak steeds een ander type grafiek
Maak nu een grafiek van de CO2 metingen. Dit doe je als volgt:
-
Open het bestand MeetgegevensCO2.xls
Op de eerste rij staan de namen van de parameters, zodat je weet wat er in elke kolom voor informatie te
vinden is. De rijen eronder zijn de gegevens van elk meetmoment. Onderaan zie je een tabje met de
namen van de scholen en het onderzoeksinstituut. Als je daarop klikt, zie je de gegevens van deze
meetlocaties. Maak nu een grafiek van de CO2 metingen van alle meetlocaties.
-
Selecteer met de muis het gedeelte van het rekenblad waarvan je de grafiek wilt maken in dit
geval is dat dus alles
-
Ga naar invoegen en kies voor grafieken
-
Kies hier voor spreiding met losse datapunten
-
Druk op ok
-
Bekijk het resultaat
Als het goed is, heb je nu een grafiek die er ongeveer hetzelfde uitziet als de grafiek van de ruwe data op
de volgende pagina. Je kunt nu om de grafiek duidelijker te maken een aantal meetvariabelen weg halen.
Dit doe je door de cursor op een van de meetpunten met de linkermuisknop te selecteren en met de
rechter muisknop te klikken en dan verwijderen. Een aantal waarden kun je veilig verwijderen: luchtdruk.
Opdracht 3
We gaan nu kijken naar een grafiek van drie locaties. Deze hoef je nu nog niet zelf te maken maar vind je
op het grafieken tabblad en hij is hieronder ook afgebeeld. Het Maartenscollege bevindt zich in Haren
vlak buiten Groningen (stad), het Willem Lodewijk Gymnasium in hartje Groningen en het CIO is de
testopstelling op het Centrum voor Isotopen Onderzoek aan de rand van Groningen op het Zernike
universiteitsterrein. Een aantal zaken zullen opvallen in de grafiek.
-
Schrijf voor jezelf de 5 meest opvallende punten van de grafiek op
-
Bedenk voor elk punt een verklaring
-
Ga nu pas overleggen met een medeleerling
-
Bespreek de uitkomsten met de docent
Deze grafiek geeft maar twee typen data, namelijk de tijd en de CO2-concentratie. Je ziet hier dus niet
waar de wisseling in CO2 door veroorzaakt kan worden.
Je hebt nu gezien dat ruwe data en zelfs grafieken niet altijd een duidelijk beeld geven. In de volgende
lessen ga je kennis maken met een aantal statistische technieken die je kunnen helpen bij het kritisch
analyseren van dergelijke complexe data.
Statistiek
Statistiek is een vorm van wiskunde die toegepast wordt om informatie uit ruwe data te krijgen. Het is de
wetenschap en techniek die zich bezighoudt met het verzamelen, bewerken, interpreteren en
presenteren van gegevens. Statistiek is oorspronkelijk begonnen toen men onderzoek ging doen naar de
bevolking van landen en met kleine steekproeven toch iets over de gehele bevolking wilde zeggen of
wanneer juist gehele bevolkingsonderzoeken geen duidelijke antwoorden gaven. Statistiek is
tegenwoordig een grote en belangrijke tak van de wiskunde en bijna geen wetenschapsgebied kan zonder
Elke dag vind je voorbeelden van statistiek in de krant en op het journaal in de vorm van enquêtes,
percentages en gemiddelden.
Door statistiek kun je uit veel informatie een simpel en duidelijk antwoord krijgen. Stel: je hebt een
enquête gehouden onder 1456 mensen en 290 mensen hebben aangegeven dat ze 7 keer per week
douchen. Je kan in de krant deze getallen opschrijven maar je mag ook zeggen dat 20% van de
deelnemers 7 keer in de week doucht. Dit laatste is overzichtelijker.
Dergelijke onderzoeken worden meestal gedaan om iets over een grotere groep te kunnen zeggen. In het
douche voorbeeld zou het een onderzoek kunnen zijn om iets te weten te komen over het douche gedrag
van de Nederlanders. Als je een kleine groep onderzoekt, om iets over een veel grotere groep te weten te
krijgen, noem je dat een steekproef. De gehele groep noem je meestal de populatie of totale verzameling.
Je zult bij de opgaven zien dat je goed moet nadenken over je steekproef. Zo moet een steekproef
representatief zijn voor de groep waar je iets over wilt weten. Dat betekent dat de steekproef lijkt op een
kleine versie van de gehele populatie. Maar het is verkeerd om dan de deelnemers te selecteren om dat
deze waarschijnlijk de populatie goed vertegenwoordigen. Dit omdat je dan voor je onderzoek start al
bepaalt wie er eigenschappen hebben die waarschijnlijk voldoen aan de verwachting die jij hebt van de
populatie. Voor een goed onderzoek moet je duidelijk bepalen wat de populatie is en dan een voldoende
grote steekproef nemen op door toeval bepaalde individuen van de populatie. Dit heet een willekeurige
steekproef.
Bij klimaatonderzoek spelen zowel hele grote hoeveelheden data een rol als ook het probleem van
steekproeven. Een meetstation meet immers maar op één plek in de ruimte. Met deze plek probeer je
een uitspraak te doen over een veel groter omliggend gebied en vormt daarom een steekproef. Alle
meetstations op de wereld vormen samen een reeks van steekproeven. Dat zijn er een heleboel.
Bovendien meet elk meetstation regelmatig en meerdere parameters, waardoor er een enorme
hoeveelheid data gegenereerd wordt.
Vaak worden er meerdere statistische bewerkingen op de oorspronkelijke waarnemingen of metingen los
gelaten. Het is belangrijk je altijd te realiseren waar je nu mee werkt: de oorspronkelijke of de bewerkte
data. In de praktijk noemt men de data die direct door een meter gemeten wordt of de directe
waarnemingen de ruwe data. Het gebruik van statistiek vraagt een kritische houding van zowel degene
die de ruwe data bewerkt als degene die het uiteindelijk leest.
Je gaat nu aan de hand van een aantal opdrachten kennis maken met statistische bewerkingen.
Meetfout en significantie van getallen.
Opdracht 4
Let op: het is belangrijk dat je de eerste stappen van de volgende proef alleen doet zonder overleg. Je
krijgt van je docent een blokje metaal. Bepaal het volume van het blokje op een van de volgende
manieren. Doe dit zo precies mogelijk. Als je klaar bent met het blokje geef je het aan een klasgenoot
zodat iedereen precies het zelfde blokje meet.
-
Meet met een geodriehoek de drie dimensies en bereken het volume via V=LxBxH
-
Meet met een (pressie) schuifmaat en bereken via V=LxBxH
-
Vul een maatbeker met water en lees het volume van het water af. Als je nu het blokje in het
water doet, zal het water zoveel stijgen als het blokje verplaatst. Lees het volume af nadat het
blokje helemaal onder water is verdwenen. Door het eerste volume van het laatste volume af
te trekken krijg je het volume van het blokje
Vergelijk de waarden met die van je klasgenoten. Ze zullen niet allemaal hetzelfde zijn.
Omdat elke meetmethode een kleine fout oplevert, werk je bij het doen van metingen met een
standaard meetfout. Deze meetfout is een veilige schatting van de mogelijke fout bij metingen. De
meetfout zit meestal tussen 1 schaaldeel en 0.5 schaaldeel. Voor metingen waar je de schaaldelen
gemakkelijk kunt onderscheiden, is een half schaaldeel meestal genoeg. Als het moeilijker te
onderscheiden is, ga je naar 1 schaaldeel. Dit betekent in de praktijk dat waneer je met een liniaal
gaat meten waarop centimeters als kleinste schaaldeel is aangegeven dat je dus een halve centimeter
als meetfout neemt. Dus: als je 20 cm meet dan schrijf je op: 20 cm +/- 0.5 cm. Als je hier vervolgens
mee gaat verder rekenen, moet je steeds met het hoogste en het laagste getal rekenen. In dit
voorbeeld dus 19,5 cm en 20,5 cm. Voor elektronische meetapparatuur staat vaak in de handleiding
wat de meetfout is.
Significantie van getallen
Een andere manier om met de (on)nauwkeurigheid van je waarneming om te gaan is alleen de
significante of redelijkerwijs echt waargenomen waarden te noteren. Deze methode word vaker gebruikt
dan steeds de meetfout aan te geven. Een van de redenen is dat als je met meetfouten gaat rekenen je
per meetwaarde steeds twee getallen mee moet laten tellen, door consequent om te gaan met de
significantie van getallen hoeft dit niet. Wat houdt significantie van getallen in?
Cijfers worden door niet-wetenschappers (of slechte wetenschappers) vaak met te grote precisie
weergegeven, terwijl er 2 cm is waargenomen wordt er toch 2,00 cm genoteerd. Dit is niet correct. Het
suggereert namelijk een grotere meetnauwkeurigheid dan de nauwkeurigheid van de werkelijke meting.
Bij gemeten waarden is het belangrijk de significante getallen te noteren. Het eerste cijfer van een getal
heeft de grootste significantie en de getallen er na steeds minder. Bij het getal 259,8 heeft twee dus de
hoogste significantie en 8 de laagste. Wat de significantie van de getallen zijn, hangt af van de meting
,maar significante getallen moet binnen de foutenmarges blijven. Als de meetfout van een weegschaal
0,05 gram is, dan zijn de cijfers die een positie hebben van meer dan 2 cijfers achter de komma sowieso
niet significant.
In de beschrijvende natuurwetenschap worden getallen op een andere manier behandeld dan in de
zuivere wiskunde. In de wiskunde betekent het getal 20 precies 20 en is dus gelijk aan 20,00000000… met
een oneindig aantal nullen achter de komma. In alle andere
wetenschap betekent 20 eigenlijk dat we weten dat het
ongeveer 20 is. Wiskunde houdt zich bezig met zuivere
getallen en is zuiver logisch van aard terwijl de andere
wetenschappen empirisch van aard zijn. Empirisch
betekent: gebaseerd op waarnemingen. De waarnemingen
zijn nooit perfect zuiver maar er is wel te schatten hoe
onzuiver de metingen zijn.
Als je van een thermometer bijvoorbeeld 20oC afleest en
opschrijft dat de temperatuur 20,00oC is, ben je eigenlijk te
precies. Immers, je zegt dat de temperatuur 20,00 is, niet
20,01 of 19,99. Je liegt dus eigenlijk dat je het zo precies
weet. Als je op de gemeten waarden berekeningen gaat
toepassen, kun je pas echt in de problemen komen.
(waarom? Omdat de onnauwkeurigheid dan nog verder
toeneemt) Om erg grote getallen of juist getallen tussen 1
en 0 met veel cijfers achter de komma weer te geven,
gebruiken we de zogenaamde wetenschappelijke
notitiemethode. Deze heb je waarschijnlijk al eens gebruikt
of gezien. Hij ziet er als volgt uit: 3,6 x 1032 . Dit betekent
dan 36 met 31 nullen. De rekenregels voor meetfout,
significante getallen en de wetenschappelijke methode
staan in het kader hiernaast.
Voorbeeld:
Je meet het groeien van een boom van zaadje tot
volwassen boom en je meet het elk jaar. In tien jaar is de
boom tot 20,5 m gegroeid. De gemiddelde groeisnelheid is
dan dus 20,5m/10 Jaar= 2,05 m/jaar. Omdat Meter per Jaar
geen standaardmaat is, wil je ze nu omrekenen naar
km/uur. 2,05m is 0,00205 km en een jaar is 6766 uur dus
0,00205km/6766uur = 0,00000030292324850769.
Dit is duidelijk niet correct.
Opdracht 5
Maak de som met de boom met de juiste significantie.
Kalibreren van meetapparatuur
Alle meetapparatuur moet minimaal eens gekalibreerd zijn.
Kalibratie van meetapparatuur is synoniem met het woord
ijken en betekent dat je het meetinstrument zo instelt dat
het de juiste meetwaardes aangeeft en niet te grote
foutmarges heeft. Je gebruikt hiervoor een standaardmaat.
Rekenregels
De regel voor het rekenen met twee meetwaarden
met elk een meetfout is eigenlijk vrij simpel: de
relatieve meetfout van het resultaat is nooit kleiner
dan de meetfout van de waarden waaruit het
berekend is. Dit betekent dat je bij optellen de twee
grootste meetfouten bij elkaar optelt en de twee
kleinste bij elkaar optelt. Bij aftrekken moet je juist het
grootste van het kleinste getal aftrekken en het
kleinste van het grootste. Dat levert het grootste
verschil op. Ook bij vermenigvuldigen en delen ga je
op zoek naar het grootste verschil. Dus bij
vermenigvuldigen grootste maal grootste en kleinste
maal kleinste en bij delen kleinste delen door de
grootste en grootste delen door de kleinste.
Voorbeeld: Ik wil de snelheid bepalen van een slak. Ik
meet daarvoor een afstand en een tijd. De afstand
meet ik met een lineaal waarop de eenheden cm zijn.
Ik neem daarom een meetfout van een halve cm. De
afstand is: 20 cm en de waarden met meetfout zijn dus
19,5 cm en 20,5 cm. De tijd die de slak over deze
afstand doet meet ik met mijn horloge met
secondewijzer. Omdat het lastig is af te lezen neem ik
als meetfout 1 schaaldeel, 1 seconde dus. Ik zie dat de
slak er 360 seconden over doet, met meetfout dus 359
sec of 361 sec. De berekening is nu als volgt:
19,5/361=0,0540 cm/sec & 20,5/359=0,0571 cm/sec
Significante cijfers
De regels voor het rekenen met significante cijfers is
dat het aantal significante cijfers van het resultaat
gelijk is aan het aantal significante cijfers van de
meetwaarde met het minste significante cijfers. Het
aantal significante cijfers neemt dus nooit toe.
Voorbeeld: Ik heb de snelheid van de slak weer eens
gemeten in cm. De slak kroop 25 cm in 330 seconden.
De snelheid is dus 25/330=0,0757575 cm/sec maar
omdat ik een meting heb met maar twee significante
cijfers mag ik dat niet zo opschrijven. Ik moet daar van
maken 0,075 cm/sec of nog beter gebruik maken van
de wetenschappelijke notitie 7,5 x 10-2. De
wetenschappelijk methode is altijd de beste methode
om grote getallen te noteren omdat meteen duidelijk
is hoeveel cijfers achter de komma of hoeveel nullen
er bij een getal horen.
Let op! Ook als je wel met meetfouten rekent, moet
het aantal significante cijfers gelijk zijn aan het aantal
significante cijfers van het getal met de minste aantal
significante cijfers waarmee je hebt gerekend.
Het beste is om met meetfouten te werken en de
significante cijfers in de gaten houden.
Deze meet je met het te ijken instrument en daarna pas je eventueel het instrument aan op de juiste
waarde. Veel onderzoeksinstrumenten moeten regelmatig geijkt worden, omdat ze na verloop van tijd
een flinke afwijking kunnen krijgen. Een niet goed gekalibreerd instrument kan grote fouten opleveren in
de metingen. De gegevens waarmee je hier werkt, zijn verkregen met niet optimaal geijkte apparatuur. Er
wordt vermoed dat met name die van de scholen daardoor wel eens iets hoger zou kunnen uitvallen dan
de werkelijke concentratie. De gemiddelde concentratie op aarde is ongeveer 370-390 ppm . Het zou ook
kunnen dat er in Groningen stad gewoon een veel hogere koolstofdioxide concentratie is. Doordat er
misschien niet goed geijkt is, kunnen we dat echter niet zeggen. Een niet gekalibreerd apparaat zal over
het algemeen relatieve verschillen nog wel goed weergeven. Een thermometer mag misschien niet goed
aangeven dat het kookpunt 100oC is, maar een temperatuur stijging zal nog steeds weergegeven worden.
Het is verstandig om grotere foutenmarges te gebruiken als apparatuur niet goed geijkt is.
Significantie in de statistiek
Let op: significantie betekent in de statistiek, behalve significantie van getallen ook nog iets anders. In de
statistiek wordt gezegd dat een bepaald experimenteel resultaat significant is als de kans dat hetzelfde
resultaat door toeval verklaard kan worden erg klein is.
Stel: ik wil bewijzen dat een dobbelsteen verzwaard is. Ik werp de dobbelsteen 600 keer. Op basis van het
toeval verwacht je dat je van die 600 keer 100 keer een 6 gooit. Als ik in het experiment nu 102 keer een
6 gooi, is dat maar een kleine afwijking van het aantal wat je op basis van toeval mag verwachten. Stel: ik
zou 500 keer een 6 hebben gegooid, dan is dat een erg groot verschil met de verwachte toevalswaarde en
mag je gerust aannemen dat de dobbelsteen zo verzwaard is dat er vaker een 6 naar boven zal komen.
Maar stel nu dat er 110 keer 6 gegooid is? Of misschien zelfs 150 keer? Of je dan gerust kunt stellen dat
de dobbelsteen verzwaard is, is een moeilijke zaak. Statistici hebben daarvoor tests bedacht en verbinden
aan die tests ook onzekerheden ofwel de kans dat een bepaald resultaat toch door toeval bepaald is.
Meestal is deze kans gesteld op minder dan 1% maar soms kom je ook 5% tegen of juist 0.1%. Veel hoger
dan 5% is meestal niet erg betrouwbaar.
Nogmaals: een bepaald resultaat is significant als het erg onwaarschijnlijk is dat hetzelfde resultaat door
toeval bepaald is. Significante cijfers zijn die cijfers waar je van mag aan nemen dat ze ook echt
waargenomen zijn of berekend zijn volgens de regels uit waarnemingen met significante cijfers.
Centrummaten
Een belangrijke term die heel veel wordt gebruikt is het gemiddelde. Het een voorbeeld van een
zogenaamde centrummaat. Centrummaten zijn statische gereedschappen om iets algemeens over een
verzameling gegevens te kunnen zeggen, namelijk waar het midden van de verzameling is.
Gemiddelde
Met het gemiddelde wordt meestal het rekenkundig gemiddelde bedoeld. Het rekenkundig gemiddelde is
niet het enige type gemiddelde. Zo zijn er ook het harmonisch, meetkundig, gewogen en getrimd
gemiddelde. Het rekenkundige gemiddelde bereken je door alle getallen van de verzameling op te tellen
en daarna te delen door het totaal aantal. Bij een proefwerk zijn de volgende cijfers gehaald: 4 , 4 , 5 , 5 ,
6 , 6 , 6 , 7 , 7 , 7 , 7 , 8 , 9 . Gemiddeld is het dan 5,7. Het gemiddelde wordt van de centrummaten
waarschijnlijk het meest gebruikt. Ook jij heb waarschijnlijk al voor van alles en nog wat een gemiddelde
uitgerekend. Maar pas op: een gemiddelde alleen kan verraderlijke informatie zijn.
Mediaan
De mediaan is het middelste getal in een verzameling die op volgorde van grote is gesorteerd. In een klas
zijn bijvoorbeeld de volgende cijfers gehaald: 4 , 4 , 5 , 5 , 6 , 6 , 6 , 7 , 7 , 7 , 7 , 8 , 9 . Het onderstreepte
getal is de mediaan. Als er een even aantal waarden zijn is de mediaan het gemiddelde van de twee
middelste getallen.
Modus
Modus is het getal wat het meest voorkomt in een verzameling getallen. In het bovenstaande voorbeeld
komt 7 het vaakst voor en is dus de modus. De modus wordt onder andere gebruikt als centrummaat bij
loonverdeling. Het modaal loon is het loon wat het meest verdient wordt. Als je bij loon een gemiddelde
zou nemen zou het veel hoger uit komen door dat er maar een kleine groep wel heel veel verdient. Het
modaal loon zegt dus meer over wat de meeste Nederlanders verdienen en is in dit geval nuttiger dan het
gemiddelde.
Standaard afwijking
Standaardafwijking of standaarddeviatie zoals het vaker wordt genoemd is een maat voor afwijking van
het gemiddelde. En het is een belangrijke maat. Stel: we vergelijken drie klassen in een experimenteel
schoolsysteem met elkaar. Het gaat om brugklassen die allemaal hetzelfde niveau (havo) hebben gehad.
In de tweede klas blijven de leerlingen bij elkaar in dezelfde klas maar de beste
Klas
1a 1b 1c
klas krijgt les op VWO niveau en als er een klas is die gemiddeld lager scoort,
/Ll#
gaan die naar een lager niveau. In klas 1a is het gemiddelde cijfer op Havo niveau
een 6, in klas 1b is het gemiddelde 6 en in klas 1c is het gemiddelde cijfer een 7.
1
5 4
9
Op basis van deze gemiddelden lijkt het een goed idee om klas 1c naar het
2
7 3
9
hogere niveau te brengen. Maar laten we eens naar de cijfers van de
verschillende klassen kijken.
3
6 4
4
-
Opdracht 6
Is het, gezien de cijfers verstandig om de leerlingen van 1b op hetzelfde
niveau te houden?
-
En moeten de leerlingen van 1c wel naar een hoger niveau?
4
6
9
6
5
7
9
9
6
6
3
9
7
5
8
8
8
6
8
10
9
6
4
7
10
6
4
5
11
6
9
7
12
7
4
3
13
5
9
5
gem
- Klik nu op de cellen waar de gemiddelden, standaarddeviaties, mediaan
6en modus
6
7afgebeeld zijn. Je ziet nu als het goed is de gebruikte formule bovenin de formulebalk.
Zoals je merkt zou het handig zijn om bij het gemiddelde ook een maat te krijgen
die uitdrukt in hoeverre de gegevens afwijken van dit gemiddelde. Gelukkig is er
de zogenaamd standaarddeviatie. De standaarddeviatie geeft aan hoeveel de
waarden waarvan je het gemiddelde hebt genomen gemiddeld afwijken. De
standaarddeviatie is een nuttige waarde als je gemiddelden met elkaar wilt
vergelijken. Meestal wordt namelijk gesteld dat twee gemiddelden echt van
elkaar verschillen als de gemiddelden meer dan de standaarddeviatie van elkaar
verschillen. Het berekenen van gemiddelden en standaarddeviaties is erg
makkelijk in Excel.
-
Open hiervoor bestand [klassen 1]
Je kunt dit als voorbeeld gebruiken bij de volgende opdracht waar we het gemiddelde gaan berekenen
van de CO2 concentratie van de diverse scholen.
Opdracht 7
Gemiddelden
In Excel kun je vrij gemakkelijk gemiddelden berekenen.
-
Maak eerst een nieuw tabblad aan. Dit doe je door onderaan het rekenblad van Excel op een tab
te klikken met je rechter muisknop en dan nieuw tabblad te kiezen. Noem dit blad
“weekgemiddelden”
-
Bereken nu de gemiddelde CO2-concentratie over een week. Doe dit als volgt: zoek het laatste
meetpunt van een week en zet in de lege cel naast alle meetpunten de volgende formule
=gemiddelde(b2:b350) dit is een week. De cel nummers (B2) hangen af van het gemiddelde dat je
wilt berekenen. B2 betekend hier kolom B rij 2. Als het goed is zie je nu het gemiddelde van deze
cellen verschijnen. Hier komt een getal uit met te veel significante cijfers in Excel kun je
gemakkelijk aangeven hoeveel getallen achter de komma je wenst. Klik met de rechter muis de
kolom of cel aan en kies voor celopties; kies dan voor wetenschappelijk en kies het juiste aantal
cijfers achter de komma.
-
Maak nu een nieuwe rij aan en plaats nu in de cel ernaast de formule =stdev(b2:b350). Hiermee
bereken je de standaardafwijking.
-
Je kunt beide formules ook vinden onder de formule knop naast de formule balk. Hier vind je nog
veel meer formules
-
Kopieer nu beide formules en zet ze op het laatste meetpunt van elke week. Pas de formule
eventueel aan, want niet elke week heeft evenveel meetpunten. Dit kan best veel werk zijn!
-
Herhaal dit voor elke meetlocatie
-
Kopieer dit nu naar het nieuwe tabblad. Let op: dit kopieren gaat niet zomaar! Als je een formule
gebruikt, die ergens naar verwijst op een rekenblad, geldt die verwijzing alleen op dat rekenblad.
Daarom kun je het beste kiezen voor speciaal plakken en dan verwijzing plakken.
-
Maak nu een staafdiagram van de gegevens. Probeer de standaarddeviatie als foutenbalken in de
grafiek te verwerken.
Als het goed is krijg je dan een diagram die er ongeveer zo uitziet als degene die hieronder is afgebeeld.
Hopelijk valt het je op dat op alle meetlocaties er in week 7 iets afwijkends aan de hand is. Zowel de
gemiddelde concentratie als de standaard afwijking is overal hoger. Dergelijke afwijkingen kunnen een
aanwijzing zijn voor een interessant verband. Als er bijvoorbeeld in die week ook net hogere
temperaturen of meer neerslag is gevallen, kan het zijn dat die factor altijd is verbonden met de CO2
concentratie.
CO2
in
PPM
Correlatie
Heel vaak is het belangrijk om te bepalen of gemeten factoren met elkaar samenhangen. In
klimaatonderzoek bijvoorbeeld de CO2 concentratie en de temperatuur. De mate van samenhang noemt
men de correlatiecoëfficiënt. Deze varieert tussen -1 en 1. 0 betekent geen correlatie en dus zijn de
factoren onafhankelijk van elkaar. -1 is het sterkste negatieve verband en 1 is het sterkste positieve
verband. Als twee parameters een sterke (-1 of 1) corelatie hebben, betekent dat dat je op basis van de
ene parameter de andere parameter moet kunnen voorspellen. Hoe beter de voorspelling klopt, hoe
hoger het correlatiecoëfficiënt. De correlatie tussen parameters is te bepalen, maar vergt lastig
rekenwerk. Gelukkig kunnen we met Excel de correlatie van twee parameters bepalen.
Het bepalen van een correlatie tussen twee meetfactoren is een sterke techniek, maar kan gemakkelijk
tot verkeerde conclusies leiden. Beroemd voorbeeld van een duidelijke correlatie is dat het aantal
ooievaars in Zuid-Zweden en het aantal geboortes van mensenkinderen. Het bleek dat als er meer
ooievaars waren dat er dan ook meer baby’s werden geboren. Andersom betekende minder ooievaars
minder baby’s. Nu dacht niemand dat hier een causaal verband tussen was (causaal betekend oorzakelijk,
doordat…) maar voorbeelden waar men deze denkfout wel maakt zijn er genoeg. In het voorbeeld van de
ooievaren en baby’s bleek er later een logische verklaring te zijn voor de corelatie namelijk de
temperatuur van het voorjaar. Beide factoren werden hierdoor beïnvloed. Een correlatie kan dus duiden
op een verband, maar dat verband kan via nog een andere factor lopen die niet gemeten is. Stelregel: als
twee parameters gecorreleerd zijn, wil dat nog niet zeggen dat ze ook oorzakelijk verbonden zijn.
Let op : Een correlatie is altijd tussen numerieke variabelen zoals bijvoorbeeld lengte of temperatuur. Dus
een correlatie is dus altijd in getallen uit te drukken. Je kan dus niet spreken van een correlatie tussen
politieke voorkeur en het automerk wat mensen rijden. Het zou best kunnen zijn dat Mercedes rijders
vaker VVD stemmen maar dat noemt men een statistische associatie en niet een correlatie.
Een correlatie is een lineaire uitdrukking. Soms is er een verband maar is deze niet lineair. De hoeveelheid
bacteriën in een medium en de tijd zijn zeker met elkaar verbonden maar het verband is exponentieel.
Een correlatie zal hier alleen gevonden worden als een van de groei een logaritme word genomen
waardoor deze weer lineair verloopt.
Opdracht 8
In het vorige hoofdstuk heb je ontdekt dat er in week 7 van de metingen iets is gebeurd wat mogelijk
interessant is. In deze week was er veel meer CO2 maar ook een grotere variatie in de concentratie. Je
wilt nu gaan uitzoeken of deze afwijking verklaard kan worden door een van de factoren. Hiervoor kun je
terug naar de meetwaarden of de grafiek van alle meetwaarden en kijken of er in die week ook andere
factoren zijn die uitschieters laten zien. Het zal je al snel opvallen dat in week 7 een aantal factoren zich
wat anders gedragen dan in de andere weken. Een factor is bijvoorbeeld de wind. In week 7 heeft het
bijna niet gewaaid. Zou het kunnen dat wind ervoor zorgt dat er minder CO2 wordt gemeten? Om dat uit
te zoeken gaan we kijken of beide factoren correleren. Dit doe je als volgt:
- Ga naar het INVOEGEN menu
- selecteer grafiek type spreiding zonder lijn
- Ga nu naar gegevens selecteren met uit het menu wat je oproep met de rechtermuisknop op het
grafiekgebied
- Selecteer als x-as de kolom wind van een meetlocatie
- Selecteer als y-as de kolom met de CO2-concentratie
- Pas de assen aan. Minimum bij y-as moet 300 zijn en bij de x-as maximaal 15
- Voeg nu een trendlijn toe. In dit menu kun je ook R2 en formule toevoegen. Doe dit beide.
De grafiek moet er ongeveer uitzien als de grafiek hieronder.
Is de trendlijn aflopend, dus met een negatieve richtingscoëfficiënt, dan is er een negatieve correlatie.
Dat betekent dat als een factor toeneemt, dat de ander dan afneemt. Neemt de trendlijn toe, dan is de
correlatie positief. De R2 is een maat voor de sterkte van de correlatie. Als R2 0 is betekend het dat er
geen correlatie is en 1 zou weer betekenen dat er totale correlatie is. Een waarde boven de 0.2 is la
betrekkelijk goed. Zoals je ziet is er een duidelijke correlatie tussen windsnelheid en concentratie. Maar
een correlatie betekent niet logischerwijs dat er ook een oorzakelijk verband is. In dit geval is dat er wel.
Probeer een mogelijk mechanisme voor dit probleem te verzinnen. Denk weer eerst voor je zelf na.
Overleg dan met een medeleerling en discussieer daarna met de hele klas.
Kijk in de data of er nog meer mogelijke corelaties zijn. Onderzoek voor in ieder geval 1 weerparameter of
deze gecorreleerd is met de CO2-concentratie.
Welke factoren beïnvloeden de CO2-concentratie nog meer?
Goede statistiek, slechte statistiek
Statistiek is dus enorm belangrijk in de moderne maatschappij
en wetenschap. Dat betekent niet dat het altijd even populair is.
Een bekende uitspraak van de Amerikaanse schrijver Mark Twain
is: “There are three kinds of lies: lies, damned lies, and
statistics.” (Er zijn drie leugens: leugens, verdomde leugens en
statistiek). Twain doelde hiermee op het feit dat je door middel
van slinks gebruik van statistiek kunt liegen zonder echt te liegen
en zelfs gewoon de waarheid vertellen. Bijvoorbeeld een
dictator die beweert dat het gemiddelde inkomen onder zijn
bewind enorm is gestegen, hoeft niet te liegen. Als hij ervoor
heeft gezorgd dat een paar mensen heel erg rijk zijn geworden,
dan halen die het gemiddelde enorm omhoog. De dictator liegt
dus niet maar hij impliceert met de uitspraak natuurlijk dat hij
ervoor heeft gezorgd dat de mensen van zijn land het veel beter
hebben gekregen dan voor zijn bewind. Dat hoeft natuurlijk
helemaal niet. De meeste mensen kunnen wel armer zijn
geworden als het gemiddelde van inkomens omhoog is gegaan.
Als arme mensen eerst net rond kunnen komen van bijvoorbeeld
de 2 dollar per dag die ze verdienen en ze worden armer
waardoor ze maar 1,75 dolar per dag te besteden hebben, kan
dat betekenen dat ze omkomen van de honger. Er hoeven maar
een paar miljonairs maar een paar procent meer te krijgen en
het gemiddelde inkomen stijgt.
Politici zijn dus gek op statistiek die in hun voordeel kan werken.
Overigens zijn de meest politici niet zo fout als de eerder
genoemde dictator maar ook een gewone politicus moet zijn
mening met argumenten onderbouwen en een gedeelte van de
argumenten bestaan uit statistiek waarmee je dus kunt
misleiden.
In de zuivere wetenschap is het de bedoeling dat statistiek
duidelijkheid verschaft (daar is het voor ontwikkeld). In meer
toegepaste wetenschap is dat ook het eerste doel, maar ook
daar wordt statistiek soms gebruikt om bepaalde resultaten in
een bepaalde richting te drukken. Geen enkele wetenschapper
interpreteert zijn resultaten echter volledig waarde vrij. Een
klimaatonderzoeker die zich erg druk maakt over de opwarming
van de aarde, zal misschien eerder die statistiek gebruiken die in
zijn voordeel werkt en onderzoekers die zich geen zorgen maken
juist andersom.
Klimaat onderzoek bestaat voor een belangrijk gedeelte uit het
analyseren van enorme hoeveelheden data. Zoals je hebt
gemerkt levert 3 locaties al een enorme hoeveelheid data op.
Statistische Moord?
Ook in rechtszaken speelt statistiek vaak een
belangrijke rol. Een bekend voorbeeld uit 2007 is de
zaak Lucia de B. Lucia was in 2003 tot levenslange
gevangenisstraf veroordeeld voor meervoudige
moord. Een belangrijk bewijs bleek het feit dat zij
wel heel erg vaak aanwezig was als er een patiënt
stierf. In een uitzending van het TV programma
NOVA uit 2003 zegt de hoogleraar strafrecht Theo
de Roos: "In de Lucia de B. zaak is het statistisch
bewijs ontzettend belangrijk geweest. Ik zie niet hoe
men zonder dat bewijs tot een veroordeling zou zijn
gekomen." In de uitzending is ook de
rechtspsycholoog Elffers aanwezig. Hij denk dat de
de kans dat een verpleegkundige, werkzaam op de
drie ziekenhuisafdelingen, bij toeval bij zoveel van
de onverklaarbare overlijdensgevallen en
reanimatie op élk van de drie afdelingen aanwezig
is, één op 342 miljoen is. Deze psycholoog was ook
aanwezig in de rechtszaal en heeft dergelijke
statistiek daar gepresenteerd.
Professionele statistici reageerden kwaad op de in
hun ogen buitengewoon slechte statistiek die
gebruikt werd in de rechtszaak. De Britse statisticus
Phillip Dawid vindt dat de verkeerde gegevens op
een verkeerde manier geïnterpreteerd zijn. Hij
merkt op dat op basis van de gegevens ook
geconcludeerd zou kunnen worden dat Lucia de B
een buitengewoon goede verpleegster was. Op de
afdeling waar ze nieuw kwam werken daalde het
sterfte cijfer met 15%. Van 7 per jaar voor ze er
werkte tot 6 in het jaar dat ze er werkte. Deze
conclusie wordt echter niet getrokken, omdat
iedereen dan meteen door heeft dat er slechte
statistische analyses zijn uitgevoerd.
Na dit commentaar van statistici en druk uit de
samenleving werd de zaak heropend en de
strafzaak is in 2008 opgeschort.
Er is volgens veel profesoren in de statistiek een
gebrek aan begrip van statistiek en kansrekening op
belangrijke plekken in de maatschappij.
Door goede toepassing van kansrekening en andere
statistiek heeft Lucia haar vrijheid terug maar wie
weet hoeveel meer mensen er zijn die ten onrechte
bestraft worden als gevolg van de onwil van de
samenleving om te luisteren naar experts op het
gebied van de statistiek.
Toch kun je op basis van deze drie plekken geen conclusies trekken over de wereldwijde CO2concentratie. Misschien kun je iets zeggen over Groningen en omstreken, maar of onze steekproef daar
goed genoeg voor is?
Statistiek is het middel om uit onderzoeksdata nuttige informatie te destilleren, maar kan dus gemakkelijk
misbruikt of slecht begrepen worden. Hierdoor kan statistiek weer een middel worden waar mensen
misbruik van kunnen maken. Het is daarom van groot belang dat je kritisch kijkt naar statistiek. Vertrouw
het nooit zomaar maar stel de juiste vragen. Een paar kritische vragen die je kunt stellen, zijn:
-
Was de steekproef groot genoeg?
-
Was de steekproef representatief voor de genoemde populatie?
-
Wordt de juiste centrummaat gebruikt?
-
Wat is de standaardafwijking als er gemiddelden worden genoemd?
-
Is de correlatie tussen twee factoren ook causaal?
-
Is er acht geslagen op het gebruik van de juiste significantie van getallen?
-
Zijn de grafieken juist opgesteld en wordt relevante informatie weergegeven?
-
Is de onderzoeker en het uitgevoerde onderzoek betrouwbaar?
Opdracht 9
Zoek in een krant 3 artikelen waarin statistische termen genoemd worden en beoordeel deze op de
kritische punten die hierboven beschreven zijn.
Kritisch kijken naar de CO2metingen en conclusies trekken
Kritisch kijken betekent in de wetenschap niet alleen schoppen tegen een conclusie waar je het niet mee
eens bent , maar ook dat je elke conclusie, dus ook je eigen conclusie met een beetje scepsis bekijkt. Zorg
er dus voor dat je niet zomaar gelooft dat iets zus of zo in elkaar steekt zonder te begrijpen hoe men tot
de conclusie is gekomen. Elke conclusie is een interpretatie van de feiten en kan dus onderuitgehaald
worden door andere feiten. In de wetenschap is het belangrijk dat je aan kunt geven waar je kennis
begint en ophoudt en met welke zekerheid je een bepaalde uitspraak doet.
Opdracht 10
Het IPCC heeft jarenlang allerlei factoren van het klimaat gemeten. Je moet je voorstellen dat er
duizenden meetstations zijn die elke dag soortgelijke metingen doen als de metingen waar je binnen deze
module mee gewerkt hebt. Het IPCC heeft vervolgens alle gegevens verzameld en daar goede grafieken
van proberen te maken. Een paar bekende grafieken staan hieronder afgebeeld. Beantwoord de vragen
die erbij staan.
De bovenstaande grafiek is afkomstig van een onderzoeks instituut in hawaii ver van de meeste
industriële centra.
Vraag 1 . Waardoor wordt de jaarlijkse fluctuatie veroorzaakt?
Vraag 2. Stel de stijging zet zich met dezelfde snelheid voort wat zou het gemiddelde koolstofdioxide
niveau nu ongeveer zijn?
Een andere beroemde grafiek
Vraag 3. Je ziet hier duidelijk dat de temperatuur en de CO2 concentratie gecorreleerd zijn maar kun je
ook aanwijzingen vinden voor een causaal verband?
Vraag 4. Zou je op basis van deze grafiek zeggen dat de temperatuur de CO2 concentratie verhoogd of
juist dat de CO2 concentratie de temperatuur verhoogd?
Download