2008 Rijksuniversiteit Groningen Bart Pander [CO2 METEN EN WETEN?] Deze minimodule voor het bètaprofielvak NLT behandeld vanuit de context van het CO2 onderzoek de concepten meetfout, statistiek en het trekken van conclusies uit complexe data. De duur van de minimodule is 3 lessen. School CO2 Net [CO2 METEN EN WETEN?] INLEIDING................................................................................................................................................... 3 CO2 problemen...............................................................................................................................................3 IPCC .................................................................................................................................................................3 Koolstofkringloop ...........................................................................................................................................4 Meetapparatuur ............................................................................................................................................4 SCHOOLCO2WEB METINGEN .............................................................................................................. 5 Welke conclusies kun je trekken op basis van deze gegevens? .....................................................................6 Opdracht 1 ......................................................................................................................................................6 Grafieken ........................................................................................................................................................7 Opdracht 2 .....................................................................................................................................................7 Maken van grafieken in Excel .........................................................................................................................7 Opdracht 3 ......................................................................................................................................................9 STATISTIEK ..............................................................................................................................................10 Meetfout en significantie van getallen. ........................................................................................................11 Opdracht 4 ....................................................................................................................................................11 Significantie van getallen ..............................................................................................................................11 Rekenregels ..................................................................................................................................................12 Opdracht 5 ....................................................................................................................................................12 Significantie in de statistiek ..........................................................................................................................13 Centrummaten .............................................................................................................................................14 Gemiddelde ..................................................................................................................................................14 Mediaan ........................................................................................................................................................14 Modus ...........................................................................................................................................................14 Opdracht 6 ....................................................................................................................................................15 Opdracht 7 ....................................................................................................................................................16 Gemiddelden ...............................................................................................................................................16 Correlatie ......................................................................................................................................................18 Opdracht 8 ....................................................................................................................................................19 Statistische Moord? ......................................................................................................................................20 Goede statistiek, slechte statistiek ...............................................................................................................20 Opdracht 9 ....................................................................................................................................................21 KRITISCH KIJKEN NAAR DE CO2METINGEN EN CONCLUSIES TREKKEN............................. 22 Opdracht 10 ..................................................................................................................................................22 2 Inleiding De afgelopen jaren is de verandering van het klimaat bijna dagelijks op het nieuws geweest. Heel veel mensen maken zich ernstige zorgen over de gevolgen van het warmer worden van de aarde. Daarom zijn politici, wetenschappers, milieuorganisaties en ook scholieren heel erg geïnteresseerd in de sterkte van het broeikaseffect en de concentratie van koolstofdioxide (CO2). De koolstofdioxide die de mens uitstoot, zou ervoor kunnen zorgen dat het broeikaseffect sterker wordt, waardoor de aarde opwarmt. We zullen in deze module zien dat het bepalen van de CO2-concentratie nog niet zo gemakkelijk is. CO2 problemen Het broeikaseffect betekent dat er een hogere wereldwijde evenwichtstemperatuur is dan je zou verwachten op basis van de balans tussen eigen aardwarmte, zoninstraling en de uitstraling. De atmosfeer houdt dus wat warmte vast. Dit wordt veroorzaakt door gassen waarvan de moleculen uit meer dan 2 atomen bestaan. De belangrijkste in onze atmosfeer zijn water (H2O), koolstofdioxide (CO2), methaan (CH4), ozon (O3), distikstofoxide (N2O) en stikstofdioxide (NO2). Zonder deze gassen zou het op aarde te koud zijn om te leven, maar de planeet venus illustreert het andere uiterste: teveel broeikasgassen en daardoor een te hoge temperatuur voor leven. Waterdamp is het gas wat het grootste deel van het broeikaseffect veroorzaakt, daarna volgen koolstofdioxide en methaan. Waterdamp komt in de atmosfeer door verdamping van het vloeibare water wat we in enorme hoeveelheden in zeeën en oceanen vinden. Als de temperatuur stijgt, verdampt er meer water en ontstaat er meer waterdamp in de atmosfeer. Deze toename van waterdamp versterkt het broeikaseffect, waardoor de temperatuur nog verder stijgt. Een dergelijk versterkend proces noemen we positieve terugkoppeling. Koolstofdioxide komt vrij bij verbranding van koolstofhoudende stoffen en methaan komt los voor in het heelal,maar wordt op aarde voornamelijk bij zuurstofarme afbraak van biologisch materiaal gevormd en is het belangrijkste onderdeel van aardgas. Door het menselijk gebruik van fossiele grondstoffen zoals olie, steenkool en aardgas zijn deze laatste twee, en met name koolstofdioxide de laatste jaren erg gestegen. IPCC Er is ook een stijging in de wereldwijde temperatuur gemeten. In 2007 heeft het Intergovernemental Panel for Climate Change (IPCC) een rapport uitgebracht waarin duidelijk naar voren kwam dat het gebruik van fossiele brandstoffen door de mens het broeikaseffect versterkt en daardoor een belangrijke bijdrage levert aan de temperatuurstijging op aarde. Dit versterkte broeikaseffect heeft veel invloed op de mens en daarom zijn wetenschappers wereldwijd bezig met het meten van broeikasgassen. Met name CO2 metingen zijn interessant, omdat de stijging van de concentratie van dit gas voornamelijk door mensen wordt veroorzaakt. Koolstofdioxide is opgelost in natuurlijk water en bij hogere temperaturen zal hiervan ook meer in de atmosfeer komen. Gedeeltelijk is er bij CO2 ook sprake van een positief terugkoppelingseffect net als bij water. Dit komt omdat in warmer water minder koolstofdioxide opgelost kan worden. Volgens het IPCC is de grootste stijging veroorzaakt door menselijke factoren. Koolstofkringloop CO2 is van levensbelang. In elke levende cel zit koolstof in de moleculen van DNA, eiwit, vetten, suikers en vele andere belangrijke stoffen. Al deze koolstof is uiteindelijk via fotosynthese afkomstig uit CO2 aanwezig in de lucht. Fotosynthese vind plaats in planten maar ook in heel veel andere vaak simpele eukaryoten en prokaryoten die in water of waterrijke plekken leven. Bij verbranding komt de koolstof in cellen weer vrij als CO2. Het proces dat de koolstof steeds van de levende wezens door middel van verbranding weer in de lucht gaat en dat planten het weer vastleggen door fotosynthese heet de koolstofkringloop. De koolstofkringloop wordt een beetje gebroken doordat een gedeelte van de koolstof die vastgelegd wordt in levende wezens niet verbrand wordt maar in de bodem langzaam fossiel wordt. In het verleden is dit in grote hoeveelheden gebeurd. Gedurende miljoenen jaren zijn grote pakketten dood organisch materiaal gefossiliseerd. Het fossiele koolstof zit tegenwoordig in kalksteen en de fossiele brandstoffen zoals bijvoorbeeld steenkool. Door de fossiele brandstoffen te verbranden, brengen we dus koolstof (in de vorm van CO2) in de atmosfeer die miljoenen jaren geleden uit de atmosfeer is gehaald door planten. Voor fotosynthese is zonlicht nodig, waardoor het alleen overdag plaatsvindt. Gedurende de dag wordt er dus in theorie koolstofdioxide gebruikt in de fotosynthese waardoor overdag de CO2 concentratie kan dalen. Gedurende de nacht zal de CO2-concentratie stijgen, omdat er dan wel verbranding plaatsvindt maar geen fotosynthese. In werkelijkheid is dit verhaal te simpel. Er kunnen grote lokale verschillen zijn: in een stad waar veel auto’s en ander vormen van verbranding zijn, kan overdag ook een netto koolstofdioxide uitstoot zijn. Ook tussen de seizoenen kunnen er grote verschillen zijn en andere factoren, zoals temperatuur, windkracht en richting en zonnekracht, spelen ook een rol. Er zijn dus veel factoren om rekening mee te houden als je naar de CO2concentratie in de lucht gaat kijken. Meetapparatuur De CO2-concentratie wordt gemeten met de zogenaamde Vaisala Carbocap GMP343. Deze detector wordt veel gebruikt in kassen om de luchtsamenstelling in de gaten te houden. Voor de continue metingen is de Vaisala op het dak van de scholen bevestigd. De Vaisala is maar 20 cm groot en is daardoor ook uitermate geschikt om metingen op andere plaatsen te doen, zoals in een klaslokaal of bij een weiland. De Vaisala is een zogenaamde 'non-dispersive infra-red' sensor. In de Vaisala zit een lamp die infrarood licht uitzendt. Dit licht wordt door een spiegel teruggekaatst naar een detector voor infrarood licht. Onderweg komt het licht de CO2-moleculen in de lucht tegen, die een deel van dit licht absorberen. De infrarooddetector zal dus een lagere lichtsterkte meten dan de lamp heeft uitgezonden. Dit verschil in intensiteit is een maat voor het aantal CO2-moleculen dat het licht tegen is gekomen en dus voor de CO2-concentratie in de lucht. Op elke school is ook een Davis Vantage PRO weerstation geplaatst. Dit weerstation stuurt waardes voor de luchtdruk, temperatuur en de luchtvochtigheid door naar de Vaisala. De Vaisala heeft deze gegevens nodig om de CO2-metingen te compenseren. Dit is het makkelijkste uit te leggen aan de hand van een voorbeeld. Als de luchtdruk in de Vaisala stijgt, dan betekent dat dat er meer luchtdeeltjes in dezelfde ruimte zitten. Dus ook meer CO2-moleculen. Hierdoor meet de Vaisala meer CO2-moleculen bij een hogere luchtdruk. Omdat je de CO2-concentratie onafhankelijk van de luchtdruk wilt weten, stuur het weerstation de waarde voor de luchtdruk naar de Vaisala. De Vaisala rekent vervolgens de CO2concentratie om naar een vaste waarde voor de luchtdruk. Het weerstation houdt ook andere factoren bij, zoals de hoeveelheid regen, de windrichting en de windsnelheid. SchoolCO2web metingen Er zijn een aantal middelbare scholen in Nederland en Europa die bezig zijn met het meten van de koolstofdioxideconcentratie in de lucht. Deze gegevens kunnen vervolgens voor de wetenschap gebruikt worden. In deze module gaan we kritisch kijken naar de meetwaarden die zij van hun meetstations krijgen. De CO2 waarden die gemeten worden, variëren per uur, per dag, per seizoen en per jaar. Het is hierdoor moeilijk om goede gemiddelden te bepalen en daarmee te kijken of de hoeveelheid CO2 in de atmosfeer echt stijgt. Naast de koolstofdioxideconcentratie meten de stations ook windrichting, windsnelheid, temperatuur van de buitenlucht en het station zelf en de luchtdruk. Deze factoren kunnen allemaal invloed hebben op de gemeten CO2 waarden en moeten daarom ook gemeten worden. Laten we eens gaan kijken naar de gemeten waarden van een van deze scholen. Je vindt deze waarden in het Excel bestand [CO2waarden] en ze zijn hieronder afgebeeld in een grafiek. Deze grafiek bestaat uit een reeks van metingen in de periode van 30 januari tot aan 3 april. Elke 15 minuten is er een meting uitgevoerd. In totaal zijn er dus meer dan 3000 meetmomenten met elke keer alle eerder genoemde gemeten factoren. In de grafiek zie je de zogenaamde ruwe data verwerkt. Deze grafiek is echter niet zo heel erg waardevol. Waarom? Dit komt onder andere omdat er geen eenheden op de y-as staan. omdat de gegevens niet ongeveer dezelfde orde grote hebben en omdat er gewoon teveel gegevens met elkaar samen in een grafiek zijn afgebeeld. Om het allemaal wat duidelijker te maken, gaan we eerst eens kijken naar een kleinere hoeveelheid informatie. De hoeveelheid is op veel verschillende manieren te verkleinen bijvoorbeeld door naar een kleiner tijdsinterval te kijken en een aantal variabelen te verwijderen. De grafiek van 3 dagen zie je hieronder. Deze grafiek mag dan iets duidelijker zijn omdat er minder data in verwerkt is, je kan er niet zoveel mee. Zeker voor klimaatonderzoek is een grafiek van 3 dagen wel erg weinig. We willen juist lange termijn metingen hebben om te kijken of de CO2-concentratie gemiddeld genomen echt toeneemt. Toch is er in deze korte grafiek wel iets opvallends te zien. Welke conclusies kun je trekken op basis van deze gegevens? Je hebt gezien dat er gedurende de dag een verandering optreedt in de CO2-concentratie. Het lijkt erop dat gedurende de nacht het CO2-gehalte toeneemt en tijdens de dag afneemt. We gaan kijken en bedenken waar dit aan kan liggen. Lees hiervoor ook het kader ‘de meetapparatuur’ op pagina 4. - Opdracht 1 Welke factoren zouden van invloed kunnen zijn op de CO2-concentratie? - Wat zal de grootste invloed zijn? - Welke factoren vind je direct terug in de meetgegevens? - Vind je aanwijzingen in de meetgegevens waarmee je denkt duidelijk te kunnen bewijzen wat de grootste invloed heeft? - Zijn er in de meetgegevens nog andere waarden die je idee ondersteunen? - Zijn er ook meetgegevens die je idee juist onderuithalen? Hoewel je misschien een aantal van deze vragen al wel kunt behandelen zul je deze module hulpmiddelen leren bij het vinden van antwoorden en de goede onderbouwing van je antwoorden. De grafiek loopt slechts over 3 dagen aan het begin van het jaar. De verschillen tussen dag en nacht zullen kleiner zijn een dan paar maanden later. Dan zal het warmer zijn en de planten groeien en daarmee koolstof uit de lucht halen. We gaan nu leren hoe je zelf zo een grafiek kunt maken in het programma Excel. Grafieken Grafieken of diagrammen zijn een ideale manier om data duidelijk en overzichtelijk weer te geven. Een goede grafiek kan duidelijkheid geven. Maar grafieken kunnen ook verkeerd gebruikt worden. De verkeerde grafiekvorm voor het type gegevens, essentiële gegeven vergeten, verkeerde waarden, getallen van verschillende orde grootte in een grafiek of verschillende eenheden op een as kunnen allemaal tot verkeerde conclusies leiden. In rekenprogramma’s zoals Excel kun je vaak een groot aantal type grafieken maken. Denk goed na welk type het best bij jouw gegevens past. Opdracht 2 Maken van grafieken in Excel Let op: onderstaande voorbeeld gaat uit van Excel 2007. Er zijn veel andere versies en programma’s in omloop. De meeste programma’s werken in grote lijnen hetzelfde. Vraag hulp van een docent als je er niet uitkomt. Open [grafiekmaken.xls]. Je ziet nu een tabel. Dit is het rekenblad of in het Engels spreadsheet. Verticaal lopen de kolommen. Ze zijn van links naar rechts op alfabet gelabeld en horizontaal lopen de rijen die van boven naar beneden genummerd zijn. Om een grafiek te maken, doorloop je de volgende stappen: - Selecteer met de muis het gedeelte van het rekenblad waarvan je de grafiek wilt maken - Ga naar invoegen en kies voor grafieken - Kies hier voor een type grafiek - Druk op ok - Bekijk het resultaat - Herhaal dit nu enkele malen en maak steeds een ander type grafiek Maak nu een grafiek van de CO2 metingen. Dit doe je als volgt: - Open het bestand MeetgegevensCO2.xls Op de eerste rij staan de namen van de parameters, zodat je weet wat er in elke kolom voor informatie te vinden is. De rijen eronder zijn de gegevens van elk meetmoment. Onderaan zie je een tabje met de namen van de scholen en het onderzoeksinstituut. Als je daarop klikt, zie je de gegevens van deze meetlocaties. Maak nu een grafiek van de CO2 metingen van alle meetlocaties. - Selecteer met de muis het gedeelte van het rekenblad waarvan je de grafiek wilt maken in dit geval is dat dus alles - Ga naar invoegen en kies voor grafieken - Kies hier voor spreiding met losse datapunten - Druk op ok - Bekijk het resultaat Als het goed is, heb je nu een grafiek die er ongeveer hetzelfde uitziet als de grafiek van de ruwe data op de volgende pagina. Je kunt nu om de grafiek duidelijker te maken een aantal meetvariabelen weg halen. Dit doe je door de cursor op een van de meetpunten met de linkermuisknop te selecteren en met de rechter muisknop te klikken en dan verwijderen. Een aantal waarden kun je veilig verwijderen: luchtdruk. Opdracht 3 We gaan nu kijken naar een grafiek van drie locaties. Deze hoef je nu nog niet zelf te maken maar vind je op het grafieken tabblad en hij is hieronder ook afgebeeld. Het Maartenscollege bevindt zich in Haren vlak buiten Groningen (stad), het Willem Lodewijk Gymnasium in hartje Groningen en het CIO is de testopstelling op het Centrum voor Isotopen Onderzoek aan de rand van Groningen op het Zernike universiteitsterrein. Een aantal zaken zullen opvallen in de grafiek. - Schrijf voor jezelf de 5 meest opvallende punten van de grafiek op - Bedenk voor elk punt een verklaring - Ga nu pas overleggen met een medeleerling - Bespreek de uitkomsten met de docent Deze grafiek geeft maar twee typen data, namelijk de tijd en de CO2-concentratie. Je ziet hier dus niet waar de wisseling in CO2 door veroorzaakt kan worden. Je hebt nu gezien dat ruwe data en zelfs grafieken niet altijd een duidelijk beeld geven. In de volgende lessen ga je kennis maken met een aantal statistische technieken die je kunnen helpen bij het kritisch analyseren van dergelijke complexe data. Statistiek Statistiek is een vorm van wiskunde die toegepast wordt om informatie uit ruwe data te krijgen. Het is de wetenschap en techniek die zich bezighoudt met het verzamelen, bewerken, interpreteren en presenteren van gegevens. Statistiek is oorspronkelijk begonnen toen men onderzoek ging doen naar de bevolking van landen en met kleine steekproeven toch iets over de gehele bevolking wilde zeggen of wanneer juist gehele bevolkingsonderzoeken geen duidelijke antwoorden gaven. Statistiek is tegenwoordig een grote en belangrijke tak van de wiskunde en bijna geen wetenschapsgebied kan zonder Elke dag vind je voorbeelden van statistiek in de krant en op het journaal in de vorm van enquêtes, percentages en gemiddelden. Door statistiek kun je uit veel informatie een simpel en duidelijk antwoord krijgen. Stel: je hebt een enquête gehouden onder 1456 mensen en 290 mensen hebben aangegeven dat ze 7 keer per week douchen. Je kan in de krant deze getallen opschrijven maar je mag ook zeggen dat 20% van de deelnemers 7 keer in de week doucht. Dit laatste is overzichtelijker. Dergelijke onderzoeken worden meestal gedaan om iets over een grotere groep te kunnen zeggen. In het douche voorbeeld zou het een onderzoek kunnen zijn om iets te weten te komen over het douche gedrag van de Nederlanders. Als je een kleine groep onderzoekt, om iets over een veel grotere groep te weten te krijgen, noem je dat een steekproef. De gehele groep noem je meestal de populatie of totale verzameling. Je zult bij de opgaven zien dat je goed moet nadenken over je steekproef. Zo moet een steekproef representatief zijn voor de groep waar je iets over wilt weten. Dat betekent dat de steekproef lijkt op een kleine versie van de gehele populatie. Maar het is verkeerd om dan de deelnemers te selecteren om dat deze waarschijnlijk de populatie goed vertegenwoordigen. Dit omdat je dan voor je onderzoek start al bepaalt wie er eigenschappen hebben die waarschijnlijk voldoen aan de verwachting die jij hebt van de populatie. Voor een goed onderzoek moet je duidelijk bepalen wat de populatie is en dan een voldoende grote steekproef nemen op door toeval bepaalde individuen van de populatie. Dit heet een willekeurige steekproef. Bij klimaatonderzoek spelen zowel hele grote hoeveelheden data een rol als ook het probleem van steekproeven. Een meetstation meet immers maar op één plek in de ruimte. Met deze plek probeer je een uitspraak te doen over een veel groter omliggend gebied en vormt daarom een steekproef. Alle meetstations op de wereld vormen samen een reeks van steekproeven. Dat zijn er een heleboel. Bovendien meet elk meetstation regelmatig en meerdere parameters, waardoor er een enorme hoeveelheid data gegenereerd wordt. Vaak worden er meerdere statistische bewerkingen op de oorspronkelijke waarnemingen of metingen los gelaten. Het is belangrijk je altijd te realiseren waar je nu mee werkt: de oorspronkelijke of de bewerkte data. In de praktijk noemt men de data die direct door een meter gemeten wordt of de directe waarnemingen de ruwe data. Het gebruik van statistiek vraagt een kritische houding van zowel degene die de ruwe data bewerkt als degene die het uiteindelijk leest. Je gaat nu aan de hand van een aantal opdrachten kennis maken met statistische bewerkingen. Meetfout en significantie van getallen. Opdracht 4 Let op: het is belangrijk dat je de eerste stappen van de volgende proef alleen doet zonder overleg. Je krijgt van je docent een blokje metaal. Bepaal het volume van het blokje op een van de volgende manieren. Doe dit zo precies mogelijk. Als je klaar bent met het blokje geef je het aan een klasgenoot zodat iedereen precies het zelfde blokje meet. - Meet met een geodriehoek de drie dimensies en bereken het volume via V=LxBxH - Meet met een (pressie) schuifmaat en bereken via V=LxBxH - Vul een maatbeker met water en lees het volume van het water af. Als je nu het blokje in het water doet, zal het water zoveel stijgen als het blokje verplaatst. Lees het volume af nadat het blokje helemaal onder water is verdwenen. Door het eerste volume van het laatste volume af te trekken krijg je het volume van het blokje Vergelijk de waarden met die van je klasgenoten. Ze zullen niet allemaal hetzelfde zijn. Omdat elke meetmethode een kleine fout oplevert, werk je bij het doen van metingen met een standaard meetfout. Deze meetfout is een veilige schatting van de mogelijke fout bij metingen. De meetfout zit meestal tussen 1 schaaldeel en 0.5 schaaldeel. Voor metingen waar je de schaaldelen gemakkelijk kunt onderscheiden, is een half schaaldeel meestal genoeg. Als het moeilijker te onderscheiden is, ga je naar 1 schaaldeel. Dit betekent in de praktijk dat waneer je met een liniaal gaat meten waarop centimeters als kleinste schaaldeel is aangegeven dat je dus een halve centimeter als meetfout neemt. Dus: als je 20 cm meet dan schrijf je op: 20 cm +/- 0.5 cm. Als je hier vervolgens mee gaat verder rekenen, moet je steeds met het hoogste en het laagste getal rekenen. In dit voorbeeld dus 19,5 cm en 20,5 cm. Voor elektronische meetapparatuur staat vaak in de handleiding wat de meetfout is. Significantie van getallen Een andere manier om met de (on)nauwkeurigheid van je waarneming om te gaan is alleen de significante of redelijkerwijs echt waargenomen waarden te noteren. Deze methode word vaker gebruikt dan steeds de meetfout aan te geven. Een van de redenen is dat als je met meetfouten gaat rekenen je per meetwaarde steeds twee getallen mee moet laten tellen, door consequent om te gaan met de significantie van getallen hoeft dit niet. Wat houdt significantie van getallen in? Cijfers worden door niet-wetenschappers (of slechte wetenschappers) vaak met te grote precisie weergegeven, terwijl er 2 cm is waargenomen wordt er toch 2,00 cm genoteerd. Dit is niet correct. Het suggereert namelijk een grotere meetnauwkeurigheid dan de nauwkeurigheid van de werkelijke meting. Bij gemeten waarden is het belangrijk de significante getallen te noteren. Het eerste cijfer van een getal heeft de grootste significantie en de getallen er na steeds minder. Bij het getal 259,8 heeft twee dus de hoogste significantie en 8 de laagste. Wat de significantie van de getallen zijn, hangt af van de meting ,maar significante getallen moet binnen de foutenmarges blijven. Als de meetfout van een weegschaal 0,05 gram is, dan zijn de cijfers die een positie hebben van meer dan 2 cijfers achter de komma sowieso niet significant. In de beschrijvende natuurwetenschap worden getallen op een andere manier behandeld dan in de zuivere wiskunde. In de wiskunde betekent het getal 20 precies 20 en is dus gelijk aan 20,00000000… met een oneindig aantal nullen achter de komma. In alle andere wetenschap betekent 20 eigenlijk dat we weten dat het ongeveer 20 is. Wiskunde houdt zich bezig met zuivere getallen en is zuiver logisch van aard terwijl de andere wetenschappen empirisch van aard zijn. Empirisch betekent: gebaseerd op waarnemingen. De waarnemingen zijn nooit perfect zuiver maar er is wel te schatten hoe onzuiver de metingen zijn. Als je van een thermometer bijvoorbeeld 20oC afleest en opschrijft dat de temperatuur 20,00oC is, ben je eigenlijk te precies. Immers, je zegt dat de temperatuur 20,00 is, niet 20,01 of 19,99. Je liegt dus eigenlijk dat je het zo precies weet. Als je op de gemeten waarden berekeningen gaat toepassen, kun je pas echt in de problemen komen. (waarom? Omdat de onnauwkeurigheid dan nog verder toeneemt) Om erg grote getallen of juist getallen tussen 1 en 0 met veel cijfers achter de komma weer te geven, gebruiken we de zogenaamde wetenschappelijke notitiemethode. Deze heb je waarschijnlijk al eens gebruikt of gezien. Hij ziet er als volgt uit: 3,6 x 1032 . Dit betekent dan 36 met 31 nullen. De rekenregels voor meetfout, significante getallen en de wetenschappelijke methode staan in het kader hiernaast. Voorbeeld: Je meet het groeien van een boom van zaadje tot volwassen boom en je meet het elk jaar. In tien jaar is de boom tot 20,5 m gegroeid. De gemiddelde groeisnelheid is dan dus 20,5m/10 Jaar= 2,05 m/jaar. Omdat Meter per Jaar geen standaardmaat is, wil je ze nu omrekenen naar km/uur. 2,05m is 0,00205 km en een jaar is 6766 uur dus 0,00205km/6766uur = 0,00000030292324850769. Dit is duidelijk niet correct. Opdracht 5 Maak de som met de boom met de juiste significantie. Kalibreren van meetapparatuur Alle meetapparatuur moet minimaal eens gekalibreerd zijn. Kalibratie van meetapparatuur is synoniem met het woord ijken en betekent dat je het meetinstrument zo instelt dat het de juiste meetwaardes aangeeft en niet te grote foutmarges heeft. Je gebruikt hiervoor een standaardmaat. Rekenregels De regel voor het rekenen met twee meetwaarden met elk een meetfout is eigenlijk vrij simpel: de relatieve meetfout van het resultaat is nooit kleiner dan de meetfout van de waarden waaruit het berekend is. Dit betekent dat je bij optellen de twee grootste meetfouten bij elkaar optelt en de twee kleinste bij elkaar optelt. Bij aftrekken moet je juist het grootste van het kleinste getal aftrekken en het kleinste van het grootste. Dat levert het grootste verschil op. Ook bij vermenigvuldigen en delen ga je op zoek naar het grootste verschil. Dus bij vermenigvuldigen grootste maal grootste en kleinste maal kleinste en bij delen kleinste delen door de grootste en grootste delen door de kleinste. Voorbeeld: Ik wil de snelheid bepalen van een slak. Ik meet daarvoor een afstand en een tijd. De afstand meet ik met een lineaal waarop de eenheden cm zijn. Ik neem daarom een meetfout van een halve cm. De afstand is: 20 cm en de waarden met meetfout zijn dus 19,5 cm en 20,5 cm. De tijd die de slak over deze afstand doet meet ik met mijn horloge met secondewijzer. Omdat het lastig is af te lezen neem ik als meetfout 1 schaaldeel, 1 seconde dus. Ik zie dat de slak er 360 seconden over doet, met meetfout dus 359 sec of 361 sec. De berekening is nu als volgt: 19,5/361=0,0540 cm/sec & 20,5/359=0,0571 cm/sec Significante cijfers De regels voor het rekenen met significante cijfers is dat het aantal significante cijfers van het resultaat gelijk is aan het aantal significante cijfers van de meetwaarde met het minste significante cijfers. Het aantal significante cijfers neemt dus nooit toe. Voorbeeld: Ik heb de snelheid van de slak weer eens gemeten in cm. De slak kroop 25 cm in 330 seconden. De snelheid is dus 25/330=0,0757575 cm/sec maar omdat ik een meting heb met maar twee significante cijfers mag ik dat niet zo opschrijven. Ik moet daar van maken 0,075 cm/sec of nog beter gebruik maken van de wetenschappelijke notitie 7,5 x 10-2. De wetenschappelijk methode is altijd de beste methode om grote getallen te noteren omdat meteen duidelijk is hoeveel cijfers achter de komma of hoeveel nullen er bij een getal horen. Let op! Ook als je wel met meetfouten rekent, moet het aantal significante cijfers gelijk zijn aan het aantal significante cijfers van het getal met de minste aantal significante cijfers waarmee je hebt gerekend. Het beste is om met meetfouten te werken en de significante cijfers in de gaten houden. Deze meet je met het te ijken instrument en daarna pas je eventueel het instrument aan op de juiste waarde. Veel onderzoeksinstrumenten moeten regelmatig geijkt worden, omdat ze na verloop van tijd een flinke afwijking kunnen krijgen. Een niet goed gekalibreerd instrument kan grote fouten opleveren in de metingen. De gegevens waarmee je hier werkt, zijn verkregen met niet optimaal geijkte apparatuur. Er wordt vermoed dat met name die van de scholen daardoor wel eens iets hoger zou kunnen uitvallen dan de werkelijke concentratie. De gemiddelde concentratie op aarde is ongeveer 370-390 ppm . Het zou ook kunnen dat er in Groningen stad gewoon een veel hogere koolstofdioxide concentratie is. Doordat er misschien niet goed geijkt is, kunnen we dat echter niet zeggen. Een niet gekalibreerd apparaat zal over het algemeen relatieve verschillen nog wel goed weergeven. Een thermometer mag misschien niet goed aangeven dat het kookpunt 100oC is, maar een temperatuur stijging zal nog steeds weergegeven worden. Het is verstandig om grotere foutenmarges te gebruiken als apparatuur niet goed geijkt is. Significantie in de statistiek Let op: significantie betekent in de statistiek, behalve significantie van getallen ook nog iets anders. In de statistiek wordt gezegd dat een bepaald experimenteel resultaat significant is als de kans dat hetzelfde resultaat door toeval verklaard kan worden erg klein is. Stel: ik wil bewijzen dat een dobbelsteen verzwaard is. Ik werp de dobbelsteen 600 keer. Op basis van het toeval verwacht je dat je van die 600 keer 100 keer een 6 gooit. Als ik in het experiment nu 102 keer een 6 gooi, is dat maar een kleine afwijking van het aantal wat je op basis van toeval mag verwachten. Stel: ik zou 500 keer een 6 hebben gegooid, dan is dat een erg groot verschil met de verwachte toevalswaarde en mag je gerust aannemen dat de dobbelsteen zo verzwaard is dat er vaker een 6 naar boven zal komen. Maar stel nu dat er 110 keer 6 gegooid is? Of misschien zelfs 150 keer? Of je dan gerust kunt stellen dat de dobbelsteen verzwaard is, is een moeilijke zaak. Statistici hebben daarvoor tests bedacht en verbinden aan die tests ook onzekerheden ofwel de kans dat een bepaald resultaat toch door toeval bepaald is. Meestal is deze kans gesteld op minder dan 1% maar soms kom je ook 5% tegen of juist 0.1%. Veel hoger dan 5% is meestal niet erg betrouwbaar. Nogmaals: een bepaald resultaat is significant als het erg onwaarschijnlijk is dat hetzelfde resultaat door toeval bepaald is. Significante cijfers zijn die cijfers waar je van mag aan nemen dat ze ook echt waargenomen zijn of berekend zijn volgens de regels uit waarnemingen met significante cijfers. Centrummaten Een belangrijke term die heel veel wordt gebruikt is het gemiddelde. Het een voorbeeld van een zogenaamde centrummaat. Centrummaten zijn statische gereedschappen om iets algemeens over een verzameling gegevens te kunnen zeggen, namelijk waar het midden van de verzameling is. Gemiddelde Met het gemiddelde wordt meestal het rekenkundig gemiddelde bedoeld. Het rekenkundig gemiddelde is niet het enige type gemiddelde. Zo zijn er ook het harmonisch, meetkundig, gewogen en getrimd gemiddelde. Het rekenkundige gemiddelde bereken je door alle getallen van de verzameling op te tellen en daarna te delen door het totaal aantal. Bij een proefwerk zijn de volgende cijfers gehaald: 4 , 4 , 5 , 5 , 6 , 6 , 6 , 7 , 7 , 7 , 7 , 8 , 9 . Gemiddeld is het dan 5,7. Het gemiddelde wordt van de centrummaten waarschijnlijk het meest gebruikt. Ook jij heb waarschijnlijk al voor van alles en nog wat een gemiddelde uitgerekend. Maar pas op: een gemiddelde alleen kan verraderlijke informatie zijn. Mediaan De mediaan is het middelste getal in een verzameling die op volgorde van grote is gesorteerd. In een klas zijn bijvoorbeeld de volgende cijfers gehaald: 4 , 4 , 5 , 5 , 6 , 6 , 6 , 7 , 7 , 7 , 7 , 8 , 9 . Het onderstreepte getal is de mediaan. Als er een even aantal waarden zijn is de mediaan het gemiddelde van de twee middelste getallen. Modus Modus is het getal wat het meest voorkomt in een verzameling getallen. In het bovenstaande voorbeeld komt 7 het vaakst voor en is dus de modus. De modus wordt onder andere gebruikt als centrummaat bij loonverdeling. Het modaal loon is het loon wat het meest verdient wordt. Als je bij loon een gemiddelde zou nemen zou het veel hoger uit komen door dat er maar een kleine groep wel heel veel verdient. Het modaal loon zegt dus meer over wat de meeste Nederlanders verdienen en is in dit geval nuttiger dan het gemiddelde. Standaard afwijking Standaardafwijking of standaarddeviatie zoals het vaker wordt genoemd is een maat voor afwijking van het gemiddelde. En het is een belangrijke maat. Stel: we vergelijken drie klassen in een experimenteel schoolsysteem met elkaar. Het gaat om brugklassen die allemaal hetzelfde niveau (havo) hebben gehad. In de tweede klas blijven de leerlingen bij elkaar in dezelfde klas maar de beste Klas 1a 1b 1c klas krijgt les op VWO niveau en als er een klas is die gemiddeld lager scoort, /Ll# gaan die naar een lager niveau. In klas 1a is het gemiddelde cijfer op Havo niveau een 6, in klas 1b is het gemiddelde 6 en in klas 1c is het gemiddelde cijfer een 7. 1 5 4 9 Op basis van deze gemiddelden lijkt het een goed idee om klas 1c naar het 2 7 3 9 hogere niveau te brengen. Maar laten we eens naar de cijfers van de verschillende klassen kijken. 3 6 4 4 - Opdracht 6 Is het, gezien de cijfers verstandig om de leerlingen van 1b op hetzelfde niveau te houden? - En moeten de leerlingen van 1c wel naar een hoger niveau? 4 6 9 6 5 7 9 9 6 6 3 9 7 5 8 8 8 6 8 10 9 6 4 7 10 6 4 5 11 6 9 7 12 7 4 3 13 5 9 5 gem - Klik nu op de cellen waar de gemiddelden, standaarddeviaties, mediaan 6en modus 6 7afgebeeld zijn. Je ziet nu als het goed is de gebruikte formule bovenin de formulebalk. Zoals je merkt zou het handig zijn om bij het gemiddelde ook een maat te krijgen die uitdrukt in hoeverre de gegevens afwijken van dit gemiddelde. Gelukkig is er de zogenaamd standaarddeviatie. De standaarddeviatie geeft aan hoeveel de waarden waarvan je het gemiddelde hebt genomen gemiddeld afwijken. De standaarddeviatie is een nuttige waarde als je gemiddelden met elkaar wilt vergelijken. Meestal wordt namelijk gesteld dat twee gemiddelden echt van elkaar verschillen als de gemiddelden meer dan de standaarddeviatie van elkaar verschillen. Het berekenen van gemiddelden en standaarddeviaties is erg makkelijk in Excel. - Open hiervoor bestand [klassen 1] Je kunt dit als voorbeeld gebruiken bij de volgende opdracht waar we het gemiddelde gaan berekenen van de CO2 concentratie van de diverse scholen. Opdracht 7 Gemiddelden In Excel kun je vrij gemakkelijk gemiddelden berekenen. - Maak eerst een nieuw tabblad aan. Dit doe je door onderaan het rekenblad van Excel op een tab te klikken met je rechter muisknop en dan nieuw tabblad te kiezen. Noem dit blad “weekgemiddelden” - Bereken nu de gemiddelde CO2-concentratie over een week. Doe dit als volgt: zoek het laatste meetpunt van een week en zet in de lege cel naast alle meetpunten de volgende formule =gemiddelde(b2:b350) dit is een week. De cel nummers (B2) hangen af van het gemiddelde dat je wilt berekenen. B2 betekend hier kolom B rij 2. Als het goed is zie je nu het gemiddelde van deze cellen verschijnen. Hier komt een getal uit met te veel significante cijfers in Excel kun je gemakkelijk aangeven hoeveel getallen achter de komma je wenst. Klik met de rechter muis de kolom of cel aan en kies voor celopties; kies dan voor wetenschappelijk en kies het juiste aantal cijfers achter de komma. - Maak nu een nieuwe rij aan en plaats nu in de cel ernaast de formule =stdev(b2:b350). Hiermee bereken je de standaardafwijking. - Je kunt beide formules ook vinden onder de formule knop naast de formule balk. Hier vind je nog veel meer formules - Kopieer nu beide formules en zet ze op het laatste meetpunt van elke week. Pas de formule eventueel aan, want niet elke week heeft evenveel meetpunten. Dit kan best veel werk zijn! - Herhaal dit voor elke meetlocatie - Kopieer dit nu naar het nieuwe tabblad. Let op: dit kopieren gaat niet zomaar! Als je een formule gebruikt, die ergens naar verwijst op een rekenblad, geldt die verwijzing alleen op dat rekenblad. Daarom kun je het beste kiezen voor speciaal plakken en dan verwijzing plakken. - Maak nu een staafdiagram van de gegevens. Probeer de standaarddeviatie als foutenbalken in de grafiek te verwerken. Als het goed is krijg je dan een diagram die er ongeveer zo uitziet als degene die hieronder is afgebeeld. Hopelijk valt het je op dat op alle meetlocaties er in week 7 iets afwijkends aan de hand is. Zowel de gemiddelde concentratie als de standaard afwijking is overal hoger. Dergelijke afwijkingen kunnen een aanwijzing zijn voor een interessant verband. Als er bijvoorbeeld in die week ook net hogere temperaturen of meer neerslag is gevallen, kan het zijn dat die factor altijd is verbonden met de CO2 concentratie. CO2 in PPM Correlatie Heel vaak is het belangrijk om te bepalen of gemeten factoren met elkaar samenhangen. In klimaatonderzoek bijvoorbeeld de CO2 concentratie en de temperatuur. De mate van samenhang noemt men de correlatiecoëfficiënt. Deze varieert tussen -1 en 1. 0 betekent geen correlatie en dus zijn de factoren onafhankelijk van elkaar. -1 is het sterkste negatieve verband en 1 is het sterkste positieve verband. Als twee parameters een sterke (-1 of 1) corelatie hebben, betekent dat dat je op basis van de ene parameter de andere parameter moet kunnen voorspellen. Hoe beter de voorspelling klopt, hoe hoger het correlatiecoëfficiënt. De correlatie tussen parameters is te bepalen, maar vergt lastig rekenwerk. Gelukkig kunnen we met Excel de correlatie van twee parameters bepalen. Het bepalen van een correlatie tussen twee meetfactoren is een sterke techniek, maar kan gemakkelijk tot verkeerde conclusies leiden. Beroemd voorbeeld van een duidelijke correlatie is dat het aantal ooievaars in Zuid-Zweden en het aantal geboortes van mensenkinderen. Het bleek dat als er meer ooievaars waren dat er dan ook meer baby’s werden geboren. Andersom betekende minder ooievaars minder baby’s. Nu dacht niemand dat hier een causaal verband tussen was (causaal betekend oorzakelijk, doordat…) maar voorbeelden waar men deze denkfout wel maakt zijn er genoeg. In het voorbeeld van de ooievaren en baby’s bleek er later een logische verklaring te zijn voor de corelatie namelijk de temperatuur van het voorjaar. Beide factoren werden hierdoor beïnvloed. Een correlatie kan dus duiden op een verband, maar dat verband kan via nog een andere factor lopen die niet gemeten is. Stelregel: als twee parameters gecorreleerd zijn, wil dat nog niet zeggen dat ze ook oorzakelijk verbonden zijn. Let op : Een correlatie is altijd tussen numerieke variabelen zoals bijvoorbeeld lengte of temperatuur. Dus een correlatie is dus altijd in getallen uit te drukken. Je kan dus niet spreken van een correlatie tussen politieke voorkeur en het automerk wat mensen rijden. Het zou best kunnen zijn dat Mercedes rijders vaker VVD stemmen maar dat noemt men een statistische associatie en niet een correlatie. Een correlatie is een lineaire uitdrukking. Soms is er een verband maar is deze niet lineair. De hoeveelheid bacteriën in een medium en de tijd zijn zeker met elkaar verbonden maar het verband is exponentieel. Een correlatie zal hier alleen gevonden worden als een van de groei een logaritme word genomen waardoor deze weer lineair verloopt. Opdracht 8 In het vorige hoofdstuk heb je ontdekt dat er in week 7 van de metingen iets is gebeurd wat mogelijk interessant is. In deze week was er veel meer CO2 maar ook een grotere variatie in de concentratie. Je wilt nu gaan uitzoeken of deze afwijking verklaard kan worden door een van de factoren. Hiervoor kun je terug naar de meetwaarden of de grafiek van alle meetwaarden en kijken of er in die week ook andere factoren zijn die uitschieters laten zien. Het zal je al snel opvallen dat in week 7 een aantal factoren zich wat anders gedragen dan in de andere weken. Een factor is bijvoorbeeld de wind. In week 7 heeft het bijna niet gewaaid. Zou het kunnen dat wind ervoor zorgt dat er minder CO2 wordt gemeten? Om dat uit te zoeken gaan we kijken of beide factoren correleren. Dit doe je als volgt: - Ga naar het INVOEGEN menu - selecteer grafiek type spreiding zonder lijn - Ga nu naar gegevens selecteren met uit het menu wat je oproep met de rechtermuisknop op het grafiekgebied - Selecteer als x-as de kolom wind van een meetlocatie - Selecteer als y-as de kolom met de CO2-concentratie - Pas de assen aan. Minimum bij y-as moet 300 zijn en bij de x-as maximaal 15 - Voeg nu een trendlijn toe. In dit menu kun je ook R2 en formule toevoegen. Doe dit beide. De grafiek moet er ongeveer uitzien als de grafiek hieronder. Is de trendlijn aflopend, dus met een negatieve richtingscoëfficiënt, dan is er een negatieve correlatie. Dat betekent dat als een factor toeneemt, dat de ander dan afneemt. Neemt de trendlijn toe, dan is de correlatie positief. De R2 is een maat voor de sterkte van de correlatie. Als R2 0 is betekend het dat er geen correlatie is en 1 zou weer betekenen dat er totale correlatie is. Een waarde boven de 0.2 is la betrekkelijk goed. Zoals je ziet is er een duidelijke correlatie tussen windsnelheid en concentratie. Maar een correlatie betekent niet logischerwijs dat er ook een oorzakelijk verband is. In dit geval is dat er wel. Probeer een mogelijk mechanisme voor dit probleem te verzinnen. Denk weer eerst voor je zelf na. Overleg dan met een medeleerling en discussieer daarna met de hele klas. Kijk in de data of er nog meer mogelijke corelaties zijn. Onderzoek voor in ieder geval 1 weerparameter of deze gecorreleerd is met de CO2-concentratie. Welke factoren beïnvloeden de CO2-concentratie nog meer? Goede statistiek, slechte statistiek Statistiek is dus enorm belangrijk in de moderne maatschappij en wetenschap. Dat betekent niet dat het altijd even populair is. Een bekende uitspraak van de Amerikaanse schrijver Mark Twain is: “There are three kinds of lies: lies, damned lies, and statistics.” (Er zijn drie leugens: leugens, verdomde leugens en statistiek). Twain doelde hiermee op het feit dat je door middel van slinks gebruik van statistiek kunt liegen zonder echt te liegen en zelfs gewoon de waarheid vertellen. Bijvoorbeeld een dictator die beweert dat het gemiddelde inkomen onder zijn bewind enorm is gestegen, hoeft niet te liegen. Als hij ervoor heeft gezorgd dat een paar mensen heel erg rijk zijn geworden, dan halen die het gemiddelde enorm omhoog. De dictator liegt dus niet maar hij impliceert met de uitspraak natuurlijk dat hij ervoor heeft gezorgd dat de mensen van zijn land het veel beter hebben gekregen dan voor zijn bewind. Dat hoeft natuurlijk helemaal niet. De meeste mensen kunnen wel armer zijn geworden als het gemiddelde van inkomens omhoog is gegaan. Als arme mensen eerst net rond kunnen komen van bijvoorbeeld de 2 dollar per dag die ze verdienen en ze worden armer waardoor ze maar 1,75 dolar per dag te besteden hebben, kan dat betekenen dat ze omkomen van de honger. Er hoeven maar een paar miljonairs maar een paar procent meer te krijgen en het gemiddelde inkomen stijgt. Politici zijn dus gek op statistiek die in hun voordeel kan werken. Overigens zijn de meest politici niet zo fout als de eerder genoemde dictator maar ook een gewone politicus moet zijn mening met argumenten onderbouwen en een gedeelte van de argumenten bestaan uit statistiek waarmee je dus kunt misleiden. In de zuivere wetenschap is het de bedoeling dat statistiek duidelijkheid verschaft (daar is het voor ontwikkeld). In meer toegepaste wetenschap is dat ook het eerste doel, maar ook daar wordt statistiek soms gebruikt om bepaalde resultaten in een bepaalde richting te drukken. Geen enkele wetenschapper interpreteert zijn resultaten echter volledig waarde vrij. Een klimaatonderzoeker die zich erg druk maakt over de opwarming van de aarde, zal misschien eerder die statistiek gebruiken die in zijn voordeel werkt en onderzoekers die zich geen zorgen maken juist andersom. Klimaat onderzoek bestaat voor een belangrijk gedeelte uit het analyseren van enorme hoeveelheden data. Zoals je hebt gemerkt levert 3 locaties al een enorme hoeveelheid data op. Statistische Moord? Ook in rechtszaken speelt statistiek vaak een belangrijke rol. Een bekend voorbeeld uit 2007 is de zaak Lucia de B. Lucia was in 2003 tot levenslange gevangenisstraf veroordeeld voor meervoudige moord. Een belangrijk bewijs bleek het feit dat zij wel heel erg vaak aanwezig was als er een patiënt stierf. In een uitzending van het TV programma NOVA uit 2003 zegt de hoogleraar strafrecht Theo de Roos: "In de Lucia de B. zaak is het statistisch bewijs ontzettend belangrijk geweest. Ik zie niet hoe men zonder dat bewijs tot een veroordeling zou zijn gekomen." In de uitzending is ook de rechtspsycholoog Elffers aanwezig. Hij denk dat de de kans dat een verpleegkundige, werkzaam op de drie ziekenhuisafdelingen, bij toeval bij zoveel van de onverklaarbare overlijdensgevallen en reanimatie op élk van de drie afdelingen aanwezig is, één op 342 miljoen is. Deze psycholoog was ook aanwezig in de rechtszaal en heeft dergelijke statistiek daar gepresenteerd. Professionele statistici reageerden kwaad op de in hun ogen buitengewoon slechte statistiek die gebruikt werd in de rechtszaak. De Britse statisticus Phillip Dawid vindt dat de verkeerde gegevens op een verkeerde manier geïnterpreteerd zijn. Hij merkt op dat op basis van de gegevens ook geconcludeerd zou kunnen worden dat Lucia de B een buitengewoon goede verpleegster was. Op de afdeling waar ze nieuw kwam werken daalde het sterfte cijfer met 15%. Van 7 per jaar voor ze er werkte tot 6 in het jaar dat ze er werkte. Deze conclusie wordt echter niet getrokken, omdat iedereen dan meteen door heeft dat er slechte statistische analyses zijn uitgevoerd. Na dit commentaar van statistici en druk uit de samenleving werd de zaak heropend en de strafzaak is in 2008 opgeschort. Er is volgens veel profesoren in de statistiek een gebrek aan begrip van statistiek en kansrekening op belangrijke plekken in de maatschappij. Door goede toepassing van kansrekening en andere statistiek heeft Lucia haar vrijheid terug maar wie weet hoeveel meer mensen er zijn die ten onrechte bestraft worden als gevolg van de onwil van de samenleving om te luisteren naar experts op het gebied van de statistiek. Toch kun je op basis van deze drie plekken geen conclusies trekken over de wereldwijde CO2concentratie. Misschien kun je iets zeggen over Groningen en omstreken, maar of onze steekproef daar goed genoeg voor is? Statistiek is het middel om uit onderzoeksdata nuttige informatie te destilleren, maar kan dus gemakkelijk misbruikt of slecht begrepen worden. Hierdoor kan statistiek weer een middel worden waar mensen misbruik van kunnen maken. Het is daarom van groot belang dat je kritisch kijkt naar statistiek. Vertrouw het nooit zomaar maar stel de juiste vragen. Een paar kritische vragen die je kunt stellen, zijn: - Was de steekproef groot genoeg? - Was de steekproef representatief voor de genoemde populatie? - Wordt de juiste centrummaat gebruikt? - Wat is de standaardafwijking als er gemiddelden worden genoemd? - Is de correlatie tussen twee factoren ook causaal? - Is er acht geslagen op het gebruik van de juiste significantie van getallen? - Zijn de grafieken juist opgesteld en wordt relevante informatie weergegeven? - Is de onderzoeker en het uitgevoerde onderzoek betrouwbaar? Opdracht 9 Zoek in een krant 3 artikelen waarin statistische termen genoemd worden en beoordeel deze op de kritische punten die hierboven beschreven zijn. Kritisch kijken naar de CO2metingen en conclusies trekken Kritisch kijken betekent in de wetenschap niet alleen schoppen tegen een conclusie waar je het niet mee eens bent , maar ook dat je elke conclusie, dus ook je eigen conclusie met een beetje scepsis bekijkt. Zorg er dus voor dat je niet zomaar gelooft dat iets zus of zo in elkaar steekt zonder te begrijpen hoe men tot de conclusie is gekomen. Elke conclusie is een interpretatie van de feiten en kan dus onderuitgehaald worden door andere feiten. In de wetenschap is het belangrijk dat je aan kunt geven waar je kennis begint en ophoudt en met welke zekerheid je een bepaalde uitspraak doet. Opdracht 10 Het IPCC heeft jarenlang allerlei factoren van het klimaat gemeten. Je moet je voorstellen dat er duizenden meetstations zijn die elke dag soortgelijke metingen doen als de metingen waar je binnen deze module mee gewerkt hebt. Het IPCC heeft vervolgens alle gegevens verzameld en daar goede grafieken van proberen te maken. Een paar bekende grafieken staan hieronder afgebeeld. Beantwoord de vragen die erbij staan. De bovenstaande grafiek is afkomstig van een onderzoeks instituut in hawaii ver van de meeste industriële centra. Vraag 1 . Waardoor wordt de jaarlijkse fluctuatie veroorzaakt? Vraag 2. Stel de stijging zet zich met dezelfde snelheid voort wat zou het gemiddelde koolstofdioxide niveau nu ongeveer zijn? Een andere beroemde grafiek Vraag 3. Je ziet hier duidelijk dat de temperatuur en de CO2 concentratie gecorreleerd zijn maar kun je ook aanwijzingen vinden voor een causaal verband? Vraag 4. Zou je op basis van deze grafiek zeggen dat de temperatuur de CO2 concentratie verhoogd of juist dat de CO2 concentratie de temperatuur verhoogd?