Meetniveaus - Noordhoff Uitgevers

advertisement
© Noordhoff Uitgevers bv
STATISTIEK IN WOORDEN
Meetniveaus
Meten is het – volgens bepaalde regels – toekennen van getallen aan eigenschappen. We leggen een centimeter langs een voorwerp, lezen een getal af en noemen
dat de lengte van het voorwerp. Aan de eigenschap ‘lengte’ hebben we op die
manier een getal toegekend. Of we nemen iemand een test af, tellen het aantal
goed beantwoorde vragen en noemen dat het IQ.
Voorbeeld
De toegekende getallen kunnen in meerdere of mindere mate iets zeggen
over de ware hoeveelheid van de gemeten eigenschap. Het aantal centimeters
is eenduidig te interpreteren en zegt direct iets over de lengte van een voorwerp.
Een IQ-score daarentegen zegt minder over iemands ware intelligentie.
Neem als voorbeeld de volgende zin uit een krantenbericht: ‘Marathonloper nummer 254, de Italiaan Faustini, werd 3de in een tijd van 2 uur, 14 minuten en 28 seconden.’ In dit bericht staan drie getallen (254, 3, 2.14.28) die elk van een andere
kwaliteit zijn. Methodologen spreken van meetniveaus.
In het voorbeeld is 254 niets anders dan een label of etiket dat niet veel méér informatie verschaft dan de naam van de loper. Hoogstens kunnen we eruit afleiden dat
er vermoedelijk tenminste 254 deelnemers aan deze marathon waren.
Bij veel soorten onderzoek worden individuen ingedeeld in klassen, zoals: man /
vrouw, schizofreen / manisch-depressief / psychopaat, gehuwd / samenwonend /
gehuwd geweest / ongehuwd, provincie waar men woont. Zulke gegevens duiden
een niet-getalsmatige eigenschap (kwaliteit) aan; men noemt dit kwalitatieve
gegevens. Voor de verwerking van de gegevens per computer is het vaak handig
om hieraan een getalsmatige code te verbinden: mensen in de ene klasse krijgen
één getal en mensen in een andere klasse krijgen een ander getal. Hoe we die getallen toekennen is in feite willekeurig, zolang we de representanten van de verschillende klassen maar uit elkaar kunnen houden. Dus man = 0, vrouw = 1 is even goed
als man = 9, vrouw = 3 of man = X, vrouw = Y. Het toegekende getal zegt niets over
de mate van mannelijkheid of vrouwelijkheid. Het is, net als het rugnummer van de
marathonloper, niet anders dan een naam (Latijn: ‘nomen’) of een etiket. Dit indelen van individuen in kwalitatief verschillende klassen wordt nominaal meten genoemd, ofwel meting op een nominaal meetniveau.
Het uitvoeren van berekeningen heeft bij nominale gegevens weinig zin: het gemiddelde rugnummer van de marathonlopers zegt niets over de sterkte van het deelnemersveld. En wat dacht je van een groep met een gemiddeld geslacht van 3,98?
Faustini werd derde. Dit getal is van een andere orde dan zijn rugnummer en het
verschaft meer informatie over de marathonkwaliteiten van Faustini. We lezen
eraan af dat Faustini bij de betere lopers van deze wedstrijd hoorde. Daarmee
weten we nog niet welke tijd hij heeft gelopen, of dat dit voor hem misschien een
171
M
MEETNIVEAUS
© Noordhoff Uitgevers bv
persoonlijk record was. Hier is sprake van een ordinaal meetniveau: er zit een ordening in de getallen. Een hoger (of lager) getal betekent méér van een eigenschap.
Hoevéél meer, is echter niet eenduidig bepaald: 6 = 2 × 3, maar degene die zesde
werd is niet twee keer zo slecht als Faustini, en heeft er hoogstwaarschijnlijk niet
twee keer zo lang over gedaan. Evenals bij het nominale meetniveau, is de keuze
van de toe te kennen getallen tamelijk willekeurig. In het Nederlandse schoolsysteem ga je, naarmate je meer weet, van de eerste klas via de tweede naar de derde,
enzovoort. Bij sport is dat precies omgekeerd: naarmate een team beter wordt, promoveert het van de derde klasse naar de tweede, naar de eerste. De kwaliteit van
restaurants of de rangen in het leger worden aangegeven met meer of minder sterren. Zolang er maar een ‘natuurlijke volgorde’ in zit, is alles goed. Men spreekt dan
van een ordinale meetschaal of rangordeschaal.
Ordinale gegevens komen veel voor in sociaal-wetenschappelijk onderzoek. Dat betekent een complicatie voor de analyse van de gegevens. Want wat zegt het gemiddelde van een reeks getallen als niet duidelijk is wat die getallen precies inhouden?
Hoeveel hoger is de sociaal-economische klasse III dan de klasse IV? Doordat er
maar ‘weinig’ relaties tussen de getalswaarden bestaan, valt er ook ‘weinig informatie’ uit de gegevens te halen. De meeste klassieke statistische technieken zijn alleen van toepassing op gegevens van een hoger meetniveau. De niet-parametrische (of verdelingsvrije) methoden en de niet-lineaire multivariate technieken,
zijn vaak speciaal ontworpen voor gegevens op ordinaal niveau.
Zowel bij het nominale als soms bij het ordinale meetniveau, zou je eerder kunnen
spreken van een indeling in categorieën, dan wat men in het dagelijks leven onder
de term ‘meten’ verstaat. De zo verkregen gegevens worden daarom wel categorische data genoemd (data = gegevens).
De tijd van 2 uur, 14 minuten en 28 seconden geeft echt een hoeveelheid van iets
weer. Hier is sprake van het hoogste meetniveau, een ratioschaal (ratio = verhouding). Bij een ratioschaal kun je verhoudingen tussen getallen rechtstreeks interpreteren als verhoudingen tussen hoeveelheden van de eigenschap: 2 uur, 14
minuten en 28 seconden is twee keer zoveel tijd als 1 uur 7 minuten en 14 seconden. De marathonloper die na 4 uur, 28 minuten en 56 seconden finishte was twee
keer zo lang onderweg als Faustini. En zo bezit iemand van 165 centimeter drie
keer zoveel van de eigenschap ‘lengte’ als een baby van 55 centimeter. Bij een ratioschaal is er een vast nulpunt dat de afwezigheid van de eigenschap weergeeft: een
lengte van 0 betekent géén lengte. Maar zeer weinig metingen in de sociale wetenschappen liggen op dit meetniveau.
Tussen het ordinale meetniveau en de ratioschaal ligt het intervalniveau. Een intervalschaal heeft een arbitrair nulpunt. Een bekend voorbeeld is temperatuur in
graden Celsius. De heer Celsius heeft tamelijk willekeurig de temperatuur waarbij
water van vaste vorm (ijs) overgaat in vloeistof, 0 graden genoemd. Had hij in
plaats van water stikstof genomen, dan was 0 °C veel kouder geweest. Ook bij onze
jaartelling is het jaar 0 willekeurig gekozen. In het jaar 2000 was de aarde niet twee
172
© Noordhoff Uitgevers bv
MEETNIVEAUS
keer zo oud als in het jaar 1000; evenmin mag men zeggen dat 80 °C tweemaal zo
warm is als 40 °C, of dat persoon X met een IQ van 180 anderhalf keer zo intelligent
is als persoon Y met een IQ van 120. Zulke uitspraken zijn alleen waar wanneer we
te maken hebben met een ratioschaal.
Bij metingen op intervalniveau kunnen wel verschillen tussen twee waarden direct
vergeleken worden. Het temperatuurverschil (het interval) tussen 15 °C en 25 °C is
even groot als het verschil (interval) tussen 80 °C en 90 °C; de 200 jaar die verstreken zijn tussen 850 en 1050 AD omvatten evenveel tijd als de jaren tussen 1700 en
1900. Het verschil in intelligentie tussen IQ’s van 70 en 90 is even groot als het verschil tussen een IQ van 160 en één van 180. Bij deze laatste uitspraak is aangenomen dat intelligentie op intervalniveau gemeten wordt, maar er zijn ook geleerden
die zeggen dat IQ op een ordinaal niveau ligt. Hiermee is geïllustreerd dat de
scheidslijn tussen de verschillende meetniveaus vaak niet duidelijk te trekken is.
Het meetniveau heeft gevolgen voor de toegestane statistische bewerkingen. Hoe
hoger het meetniveau, des te meer bewerkingen zijn er toegestaan. Omdat veel metingen in de sociale wetenschappen het intervalniveau niet halen, is het aantal te
gebruiken statistische technieken vaak beperkt, wanneer je je tenminste strikt aan
de regels houdt. Maar er zijn veel onderzoekers die er een ‘rekkelijk’ standpunt op
nahouden en ordinale gegevens behandelen alsof het intervaldata zijn.
M
173
Download