Hoofdstuk 9

advertisement
Onderzoek doen
Hoofdstuk 9
Verbanden, correlatie en regressie
Het verband tussen variabelen
• Inhoudelijk: hoe kun je de samenhang tussen
variabelen theoretisch verklaren?
• Kracht: hoe sterk is het verband tussen die
variabelen?
• Causaliteit: is er sprake van een oorzakelijk
verband (asymmetrie)?
• Richting (alleen bij ordinaal en hoger
meetniveau): is het verband positief of negatief?
De analyse van de samenhang
• Methoden en technieken van de analyse van de
samenhang van verschillende variabelen
– Kruistabellen
– Rangordecorrelatie
– Correlatie (niet-causaal)
– Regressie (causaal verband)
Kruistabellen
• Voor het analyseren
van de samenhang
tussen twee (of meer)
variabelen op
nominaal niveau wordt
gebruikgemaakt van
kruistabellen. In een
kruistabel worden de
frequenties van twee
variabelen tegen
elkaar afgezet. De
meest elementaire
associatiemaat is het
chi-kwadraat.
In MS Excel kan de kans dat het
verband op toeval gebaseerd wordt
uitgerekend worden door de functie
CHIDEST
CHIDIST (32,0 ; 1) = 1,50428E-08
=> Kans op toeval = +/- 0
Rangordecorrelatie
• De Spearman
rangcorrelatiecoëfficiënt (RS) is een
indicator voor de mate
waarin twee
rangschikkingen van
dezelfde
waarnemingen naar
verschillende
variabelen aan elkaar
gelijk zijn.
• Deze functie is niet
standaard in MS Excel
beschikbaar, maar wel
in SPSS (zie
hoofdstuk 10)
Correlatie (niet-causaal)
• Het gaat bij correlatie om statistisch verklaren: de
onderzoeker moet op inhoudelijke gronden bepalen of
de statistische verklaring ook werkelijk iets betekent.
• Correlatie betekent dus NIET plausibel.
• Het bekijken van het spreidingsdiagram, waarin de
twee te correleren variabelen tegen elkaar worden
uitgezet, levert een indruk van de sterkte en de richting
van het verband.
Regressie (causaal verband)
• Hoe sterker het verband tussen
twee variabelen van minimaal
intervalniveau, des te meer zal
de puntenwolk naar een rechte
lijn tenderen. Met behulp van
regressieanalyse wordt de
vorm van deze lijn berekend.
• De berekening van de
correlatiecoëfficiënt is
gebaseerd op dit principe:
de (gekwadrateerde)
verschillen van ieder punt tot
de regressielijn moeten zo klein
mogelijk zijn. Men noemt deze
berekeningswijze dan ook de
methode van de kleinste
kwadraten (least squares)
Kracht en richting van het verband
De vorm van de puntenwolk geeft aan in hoeverre een verband
aanwezig is: wanneer een toename in de ene variabele
systematisch gepaard gaat met een toename in de andere, zal er
sprake zijn van een positief verband. Als de beweging van de
variabelen juist tegengesteld is, zal er sprake zijn van een
negatief verband.
Afhankelijk van het verband wordt gesproken van positieve en
negatieve correlatie. Indien de puntenwolk samenvalt met de lijn
is er sprake van volkomen regressie.
Voorbeeldplaatje
In het voorbeeld wordt het verband tussen gewicht en leeftijd
getoetst. Er is een verschil ten opzichte van het gemiddelde en er is
een afwijking van een persoon in kwestie.
Download