Onderzoek doen Hoofdstuk 9 Verbanden, correlatie en regressie Het verband tussen variabelen • Inhoudelijk: hoe kun je de samenhang tussen variabelen theoretisch verklaren? • Kracht: hoe sterk is het verband tussen die variabelen? • Causaliteit: is er sprake van een oorzakelijk verband (asymmetrie)? • Richting (alleen bij ordinaal en hoger meetniveau): is het verband positief of negatief? De analyse van de samenhang • Methoden en technieken van de analyse van de samenhang van verschillende variabelen – Kruistabellen – Rangordecorrelatie – Correlatie (niet-causaal) – Regressie (causaal verband) Kruistabellen • Voor het analyseren van de samenhang tussen twee (of meer) variabelen op nominaal niveau wordt gebruikgemaakt van kruistabellen. In een kruistabel worden de frequenties van twee variabelen tegen elkaar afgezet. De meest elementaire associatiemaat is het chi-kwadraat. In MS Excel kan de kans dat het verband op toeval gebaseerd wordt uitgerekend worden door de functie CHIDEST CHIDIST (32,0 ; 1) = 1,50428E-08 => Kans op toeval = +/- 0 Rangordecorrelatie • De Spearman rangcorrelatiecoëfficiënt (RS) is een indicator voor de mate waarin twee rangschikkingen van dezelfde waarnemingen naar verschillende variabelen aan elkaar gelijk zijn. • Deze functie is niet standaard in MS Excel beschikbaar, maar wel in SPSS (zie hoofdstuk 10) Correlatie (niet-causaal) • Het gaat bij correlatie om statistisch verklaren: de onderzoeker moet op inhoudelijke gronden bepalen of de statistische verklaring ook werkelijk iets betekent. • Correlatie betekent dus NIET plausibel. • Het bekijken van het spreidingsdiagram, waarin de twee te correleren variabelen tegen elkaar worden uitgezet, levert een indruk van de sterkte en de richting van het verband. Regressie (causaal verband) • Hoe sterker het verband tussen twee variabelen van minimaal intervalniveau, des te meer zal de puntenwolk naar een rechte lijn tenderen. Met behulp van regressieanalyse wordt de vorm van deze lijn berekend. • De berekening van de correlatiecoëfficiënt is gebaseerd op dit principe: de (gekwadrateerde) verschillen van ieder punt tot de regressielijn moeten zo klein mogelijk zijn. Men noemt deze berekeningswijze dan ook de methode van de kleinste kwadraten (least squares) Kracht en richting van het verband De vorm van de puntenwolk geeft aan in hoeverre een verband aanwezig is: wanneer een toename in de ene variabele systematisch gepaard gaat met een toename in de andere, zal er sprake zijn van een positief verband. Als de beweging van de variabelen juist tegengesteld is, zal er sprake zijn van een negatief verband. Afhankelijk van het verband wordt gesproken van positieve en negatieve correlatie. Indien de puntenwolk samenvalt met de lijn is er sprake van volkomen regressie. Voorbeeldplaatje In het voorbeeld wordt het verband tussen gewicht en leeftijd getoetst. Er is een verschil ten opzichte van het gemiddelde en er is een afwijking van een persoon in kwestie.