INLEIDING IN DE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN. MET ONDERSTEUNING VAN SPSS 1 HOOFDSTUK VIII DE VORM VAN DE VERDELING EN INVLOED VAN TRANSFORMATIES DOELSTELLINGEN: • Na de studie van dit hoofdstuk… kent u de betekenis van scheefheid en kurtosis van een verdeling; kunt u deze kurtosis en scheefheid berekenen; kunt u een boxplot via SPSS maken en interpreteren; begrijpt u het effect van transformaties op de vorm van de verdeling VORM VAN DE VERDELING • Veel frequentieverdelingen hebben niet de vorm van de normale verdeling. Ze vertonen niet de gelijkmatige welving van de klokfunctie, of zijn scheef. Skewness of scheefheid (skw) en welving of kurtosis (kur) kunnen via SPSS berekend worden. Deze skw en kur dient gerelateerd te worden aan de betreffende standaardfout. (de uitslag dient tweemaal zo groot of groter te zijn om betekenisvol te zijn) 8.1. KURTOSIS • Kurt > 0 wijst op een – in vergelijking met normaleverdeling - scherpe top VAR00001 VAR00005 80 30 Frequency Frequency 60 40 10 20 Mean = 49,6933 Std. Dev. = 5,59596 N = 150 0 30,00 20 40,00 50,00 60,00 VAR00001 Kur = 3,45 70,00 Mean = 50,4933 Std. Dev. = 6,83629 N = 150 0 30,00 40,00 50,00 60,00 VAR00005 Kur = 0,30 70,00 8.1. KURTOSIS • Kurt = 0 wijst op een welving die vergelijkbaar is met de normaalverdeling Kur = 0,05 8.1. KURTOSIS • Kurt < 0 wijst op een afgeplatte top VAR00003 VAR00002 25 14 20 12 Frequency Frequency 10 15 10 8 6 4 5 2 Mean = 51,0933 Std. Dev. = 14,34819 N = 150 0 30,00 Mean = 50,2533 Std. Dev. = 11,68329 N = 150 0 40,00 50,00 60,00 70,00 VAR00003 Kur = - 1,69 30,00 40,00 50,00 60,00 70,00 VAR00002 Kur = - 1,25 8.2. SCHEEFHEID VAN DE VERDELING • Skw < 0 wijst op een links scheve verdeling bv. score voor een test met heel gemakkelijke items (zgn. plafondeffect) Absolute Frequenties Histogram 45 40 35 30 25 20 15 10 5 0 0 20 40 Metingen X 60 80 Skw = - 0,75 8.2. SCHEEFHEID VAN DE VERDELING • Skw = 0 wijst op een symmetrische verdeling Absolute Frequenties Histogram 40 35 30 25 20 15 10 5 0 0 20 40 60 Metingen X Skw = 0,02 80 8.2. SCHEEFHEID VAN DE VERDELING • Skw > 0 wijst op een rechts scheve verdeling bv. de scores op een test bestaande uit veel te moeilijke items (zgn. vloereffect) Histogram Absolute Frequenties 45 40 35 30 25 20 15 10 Skw = 0,75 5 0 0 20 40 Metingen X 60 80 8.3. BEREKENING VIA SPSS DIALOOGVENSTER EXPLORE EXPLORE OUTPUT Descriptives materialtot Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Lower Bound Upper Bound Statistic 3,9927 3,8849 Std. Error ,05488 4,1006 4,0228 4,0000 1,211 1,10038 1,00 7,00 6,00 1,50 -,416 ,154 ,122 ,243 8.4. Lineaire transformatie Model: Y = a + bX • Het gemiddelde wordt op dezelfde wijze getransformeerd. • De standaarddeviatie wordt met |b| vermenigvuldigd, de variantie met b². • De ‘skewness’ blijft onveranderd indien b>0. • De kurtosis blijft onveranderd. OMZETTING IN Z-WAARDEN Heeft deze omzetting invloed op de vorm van de verdeling? Statistics N Mean Median Mode Std. Deviation Variance Skewness Kurtos is Range Minim um Maxim um Percentiles Valid 25 75 VAR00001 5000 99,4354 99,0000 96,00 15,00940 225,282 ,007 ,034 107,00 43,00 150,00 89,0000 110,0000 Zscore(VA R00001) 5000 ,0000000 -,0290085 -,22888 1,0000000 1,000 ,007 ,034 7,12887 -3,76000 3,36886 -,6952576 ,7038656 HEEFT EEN OMZETTING IN Z-WAARDEN EEN INVLOED OP DE VORM VAN DE VERDELING? • Deze omzetting heeft GEEN invloed op de scheefheid en kurtosis van de verdeling; m.a.w. scheef blijft scheef. • Deze omzetting heeft wel een invloed op het rekenkundig gemiddelde (altijd nul) en de s (altijd 1). 8.5. DE BOXPLOT • In de boxplot wordt in een doos de mediaan, het 25ste en het 75ste percentiel geplaatst, waardoor de doos in feite het interkwatielafstand voorstelt. Daarnaast worden de extreme en uiterst extreme waarden (=uitbijter) afgebeeld. Uitbijter ligt op meer dan 1,5 dooslengte van het 25ste of 75ste percentiel Extreme uitbijters liggen op meer dan 3 dooslengtes van het 25ste of 75ste percentiel. VOORBEELD VAN EEN BOXPLOT VOORBEELD VAN EEN BOXPLOT: RECHTS SCHEVE VERDELING OEFENING • Bij welke variabele is de mediaan het grootst? • Welke variabele heeft de grootste • • • • interkwartielafstand? Welke variabele(n) is (zijn) ongeveer linksscheef? Welke variabele(n) is (zijn) ongeveer rechtsscheef? Welke variabele(n) is (zijn) ongeveer symmetrisch? Welke variabelen hebben outliers? 70,00 60,00 50,00 40,00 30,00 VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 Opgave (zie hoofdstuk 5) 1 4 2 5 3 6 A D C B E F OPGAVEN UIT HET HANDBOEK INLEIDING IN DE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN. MET ONDERSTEUNING VAN SPSS 27