Inleiding in de statistiek voor de gedragswetenschappen Met

advertisement
INLEIDING IN DE STATISTIEK VOOR
DE GEDRAGSWETENSCHAPPEN.
MET ONDERSTEUNING VAN SPSS
1
HOOFDSTUK VIII DE VORM VAN DE
VERDELING EN INVLOED VAN
TRANSFORMATIES
DOELSTELLINGEN:
• Na de studie van dit hoofdstuk…
kent u de betekenis van scheefheid en
kurtosis van een verdeling;
kunt u deze kurtosis en scheefheid
berekenen;
kunt u een boxplot via SPSS maken en
interpreteren;
begrijpt u het effect van transformaties
op de vorm van de verdeling
VORM VAN DE VERDELING
• Veel frequentieverdelingen hebben niet de vorm
van de normale verdeling.
Ze vertonen niet de gelijkmatige welving van de
klokfunctie, of zijn scheef.
Skewness of scheefheid (skw) en welving of
kurtosis (kur) kunnen via SPSS berekend worden.
Deze skw en kur dient gerelateerd te worden aan
de betreffende standaardfout. (de uitslag dient
tweemaal zo groot of groter te zijn om
betekenisvol te zijn)
8.1. KURTOSIS
• Kurt > 0 wijst op een – in vergelijking met
normaleverdeling - scherpe top
VAR00001
VAR00005
80
30
Frequency
Frequency
60
40
10
20
Mean = 49,6933
Std. Dev. = 5,59596
N = 150
0
30,00
20
40,00
50,00
60,00
VAR00001
Kur = 3,45
70,00
Mean = 50,4933
Std. Dev. = 6,83629
N = 150
0
30,00
40,00
50,00
60,00
VAR00005
Kur = 0,30
70,00
8.1. KURTOSIS
• Kurt = 0 wijst op een welving die
vergelijkbaar is met de normaalverdeling
Kur = 0,05
8.1. KURTOSIS
• Kurt < 0 wijst op een afgeplatte top
VAR00003
VAR00002
25
14
20
12
Frequency
Frequency
10
15
10
8
6
4
5
2
Mean = 51,0933
Std. Dev. = 14,34819
N = 150
0
30,00
Mean = 50,2533
Std. Dev. = 11,68329
N = 150
0
40,00
50,00
60,00
70,00
VAR00003
Kur = - 1,69
30,00
40,00
50,00
60,00
70,00
VAR00002
Kur = - 1,25
8.2. SCHEEFHEID VAN DE VERDELING
• Skw < 0 wijst op een links scheve verdeling
bv. score voor een test met heel gemakkelijke
items (zgn. plafondeffect)
Absolute Frequenties
Histogram
45
40
35
30
25
20
15
10
5
0
0
20
40
Metingen X
60
80
Skw = - 0,75
8.2. SCHEEFHEID VAN DE VERDELING
• Skw = 0 wijst op een symmetrische verdeling
Absolute Frequenties
Histogram
40
35
30
25
20
15
10
5
0
0
20
40
60
Metingen X
Skw = 0,02
80
8.2. SCHEEFHEID VAN DE VERDELING
• Skw > 0 wijst op een rechts scheve verdeling
bv. de scores op een test bestaande uit veel
te moeilijke items (zgn. vloereffect)
Histogram
Absolute Frequenties
45
40
35
30
25
20
15
10
Skw = 0,75
5
0
0
20
40
Metingen X
60
80
8.3. BEREKENING VIA SPSS
DIALOOGVENSTER EXPLORE
EXPLORE OUTPUT
Descriptives
materialtot
Mean
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Lower Bound
Upper Bound
Statistic
3,9927
3,8849
Std. Error
,05488
4,1006
4,0228
4,0000
1,211
1,10038
1,00
7,00
6,00
1,50
-,416
,154
,122
,243
8.4. Lineaire transformatie
Model: Y = a + bX
• Het gemiddelde wordt op dezelfde wijze
getransformeerd.
• De standaarddeviatie wordt met |b|
vermenigvuldigd, de variantie met b².
• De ‘skewness’ blijft onveranderd indien b>0.
• De kurtosis blijft onveranderd.
OMZETTING IN Z-WAARDEN
Heeft deze omzetting invloed op
de vorm van de verdeling?
Statistics
N
Mean
Median
Mode
Std. Deviation
Variance
Skewness
Kurtos is
Range
Minim um
Maxim um
Percentiles
Valid
25
75
VAR00001
5000
99,4354
99,0000
96,00
15,00940
225,282
,007
,034
107,00
43,00
150,00
89,0000
110,0000
Zscore(VA
R00001)
5000
,0000000
-,0290085
-,22888
1,0000000
1,000
,007
,034
7,12887
-3,76000
3,36886
-,6952576
,7038656
HEEFT EEN OMZETTING IN Z-WAARDEN
EEN INVLOED OP DE VORM VAN DE
VERDELING?
• Deze omzetting heeft GEEN invloed op
de scheefheid en kurtosis van de
verdeling;
m.a.w. scheef blijft scheef.
• Deze omzetting heeft wel een invloed
op het rekenkundig gemiddelde (altijd
nul) en de s (altijd 1).
8.5. DE BOXPLOT
• In de boxplot wordt in een doos de mediaan, het 25ste en
het 75ste percentiel geplaatst, waardoor de doos in feite
het interkwatielafstand voorstelt. Daarnaast worden de
extreme en uiterst extreme waarden (=uitbijter)
afgebeeld.
Uitbijter ligt op meer dan 1,5 dooslengte van het 25ste of
75ste percentiel
Extreme uitbijters liggen op meer dan 3 dooslengtes van
het 25ste of 75ste percentiel.
VOORBEELD VAN EEN BOXPLOT
VOORBEELD VAN EEN BOXPLOT:
RECHTS SCHEVE VERDELING
OEFENING
• Bij welke variabele is de mediaan het grootst?
• Welke variabele heeft de grootste
•
•
•
•
interkwartielafstand?
Welke variabele(n) is (zijn) ongeveer
linksscheef?
Welke variabele(n) is (zijn) ongeveer
rechtsscheef?
Welke variabele(n) is (zijn) ongeveer
symmetrisch?
Welke variabelen hebben outliers?
70,00
60,00
50,00
40,00
30,00
VAR00001
VAR00002
VAR00003
VAR00004
VAR00005
Opgave (zie hoofdstuk 5)
1
4
2
5
3
6
A
D
C
B
E
F
OPGAVEN UIT HET HANDBOEK
INLEIDING IN DE STATISTIEK VOOR
DE GEDRAGSWETENSCHAPPEN.
MET ONDERSTEUNING VAN SPSS
27
Download