Nota`s oefeningensessie 1

advertisement
SPSS
REEKS 1
Multivariate (co)variantieanalyse
Definities
ANOVA : Regressie met alleen nominale variabelen
MANOVA : Multivariate regressie met alleen nominale variabelen (meerdere AV)
ANCOVA : Regressie met zowel nominale als continue variabelen
MANCOVA : Multivariate covariantie-analyse (meerder AV, nominale + continue variabelen)
Lmatrix : matrix voor de OV
Mmatrix : matrix voor de AV
SPSS – implementatie – Parate kennis
ANOVA
-
Analyze - GLM – Univariate
AV : ongeval
Fixed Factors : als we werken met nominale variabelen
UNIVARIATE COVARIANTIEANALYSE
-
Analyze - GLM – Univariate
AV : ongeval
Fixed Factors : als we werken met nominale variabelen
Covariate : als we werken met continue variabelen
Hoofdeffecten : H0 : .1 = .2 = .3
H0 : 1. = 2.
Uitwerking : 11 =  + 1 + 1 + 11
.2 =  + 1 + 2 + 2 + 12 + 22
2
2
SPSS – Multivariate (co)variantieanalyse (MANCOVA)
Nu hebben we meerdere afhankelijke variabelen, voor de rest blijft het hetzelfde als een gewone
covariantie-analyse. Er wordt nu gewerk met een L-matrix én een M-matrix.
We werken hier met zowel nominale als continue OV’s.
Gegevens
- Gezondheid (AV) = Chi , stress , depressi
- Werk-gerelateerde OV = dem13 , skillut
- Persoonsgerelateerde OV = educlev ( 3 niveaus, nominaal ) , age2
1
SPSS
REEKS 1
Multivariate (co)variantieanalyse
2
Welke van de 4 OV hebben een invloed op gezondheid (meerdere AV)? In welke
richting wijzen de effecten?
SPSS
Analyze – GLM – Multivariate
 dependent variables : chi, stress, depressi
 fixed factors : educlev
 covariates : dem13, skillut, age2
 Options : Descriptive statistics
Parameter Estimates
(SSCP matrices)
(Residual SSCP matrix)
(Homogeneïty Tests)
 De nominale variabele omzetten naar display means for
OUTPUT
Multivariate tests
 Significant ? Als we ergens significante waarden hebben, dan betekent dit dat er een
significant verband is met gezondheid. Dan rapporteren we F gebaseerd op Wilks
Lamda.
 Is er geen significant verband, dan besluiten we hieruit dat er geen significant verband
is en kijken we niet verder naar de andere tabellen.
Tests Between Subjects
 Dit bekijken we alleen als we hierboven een significant verband hebben gevonden.
 We kijken alleen naar de variabele die hierboven significant was, de rest is niet van
belang.
 Rapport : Met welke variabelen AV vallen de eventuele effecten samen?
Parameter Estimates & Descriptive statistics
 Kijken naar de Beta om de richting van de effecten te kunnen bepalen.
 Vb.: Hoe hoger dem13 , hoe hoger de chi-score.
 Ook hier kijken we alleen naar die variabelen waarvoor we een significant verband
hebben gevonden.

In de tabel Parameter Estimates kunnen we ook de volgorde van de L-matrix bekijken.
SPSS
REEKS 1
Multivariate (co)variantieanalyse
3
RAPPORT
Een mancova werd uitgevoerd met als afhankelijke variabelen drie gezondheidsvariabelen (fysische
gezondheidstoestand, stress en depressie) en met als onafhankelijke variabelen twee werkgerelateerde variabelen (psychologische belasting tijdens het werk, en de mate waarin de werknemer
zijn vaardigheden kan aanwenden tijdens het werk), en twee persoons-gerelateerde variabelen
(opleidingsniveau en leeftijd).
Wat de werk-gerelateerde variabelen betreft, is het effect van het kunnen aanwenden van de
vaardigheden niet significant (F < 1). Het effect van psychologische belasting daarentegen is wel
significant, F(3,369) = 25.44, p < 0.001. (Alle multivariate F-toetsen in dit rapport zijn gebaseerd op
Wilks’ Lambda). De univariate toetsen suggereren dat dit effect samenhangt met zowel de fysische
gezondheid, F(1,371) = 17.77, p < 0.001, als met de psychische gezondheidvariabelen stress, F(1,371) =
62.24, p < 0.001, en depressie, F(1,371) = 40.94, p < 0.001. De richting van het effect ligt in de lijn van
de verwachtingen: hogere ‘psychological job demands’ gaan gepaard met meer gezondheidsklachten, meer stress, en meer depressie.
Bij de persoons-gerelateerde variabelen is het effect van leeftijd niet significant, F(3,369) = 1.34, p =
.26. Opleidingsniveau daarentegen, speelt wel een rol, F(6,738) = 4.22, p < 0.001. Uit de univariate
toetsen blijkt dat dit effect vooral samenhangt met de gezondheidsklachten, F(2,371) = 7.25, p = 0.001,
en met depressie, F(2,371) = 8.14, p < 0.001, maar niet met stress, F(2,371) = 1.20, p = 0.30. De
gemiddelde waarden voor deze variabelen vind je terug in tabel 1.
SPSS
REEKS 1
Multivariate (co)variantieanalyse
4
Kan men het effect op de gezondheid even goed verklaren als men alleen de werkgerelateerde variabelen beschouwt?
Het betreft hier een modelvergelijking tussen het volledige model met alle predictoren en een
gerestricteerd model.
Aangezien we alle AV gebruiken, moet er geen Mmatrix opgesteld worden. Wel worden niet alle OV
gebruikt, daarom moet er wel een Lmatrix worden opgesteld.
De volgorde van de Lmatrix kennen we uit de tabel : Parameter Estimates.
(0) : intercept
(1) : dem13
(2) : skillut
(3) : age2
(4) : educlev = 1
(5) : educlev = 2
(6) : educlev = 3

Age2 en Educlev worden buiten het model gehouden, met als gevolg :
 Age 2 (continue variabele) :
(3) = 0
L=( 0 0 0 1 0 0 0)
 Educlev (nominale variabele)
H0 : 1 = 2 = 3
(4) = (5) = (6)
DUS
(4) - (5) = 0 en (5) - (6) = 0
L = ( 0 0 0 0 1 –1 0 )
L = ( 0 0 0 0 0 1 –1 )

Deze worden worden ingevoerd via de Syntax :
/LMATRIX “onderzoeksvraag 2”
all 0 0 0 1 0 0 0;
all 0 0 0 0 1 –1 0;
all 0 0 0 0 0 1 –1;
SPSS
REEKS 1
Multivariate (co)variantieanalyse
5
OUTPUT
Costum Hypothesis Tests (Multivariate Test Results)
 Weer F rapporteren (Wilks Lambda) + idem als output hierboven!
 Als we een significant effect vinden, kunnen we de nulhypothese verwerpen en zijn de
andere variabelen wel degelijk van belang.
 Men kan het effect van gezondheid dus niet evengoed verklaren zonder de
werkgerelateerde variabelen.
RAPPORT
Om na te gaan of men het effect op de gezondheid even goed kan verklaren indien men enkel de
werk-gerelateerde variabelen beschouwt, worden twee modellen met elkaar vergeleken: een model
met zowel de werk-gerelateerde variabelen als de persoons-gerelateerde variabelen, en een model
met enkel de werk-gerelateerde variabelen. Uit de modelvergelijkingstoets blijkt dat het model met
enkel de werk-gerelateerde variabelen significant slechter is dan het volledige model, F(9,898.2) =
3.30, p = 0.001. De persoons-gerelateerde variabelen spelen wel degelijk een belangrijke rol.
SPSS
REEKS 1
Multivariate (co)variantieanalyse
6
Indien men enkel de psychische gezondheid beschouwt (depressi & stress), is er dan
een verschil tussen de laagste scholingsgraad (educlev = 1) en de hoogste
scholingsgraad (educlev = 3) ?

In dit geval gaan we zowel een Mmatrix als een Lmatrix moeten opstellen. De Mmatrix
ziet er als volgt uit :
M=(0 10)
(staat voor stress)
M=(0 01)
(staat voor depressi)

Voor de Lmatrix zitten we met 2 celgemiddelden :
H0 : 1 = 3
1 - 3 = 0 of (4) - (6) = 0

L = ( 0 0 0 0 1 0 –1)
Nu worden beide matrixen in het syntaxvenster ingevoerd.
/LMATRIX “onderzoeksvraag 3”
all 0 0 0 0 1 0 –1;
/MMATRIX “onderzoeksvraag 3”
all 0 1 0;
all 0 0 1;
OUTPUT
Output interpreteren als vorige oefeningen. Als we significante effecten vinden, dan kunnen we de
nulhypothese verwerpen en kunnen we concluderen dat er een verschil is tussen hoogste en laagste
scholingsgraad als men alleen de psychische gezondheid beschouwt.
RAPPORT
Indien men enkel de psychische gezondheidsvariabelen beschouwt (stress en depressie) is er een
significant verschil tussen werknemers met de laagste scholingsgraad, en werknemers met de
hoogste scholingsgraad, F(2,370) = 9.34, p < 0.001.
Is er voor de verschillende effecten een verschil tussen de fysische gezondheid
enerzijds en de psychische gezondheid anderzijds ?
Dit is appelen met peren vergelijken, daar de variabelen die we willen vergelijken op een andere
schaal zijn gemeten.
Zie pagina 5 in feedbackbundel!
SPSS
REEKS 1
Multivariate (co)variantieanalyse
7
SPSS – Multivariate variantieanalyse (MANOVA)
Nu hebben we meerdere afhankelijke variabelen, voor de rest blijft het hetzelfde als een gewone
variantie-analyse. Er wordt nu gewerk met een L-matrix én een M-matrix.
We werken hier met meerdere AV en OV, maar enkel nominale OV’s.
Gegevens
- Gezondheid (AV) : chi, stress, depress
- OV : educlev (nominaal met 3 niveaus)
- OV : agec (nominaal met 2 niveaus)
Spelen voor de gezondheid leeftijd en scholingsgraad een rol ? Zo ja, in welke
richting wijzen hun effecten ?
SPSS

Analyze – GLM – Multivariate
 dependent variables : chi, stress, depressi
 fixed factors : educlev, agec
 Options : Descriptive statistics
Parameter Estimates
 Plots : Horizontal Axis : educlev
Seperate Lines : agec
OUTPUT


idem als alle andere oefeningen, zie MANCOVA.
Ook kijken naar ESTIMATED MARGINAL MEANS
 alleen kijken naar die variabelen die significant waren ! ! !
 Wie scoort het hoogst op wat, wat valt er op ?
RAPPORT
Een manova werd uitgevoerd met als afhankelijke variabelen drie gezondheidsvariabelen (fysische
gezondheidstoestand, stress en depressie) en met als factoren de scholingsgraad en de
leeftijdscategorie. Het hoofdeffect van leeftijd is niet significant (F < 1). De interactie tussen
leeftijdscategorie en scholingsgraad is eveneens niet significant, F(12,968.6) = 1.38, p = 0.17. Het
hoofdeffect van scholingsgraad daarentegen is wel significant, F(6,732) = 3.62, p = 0.001. Uit de
univariate toetsen blijkt dat het effect van scholingsgraad vooral samenhangt met de gezondheidsklachten, F(2,368) = 3.17, p < 0.05, en met stress, F(2,368) = 3.43, p < 0.05, maar niet met depressie,
F(2,368) = 1.98, p = 0.14.
Het valt op dat werknemers met een lagere scholingsgraad het meest gezondheidsklachten
rapporteren: de gemiddelde gezondheidsindeces bedragen respectievelijk: 4.48 (lage scholingsgraad),
3.60 (gemiddelde scholingsgraad) en 3.53 (hoge scholingsgraad).
Anderzijds, en dit is opvallend, rapporteren de werknemers met de hoogste scholingsgraad dat ze
het meest last hebben van stress: De gemiddelde waarde voor stress bedragen respectievelijk: 2.25
(lage scholingsgraad), 2.26 (gemiddelde scholingsgraad) en 2.51 (hoge scholingsgraad).
SPSS
REEKS 1
Multivariate (co)variantieanalyse
8
Is er een verschil in gezondheid tussen de oudste groep (agec = 3) enerzijds, en de 2
jongere groepen (agec = 1 en agec = 2) anderzijds?
Educlev
Educlev = 1
Educlev = 2
Educlev = 3

H0 : .3 =
Agec = 1
11
21
31
.1
Agec
Agec = 2
12
22
32
.2
Agec = 3
13
23
33
.3
1.
2.
3.
.1 + .2
2
De volgorde van de parameters kunnen we bekijken in de tabel Parameter Estimates.
Nu moeten we het contrast uitwerken en invullen als Lmatrix in de syntax.
 Uitwerking : Feedbackbundel pagina 9
OUTPUT
Multivariate Test Results
 De F – toets toetst de onderzoeksvraag. Is deze niet significant, dan moeten we de
hypothese verwerpen en H0 aanvaarden. Er is dus geen verschil tussen de oudste groep
en de 2 andere groepen ivm gezondheid.
RAPPORT
Indien men enkel rekening houdt met de leeftijd, dan is er geen verschil tussen de twee jongste
groepen van werknemers en de oudste groep van werknemers, F(3, 366) = 0.52, p = 0.634.
SPSS
REEKS 1
Multivariate (co)variantieanalyse
Is het zo dat er géén verschil is tussen de 3 onderstaande subgroepen?
a) De groep met de laagste leeftijd en een gemiddelde scholingsgraad
 agec = 1 , educlev = 2
 21
b) De groep met gemiddelde leeftijd en een gemiddelde scholingsgraad
 agec = 2 , educlev = 2
 22
c) De groep met een gemiddelde scholingsgraad ongeacht de leeftijd?
 educlev = 2
 2.
H0 : 21 = 22 = 2.
Zo een hypothese moet herschreven worden naar 2 contrasten, en deze moeten we dan uitrekenen.
Elk contrast vertegenwoordigt een rij in de Lmatrix (p. 10):
21 - 22 = 0
22 - 2. = 0
21 =  + 2 + 1 + 21
22 =  + 2 + 2 + 22
2. =  + 2 + 1/31 + 1/32 + 1/33 + 1/321+ 1/322 + 1/323
OUTPUT
Idem als alle vorige oefeningen van MANOVA en MANCOVA
RAPPORT
Er wordt ook geen significant verschil gevonden tussen (1) de jongste werknemers met een
gemiddelde scholingsgraad, (2) werknemers met een gemiddelde leeftijd en een gemiddelde
scholingsgraad, en (3) werknemers met een gemiddelde scholingsgraad (ongeacht de leeftijd), F(6,
732) = 1.28, p = 0.26.
9
SPSS
10
REEKS 1
Multivariate (co)variantieanalyse
Indien men enkel de psychologische variabelen (stress , depressi) beschouwt, is er
een verschil tussen een hoge scholingsgraad (educlev =3) en een lage
scholingsgraad (educlev = 1) ?
In dit geval gaan we zowel een Mmatrix als een Lmatrix moeten opstellen. De
Mmatrix ziet er als volgt uit :
M=(0 10)
(staat voor stress)
M=(0 01)
(staat voor depressi)
Voor de Lmatrix zitten we met 2 celgemiddelden :
H0 : 1. = 3.
Deze hypothese moeten we uitwerken (p. 11 feedbackbundel) en we bekomen 1 rij in de Lmatrix.
Deze vullen we dan in in de syntax.
OUTPUT
De output is hetzelfde als bij alle vorige oefeningen van MANOVA en MANCOVA
RAPPORT
Tenslotte, indien men enkele de psychische gezondheid beschouwt, is er een significant verschil
tussen werknemers met een hoge scholingsgraad, en werknemers met een lage scholingsgraad
(ongeacht de leeftijd), 8.49, p = 0.000.
Download