SPSS REEKS 1 Multivariate (co)variantieanalyse Definities ANOVA : Regressie met alleen nominale variabelen MANOVA : Multivariate regressie met alleen nominale variabelen (meerdere AV) ANCOVA : Regressie met zowel nominale als continue variabelen MANCOVA : Multivariate covariantie-analyse (meerder AV, nominale + continue variabelen) Lmatrix : matrix voor de OV Mmatrix : matrix voor de AV SPSS – implementatie – Parate kennis ANOVA - Analyze - GLM – Univariate AV : ongeval Fixed Factors : als we werken met nominale variabelen UNIVARIATE COVARIANTIEANALYSE - Analyze - GLM – Univariate AV : ongeval Fixed Factors : als we werken met nominale variabelen Covariate : als we werken met continue variabelen Hoofdeffecten : H0 : .1 = .2 = .3 H0 : 1. = 2. Uitwerking : 11 = + 1 + 1 + 11 .2 = + 1 + 2 + 2 + 12 + 22 2 2 SPSS – Multivariate (co)variantieanalyse (MANCOVA) Nu hebben we meerdere afhankelijke variabelen, voor de rest blijft het hetzelfde als een gewone covariantie-analyse. Er wordt nu gewerk met een L-matrix én een M-matrix. We werken hier met zowel nominale als continue OV’s. Gegevens - Gezondheid (AV) = Chi , stress , depressi - Werk-gerelateerde OV = dem13 , skillut - Persoonsgerelateerde OV = educlev ( 3 niveaus, nominaal ) , age2 1 SPSS REEKS 1 Multivariate (co)variantieanalyse 2 Welke van de 4 OV hebben een invloed op gezondheid (meerdere AV)? In welke richting wijzen de effecten? SPSS Analyze – GLM – Multivariate dependent variables : chi, stress, depressi fixed factors : educlev covariates : dem13, skillut, age2 Options : Descriptive statistics Parameter Estimates (SSCP matrices) (Residual SSCP matrix) (Homogeneïty Tests) De nominale variabele omzetten naar display means for OUTPUT Multivariate tests Significant ? Als we ergens significante waarden hebben, dan betekent dit dat er een significant verband is met gezondheid. Dan rapporteren we F gebaseerd op Wilks Lamda. Is er geen significant verband, dan besluiten we hieruit dat er geen significant verband is en kijken we niet verder naar de andere tabellen. Tests Between Subjects Dit bekijken we alleen als we hierboven een significant verband hebben gevonden. We kijken alleen naar de variabele die hierboven significant was, de rest is niet van belang. Rapport : Met welke variabelen AV vallen de eventuele effecten samen? Parameter Estimates & Descriptive statistics Kijken naar de Beta om de richting van de effecten te kunnen bepalen. Vb.: Hoe hoger dem13 , hoe hoger de chi-score. Ook hier kijken we alleen naar die variabelen waarvoor we een significant verband hebben gevonden. In de tabel Parameter Estimates kunnen we ook de volgorde van de L-matrix bekijken. SPSS REEKS 1 Multivariate (co)variantieanalyse 3 RAPPORT Een mancova werd uitgevoerd met als afhankelijke variabelen drie gezondheidsvariabelen (fysische gezondheidstoestand, stress en depressie) en met als onafhankelijke variabelen twee werkgerelateerde variabelen (psychologische belasting tijdens het werk, en de mate waarin de werknemer zijn vaardigheden kan aanwenden tijdens het werk), en twee persoons-gerelateerde variabelen (opleidingsniveau en leeftijd). Wat de werk-gerelateerde variabelen betreft, is het effect van het kunnen aanwenden van de vaardigheden niet significant (F < 1). Het effect van psychologische belasting daarentegen is wel significant, F(3,369) = 25.44, p < 0.001. (Alle multivariate F-toetsen in dit rapport zijn gebaseerd op Wilks’ Lambda). De univariate toetsen suggereren dat dit effect samenhangt met zowel de fysische gezondheid, F(1,371) = 17.77, p < 0.001, als met de psychische gezondheidvariabelen stress, F(1,371) = 62.24, p < 0.001, en depressie, F(1,371) = 40.94, p < 0.001. De richting van het effect ligt in de lijn van de verwachtingen: hogere ‘psychological job demands’ gaan gepaard met meer gezondheidsklachten, meer stress, en meer depressie. Bij de persoons-gerelateerde variabelen is het effect van leeftijd niet significant, F(3,369) = 1.34, p = .26. Opleidingsniveau daarentegen, speelt wel een rol, F(6,738) = 4.22, p < 0.001. Uit de univariate toetsen blijkt dat dit effect vooral samenhangt met de gezondheidsklachten, F(2,371) = 7.25, p = 0.001, en met depressie, F(2,371) = 8.14, p < 0.001, maar niet met stress, F(2,371) = 1.20, p = 0.30. De gemiddelde waarden voor deze variabelen vind je terug in tabel 1. SPSS REEKS 1 Multivariate (co)variantieanalyse 4 Kan men het effect op de gezondheid even goed verklaren als men alleen de werkgerelateerde variabelen beschouwt? Het betreft hier een modelvergelijking tussen het volledige model met alle predictoren en een gerestricteerd model. Aangezien we alle AV gebruiken, moet er geen Mmatrix opgesteld worden. Wel worden niet alle OV gebruikt, daarom moet er wel een Lmatrix worden opgesteld. De volgorde van de Lmatrix kennen we uit de tabel : Parameter Estimates. (0) : intercept (1) : dem13 (2) : skillut (3) : age2 (4) : educlev = 1 (5) : educlev = 2 (6) : educlev = 3 Age2 en Educlev worden buiten het model gehouden, met als gevolg : Age 2 (continue variabele) : (3) = 0 L=( 0 0 0 1 0 0 0) Educlev (nominale variabele) H0 : 1 = 2 = 3 (4) = (5) = (6) DUS (4) - (5) = 0 en (5) - (6) = 0 L = ( 0 0 0 0 1 –1 0 ) L = ( 0 0 0 0 0 1 –1 ) Deze worden worden ingevoerd via de Syntax : /LMATRIX “onderzoeksvraag 2” all 0 0 0 1 0 0 0; all 0 0 0 0 1 –1 0; all 0 0 0 0 0 1 –1; SPSS REEKS 1 Multivariate (co)variantieanalyse 5 OUTPUT Costum Hypothesis Tests (Multivariate Test Results) Weer F rapporteren (Wilks Lambda) + idem als output hierboven! Als we een significant effect vinden, kunnen we de nulhypothese verwerpen en zijn de andere variabelen wel degelijk van belang. Men kan het effect van gezondheid dus niet evengoed verklaren zonder de werkgerelateerde variabelen. RAPPORT Om na te gaan of men het effect op de gezondheid even goed kan verklaren indien men enkel de werk-gerelateerde variabelen beschouwt, worden twee modellen met elkaar vergeleken: een model met zowel de werk-gerelateerde variabelen als de persoons-gerelateerde variabelen, en een model met enkel de werk-gerelateerde variabelen. Uit de modelvergelijkingstoets blijkt dat het model met enkel de werk-gerelateerde variabelen significant slechter is dan het volledige model, F(9,898.2) = 3.30, p = 0.001. De persoons-gerelateerde variabelen spelen wel degelijk een belangrijke rol. SPSS REEKS 1 Multivariate (co)variantieanalyse 6 Indien men enkel de psychische gezondheid beschouwt (depressi & stress), is er dan een verschil tussen de laagste scholingsgraad (educlev = 1) en de hoogste scholingsgraad (educlev = 3) ? In dit geval gaan we zowel een Mmatrix als een Lmatrix moeten opstellen. De Mmatrix ziet er als volgt uit : M=(0 10) (staat voor stress) M=(0 01) (staat voor depressi) Voor de Lmatrix zitten we met 2 celgemiddelden : H0 : 1 = 3 1 - 3 = 0 of (4) - (6) = 0 L = ( 0 0 0 0 1 0 –1) Nu worden beide matrixen in het syntaxvenster ingevoerd. /LMATRIX “onderzoeksvraag 3” all 0 0 0 0 1 0 –1; /MMATRIX “onderzoeksvraag 3” all 0 1 0; all 0 0 1; OUTPUT Output interpreteren als vorige oefeningen. Als we significante effecten vinden, dan kunnen we de nulhypothese verwerpen en kunnen we concluderen dat er een verschil is tussen hoogste en laagste scholingsgraad als men alleen de psychische gezondheid beschouwt. RAPPORT Indien men enkel de psychische gezondheidsvariabelen beschouwt (stress en depressie) is er een significant verschil tussen werknemers met de laagste scholingsgraad, en werknemers met de hoogste scholingsgraad, F(2,370) = 9.34, p < 0.001. Is er voor de verschillende effecten een verschil tussen de fysische gezondheid enerzijds en de psychische gezondheid anderzijds ? Dit is appelen met peren vergelijken, daar de variabelen die we willen vergelijken op een andere schaal zijn gemeten. Zie pagina 5 in feedbackbundel! SPSS REEKS 1 Multivariate (co)variantieanalyse 7 SPSS – Multivariate variantieanalyse (MANOVA) Nu hebben we meerdere afhankelijke variabelen, voor de rest blijft het hetzelfde als een gewone variantie-analyse. Er wordt nu gewerk met een L-matrix én een M-matrix. We werken hier met meerdere AV en OV, maar enkel nominale OV’s. Gegevens - Gezondheid (AV) : chi, stress, depress - OV : educlev (nominaal met 3 niveaus) - OV : agec (nominaal met 2 niveaus) Spelen voor de gezondheid leeftijd en scholingsgraad een rol ? Zo ja, in welke richting wijzen hun effecten ? SPSS Analyze – GLM – Multivariate dependent variables : chi, stress, depressi fixed factors : educlev, agec Options : Descriptive statistics Parameter Estimates Plots : Horizontal Axis : educlev Seperate Lines : agec OUTPUT idem als alle andere oefeningen, zie MANCOVA. Ook kijken naar ESTIMATED MARGINAL MEANS alleen kijken naar die variabelen die significant waren ! ! ! Wie scoort het hoogst op wat, wat valt er op ? RAPPORT Een manova werd uitgevoerd met als afhankelijke variabelen drie gezondheidsvariabelen (fysische gezondheidstoestand, stress en depressie) en met als factoren de scholingsgraad en de leeftijdscategorie. Het hoofdeffect van leeftijd is niet significant (F < 1). De interactie tussen leeftijdscategorie en scholingsgraad is eveneens niet significant, F(12,968.6) = 1.38, p = 0.17. Het hoofdeffect van scholingsgraad daarentegen is wel significant, F(6,732) = 3.62, p = 0.001. Uit de univariate toetsen blijkt dat het effect van scholingsgraad vooral samenhangt met de gezondheidsklachten, F(2,368) = 3.17, p < 0.05, en met stress, F(2,368) = 3.43, p < 0.05, maar niet met depressie, F(2,368) = 1.98, p = 0.14. Het valt op dat werknemers met een lagere scholingsgraad het meest gezondheidsklachten rapporteren: de gemiddelde gezondheidsindeces bedragen respectievelijk: 4.48 (lage scholingsgraad), 3.60 (gemiddelde scholingsgraad) en 3.53 (hoge scholingsgraad). Anderzijds, en dit is opvallend, rapporteren de werknemers met de hoogste scholingsgraad dat ze het meest last hebben van stress: De gemiddelde waarde voor stress bedragen respectievelijk: 2.25 (lage scholingsgraad), 2.26 (gemiddelde scholingsgraad) en 2.51 (hoge scholingsgraad). SPSS REEKS 1 Multivariate (co)variantieanalyse 8 Is er een verschil in gezondheid tussen de oudste groep (agec = 3) enerzijds, en de 2 jongere groepen (agec = 1 en agec = 2) anderzijds? Educlev Educlev = 1 Educlev = 2 Educlev = 3 H0 : .3 = Agec = 1 11 21 31 .1 Agec Agec = 2 12 22 32 .2 Agec = 3 13 23 33 .3 1. 2. 3. .1 + .2 2 De volgorde van de parameters kunnen we bekijken in de tabel Parameter Estimates. Nu moeten we het contrast uitwerken en invullen als Lmatrix in de syntax. Uitwerking : Feedbackbundel pagina 9 OUTPUT Multivariate Test Results De F – toets toetst de onderzoeksvraag. Is deze niet significant, dan moeten we de hypothese verwerpen en H0 aanvaarden. Er is dus geen verschil tussen de oudste groep en de 2 andere groepen ivm gezondheid. RAPPORT Indien men enkel rekening houdt met de leeftijd, dan is er geen verschil tussen de twee jongste groepen van werknemers en de oudste groep van werknemers, F(3, 366) = 0.52, p = 0.634. SPSS REEKS 1 Multivariate (co)variantieanalyse Is het zo dat er géén verschil is tussen de 3 onderstaande subgroepen? a) De groep met de laagste leeftijd en een gemiddelde scholingsgraad agec = 1 , educlev = 2 21 b) De groep met gemiddelde leeftijd en een gemiddelde scholingsgraad agec = 2 , educlev = 2 22 c) De groep met een gemiddelde scholingsgraad ongeacht de leeftijd? educlev = 2 2. H0 : 21 = 22 = 2. Zo een hypothese moet herschreven worden naar 2 contrasten, en deze moeten we dan uitrekenen. Elk contrast vertegenwoordigt een rij in de Lmatrix (p. 10): 21 - 22 = 0 22 - 2. = 0 21 = + 2 + 1 + 21 22 = + 2 + 2 + 22 2. = + 2 + 1/31 + 1/32 + 1/33 + 1/321+ 1/322 + 1/323 OUTPUT Idem als alle vorige oefeningen van MANOVA en MANCOVA RAPPORT Er wordt ook geen significant verschil gevonden tussen (1) de jongste werknemers met een gemiddelde scholingsgraad, (2) werknemers met een gemiddelde leeftijd en een gemiddelde scholingsgraad, en (3) werknemers met een gemiddelde scholingsgraad (ongeacht de leeftijd), F(6, 732) = 1.28, p = 0.26. 9 SPSS 10 REEKS 1 Multivariate (co)variantieanalyse Indien men enkel de psychologische variabelen (stress , depressi) beschouwt, is er een verschil tussen een hoge scholingsgraad (educlev =3) en een lage scholingsgraad (educlev = 1) ? In dit geval gaan we zowel een Mmatrix als een Lmatrix moeten opstellen. De Mmatrix ziet er als volgt uit : M=(0 10) (staat voor stress) M=(0 01) (staat voor depressi) Voor de Lmatrix zitten we met 2 celgemiddelden : H0 : 1. = 3. Deze hypothese moeten we uitwerken (p. 11 feedbackbundel) en we bekomen 1 rij in de Lmatrix. Deze vullen we dan in in de syntax. OUTPUT De output is hetzelfde als bij alle vorige oefeningen van MANOVA en MANCOVA RAPPORT Tenslotte, indien men enkele de psychische gezondheid beschouwt, is er een significant verschil tussen werknemers met een hoge scholingsgraad, en werknemers met een lage scholingsgraad (ongeacht de leeftijd), 8.49, p = 0.000.