Oef reeks 3: regressie en ALH -covariantieanalyse 1. Regressie en ALH - werken met numerieke var - 2 mogelijkheden: lineaire regressie GLM (makkelijker) - Welke var (OV) hebben een effect op de AV? - GLM - lineair regressie - geven hetzelfde resultaat - maar verschil: GLM: OV in vakje van covariate zetten lineair regressie: OV in vakje van independent zetten variantieanalyse (ANOVA): OV allemaal nominale meetwaarden (fixed factors in GLM) Reeks 2 Werken met ALH - Ho: μ11 = μ22 =0 - L = ( 0 1 –1 1 –1 0 1 0 0 0 –1 0 ) - In syntax: aanwezig 1 –1 Stoornis 1 –1 0 Aanwezig*stoornis: 1 0 0 0 –1 0 - hier kan je contrast wel gewoon uitvoeren, je moet niet eerst standaardiseren hier gaat het over HE en IE (niet bij regr analyse) Regressieanalyse: OV allemaal numeriek (covariate in GLM) Reeks 3 Werken met ALH - Ho: β3 = β4 restrictie of selectie - L= 0 0 0 1 0 (par op nul fixeren) 0 0001 (gezam effect v 2 var) - in syntax: decaut 1; jobins 1 - - β3 - β4 = 0 men kan ze niet zomaar vgl men moet ze eerst standaardiseren (zie pg hieronder) bv is impact van var psydem binnen dit model even groot als de impact vd var tsosup? contrast - F stat sign: nulhypothese verwerpen - F stat niet sign: nulhypothese behouden (dus bv Ho: μ11 = μ22 = o dan is er geen sign verschil tussen de 2 groepen) - standaardiseren van var: analyse–descrip stat–descrip-save standardized values as var standaardiseren van de predictoren (om zo zinvolle interpretatie te kunnen doen) je kan nl enkel gestandaardiseerde regr coef onderling vgl (mn de ruwe regr coef houden geen rekening met de schaal v vgl bv m met cm vgl) zien dat je bij je GLM nu de gestandaardiseerde var in het vakje van covariate schrijft om bv te vgl of de impact van de var psydem even groot is dan de impact vd var jobins bv Ho: β3 = β4 β3 - β4 = 0 L = (0 0 0 1 –1) In syntax invoeren door all 0 0 0 1 –1 Resultaat: F(1,372)= 67.101, p=0.000 betekenis: nulhypothese w verworpen met resultaat is sign (dus de gestandaardiseerde parameters zijn sign verschillend) Parameters estimates - B van zpsydem: .308 B van ztsosup: -.132 Dus impact van psydem (binnen dit model) is ongeveeer 3 keer hoger als deze van tsosup 2. Covariantieanalyse - nu mix van nominale (fixed factors) en numerieke var (covariate) (numerieke var = continue var) - 2 mogelijkheden: lineaire regressie (hercoderen v nom var via effectcodering) GLM (nom var w automatisch gehercodeerd) (makkelijker) - richting van effect van de var nagaan: voor nominale var: tabel van descript stat (in termen van celgem) maar je kan het ook in de plot zien voor numerieke var: tabel par estimates (in kolom van de B, is eerste kolom) dus baseren op de regressiecoefficienten - uitvoeren van een modelvgl: via lineaire regressie (makkelijker je hebt nl een next toets, let op: hier moet je voor e nom var werken met de hulpveranderlijken, de numerieke var blijven gewoon hetzelfde) - via next toets werken (model 1 vgl met volledig model) via GLM (moeilijker we moeten nl de onderliggende ALH zelf specifieren en daarna in de syntax invullen bv all 0 0 0 1 –1 0 0 0 1/3 1/3 1/3 –1/3 –1/3 –1/3 ) - correspondeert met de het intercept - corresponderen met de 2 numerieke var - corresponderen met je alfa - corresponderen met je beta - corresponderen met je IE wanneer je in een modelvgl het effect bevraagt van een nominale var (dan de numerieke var op nul zetten) - modelvgl: (via GLM) bij numerieke var: zet je gewoon een 1 op de plaats vd var bv L = (0 0 1 0 0 0 0 0 0 0 0 0 0 0 ) werken met β bij nominale var: betrek je de anderen er ook bij bv L = ( 0 0 0 1 –1 0 0 0 1/3 1/3 1/3 –1/3 –1/3 –1/3) werken met μ (bv effect van sex nagaan, sex is alfa heeft 2 niv dus α1 α2) - μ1. = μ2. (mn die 1 en 2 slagen op α1 en α2 het puntje slaagt op β en γ - modelvgl (via lineaire regressie) LET OP: niet vergeten R squared change in statistices (analyze –regr- lin) Aan te duiden, anders bekom je verkeerde resultaten Algemeen - welke var hebben e effect op AV en in welke richting wijzen d effecten? (HE en IE) - regressie met nominale var - variantieanalyse (anova) - regressieanalyse via GLM of lineaire regressie - covariantieanalyse - multiple regressie Om nu precies te weten welke je moet nemen moet je kijken naar de var regressie met nom var: de OV zijn allemaal nominaal (bv geslacht, educlev) hier moet je met hulpveranderlijken werken variantieanlyse: de OV zijn allemaal nominaal (factoren) regressieanalyse: OV zijn allemaal numeriek covariantieanalyse: mix van nominale en numerieke var PCA: OV zijn allemaal numeriek (vandaar dat je e regressie analyse uitvoerd, dit doe je via lineaire regressie) FA: mix van nominale en numerieke (vandaar dat je een covariantieanalyse moet uitvoeren, dit doe je via GLM) - effect van 1 OV of de AV? - enkelvoudige regressie lineaire regressie of Pearson corr - Algemene lineaire hypothese: (contrasten) - gebruiken bij modelvergelijkingen als je werk via GLM (in syntax dan invullen) * variantieanalyse (ANOVA) * regressieanalyse * covariantieanalyse - General lineair - model variantieanalyse: OV in fixd factors (nominaal) regressieanalyse: OV in covariate (numeriek) covariantieanalyse: nom OV in fixed factors, numeriek in covariate - modelvergelijking ofwel: via GLM: maar dan moet je wel werken met contrasten (ALH) via lineaire regressie: dan moet je werken met de hulpveranderlijken - werken met items (vragenlijst): FA - werken met metingen die sterk onderling gecorr zijn (bv voor gewicht): PCA - mutiple regressie: je werkt met meerdere predictoren (hetzij nom hetzij numeriek) - hulpveranderlijke gebruiken: enkel bij nominale OV - random sample van bv 10% trekken uit de huidige dataset: Data –select cases- random sample of cases – sample (approximately: 10% of all cases) - wanneer er wordt gevraagd toets volgende hypothesen: dan met contrasten werken die je daarna in de syntax van het GLM invult vgl v 2 hypothesen: 1 rij in je L matrix vgl v 3 hypothesen: 2 rijen in je L matrix (dan moet je in je syntax ts de 2 contrasten een ; zetten) - om een contrast uit te voeren (werken met ALH) eerst zien dat je je lijst met modelparameters hebt bij nominale var: spreekt men μ (α en β en γ) (Ho: μ11 = μ22) - bij numerieke var: spreekt men van β0 tem βbv13 (Ho: βJ = 0) - intercept: bij nom (μ) bij numerieke β0 nulhypothese schrijven nukllhypothese als contrast schrijven contrast herschrijven in termen van modelparameters in L matrix invullen in syntax invullen (via Paste knop in GLM) reeks2: contrast (variantieanalyse: met nominale var werken) reeks 3: contrast (regressieanalyse: met numerieke var werken, covariantieanalyse: : met nom en numerieke var werken) eerst je predictoren standaardiseren om vervolgens je contrast uit te voeren en je resultaat zinvol te interpreteren analyse- descript stat – descript – var : de 4 numerieke var hierin – save standardized values as var ENKEL STANDAARDISEREN wanneer je wilt zien of de gewichten van 2 var even groot zijn. Bv is impact van psydem even groot dan de impact van jobins op stress. (H0: β1 = β2 niet bij H0: β1 = β2 = 0) bij je contrast met nom var moet je nt eerst staandaardiseren - geen verschil ts variantieanalyse en regr analyse met nom var: 2 versch methodes om hetzelfde te doen - suppress absolute value less than .40: wanneer > of = aan .40 dan spreken we van een hoge lading - 2 of 3 nom var: best GLM - PCA en FA: interval niveau - clusteranalyse: nom niveau -> bij permuteren v rijen, nieuwe var niet terug heropnemen in analyse - let op verschil: even goed verklaren MET enkel werkgerelateerde var (skillut en dem13) - model 1: dem 13, skillut - model 2: depressi, es, ed1, ed2, esed1, esed2 (skillut dem13) even goed verklaren ZONDER werkgerelateerde var (dem13 en skillut) - model 1: depressi, es, ed1; ed2, esed1, esed2 - model 2: dem13, skillut (depressi, es, ed1, ed2, esed1, esed2) - wanneer geen sign effect dan moet je niet naar de richting kijken - wanneer IE sign hoef je de HE niet verder te interpreteren - modelvergelijking met nominale variabelen ongeacht geslacht (μ.1 vergelijken met μ .2) rekening houden met geslacht (bv is er een verschil ts mannelijke en vrouwelijke studenten indien enkle rekening houden met de optie klinische en bedrijfs) (μ11 + μ12 = μ21 + μ22) 2 2 - modelvergelijkingen: algemeen ts nom var: contrasten (GLM) bv Ho: μ21 = μ22 ts num var: contrasten (GLM) bv H0: H0: β1 = β2 = 0 ts nom en num var: lineaire regressie - Let op bij ALH: altijd nul voor je intercept schrijven (voor = op de plaats van) - voor syntax: indien tijd best wel checken of resultaat klopt - all 0 0 1 0 –1 - psydem 1 tsosup –1 -> zo zien of resultaat idem is - wanneer wel en wanneer niet ; schrijven in de syntax niet: bij contrast (zie hier juist boven) wel: bij restrictie of selectie (gezamelijk effect van jobins en psydem nagaan Ho: β1 = β2 = 0) - lineaire regressie: t -toetsen - GLM: F-toetsen