Om nu precies te weten welke je moet nemen moet je kijken naar de

advertisement
Oef reeks 3: regressie en ALH -covariantieanalyse
1. Regressie en ALH
- werken met numerieke var
- 2 mogelijkheden:
 lineaire regressie
 GLM (makkelijker)
- Welke var (OV) hebben een effect op de AV?
- GLM
- lineair regressie
- geven hetzelfde resultaat
- maar verschil: GLM: OV in vakje van covariate zetten
lineair regressie: OV in vakje van independent zetten
variantieanalyse (ANOVA):
 OV allemaal nominale meetwaarden (fixed factors in GLM)
 Reeks 2
 Werken met ALH
- Ho: μ11 = μ22 =0
- L = ( 0 1 –1 1 –1 0 1 0 0 0 –1 0 )
- In syntax: aanwezig 1 –1
Stoornis 1 –1 0
Aanwezig*stoornis: 1 0 0 0 –1 0
- hier kan je contrast wel gewoon uitvoeren, je moet niet
eerst standaardiseren
 hier gaat het over HE en IE (niet bij regr analyse)
Regressieanalyse:
 OV allemaal numeriek (covariate in GLM)
 Reeks 3
 Werken met ALH
- Ho: β3 = β4
restrictie of selectie
- L= 0 0 0 1 0
(par op nul fixeren)
0 0001
(gezam effect v 2 var)
- in syntax: decaut 1;
jobins 1
-
-
β3 - β4 = 0
men kan ze niet zomaar
vgl men moet ze eerst
standaardiseren (zie pg
hieronder)
bv is impact van var psydem
binnen dit model even groot
als de impact vd var tsosup?
contrast
- F stat sign: nulhypothese verwerpen
- F stat niet sign: nulhypothese behouden (dus bv Ho: μ11 = μ22 = o dan is er geen sign
verschil tussen de 2 groepen)
- standaardiseren van var: analyse–descrip stat–descrip-save standardized values as var
 standaardiseren van de predictoren (om zo zinvolle interpretatie te kunnen
doen)
 je kan nl enkel gestandaardiseerde regr coef onderling vgl (mn de ruwe regr
coef houden geen rekening met de schaal v vgl bv m met cm vgl)
 zien dat je bij je GLM nu de gestandaardiseerde var in het vakje van
covariate schrijft
om bv te vgl of de impact van de var psydem even groot is dan de impact vd var jobins

bv Ho: β3 = β4

β3 - β4 = 0

L = (0 0 0 1 –1)

In syntax invoeren door all 0 0 0 1 –1

Resultaat: F(1,372)= 67.101, p=0.000 betekenis: nulhypothese w verworpen
met resultaat is sign (dus de gestandaardiseerde parameters zijn sign
verschillend)

Parameters estimates
- B van zpsydem: .308
B van ztsosup: -.132
Dus impact van psydem (binnen dit model) is ongeveeer 3 keer hoger
als deze van tsosup
2. Covariantieanalyse
- nu mix van nominale (fixed factors) en numerieke var (covariate)
(numerieke var = continue var)
- 2 mogelijkheden:
 lineaire regressie (hercoderen v nom var via effectcodering)
 GLM (nom var w automatisch gehercodeerd) (makkelijker)
- richting van effect van de var nagaan:
 voor nominale var: tabel van descript stat (in termen van celgem) maar je kan
het ook in de plot zien
 voor numerieke var: tabel par estimates (in kolom van de B, is eerste kolom)
dus baseren op de regressiecoefficienten
- uitvoeren van een modelvgl:
 via lineaire regressie (makkelijker je hebt nl een next toets, let op: hier moet
je voor e nom var werken met de hulpveranderlijken, de numerieke var blijven
gewoon hetzelfde)
- via next toets werken (model 1 vgl met volledig model)
 via GLM (moeilijker we moeten nl de onderliggende ALH zelf specifieren en
daarna in de syntax invullen bv all 0 0 0 1 –1 0 0 0 1/3 1/3 1/3 –1/3 –1/3 –1/3 )
- correspondeert met de het intercept
- corresponderen met de 2 numerieke var
- corresponderen met je alfa
- corresponderen met je beta
- corresponderen met je IE
wanneer je in een modelvgl het effect bevraagt
van een nominale var (dan de numerieke var op nul zetten)
- modelvgl: (via GLM)
 bij numerieke var: zet je gewoon een 1 op de plaats vd var
bv L = (0 0 1 0 0 0 0 0 0 0 0 0 0 0 )
werken met β
 bij nominale var: betrek je de anderen er ook bij
bv L = ( 0 0 0 1 –1 0 0 0 1/3 1/3 1/3 –1/3 –1/3 –1/3)
werken met μ (bv effect van sex nagaan, sex is alfa heeft 2 niv dus α1 α2)
- μ1. = μ2. (mn die 1 en 2 slagen op α1 en α2 het puntje slaagt op β en γ
- modelvgl (via lineaire regressie)
 LET OP: niet vergeten R squared change in statistices (analyze –regr- lin)
Aan te duiden, anders bekom je verkeerde resultaten
Algemeen
- welke var hebben e effect op AV en in welke richting wijzen d effecten? (HE en IE)
- regressie met nominale var
- variantieanalyse (anova)
- regressieanalyse
via GLM of lineaire regressie
- covariantieanalyse
- multiple regressie
Om nu precies te weten welke je moet nemen moet je kijken naar de var
 regressie met nom var: de OV zijn allemaal nominaal (bv geslacht, educlev)
hier moet je met hulpveranderlijken werken
 variantieanlyse: de OV zijn allemaal nominaal (factoren)
 regressieanalyse: OV zijn allemaal numeriek
 covariantieanalyse: mix van nominale en numerieke var


PCA: OV zijn allemaal numeriek (vandaar dat je e regressie analyse uitvoerd,
dit doe je via lineaire regressie)
FA: mix van nominale en numerieke (vandaar dat je een covariantieanalyse
moet uitvoeren, dit doe je via GLM)
- effect van 1 OV of de AV?
- enkelvoudige regressie
lineaire regressie of Pearson corr
- Algemene lineaire hypothese: (contrasten)
- gebruiken bij modelvergelijkingen als je werk via GLM (in syntax dan
invullen)
* variantieanalyse (ANOVA)
* regressieanalyse
* covariantieanalyse
- General lineair
-
model
variantieanalyse: OV in fixd factors (nominaal)
regressieanalyse: OV in covariate (numeriek)
covariantieanalyse: nom OV in fixed factors, numeriek in covariate
- modelvergelijking ofwel:
 via GLM: maar dan moet je wel werken met contrasten (ALH)
 via lineaire regressie: dan moet je werken met de hulpveranderlijken
- werken met items (vragenlijst): FA
- werken met metingen die sterk onderling gecorr zijn (bv voor gewicht): PCA
- mutiple regressie: je werkt met meerdere predictoren (hetzij nom hetzij numeriek)
- hulpveranderlijke gebruiken: enkel bij nominale OV
- random sample van bv 10% trekken uit de huidige dataset: Data –select cases- random
sample of cases – sample (approximately: 10% of all cases)
- wanneer er wordt gevraagd toets volgende hypothesen: dan met contrasten werken
die je daarna in de syntax van het GLM invult
vgl v 2 hypothesen: 1 rij in je L matrix
vgl v 3 hypothesen: 2 rijen in je L matrix (dan
moet je in je syntax ts de 2 contrasten een ;
zetten)
- om een contrast uit te voeren (werken met ALH)
 eerst zien dat je je lijst met modelparameters hebt
bij nominale var: spreekt men μ (α en β en γ) (Ho: μ11 = μ22)
- bij numerieke var: spreekt men van β0 tem βbv13 (Ho: βJ = 0)
- intercept: bij nom (μ) bij numerieke β0
 nulhypothese schrijven
 nukllhypothese als contrast schrijven
 contrast herschrijven in termen van modelparameters
 in L matrix invullen
 in syntax invullen (via Paste knop in GLM)
 reeks2: contrast (variantieanalyse: met nominale var werken)
 reeks 3: contrast (regressieanalyse: met numerieke var werken, covariantieanalyse: : met nom en numerieke var werken)
eerst je predictoren standaardiseren om vervolgens je contrast
uit te voeren en je resultaat zinvol te interpreteren
analyse- descript stat – descript – var : de 4 numerieke
var hierin – save standardized values as var
ENKEL STANDAARDISEREN wanneer je wilt zien of de gewichten
van 2 var even groot zijn. Bv is impact van psydem even groot dan
de impact van jobins op stress. (H0: β1 = β2 niet bij H0: β1 = β2 = 0)
 bij je contrast met nom var moet je nt eerst staandaardiseren
- geen verschil ts variantieanalyse en regr analyse met nom var: 2 versch methodes om
hetzelfde te doen
- suppress absolute value less than .40: wanneer > of = aan .40 dan spreken we van een
hoge lading
- 2 of 3 nom var: best GLM
- PCA en FA: interval niveau
- clusteranalyse: nom niveau
-> bij permuteren v rijen, nieuwe var niet terug heropnemen in analyse
- let op verschil:
 even goed verklaren MET enkel werkgerelateerde var (skillut en dem13)
- model 1: dem 13, skillut
- model 2: depressi, es, ed1, ed2, esed1, esed2 (skillut dem13)
 even goed verklaren ZONDER werkgerelateerde var (dem13 en skillut)
- model 1: depressi, es, ed1; ed2, esed1, esed2
- model 2: dem13, skillut (depressi, es, ed1, ed2, esed1, esed2)
- wanneer geen sign effect dan moet je niet naar de richting kijken
- wanneer IE sign hoef je de HE niet verder te interpreteren
- modelvergelijking met nominale variabelen
 ongeacht geslacht (μ.1 vergelijken met μ .2)
 rekening houden met geslacht (bv is er een verschil ts mannelijke en
vrouwelijke studenten indien enkle rekening houden met de optie klinische en
bedrijfs) (μ11 + μ12 = μ21 + μ22)
2
2
- modelvergelijkingen: algemeen

ts nom var: contrasten (GLM) bv Ho: μ21 = μ22

ts num var: contrasten (GLM) bv H0: H0: β1 = β2 = 0

ts nom en num var: lineaire regressie
- Let op bij ALH: altijd nul voor je intercept schrijven (voor = op de plaats van)
- voor syntax: indien tijd best wel checken of resultaat klopt
- all 0 0 1 0 –1
- psydem 1
tsosup –1
-> zo zien of resultaat idem is
- wanneer wel en wanneer niet ; schrijven in de syntax
 niet: bij contrast (zie hier juist boven)
 wel: bij restrictie of selectie (gezamelijk effect van jobins en
psydem nagaan Ho: β1 = β2 = 0)
- lineaire regressie: t -toetsen
- GLM: F-toetsen
Download