Toegepaste data-analyse testen

advertisement
TESTEN
Univariate testen
Is tevredenheid bij mannen gemiddeld dezelfde als bij vrouwen, binnen hetzelfde koppel?
Gepaarde t-test (Inleiding sl 9)
- wanneer gemiddeldes vergeleken worden
- H0 : μ1 = μ2 versus Ha : μ1 ≠ μ2 (H0 : μ1 - μ2 = 0 => H0 : μD = 0)
- bij afhankelijke/geclusterde steekproeven
o bv. bij koppels, bij ouders vs kinderen, …
- SPSS: Analyze – Compare Means – Paired Samples T-test
o Paired variables aangeven
Wat is het effect van X op Y bij mannen? Wat is het effect van X op Y bij vrouwen?
Meervoudige lineaire regressieanalyse (Inleiding sl 34)
- verband tussen twee variabelen bekijken
- bij meerdere predictoren (OV)
- kan enkel bij onafhankelijke steekproeven (moet aan drie basisassumpties w voldaan)
o kan wel bij afhankelijke steekproeven wnr je die afzonderlijk bekijkt
o bv. binnen data verzameld bij koppels, data van mannen en vrouwen apart bekijken
- SPSS: twee opties
o Analyze – Regression – Linear
 OV en AV aangeven
o Analyze – General Linear Model – Univariate
 Makkelijker als je met factoren (bv. leeftijdscategorieën) zit
 Makkelijker als je met interacties werkt
-
SPSS: Analyze – GLM – Univariate
o Covariates: variabelen gemeten op intervalniveau (continue var)
o Fixed factors: factoren gemeten op nominaal of ordinaal niveau (categorische var)
o Model: structuur van het model aangeven
 Full factorial: alle mogelijke interacties tussen een model beschouwen
 Custom: zelf hoofd- en/of interactie-effecten aangeven
Multivariate testen
Is er een verschil in effect van X1 t.o.v. X2 op elk van de verschillende Y’s?
Multivariate lineaire regressie-analyse (MLM sl 21)
- verband bij meerdere afhankelijke variabelen bekijken
- H0 : β11 - β21 = β11 - β31 = 0
- SPSS: Analyze – GLM – Multivariate
o Dependents: AV
o Fixed effects: categorische predictoren
o Covariates: continue predictoren
o Model: model specifiëren  hoofd/interactie-effecten?
- General Linear Hypothesis (MLM sl 28)
o L- en M-matrix handmatig opstellen via Window – Syntax
o Syntax laten runnen door groen pijltje
Zijn de gemiddelde Y1, Y2 en Y3 gelijk over de 3 niveaus van X?
Manova en Mancova (MLM sl 40)
- gemiddeldes vergelijken tussen groepen over meerdere uitkomsten
μ11 = μ21 = μ31
- H0 :
μ12 = μ22 = μ32
μ13 = μ23 = μ33
- mancova: indien ook gecontroleerd wordt voor continue predictoren
- speciaal geval van lineaire regressie
o vnl gebruiken als men binnen het individu verschillende uitkomsten wil bekijken
- via L- en M-matrix
Is de Y voor elk van de 3 X’en gelijk? (3 X’en binnen elk kind gemeten)
Repeated Measures Anova (RM Anova sl 17)
- gelijkheid in gemiddelden bij groepen
- bij herhaalde metingen onder verschillende ‘condities’ binnen hetzelfde subject
- dezelfde uitkomst herhaaldelijk bekeken onder verschillende condities
- validiteit van RM gebaseerd op sfericiteitsassumptie
o de variantie in de verschilscores tussen de condities is gelijk
- SPSS: Analyze – GLM – Repeated Measures
 Wat is WS factor? Wat is de uitkomst die je gaat meten?
 Wat zijn de verschillende variabelen die niveaus binnen WS factor weergeven?
 Model specifiëren
 Contrast bekijken (! vergeet niet op Change te klikken)
Mixed models
Is gemiddelde populariteit gelijk bij jongens en meisjes, controlerend voor klas?
Random intercept model (MM1 sl 20)
- X1 (level 1) = fixed effect  effect waarin we geïnteresseerd zijn
- X2 (level 2) = random effect  we zijn er niet echt in geïnteresseerd, een nieuwe ‘at random’
getrokken steekproef zou een nieuwe X2 opleveren
o Variatie in intercept, niet in helling
- SPSS: Analyze – Mixed Models – Linear
 Specify Subjects en Repeated:
 Subjecten = upper level
 Repeated (enkel wanneer via marginaal model, fixed factor invullen => ook
covariance type invullen!)
 Afhankelijke variabelen, factoren (categorische var) en covariaten (continue var)
bepalen
 Fixed effect specifiëren
 Random effect specifiëren
 Covariantietype specifiëren
 Include intercept aanvinken
 Subject Groupings specifiëren: wat is de eenheid? hoe heb je de data
verzameld?
Is groei bij kinderen gerelateerd aan de lengte van de moeder? (longitudinale data)
Random intercept, random slope model (MM2 sl 19)
- bij longitudinale data gaan assumpties van random intercept model de data niet goed
genoeg omvatten (zeer sterke assumpties die niet realistisch zijn)
- SPSS: Analyze – Mixed Models – Linear
 Specify Subjects en Repeated:
 Subjecten = upper level
 Repeated (enkel wanneer via marginaal model, fixed factor invullen => ook
covariance type invullen!)
 Afhankelijke variabelen, factoren (categorische var) en covariaten (continue var)
bepalen
 Fixed effect specifiëren (blijft hetzelfde als bij random intercept model)
 Random effect specifiëren
 Covariantietype specifiëren
 Include intercept aanvinken
 Random slope toevoegen
 Subject Groupings specifiëren: wat is de eenheid? hoe heb je de data
verzameld?
Beïnvloeden mijn schuldgevoelens de onderhandelingsstijl van mezelf en/of van mijn partner?
Actor-Partner Interdependence model (MM3 sl 4)
- twee personen die interageren met elkaar (dyadische data)
o Actor effect: het effect van iemands score X op de eigen uitkomst Y
o Partner effect: het effect van iemands score X op de uitkomst Y van de partner
- (1) Two-intercept approach = marginale aanpak
o SPSS: Analyze – Mixed Models – Linear
 Specifiëren hoe data binnen dyade gestructureerd zijn (volgens factor X, bij
repeated)
 Covariantietype specifiëren
 Fixed effecten
 Random effecten (include intercept uit! Geen random effecten toelaten!)
Zijn deze effecten hetzelfde bij mannen en vrouwen?
- (2) Interaction approach
o SPSS: Analyze – Mixed Models – Linear
 Fixed effecten verschillen: nu wel een intercept
Structural Equation Modeling
Is er een direct of een indirect effect van X1 / X2 op Y?
Padanalyse
- alle variabelen zijn manifest (kunnen worden geobserveerd)
Lineaire regressie (Padanalyse sl 21)
- Enkel voor recursieve modellen
- R: model <- lm(AV ~ OV + OV, data = dataset waar je lineaire regressie op wil doen)
o summary(model) om uitkomsten te zien
o hoofdeffecten scheiden door een + teken
Covariantie-gebaseerde structurele vergelijkingsmodellen (Padanalyse sl 39)
- Zowel voor recursieve als niet-recursieve modellen
- Parameters schatten
- SPSS bestand inlezen?
o Zorgen dat wd juist staat via setwd(“H:/…”)
o library(foreign)
o data1 <-read.spss(“naam van het bestand.sav”,to.data.frame=TRUE,
use.value.labels=FALSE)
- SEM uitvoeren?
o Model specifiëren
 semmodel <- ‘AV ~ OV + OV’
o SEM uitvoeren
 fit <- sem(semmodel, data=data1)
o uitkomst laten zien
 summary(fit)
- variabelen standaardiseren om zo ook correlaties te kunnen zien?
o Extra commando bij summary
 summary(fit, standardized = T)
Vinden we bij kinderen ook een tweedelige factorstructuur?
Confirmatorische factoranalyse
- SPSS bestand inlezen indien nodig
- Model specifiëren
- CFA uitvoeren
o fit <- cfa(model, data=data1, test=”santorra.bentler”)
o summary(fit, fit.measures=T, standardized=T)
 fit.measures: fitmaten zoals CFI, RMSEA, …
 standardized: correlaties door gestandaardiseerde maten
o ULI: standaard in R  factorlading = referentie-indicator, wordt gefixeerd op 1
Zijn factorladingen identiek bij jongens en meisjes?
- Fit afzonderlijk voor verschillende groepen (bv. jongens en meisjes)?
o fit1 <- cfa(model, data=data1, group= “geslacht”, test = “santorra.bentler”)
- Restricted model: gelijke factorladingen voor bv. jongens en meisjes
o fit2 <- cfa(model, data=data1, group = “geslacht”, group.equal=”loadings”,
test=”santorra.bentler”)
- Vergelijk twee modellen
o anova(fit1, fit2)
 wanneer H0 niet wordt verworpen dan is het effect van de factoren op de
indicatoren gelijk bij jongens en meisjes
Stappen bij een volledige SEM
1. Ga het meetmodel na (= CFA)
- Eén factor model
o model1 <- ‘all=~ OV + OV + …’
o fit1 <- cfa(model1, data=data1)
o summary(fit1, fit.measures=T)
-
alle geobserveerde variabelen
Slechte fit voor data? Meerdere factoren (bv. 4)
o model4 <- ‘AV1 =~ OV1 + …
alle indicatoren per factor weergeven
AV2 =~ OV + …
AV3 =~ OV + …
AV4 =~ OV + …’
fit4 <- cfa(model4, data=data1)
summary(fit4,fit.measures=T, standardized=T)
o
mi4 <-inspect(fit4, “mi”)
Model indices ook tonen, zodanig dat je kan nagaan
door welke extra verbanden toe te voegen je model
beter zal fitten
subset(mi4,mi>5)
doen zodanig dat je alle mi groter dan 5 weergeeft, mi
moet groter zijn dan 5 of dan 10 om een groot genoege
verandering te hebben
-
Modification indices geven een bijkomende residuele correlatie aan?
o model4b <- ‘AV1 =~ OV1 + …
alle indicatoren per factor weergeven
AV2 =~ OV + …
AV3 =~ OV + …
AV4 =~ OV + …
happy ~~ mood’
bijvoorbeeld: gecorreleerde residuen
fit4b <- cfa(model4b, data=data1)
summary(fit4b,fit.measures=T, standardized=T)
2. Meetmodel OK? Focus op structuur deel!
- Regressies aangeven
o semmodel <‘AV1 =~ OV1 + …
AV2 =~ OV + …
AV3 =~ OV + …
AV4 =~ OV + …
-
alle indicatoren per factor weergeven
happy ~~ mood
gecorreleerde residuen
AV3 ~ AV4
AV2 ~ AV3 + AV4
AV1 ~ AV2 + AV3 + AV4’
regressies weergegeven met 1 ~ (kijken wat
door structureel model wordt opgelegd!)
fitsem <- cfa(semmodel, data=data1)
summary(fitsem, fit.measures=T)
Eenvoudiger model? Enkel regressies opnemen waarvan padcoëfficiënten significant zijn.
o Zelfde stappen in R, met minder regressies.
Modellen vergelijken in een tabel => eenvoudigste model is het beste model.
Mediatie en moderatie
Leidt de priming (OV) tot minder positieve ratings (mediator) wat op zijn beurt leidt tot een lagere
schatting van de pijn (AV)?
Mediatie
- Totaal effect
via lineaire regressie
o model0 <- lm(AV ~ OV, data=paindata)
summary(model0)
- Het pad van OV naar mediator (a-pad)
o model1 <- lm(med ~ OV, data=paindata)
summary(model1)
- Direct effect + pad van mediator naar AV (b-pad)
o model2 <- lm(AV ~ OV + med, data=paindata)
summary(model2)
- Het indirect effect
via SEM (sl22)
o model3 <- ‘ med ~ a*OV
AV ~ cp*OV + b*AV
ab:= a*b ’
fit3 <- sem(model3, data=paindata)
summary(fit3)
o
set.seed(1)
fit4 <- sem(model3, data=paindata, se=”boot”)
parameterEstimates(fit4,boot.ci.type=”perc”)
via bootstrap + SEM (sl23)
percentile-based bootstrap (sl 16)
Is het effect van de mediator evaluatie (M) op de uitkomst pijn (Y) dezelfde in beide condities (X)?
Moderatie (gemodereerde mediatie)
- interactie-effect ook testen via bootstrapping
o set.seed(1)
paindata$CONDEVAL <- paindata$condition*paindata$evaluation
nieuwe variabele aanmaken die interactie
bevat ($ wijzen op het feit dat je een specifiek
deel/variabele uit de dataset wil halen)
model5<- ‘M ~ a*X
Y ~ cp*X + b*M + d*CONDEVAL
IE0 := a*b
IE1 := a* (b+d) ‘
fit5 <- sem(model5, data=paindata, se=”boot”)
parameterEstimates(fit5,boot.ci.type=”perc”)
Download