MTO-D MAW, theorie les 1

advertisement
Theorie MTO-D MAW/02.
Exploratieve Factoranalyse.
De correlatie matrix geeft correlaties tussen de vragen (=items/variabelen).
Een factor kan groepjes van vragen samenvoegen tot een begrip.
Doelstelling factoranalyse.
1. Met een paar factoren de antwoorden op de vragen verklaren.
2. Met een paar factoren de correlatiematrix tussen de vragen reproduceren.
Componenten matrix geeft de componenten of factorladingen a.
Dit zijn de scores van de vraag op de factor.
Groepjes vragen die samen hoog scoren op een factor vormen samen begrip.
Vraag met de hoogste a is beste indicator voor het begrip.
Communaliteit h2 geeft verklaarde variantie van een vraag door de factoren
dwz. hoe goed worden de scores op een vraag verklaard door de begrippen.
Communaliteit= factorladingen2 (horizontaal optellen per vraag).
Uniciteit= 1 - communaliteit.
De eigenwaarde λ van een factor geeft aan hoeveel van de totale variantie van
alle vragen wordt verklaard door een factor dwz. hoe goed worden de scores op
alle vragen verklaard door de begrippen.
De eigenwaarde= factorladingen2 (verticaal optellen per factor).
Proportie verklaarde variantie= eigenwaarde/ totale variantie van alle vragen.
Totale variantie= aantal vragen (als gestandaardiseerd).
Selecteren hoeveel factoren:
- Eigenwaarde > 1 (=Kaisercriterium).
- Scree test van Catell, neem de eigenwaarden die duidelijk hoger liggen.
- Aantal Factoren K= aantal vragen/3.
Factorrotatie heeft als doel het maken van een eenvoudige structuur.
Dat wil zeggen componentenladingen dichtbij 1 of dichtbij 0.
Elke vraag hoort bij een begrip en elk begrip (=factor) heeft eigen vragen.
Vraag hoort bij begrip als ≥0,3 en niet als <0,3.
Factorrotatie verandert bij VARIMAX niet de communaliteit, de som van de
eigenwaarden, de geproduceerde R en de Residuele R.
De eigenwaarde per factor en de factorladingen veranderen.
Voor OBLMIN geldt hetzelfde, maar bij VARIMAX zijn de communaliteit en de
totale variantie nog steeds te berekenen, bij OBLIMIN niet.
3 manieren van factorrotatie.
Begin is wiskundig en moeilijk te interpreteren want geen eenvoudige structuur.
VARIMAX=orthogonaal=ongecorreleerde F: Rotated Component Matrix.
OBLIMIN=gecorreleerde F: Pattern Matrix en Structure Matrix.
Factorcorrelatie tussen F1 en F2: Component Correlation Matrix
Kies voor VARIMAX tenzij OBLIMIN duidelijk eenvoudiger (vergelijk Rotated
Component Matrix VARIMAX met Pattern Matrix OBLIMIN) of als correlatie van
begrippen ≥ 0,3 (Bij VARIMAX zijn begrippen ongecorreleerd).
Gereproduceerde correlatie R tussen 2 vragen rX1X2.
Varimax: per factor a1 en a2 vermenigvuldigen.
Oblimin: a1F1.a2F1 + a1F2.a2F2 + rF1F2.(a1F1.a2F2+a1F2.a2F1).
Residuele R= correlatiematrix - gereproduceerde matrix
Veel absolute waarden > 0,05 is probleem: extra factor of stoppen met FA.
Correlatie vraag X1 en begrip F1: rX1F1.
Varimax: aflezen a Rotated Component Matrix
Oblimin: aflezen Structure Matrix
Of: a1F1 + a1F2.rF1F2 (a aflezen bij Pattern Matrix)
Pattern Matrix geeft factorladingen a, Structure Matrix geeft rXF
F1
a1F1
rF1F2
F2
X1
a1F2
Factorscore is een gewogen somscore van een persoon op de vragen en geeft aan
hoe goed de proefpersoon scoort op een factor.
Als een persoon hoog scoort op een factor is het ook aannemelijk dat die hoog
scoort op de vragen die sterk samenhangen met de factor.
Nagaan of factoranalyse goed is.
1. Aanname FA dat er lineaire samenhang is tussen de vragen=items.
Check samenhang tussen elk paar vragen in figuur en per vraag ≥5 categorieën
of anders gelijke frequentieverdelingen.
2. Voorwaarden aan aantal proefpersonen N en aantal vragen J.
N ≥ 100 en N ≥ 5J
3. Voorwaarden aan Correlatiematrix R.
R heeft veel correlaties > │0,3│
KMO om na te gaan of factorrotatie mag, >0,6 is goed.
Bartlett Sphericity test om aan te tonen tenminste 1 correlatie≠0 (p<0,05)
2 manieren: Principale factoranalyse (PAF) en Principale componentenanalyse (PCA).
In praktijk geen duidelijk verschil, behalve iets andere factorenladingen.
Theoretisch wel verschil:
Factoranalyse PAF= gebaseerd op gemeenschappelijke variantie h2 met R*
(=aangepaste correlaties).
Proefpersonen beantwoorden vragen. Het antwoord van de proefpersoon valt voor
een deel te voorspellen uit de antwoorden op de andere vragen. Dat is de
gemeenschappelijke variantie, die valt terug te voeren op een onderliggend
begrip.
Het antwoord van de proefpersoon wordt voor een deel verklaard omdat de vraag
iets unieks meet en dat is de unieke variantie.
PAF is latent, want die begrippen kunnen niet direct worden gemeten.
Model PAF: Antwoord X= a1 . Begrip F1 + a2 . Begrip F2 + b . Unieke Vraag X
In Model PAF zijn de vragen dus lineaire combinaties van de begrippen F en het
unieke van de vraag.
Principale componentenanalyse PCA= gebaseerd op totale variantie met R
(=werkelijke correlaties).
PCA maakt geen onderscheid Algemeen Begrip en Unieke van Vraag.
PCA reduceert het aantal vragen door een aantal antwoorden samen te voegen.
Grofweg neemt PCA het gemiddelde van gelijkscorende vragen
PCA is manifest, want het is de gemeten en geobserveerde variantie.
Model PCA: Component Y= (w . X)
Y is dus niet een combinatie van begrippen F, maar van de gemeten
vragen=variabelen.
MTO-D MAW/02.
Opgaven Exploratieve Factoranalyse.
Voorbeeld 1.
Een rapport:
Wiskunde
Jan
4
Peter
8
Anne
8
Marie
3
Correlatiematrix:
Wis. Nat.
Wis.
1
0,9
Nat.
0,9
1
Soc.
0,1
0,1
Psy.
0,1
0,1
Natuurkunde
5
7
7
4
Psy.
0,1
0,1
1
0,9
Ped.
0,1
0,1
0,9
1
Psychologie
5
4
7
8
Pedagogiek
4
5
8
8
Nieuw rapport:
B
Jan
4,5
Peter
7,5
Anne
7,5
Marie
3,5
A
4,5
4,5
7,5
8
Ladingen:
Component 1 C2
B
A
Wis. 0,9
0,3
Nat. 0,9
0,3
Soc. 0,3
0,9
Psy. 0,3
0,9
a. Wat voor samenhang tussen de Items zie je in het rapport.
b. Zie je dat terug in de correlatiematrix.
c. Nieuwe rapport vat oude rapport samen in 2 gemiddelden.
Hoe noem je dat verschijnsel.
d. Wat zie je in aan de Componenten.
Bereken de eigenwaarden en de communaliteit met 2 Componenten.
Antwoord.
a. Wiskunde en Natuurkunde hangen samen,
en Psychologie en Pedagogiek hangen samen.
b. Hoge correlaties (0,9) tussen die variabelen.
c. Datareductie
d. Wis. en Nat. scoren beide hoog op Component: B-Component.
Psy. en Ped. scoren beide hoog op Component: A-Component.
Eigenwaarde van Component 1: 0,92 + 0,92 + 0,32 + 0,32= 1,8
Component 1 reduceert 1,8 variabele tot 1 Component (ruwweg Wis. + Nat.)
Component 1 meet 1,8/4= 45% van verschillen in de cijfers (=variantie)
Eigenwaarde van Component 2: 0,32 + 0,32 + 0,92 + 0,92= 1,8
Communaliteit van Wis. op eerste 2 Componenten: 0,92 + 0,32= 90%
De eerste 2 Componenten verklaren 90% van het wiskundecijfer.
Opgave 1.
Een onderzoeker wil een schaal maken om werkdruk te meten.
Om een indruk te krijgen maakt hij elf vragen en de antwoorden
worden verwerkt met een exploratieve Componenten analyse.
Na rotatie is dit de uitslag:
VARIMAX-Rotated Component Matrix
Componenten
1
2
1. Snel werken
0,729
0,187
2. Teveel werk
0,583
0,337
3. Te hard werken om af
0,759
0,227
4. Teveel tijdsdruk
0,773
0,299
5. Teveel haast
0,827
0,171
6. Werk op mijn gemak
-0,661
-0,019
7. Vaak achterstanden
0,520
0,222
8. Te weinig werk
0,556
0,093
9. Problemen met werktempo
0,169
0,793
10. Problemen met werkdruk
0,145
0,839
11. Liever wat kalmer aan
0,229
0,716
OBLIMIN-PATTERN MATRIX
1. Snel werken
2. Teveel werk
3. Te hard werken om af
4. Teveel tijdsdruk
5. Teveel haast
6. Werk op mijn gemak
7. Vaak achterstanden
8. Te weinig werk
9. Problemen met werktempo
10. Problemen met werkdruk
11. Liever wat kalmer aan
Componenten
1
2
0,748
0,011
0,556
0,210
0,771
0,046
0,770
0,120
0,857
-0,032
-0,712
0,152
0,514
0,103
0,581
-0,045
0,005
0,809
-0,032
0,865
0,087
0,710
Vraag a. t/m j. met VARIMAX:
a. Wat is de componentenlading van vraag 8 op Component 2.
b. Wat is de correlatie tussen vraag 1 en component 1.
c. Hoe goed verklaart het eerste begrip vraag 1.
d. Wat is de communaliteit van vraag 1.
e. Wat is de uniciteit van vraag 1.
f. Hoeveel variantie van de vragen wordt verklaard door het eerste begrip.
g. Hoeveel variantie wordt verklaard door beide begrippen samen.
h. Wat is de proportie verklaarde variantie door beide begrippen samen.
i. Wat is de geproduceerde correlatie tussen vraag 1 en 8.
j. De gemeten correlatie tussen vraag 1 en 8 is 0,309.
Bereken de residuele correlatie tussen vraag 1 en 8.
k. Kies je voor VARIMAX of OBLIMIN.
l. Hoe zou je de componenten benoemen.
Component Correlation Matrix
Component
1
2
1
1,000
0,428
2
0,428
1,000
Antwoorden.
a. 0,093. Geeft aan hoe sterk vraag 8 samenhangt met Component 2.
b. 0,729
c. 0,7292= 0,531 -> 53,1% van de verschillen in het antwoord op vraag 1
wordt verklaard door Component 1.
d. 0,7292 + 0,1872= 0,566 -> 56,6% van het antwoord wordt verklaard door
Component 1 en 2.
e. Uniciteit= 1 - 0,566= 0,434. Het deel van het antwoord dat niet valt af
te leiden uit de scores op Component 1 en 2.
f. λ1= 0,7292 + . . + 0,2292= 3,847
g. λ2= 0,1872 + . . + 0,7162= 2,22 -> λ1 + λ2= 6,067
h. 6,067/11= 0,552 -> 55,2%
i. r= 0,729 . 0,556 + 0,187 . 0,093= 0,423
j. 0,309 - 0,423= -0,114. De Componenten schatten de correlatie dus een
stuk hoger dan is gemeten in de steekproef. >0,05 en dat is dus slecht.
k. 0,428 > 0,3 -> OBLIMIN.
l. Werkdruk en Werkstress.
Opgave 2.
Factor-analyse met 18 vragen= items= variabelen.
Eerste analyse om aantal factoren te bepalen.
Tweede analyse met Varimax.
Derde analyse met Oblimin.
Eerste analyse:
Componenten
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Total
5,655
2,142
1,188
0,949
0,818
0,795
0,740
0,668
0,649
0,627
0,552
0,548
0,523
0,511
0,460
0,435
0,426
0,317
Inital Eigenvalues
% of Variance
Cumulative %
31,416
31,416
11,898
43,315
6,599
49,914
5,271
55,184
4,542
59,726
4,417
64,143
4,111
68,254
3,709
71,962
3,605
75,567
3,481
79,048
3,064
82,112
3,042
85,154
2,907
88,061
2,840
90,901
2,553
93,454
2,417
95,872
2,366
98,238
1,762
100,00
Communalities
claim state benefits
cheating on tax
joyriding
taking soft drugs
lying
adultery
accepting a bribe
homosexuality
abortion
divorce
euthanasia
suicide
throwing away litter
drunk driving
paying cash
having casual sex
smoking in public
speeding over limit
Initial
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
Extraction
0,426
0,686
0,433
0,424
0,510
0,402
0,465
0,574
0,646
0,680
0,485
0,434
0,505
0,537
0,530
0,499
0,310
0,437
6
Eigenvalue
5
4
3
2
λ=1
1
0
Component number
1
a.
b.
c.
d.
e.
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
17 18
Waarom is er voor 3 componenten gekozen.
Hoeveel variantie item ‘joyriding’ wordt verklaard door 3 componenten.
Wat is de uniciteit van item ‘joyriding’.
Wat is de eigenwaarde van de eerste component.
Hoeveel variantie verklaren de 3 componenten tezamen van alle items.
Antwoord.
a. Scree-plot: 2 duidelijk hoger, 3 heel klein beetje hoger.
3 Eigenwaarden > 1.
Keuze gaat tussen 2 of 3 componenten.
b. 43,3% (kijken bij Communalities)
c. 1 – 43,3%= 56,7%
d. 5,655
e. 5,655 + 2,142 + 1,188= 8,985 -> 8,985/18= 49,9%
Tweede Analyse, VARIMAX rotatie:
Rotated Component Matrix
Component
1
divorce
0,817
abortion
0,794
homosexuality
0,740
euthanasia
0,654
suicide
0,603
having casual sex
0,566
adultery
0,401
drunk driving
throwing away litter
joyriding
speeding over limit
taking soft drugs
0,394
smoking in public
0,365
cheating on tax
paying cash
claim state benefits
lying
accepting a bribe
2
3
0,365
0,367
0,705
0,694
0,642
0,583
0,512
0,417
0,366
0,817
0,668
0,618
0,613
0,522
0,434
f. Voldoet de oplossing aan de eenvoudige structuur.
Antwoord.
f. Nee, sommige vragen scoren 2x hoog.
Derde Analyse, OBLIMIN rotatie:
Pattern Matrix
drunk driving
throwing away litter
joyriding
speeding over limit
taking soft drugs
smoking in public
divorce
abortion
homosexuality
euthanasia
suicide
having casual sex
adultery
cheating on tax
paying cash
claim state benefits
lying
accepting a bribe
Structure Matrix
Component
1
2
0,720
0,720
0,667
0,555
0,493
-0,361
0,370
-0,839
-0,815
-0,766
-0,662
-0,594
-0,523
-0,365
g.
h.
i.
j.
-0,870
-0,680
-0,638
-0,593
-0,480
0,363
Component Correlation Matrix
Component
1
2
1
1,000
-0,290
2
-0,290
1,000
3
-0,432
0,289
3
drunk driving
throwing away litter
joyriding
speeding over limit
taking soft drugs
smoking in public
divorce
abortion
homosexuality
euthanasia
suicide
having casual sex
adultery
cheating on tax
paying cash
claim state benefits
lying
accepting a bribe
Component
1
2
0,729
0,709
0,655
0,641
0,567
-0,467
0,487
-0,381
-0,821
-0,799
-0,742
-0,665
0,344
-0,636
0,473
-0,632
0,475
-0,484
0,362
0,366
0,423
0,533
-0,364
-0,367
3
-0,357
-0,364
-0,414
-0,368
-0,360
-0,371
-0,456
-0,824
-0,713
-0,643
-0,688
-0,610
3
-0,432
0,289
1,000
Wat is de correlatie tussen ‘joyriding en Component 1.
Voldoet de oplossing aan een eenvoudige structuur.
Kies je voor Varimax of Oblimin.
Interpreteer de gevonden deelbegrippen.
Antwoord.
g. 0,655
h. Nee, ‘soft drugs’ en ‘bribe’ scoren 2x hoog.
i. Oblimin: eenvoudiger (vergelijk Rotated met Pattern) en │-0,432│ > 0,3.
j. 1. Tolerantie asocialen. 2. Tolerantie modern leven. 3.Tolerantie witte boorden criminaliteit.
Opgave 3.
Op een correlatiematrix van 8 items wordt een factoranalyse uitgevoerd.
Een selectie van de output is bijgevoegd:
Correlation Matrix.
Item 1 Item 2
Item 1 1,000
Item 2 0,486 1,000
Item 3 0,498 0,634
Item 4 0,435 0,613
Item 5 0,271 0,139
Item 6 0,198 0,257
Item 7 0,263 0,272
Item 8 0,283 0,378
Item 3 Item 4 Item 5 Item 6 Item 7 Item 8
1,000
0,757
0,128
0,218
0,237
0,403
1,000
0,148
0,257
0,160
0,379
1,000
0,252 1,000
0,263 0,333 1,000
0,201 0,264 0,374 1,000
4
1 factor oplossing
Scree-plot
3
Item 1
Item 2
Item 3
Item 4
Item 5
Item 6
Item 7
Item 8
2
1
1
0,607
0,753
0,814
0,770
0,286
0,381
0,400
0,537
2 factor oplossing
Item 1
Item 2
Item 3
Item 4
Item 5
Item 6
Item 7
Item 8
1
0,596
0,741
0,836
0,789
0,294
0,392
0,437
0,539
2
0,028
-0,115
-0,294
-0,297
0,327
0,317
0,507
0,199
0
1
2
3
Pattern Matrix
Item 1
Item 2
Item 3
Item 4
Item 5
Item 6
Item 7
Item 8
1
0,464
0,689
0,922
0,886
0,026
0,061
0,056
0,278
4
5
6
Structure Matrix
2
0,210
0,094
0,076
0,094
0,452
0,471
0,695
0,383
Item 1
Item 2
Item 3
Item 4
Item 5
Item 6
Item 7
Item 8
1
0,568
0,745
0,884
0,839
0,199
0,296
0,289
0,468
2
0,441
0,442
0,382
0,347
0,439
0,501
0,667
0,522
7
8
Factor Correlation
Matrix
1
2
1 1,000 0,497
2 0,497 1,000
Vragen.
a. Op grond waarvan kan je kiezen voor 2 factoren.
b. Wat staat er in de Pattern-, Structure- en Factor Correlation Matrix.
c. Is er een eenvoudige structuur.
Antwoord.
a. Lichte sprong in Scree-plot, 2 factoren > 1.
b. Pattern Matrix: factorladingen.
Structure Matrix: correlaties tussen items en factoren.
Factor correlation Matrix: correlatie tussen de 2 Factoren.
c. Eenvoudige structuur redelijk goed, item 8 en item 1 een beetje
onbevredigend. 0,464 en 0,383 vrij laag en 0,210 en 0,278 vrij hoog.
Metafoor om factorrotatie uit te leggen.
Je hebt 3 bakken met gekleurde balletjes.
Je gaat de ballen anders over de bakken verdelen zodat
de kleuren mooier bij elkaar liggen (=rotatie).
De inhoud van de bakken (=factoren) kan totaal veranderen,
maar het aantal ballen (=verklaring) blijft hetzelfde.
Opgave 4.
2 vriendinnen doen samen een schoonmaakklus.
Normaal verdelen ze alle klussen in 2 gelijke delen.
Afwassen
Ramen wassen
Stofzuigen
Tafels afnemen
Vriendin 1
0,5
0,5
0,5
0,5
Vriendin 2
0,5
0,5
0,5
0,5
Vriendin 2 is grieperig en bij uitzondering verdelen ze het werk anders.
Afwassen
Ramen wassen
Stofzuigen
Tafels afnemen
Vriendin 1
0,7
0,1
0,7
0,7
Vriendin 2
0,1
0,7
0,1
0,1
Als we de vriendinnen opvatten als Factoren, de klusjes als items en de
herverdeling
als rotatie. Wat is dan wel en wat is niet veranderd.
Antwoord.
Afwassen
Ramen wassen
Stofzuigen
Tafels afnemen
Eigenwaarde
Vriendin 1
0,5
0,5
0,5
0,5
1
Vriendin 2
0,5
0,5
0,5
0,5
1
Communaliteit
0,5
0,5
0,5
0,5
2,0
Vriendin 2 is grieperig en bij uitzondering verdelen ze het werk anders.
Afwassen
Ramen wassen
Stofzuigen
Tafels afnemen
Eigenwaarde
Vriendin 1
0,7
0,1
0,7
0,7
1,48
Vriendin 2
0,1
0,7
0,1
0,1
0,52
Communalities
0,5
0,5
0,5
0,5
2,0
Door rotatie veranderen de factorladingen,
ontstaat een simpele structuur en verandert de eigenwaarde per factor.
Onverandert blijft de communaliteit en de som van de eigenwaarden.
Opgave 5.
Schets in grote lijnen een onderzoek met Factoranalyse.
Antwoord.
Je begint met het maken van een vragenlijst, met vragen die lopen
van negatief naar positief met een neutraal middenpunt.
Nadat de deelnemers aan het onderzoek de vragen hebben ingevuld,
geef je alle antwoorden aan SPSS.
De kern van de SPSS-uitdraai is de correlatie-matrix met alle
correlaties tussen alle vragen= Items.
Als je zelf goed kijkt, kan je in die matrix al de clusters
van samenhangende vragen ontdekken die samen een factor vormen.
Op de geroteerde factoroplossing kan je die clusters van
samenhangende vragen zo aflezen.
De factoroplossing is dus makkelijker te lezen dan de
oorspronkelijke correlatie-matrix.
Factoranalyse sluit heel direct aan op de denkwereld van psychologen.
Je zoekt naar clusters van kenmerken of van gelijkscorende vragen en je
gaat intuïtief en speculatief op zoek naar een achterliggende dimensie.
Enige voorbeelden hoe je factoranalyse kan toepassen:
Politiek:
Klassiek is er de tegenstelling tussen links en rechts.
Je kan in een onderzoek nagaan of een standpunt meer correleert
met andere linkse standpunten of juist met rechtse standpunten.
Milieubewustzijn is een voorbeeld van een kenmerk dat vroeger
bij uitstek links was, maar nu veel breder gedeeld wordt.
Het wordt interessanter als uit een factoranalyse een cluster
van samenhangende variabelen komt, dat helemaal niet meer past
in het klassieke links/rechts denken.
Dat zou een hele nieuwe stroming kunnen zijn en dus ook weer
een hele nieuwe doelgroep voor een politiek partij:
Voorbeeld nieuwe indeling:
F1. Traditioneel Links:
F2. Populair volks:
F3. Modern, Liberaal, Ecologisch:
F4. Traditioneel, Religieus, Provinciaals:
PvdA, SP
SP, PVV
Groen Links, D66, VVD
CDA, Christen Unie
Marketting:
Marketting is vaak gericht op doelgroepen.
Een doelgroep kan je definiëren als een cluster van kenmerken en factoranalyse
is dus bij uitstek geschikt om doelgroepen op te sporen
en te beschrijven.
Psychologie:
Bijna geen enkele dimensie in de psychologie is direct meetbaar.
Factor analyse is zeer geschikt om te onderzoeken welk cluster
van kenmerken met een dimensie samenhangt.
Je kan bijvoorbeeld een onderzoek doen naar stijlen van leiderschap.
Een cluster van eigenschappen kan je waarschijnlijk omschrijven als
een autoritaire stijl van leiding geven.
Het wordt interessant op het moment dat in dit cluster kenmerken
voorkomen die je eigenlijk niet verwacht.
Het kan bijvoorbeeld ook blijken dat zowel bij mannen en bij vrouwen
een autoritaire stijl van leiderschap herkenbaar is,
maar dat het cluster van eigenschappen wel van elkaar verschilt.
Appendix voor verschi l FA en PCA.
Factoranalyse FA.
Proefpersonen beantwoorden vragen.
Het antwoord van de proefpersoon valt voor een deel te voorspellen uit de
antwoorden op de andere vragen. Dat is de gemeenschappelijke variantie,
die valt terug te voeren op een onderliggende dimensie.
Het antwoord van de proefpersoon wordt voor een deel verklaard omdat de vraag
iets unieks meet en dat is de unieke variantie.
FA is latent, want die dimensies kunnen niet direct worden gemeten.
Model FA: Antwoord X= c1 . Dimensie F1 + c2 . Dimensie F2 + Unieke Vraag X
In Model FA zijn de vragen dus lineaire combinaties van de begrippen F.
Principal Component Analyse PCA.
PCA maakt geen onderscheid Algemeen Begrip en Unieke van Vraag.
PCA reduceert het aantal vragen door een aantal antwoorden samen te voegen.
Grofweg neemt PCA een gewogen gemiddelde van gelijkscorende vragen
PCA is manifest, want het zijn de gemeten antwoorden op de Items.
Model PCA: Component Y= (c1 . Item 1 + c2 . Item 2 + etc.)
Y is dus niet een lineaire combinatie van achterliggende begrippen
(zoals bij FA), maar van de gemeten Items=variabelen.
De vragen worden zo samengevoegd dat de variantie van de eerste component
maximaal is. Voor Component 2 geldt weer hetzelfde voor de restvariantie.
Vergelijken PCA en FA.
1. Bij PCA is component lineaire combinatie van geobserveerde variabelen,
bij FA is variabele lineaire combinatie van onderliggende dimensies.
2. PCA probeert data te reduceren, FA probeert data te verklaren.
3. Resultaten zijn meestal identiek.
Voorbeeld 1.
Vragenlijst: X1. Hou je van vanilleijs, 1 tot 5=heel erg.
X2. Hou je van roomijs, 1 tot 5=heel erg.
X3. Hou je van patat, 1 tot 5=heel erg.
X4. Hou je van kroket, 1 tot 5=heel erg.
- PCA: Introduceer 2 nieuwe componenten Y1 en Y2.
Y1 voegt ´ijs´ samen. Y2 voegt ´snackbar´ samen.
Y1= X1 + X2
Y2= X3 + X4
Je reduceert 4 variabelen X naar 2 variabelen Y, met waarschijnlijk vrij
weinig verlies aan informatie, omdat X1 en X2 toch vrij gelijk scoren.
- FA: 2 latente variabelen F1=ijs en F2=snackbar
X1= F1 + E1 (algemene voorkeur voor ijs + het unieke van vanilleijs).
X2= F1 + E2
X3= F2 + E3 (algemene voorkeur voor snackbar + het unieke van patat).
X4= F2 + E4
Je maakt onderscheid tussen het algemene dat wordt gedeeld met andere
variabelen en het unieke van elke variabele.
Dus 2 totaal verschillende methoden. PCA voor datareductie door gelijkscorende
variabelen samen te voegen. FA om achterliggende latente verklarende variabele
op te sporen.
Resultaat hetzelfde! Y1 voegt X1 en X2 samen.
F1 latente variabele om X1 en X2 te verklaren.
Download