Theorie MTO-D MAW/02. Exploratieve Factoranalyse. De correlatie matrix geeft correlaties tussen de vragen (=items/variabelen). Een factor kan groepjes van vragen samenvoegen tot een begrip. Doelstelling factoranalyse. 1. Met een paar factoren de antwoorden op de vragen verklaren. 2. Met een paar factoren de correlatiematrix tussen de vragen reproduceren. Componenten matrix geeft de componenten of factorladingen a. Dit zijn de scores van de vraag op de factor. Groepjes vragen die samen hoog scoren op een factor vormen samen begrip. Vraag met de hoogste a is beste indicator voor het begrip. Communaliteit h2 geeft verklaarde variantie van een vraag door de factoren dwz. hoe goed worden de scores op een vraag verklaard door de begrippen. Communaliteit= factorladingen2 (horizontaal optellen per vraag). Uniciteit= 1 - communaliteit. De eigenwaarde λ van een factor geeft aan hoeveel van de totale variantie van alle vragen wordt verklaard door een factor dwz. hoe goed worden de scores op alle vragen verklaard door de begrippen. De eigenwaarde= factorladingen2 (verticaal optellen per factor). Proportie verklaarde variantie= eigenwaarde/ totale variantie van alle vragen. Totale variantie= aantal vragen (als gestandaardiseerd). Selecteren hoeveel factoren: - Eigenwaarde > 1 (=Kaisercriterium). - Scree test van Catell, neem de eigenwaarden die duidelijk hoger liggen. - Aantal Factoren K= aantal vragen/3. Factorrotatie heeft als doel het maken van een eenvoudige structuur. Dat wil zeggen componentenladingen dichtbij 1 of dichtbij 0. Elke vraag hoort bij een begrip en elk begrip (=factor) heeft eigen vragen. Vraag hoort bij begrip als ≥0,3 en niet als <0,3. Factorrotatie verandert bij VARIMAX niet de communaliteit, de som van de eigenwaarden, de geproduceerde R en de Residuele R. De eigenwaarde per factor en de factorladingen veranderen. Voor OBLMIN geldt hetzelfde, maar bij VARIMAX zijn de communaliteit en de totale variantie nog steeds te berekenen, bij OBLIMIN niet. 3 manieren van factorrotatie. Begin is wiskundig en moeilijk te interpreteren want geen eenvoudige structuur. VARIMAX=orthogonaal=ongecorreleerde F: Rotated Component Matrix. OBLIMIN=gecorreleerde F: Pattern Matrix en Structure Matrix. Factorcorrelatie tussen F1 en F2: Component Correlation Matrix Kies voor VARIMAX tenzij OBLIMIN duidelijk eenvoudiger (vergelijk Rotated Component Matrix VARIMAX met Pattern Matrix OBLIMIN) of als correlatie van begrippen ≥ 0,3 (Bij VARIMAX zijn begrippen ongecorreleerd). Gereproduceerde correlatie R tussen 2 vragen rX1X2. Varimax: per factor a1 en a2 vermenigvuldigen. Oblimin: a1F1.a2F1 + a1F2.a2F2 + rF1F2.(a1F1.a2F2+a1F2.a2F1). Residuele R= correlatiematrix - gereproduceerde matrix Veel absolute waarden > 0,05 is probleem: extra factor of stoppen met FA. Correlatie vraag X1 en begrip F1: rX1F1. Varimax: aflezen a Rotated Component Matrix Oblimin: aflezen Structure Matrix Of: a1F1 + a1F2.rF1F2 (a aflezen bij Pattern Matrix) Pattern Matrix geeft factorladingen a, Structure Matrix geeft rXF F1 a1F1 rF1F2 F2 X1 a1F2 Factorscore is een gewogen somscore van een persoon op de vragen en geeft aan hoe goed de proefpersoon scoort op een factor. Als een persoon hoog scoort op een factor is het ook aannemelijk dat die hoog scoort op de vragen die sterk samenhangen met de factor. Nagaan of factoranalyse goed is. 1. Aanname FA dat er lineaire samenhang is tussen de vragen=items. Check samenhang tussen elk paar vragen in figuur en per vraag ≥5 categorieën of anders gelijke frequentieverdelingen. 2. Voorwaarden aan aantal proefpersonen N en aantal vragen J. N ≥ 100 en N ≥ 5J 3. Voorwaarden aan Correlatiematrix R. R heeft veel correlaties > │0,3│ KMO om na te gaan of factorrotatie mag, >0,6 is goed. Bartlett Sphericity test om aan te tonen tenminste 1 correlatie≠0 (p<0,05) 2 manieren: Principale factoranalyse (PAF) en Principale componentenanalyse (PCA). In praktijk geen duidelijk verschil, behalve iets andere factorenladingen. Theoretisch wel verschil: Factoranalyse PAF= gebaseerd op gemeenschappelijke variantie h2 met R* (=aangepaste correlaties). Proefpersonen beantwoorden vragen. Het antwoord van de proefpersoon valt voor een deel te voorspellen uit de antwoorden op de andere vragen. Dat is de gemeenschappelijke variantie, die valt terug te voeren op een onderliggend begrip. Het antwoord van de proefpersoon wordt voor een deel verklaard omdat de vraag iets unieks meet en dat is de unieke variantie. PAF is latent, want die begrippen kunnen niet direct worden gemeten. Model PAF: Antwoord X= a1 . Begrip F1 + a2 . Begrip F2 + b . Unieke Vraag X In Model PAF zijn de vragen dus lineaire combinaties van de begrippen F en het unieke van de vraag. Principale componentenanalyse PCA= gebaseerd op totale variantie met R (=werkelijke correlaties). PCA maakt geen onderscheid Algemeen Begrip en Unieke van Vraag. PCA reduceert het aantal vragen door een aantal antwoorden samen te voegen. Grofweg neemt PCA het gemiddelde van gelijkscorende vragen PCA is manifest, want het is de gemeten en geobserveerde variantie. Model PCA: Component Y= (w . X) Y is dus niet een combinatie van begrippen F, maar van de gemeten vragen=variabelen. MTO-D MAW/02. Opgaven Exploratieve Factoranalyse. Voorbeeld 1. Een rapport: Wiskunde Jan 4 Peter 8 Anne 8 Marie 3 Correlatiematrix: Wis. Nat. Wis. 1 0,9 Nat. 0,9 1 Soc. 0,1 0,1 Psy. 0,1 0,1 Natuurkunde 5 7 7 4 Psy. 0,1 0,1 1 0,9 Ped. 0,1 0,1 0,9 1 Psychologie 5 4 7 8 Pedagogiek 4 5 8 8 Nieuw rapport: B Jan 4,5 Peter 7,5 Anne 7,5 Marie 3,5 A 4,5 4,5 7,5 8 Ladingen: Component 1 C2 B A Wis. 0,9 0,3 Nat. 0,9 0,3 Soc. 0,3 0,9 Psy. 0,3 0,9 a. Wat voor samenhang tussen de Items zie je in het rapport. b. Zie je dat terug in de correlatiematrix. c. Nieuwe rapport vat oude rapport samen in 2 gemiddelden. Hoe noem je dat verschijnsel. d. Wat zie je in aan de Componenten. Bereken de eigenwaarden en de communaliteit met 2 Componenten. Antwoord. a. Wiskunde en Natuurkunde hangen samen, en Psychologie en Pedagogiek hangen samen. b. Hoge correlaties (0,9) tussen die variabelen. c. Datareductie d. Wis. en Nat. scoren beide hoog op Component: B-Component. Psy. en Ped. scoren beide hoog op Component: A-Component. Eigenwaarde van Component 1: 0,92 + 0,92 + 0,32 + 0,32= 1,8 Component 1 reduceert 1,8 variabele tot 1 Component (ruwweg Wis. + Nat.) Component 1 meet 1,8/4= 45% van verschillen in de cijfers (=variantie) Eigenwaarde van Component 2: 0,32 + 0,32 + 0,92 + 0,92= 1,8 Communaliteit van Wis. op eerste 2 Componenten: 0,92 + 0,32= 90% De eerste 2 Componenten verklaren 90% van het wiskundecijfer. Opgave 1. Een onderzoeker wil een schaal maken om werkdruk te meten. Om een indruk te krijgen maakt hij elf vragen en de antwoorden worden verwerkt met een exploratieve Componenten analyse. Na rotatie is dit de uitslag: VARIMAX-Rotated Component Matrix Componenten 1 2 1. Snel werken 0,729 0,187 2. Teveel werk 0,583 0,337 3. Te hard werken om af 0,759 0,227 4. Teveel tijdsdruk 0,773 0,299 5. Teveel haast 0,827 0,171 6. Werk op mijn gemak -0,661 -0,019 7. Vaak achterstanden 0,520 0,222 8. Te weinig werk 0,556 0,093 9. Problemen met werktempo 0,169 0,793 10. Problemen met werkdruk 0,145 0,839 11. Liever wat kalmer aan 0,229 0,716 OBLIMIN-PATTERN MATRIX 1. Snel werken 2. Teveel werk 3. Te hard werken om af 4. Teveel tijdsdruk 5. Teveel haast 6. Werk op mijn gemak 7. Vaak achterstanden 8. Te weinig werk 9. Problemen met werktempo 10. Problemen met werkdruk 11. Liever wat kalmer aan Componenten 1 2 0,748 0,011 0,556 0,210 0,771 0,046 0,770 0,120 0,857 -0,032 -0,712 0,152 0,514 0,103 0,581 -0,045 0,005 0,809 -0,032 0,865 0,087 0,710 Vraag a. t/m j. met VARIMAX: a. Wat is de componentenlading van vraag 8 op Component 2. b. Wat is de correlatie tussen vraag 1 en component 1. c. Hoe goed verklaart het eerste begrip vraag 1. d. Wat is de communaliteit van vraag 1. e. Wat is de uniciteit van vraag 1. f. Hoeveel variantie van de vragen wordt verklaard door het eerste begrip. g. Hoeveel variantie wordt verklaard door beide begrippen samen. h. Wat is de proportie verklaarde variantie door beide begrippen samen. i. Wat is de geproduceerde correlatie tussen vraag 1 en 8. j. De gemeten correlatie tussen vraag 1 en 8 is 0,309. Bereken de residuele correlatie tussen vraag 1 en 8. k. Kies je voor VARIMAX of OBLIMIN. l. Hoe zou je de componenten benoemen. Component Correlation Matrix Component 1 2 1 1,000 0,428 2 0,428 1,000 Antwoorden. a. 0,093. Geeft aan hoe sterk vraag 8 samenhangt met Component 2. b. 0,729 c. 0,7292= 0,531 -> 53,1% van de verschillen in het antwoord op vraag 1 wordt verklaard door Component 1. d. 0,7292 + 0,1872= 0,566 -> 56,6% van het antwoord wordt verklaard door Component 1 en 2. e. Uniciteit= 1 - 0,566= 0,434. Het deel van het antwoord dat niet valt af te leiden uit de scores op Component 1 en 2. f. λ1= 0,7292 + . . + 0,2292= 3,847 g. λ2= 0,1872 + . . + 0,7162= 2,22 -> λ1 + λ2= 6,067 h. 6,067/11= 0,552 -> 55,2% i. r= 0,729 . 0,556 + 0,187 . 0,093= 0,423 j. 0,309 - 0,423= -0,114. De Componenten schatten de correlatie dus een stuk hoger dan is gemeten in de steekproef. >0,05 en dat is dus slecht. k. 0,428 > 0,3 -> OBLIMIN. l. Werkdruk en Werkstress. Opgave 2. Factor-analyse met 18 vragen= items= variabelen. Eerste analyse om aantal factoren te bepalen. Tweede analyse met Varimax. Derde analyse met Oblimin. Eerste analyse: Componenten 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Total 5,655 2,142 1,188 0,949 0,818 0,795 0,740 0,668 0,649 0,627 0,552 0,548 0,523 0,511 0,460 0,435 0,426 0,317 Inital Eigenvalues % of Variance Cumulative % 31,416 31,416 11,898 43,315 6,599 49,914 5,271 55,184 4,542 59,726 4,417 64,143 4,111 68,254 3,709 71,962 3,605 75,567 3,481 79,048 3,064 82,112 3,042 85,154 2,907 88,061 2,840 90,901 2,553 93,454 2,417 95,872 2,366 98,238 1,762 100,00 Communalities claim state benefits cheating on tax joyriding taking soft drugs lying adultery accepting a bribe homosexuality abortion divorce euthanasia suicide throwing away litter drunk driving paying cash having casual sex smoking in public speeding over limit Initial 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Extraction 0,426 0,686 0,433 0,424 0,510 0,402 0,465 0,574 0,646 0,680 0,485 0,434 0,505 0,537 0,530 0,499 0,310 0,437 6 Eigenvalue 5 4 3 2 λ=1 1 0 Component number 1 a. b. c. d. e. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Waarom is er voor 3 componenten gekozen. Hoeveel variantie item ‘joyriding’ wordt verklaard door 3 componenten. Wat is de uniciteit van item ‘joyriding’. Wat is de eigenwaarde van de eerste component. Hoeveel variantie verklaren de 3 componenten tezamen van alle items. Antwoord. a. Scree-plot: 2 duidelijk hoger, 3 heel klein beetje hoger. 3 Eigenwaarden > 1. Keuze gaat tussen 2 of 3 componenten. b. 43,3% (kijken bij Communalities) c. 1 – 43,3%= 56,7% d. 5,655 e. 5,655 + 2,142 + 1,188= 8,985 -> 8,985/18= 49,9% Tweede Analyse, VARIMAX rotatie: Rotated Component Matrix Component 1 divorce 0,817 abortion 0,794 homosexuality 0,740 euthanasia 0,654 suicide 0,603 having casual sex 0,566 adultery 0,401 drunk driving throwing away litter joyriding speeding over limit taking soft drugs 0,394 smoking in public 0,365 cheating on tax paying cash claim state benefits lying accepting a bribe 2 3 0,365 0,367 0,705 0,694 0,642 0,583 0,512 0,417 0,366 0,817 0,668 0,618 0,613 0,522 0,434 f. Voldoet de oplossing aan de eenvoudige structuur. Antwoord. f. Nee, sommige vragen scoren 2x hoog. Derde Analyse, OBLIMIN rotatie: Pattern Matrix drunk driving throwing away litter joyriding speeding over limit taking soft drugs smoking in public divorce abortion homosexuality euthanasia suicide having casual sex adultery cheating on tax paying cash claim state benefits lying accepting a bribe Structure Matrix Component 1 2 0,720 0,720 0,667 0,555 0,493 -0,361 0,370 -0,839 -0,815 -0,766 -0,662 -0,594 -0,523 -0,365 g. h. i. j. -0,870 -0,680 -0,638 -0,593 -0,480 0,363 Component Correlation Matrix Component 1 2 1 1,000 -0,290 2 -0,290 1,000 3 -0,432 0,289 3 drunk driving throwing away litter joyriding speeding over limit taking soft drugs smoking in public divorce abortion homosexuality euthanasia suicide having casual sex adultery cheating on tax paying cash claim state benefits lying accepting a bribe Component 1 2 0,729 0,709 0,655 0,641 0,567 -0,467 0,487 -0,381 -0,821 -0,799 -0,742 -0,665 0,344 -0,636 0,473 -0,632 0,475 -0,484 0,362 0,366 0,423 0,533 -0,364 -0,367 3 -0,357 -0,364 -0,414 -0,368 -0,360 -0,371 -0,456 -0,824 -0,713 -0,643 -0,688 -0,610 3 -0,432 0,289 1,000 Wat is de correlatie tussen ‘joyriding en Component 1. Voldoet de oplossing aan een eenvoudige structuur. Kies je voor Varimax of Oblimin. Interpreteer de gevonden deelbegrippen. Antwoord. g. 0,655 h. Nee, ‘soft drugs’ en ‘bribe’ scoren 2x hoog. i. Oblimin: eenvoudiger (vergelijk Rotated met Pattern) en │-0,432│ > 0,3. j. 1. Tolerantie asocialen. 2. Tolerantie modern leven. 3.Tolerantie witte boorden criminaliteit. Opgave 3. Op een correlatiematrix van 8 items wordt een factoranalyse uitgevoerd. Een selectie van de output is bijgevoegd: Correlation Matrix. Item 1 Item 2 Item 1 1,000 Item 2 0,486 1,000 Item 3 0,498 0,634 Item 4 0,435 0,613 Item 5 0,271 0,139 Item 6 0,198 0,257 Item 7 0,263 0,272 Item 8 0,283 0,378 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 1,000 0,757 0,128 0,218 0,237 0,403 1,000 0,148 0,257 0,160 0,379 1,000 0,252 1,000 0,263 0,333 1,000 0,201 0,264 0,374 1,000 4 1 factor oplossing Scree-plot 3 Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 2 1 1 0,607 0,753 0,814 0,770 0,286 0,381 0,400 0,537 2 factor oplossing Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 1 0,596 0,741 0,836 0,789 0,294 0,392 0,437 0,539 2 0,028 -0,115 -0,294 -0,297 0,327 0,317 0,507 0,199 0 1 2 3 Pattern Matrix Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 1 0,464 0,689 0,922 0,886 0,026 0,061 0,056 0,278 4 5 6 Structure Matrix 2 0,210 0,094 0,076 0,094 0,452 0,471 0,695 0,383 Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 1 0,568 0,745 0,884 0,839 0,199 0,296 0,289 0,468 2 0,441 0,442 0,382 0,347 0,439 0,501 0,667 0,522 7 8 Factor Correlation Matrix 1 2 1 1,000 0,497 2 0,497 1,000 Vragen. a. Op grond waarvan kan je kiezen voor 2 factoren. b. Wat staat er in de Pattern-, Structure- en Factor Correlation Matrix. c. Is er een eenvoudige structuur. Antwoord. a. Lichte sprong in Scree-plot, 2 factoren > 1. b. Pattern Matrix: factorladingen. Structure Matrix: correlaties tussen items en factoren. Factor correlation Matrix: correlatie tussen de 2 Factoren. c. Eenvoudige structuur redelijk goed, item 8 en item 1 een beetje onbevredigend. 0,464 en 0,383 vrij laag en 0,210 en 0,278 vrij hoog. Metafoor om factorrotatie uit te leggen. Je hebt 3 bakken met gekleurde balletjes. Je gaat de ballen anders over de bakken verdelen zodat de kleuren mooier bij elkaar liggen (=rotatie). De inhoud van de bakken (=factoren) kan totaal veranderen, maar het aantal ballen (=verklaring) blijft hetzelfde. Opgave 4. 2 vriendinnen doen samen een schoonmaakklus. Normaal verdelen ze alle klussen in 2 gelijke delen. Afwassen Ramen wassen Stofzuigen Tafels afnemen Vriendin 1 0,5 0,5 0,5 0,5 Vriendin 2 0,5 0,5 0,5 0,5 Vriendin 2 is grieperig en bij uitzondering verdelen ze het werk anders. Afwassen Ramen wassen Stofzuigen Tafels afnemen Vriendin 1 0,7 0,1 0,7 0,7 Vriendin 2 0,1 0,7 0,1 0,1 Als we de vriendinnen opvatten als Factoren, de klusjes als items en de herverdeling als rotatie. Wat is dan wel en wat is niet veranderd. Antwoord. Afwassen Ramen wassen Stofzuigen Tafels afnemen Eigenwaarde Vriendin 1 0,5 0,5 0,5 0,5 1 Vriendin 2 0,5 0,5 0,5 0,5 1 Communaliteit 0,5 0,5 0,5 0,5 2,0 Vriendin 2 is grieperig en bij uitzondering verdelen ze het werk anders. Afwassen Ramen wassen Stofzuigen Tafels afnemen Eigenwaarde Vriendin 1 0,7 0,1 0,7 0,7 1,48 Vriendin 2 0,1 0,7 0,1 0,1 0,52 Communalities 0,5 0,5 0,5 0,5 2,0 Door rotatie veranderen de factorladingen, ontstaat een simpele structuur en verandert de eigenwaarde per factor. Onverandert blijft de communaliteit en de som van de eigenwaarden. Opgave 5. Schets in grote lijnen een onderzoek met Factoranalyse. Antwoord. Je begint met het maken van een vragenlijst, met vragen die lopen van negatief naar positief met een neutraal middenpunt. Nadat de deelnemers aan het onderzoek de vragen hebben ingevuld, geef je alle antwoorden aan SPSS. De kern van de SPSS-uitdraai is de correlatie-matrix met alle correlaties tussen alle vragen= Items. Als je zelf goed kijkt, kan je in die matrix al de clusters van samenhangende vragen ontdekken die samen een factor vormen. Op de geroteerde factoroplossing kan je die clusters van samenhangende vragen zo aflezen. De factoroplossing is dus makkelijker te lezen dan de oorspronkelijke correlatie-matrix. Factoranalyse sluit heel direct aan op de denkwereld van psychologen. Je zoekt naar clusters van kenmerken of van gelijkscorende vragen en je gaat intuïtief en speculatief op zoek naar een achterliggende dimensie. Enige voorbeelden hoe je factoranalyse kan toepassen: Politiek: Klassiek is er de tegenstelling tussen links en rechts. Je kan in een onderzoek nagaan of een standpunt meer correleert met andere linkse standpunten of juist met rechtse standpunten. Milieubewustzijn is een voorbeeld van een kenmerk dat vroeger bij uitstek links was, maar nu veel breder gedeeld wordt. Het wordt interessanter als uit een factoranalyse een cluster van samenhangende variabelen komt, dat helemaal niet meer past in het klassieke links/rechts denken. Dat zou een hele nieuwe stroming kunnen zijn en dus ook weer een hele nieuwe doelgroep voor een politiek partij: Voorbeeld nieuwe indeling: F1. Traditioneel Links: F2. Populair volks: F3. Modern, Liberaal, Ecologisch: F4. Traditioneel, Religieus, Provinciaals: PvdA, SP SP, PVV Groen Links, D66, VVD CDA, Christen Unie Marketting: Marketting is vaak gericht op doelgroepen. Een doelgroep kan je definiëren als een cluster van kenmerken en factoranalyse is dus bij uitstek geschikt om doelgroepen op te sporen en te beschrijven. Psychologie: Bijna geen enkele dimensie in de psychologie is direct meetbaar. Factor analyse is zeer geschikt om te onderzoeken welk cluster van kenmerken met een dimensie samenhangt. Je kan bijvoorbeeld een onderzoek doen naar stijlen van leiderschap. Een cluster van eigenschappen kan je waarschijnlijk omschrijven als een autoritaire stijl van leiding geven. Het wordt interessant op het moment dat in dit cluster kenmerken voorkomen die je eigenlijk niet verwacht. Het kan bijvoorbeeld ook blijken dat zowel bij mannen en bij vrouwen een autoritaire stijl van leiderschap herkenbaar is, maar dat het cluster van eigenschappen wel van elkaar verschilt. Appendix voor verschi l FA en PCA. Factoranalyse FA. Proefpersonen beantwoorden vragen. Het antwoord van de proefpersoon valt voor een deel te voorspellen uit de antwoorden op de andere vragen. Dat is de gemeenschappelijke variantie, die valt terug te voeren op een onderliggende dimensie. Het antwoord van de proefpersoon wordt voor een deel verklaard omdat de vraag iets unieks meet en dat is de unieke variantie. FA is latent, want die dimensies kunnen niet direct worden gemeten. Model FA: Antwoord X= c1 . Dimensie F1 + c2 . Dimensie F2 + Unieke Vraag X In Model FA zijn de vragen dus lineaire combinaties van de begrippen F. Principal Component Analyse PCA. PCA maakt geen onderscheid Algemeen Begrip en Unieke van Vraag. PCA reduceert het aantal vragen door een aantal antwoorden samen te voegen. Grofweg neemt PCA een gewogen gemiddelde van gelijkscorende vragen PCA is manifest, want het zijn de gemeten antwoorden op de Items. Model PCA: Component Y= (c1 . Item 1 + c2 . Item 2 + etc.) Y is dus niet een lineaire combinatie van achterliggende begrippen (zoals bij FA), maar van de gemeten Items=variabelen. De vragen worden zo samengevoegd dat de variantie van de eerste component maximaal is. Voor Component 2 geldt weer hetzelfde voor de restvariantie. Vergelijken PCA en FA. 1. Bij PCA is component lineaire combinatie van geobserveerde variabelen, bij FA is variabele lineaire combinatie van onderliggende dimensies. 2. PCA probeert data te reduceren, FA probeert data te verklaren. 3. Resultaten zijn meestal identiek. Voorbeeld 1. Vragenlijst: X1. Hou je van vanilleijs, 1 tot 5=heel erg. X2. Hou je van roomijs, 1 tot 5=heel erg. X3. Hou je van patat, 1 tot 5=heel erg. X4. Hou je van kroket, 1 tot 5=heel erg. - PCA: Introduceer 2 nieuwe componenten Y1 en Y2. Y1 voegt ´ijs´ samen. Y2 voegt ´snackbar´ samen. Y1= X1 + X2 Y2= X3 + X4 Je reduceert 4 variabelen X naar 2 variabelen Y, met waarschijnlijk vrij weinig verlies aan informatie, omdat X1 en X2 toch vrij gelijk scoren. - FA: 2 latente variabelen F1=ijs en F2=snackbar X1= F1 + E1 (algemene voorkeur voor ijs + het unieke van vanilleijs). X2= F1 + E2 X3= F2 + E3 (algemene voorkeur voor snackbar + het unieke van patat). X4= F2 + E4 Je maakt onderscheid tussen het algemene dat wordt gedeeld met andere variabelen en het unieke van elke variabele. Dus 2 totaal verschillende methoden. PCA voor datareductie door gelijkscorende variabelen samen te voegen. FA om achterliggende latente verklarende variabele op te sporen. Resultaat hetzelfde! Y1 voegt X1 en X2 samen. F1 latente variabele om X1 en X2 te verklaren.