Methodologie Hoofstuk 1: onderzoek in de gedragswetenschappen Psychologie: De wetenschappelijke studie van het gedrag Dus is net als chemie, fysica en biowetenschappen een wetenschap! 1. Het begin van de gedragswetenschappen Aristoteles: fundamentele vragen over de aard van het menselijk gedraag maar geen wetenschappelijke methode om vragen te beantwoorden. Heel lang schreven enkel filosofen of theologen over het gedrag, maar doordat ze niet wetenschappelijk waren, waren ze meestal fout. De wetenschappelijke psychologie en gedragswetenschappen bestaan vanaf het einde van de 19de eeuw. Wilhelm wundt De eerste onderzoekspsychologe Had het eerste psychologisch lab voor systematisch onderzoek en psychologische experimenten (1879) Vond het eerste wetenschappelijk tijdschrift uit (1881) 2. Doel van de gedragswetenschappen Basic research (=fundamenteel onderzoek) Onderzoek dat wordt gevoerd om psychologische processen beter te begrijpen en onze kennis te vergroten. Hierbij wordt de toepasbaarheid niet in acht genomen Applied research (=toegepast onderzoek) Onderzoek dat wordt gevoerd om een oplossing te vinden voor een specifiek probleem. Evaluation research Onderzoekt de effecten van sociale of institutionele programma’s op gedrag Gedragswetenschappers hebben meestal 3 doelen: Gedrag beschrijven Gedrag voorspellen Gedrag verklaren ( in toegepast onderzoek meestal nog een stap verder: oplossing vinden) a. Gedrag Beschrijven Bv. Ontwikkelingspsychologisch onderzoek dat de leeftijdgerelateerde veranderingen beschrijft. 1 b. Gedrag voorspellen Bv. Bedrijfspsychologen willen het gedrag van sollicitanten voorspellen om zo te meten hoe goed ze zullen zijn in hun job. Testen die hierin gebruikt worden, worden geanalyseerd, gecontroleerd en gewijzigd naar bepaalde statistische criteria. De wetenschappelijke voorspelling van gedrag kan enkel als de juiste methodes gebruikt worden. c. Gedrag verklaren Veel onderzoekers vinden dit het belangrijkste doel van onderzoek, want vele onderzoekers geloven niet dat men iets begrijpt als men het niet kan verklaren, en dus is het plaatje niet compleet zonder verklaring 3. Gedragswetenschappen vs gezond verstand Meeste onderwerpen in de gedragswetenschappen zijn onderwerpen waar velen zich dagelijks mee bezighoud -> fabeltjes We kunnen enkel adhv wetenschappelijk onderzoek te weten komen of deze “volkswijsheden” waar zijn of niet. 4. De waarde van het onderzoek voor de student Waarde van het onderzoek voor de student: Het begrijpen van gedrag Levenskwaliteit verhogen Buiten deze twee lijkt het leren over onderzoek en –methodes niet relevant voor een student MAAR toch zijn er vier belangrijke redenen: Kennis over onderzoeksmethoden -> Beroepsrelevant onderzoek begrijpen Het is onmogelijk om deze onderzoeken te begrijpen zonder kennis over de methoden en statistiek. Ontwikkeling van kritisch denken (over eigen conclusies en die van anderen) Men wordt vertrouwd met bepaalde onderwerpen, waardoor men blijft bijleren (Daarom wordt onderzoek zo gestimuleerd aan universiteiten) Kennis van onderzoeksmethoden en statistiek is belangrijk voor een succesvol leven 5. De basiskenmerken Voordat een onderzoek als wetenschappelijk beschouwd wordt moet er aan drie voorwaarden voldaan worden: 2 Systematische empirisme: Empirisme -> enkel vertrouwen op observaties Iets logische afleiden heeft niet dezelfde waarde als een empirische observatie. Er is geen plaats voor inuïtie, rede en geloof. Systematisch -> gestructureerd data verzamelen Op verschillende momenten, bij verschillende persoenen, bij verschillende situaties Publieke verificatie o Replicatie: Andere onderzoekers kunnen het onderzoek herhalen om zo fouten eruit te halen en/of een theorie uit te bereiden. Zo weten ze zeker dat de theorie niet verzonnen is, of is opgemaakt door een foute interpretatie o Zelf-correctie Verifieerbaar: het moet “meetbaar” zijn. Je kunt enkel onderzoeken opstellen die mogelijk zijn met de huidige methodologische beperkingen. Als dit niet zo is spreken van psuedowetenschap 6. Het wetenschappelijke proces a. Een wetenschapper doet 2 dingen: Detecteren van fenomenen o o o o Ontdekken Beschrijven (systematisch) Inductie: theorie opstellen op basis van generalisatie Theorie = een reeks stellingen die het verband tussen verschillende concepten probeert te verklaren Verklaren van fenomen Construeren van een theorie Vb: doordat bepaalde mensen voortdurend hun aandacht naar negatieve informatie richten, worden ze depressief o Evalueren van de theorie door onderzoek (=toetsing) Contingentietheorie: Drie factoren beslissen of een leider succesvol is of niet in een bepaalde situatie Kwaliteit van de relatie tussen de leider en de groepsleden De mate van structuur in de taak die uitgevoerd moet worden De macht van de leider in de groep Theorieën construeren adhv: Literatuurstudie Verzamelde date via observatie Case studies … Criteria voor een goede theorie Verklaren hoe 1 of meer variabelen leiden tot een cognitieve, emotionele, gedragsmatige of fysieke respons Coherentie: duidelijk, logisch en consistent Maakt de dingen niet ingewikkelder dan ze zijn (slechts enkele concepten en processen om het fenomeen te verklaren) Genereert toetsbare hypotheses die kunnen weerlegd worden door onderzoek Stimuleert andere onderzoeker om onderzoek te voeren rond deze theorie Lost een theoretische vraag op … o 3 Voorspellen en verklaren b. Model want dit beschrijft enkel welk verband er is tussen variabelen en beschrijft niet waarom (=beschrijvend) c. Wetenschappelijke theorie Een wetenschappelijke theorie = een set van uitspraken die relaties tussen concepten weergeeft en die ondersteund is door empirische gegevens Vb: papa’s spelen meer fysieke spelletjes met hun baby’s, vooral met jongens d. Wetenschappelijke verklaring A priori verklaringen = theorie > gegevens Uit theorie wordt een hypothese afgeleid, hypothese worden getoetst, theorie moet falsifieerbaar zijn o Post-hoc of a posteriori verklaringen = gegevens > theorie (niet wetenschappelijke) Na de feiten is er voor alles een verklaring: het zegt niets over de waarde van theorie. e. Wetenschap werkt op 2 niveaus Theoretisch niveaus: conceptuele definities (+woordenboek) + niet speciefiek Empirisch niveau: operationele definities (=positieve & negatieve info wordt geoperationaliseerd als positieve & negatieve foto’s) + concreet en expliciet (meerdere operationele definities zijn mogelijk voor zelfde concept > exact) Vb: operationele definitie -> honger = de toestand na 24 uren zonder voedsel Een theorie wordt op indirecte manier getoetst (langs beide richtingen mogelijk) 7. De wetenschappelijke hypothese Een wetenschappelijke hypothese = een uitspraak die volgt uit een theorie Vb. Als mama en papa met een jongetje spelen, dan zal papa meer fysieke spelletjes spelen Deductie = van algemene theorie naar specifiek aspect van deze theorie Inductie= hypothese opstellen op basis van observaties (niet op basis van theorie) = empirische generalisatie a. Een hypothese toetsen (voorbeeld) 1. Theorie: depressie ontstaat door aandacht naar negatieve informatie 2. Hypothese: we verwachten dat proefpersonen die meer aandacht hebben voor naar negatieve informatie depressiever zullen zijn dan proefpersonen die meer aandacht hebben voor positieve informatie 3. Conceptuele definitie 4. Operationele definitie: minstens 30 seconden intensieve interactie tussen ouder en kind 4 8. bevestiging, weerlegging en wetenschappelijke vooruitgang a. b. Bevestiging van een theorie Ondersteuning voor een theorie eerder dan bewijs Als we kunnen aantonen dat we uit theorie T, hypothese H ontwikkelen en dat deze hypothese klopt. Dan wil dit niet zeggen dat we kunnen bewijzen dat theorie T ook correct is. Bewijs voor een theorie is logisch niet mogelijk Als T dan H, welnu H dus T -> logische fout Als het regent wordt je nat, welnu ik ben nat dus het regent ? (Neen, want ik lig in het zwembad) Weerleggen van een theorie Als T dan H, welnu niet H dus niet T is logisch correct maar … Door fouten in de deductie (hypothese H volgt niet uit theorie T) Foute operationalisatie (experiment test eigenlijk H niet) Slechte meting, ongepaste keuze van steekproef, slechte controle over variabelen Andere factoren die nog niet in de theorie zitten (vb. vergeten rekening te houden met leeftijd) “null findings” = wanneer ons onderzoek niet leidt tot wat we voorspeld hadden “The file-drawer problem”= het probleem dat onsuccesvolle theorieën soms opnieuw onderzocht worden, omdat niemand weet van het bestaan van de voorgaande onsuccesvolle studies 9. De wetenschappelijke filter Praktische onmogelijkheid van het tegenbewijs (hypothese blijkt fout maar daarom is de theorie nog niet fout) Daarom bestaan er wetenschappelijke filters Alle ideeën: groot deel van het onderzoek is gefocust op de ideeën van hier Initiële onderzoeksprojecten Onderzoeksprogramma’s Gepubliceerd onderzoek (primaire literatuur) 5 FILTER 1: Wetenschappelijke training Bezorgdheid om wetenschappelijke reputatie Beschikbaarheid van financiële middelen FILTER 2: Zelfbeoordeling van haalbaarheid FILTER 3 “peer” review: beoordeling door experten (gelijken) FILTER 4: Gebruik Replicatie uitbreiding Initiële onderzoeksprojecten Nonsens Onderzoeksprogramma’s Niet haalbare onderzoeken Gepubliceerd onderzoek (primaire literatuur) Methodologische fouten, foutieve conclusies en onbelangrijke bijdragen secundaire literatuur gevestigde kennis niet repliceerbaar onderzoek, oninteressante en onbruikbare relsutaten DUS: ondanks onmogelijkheid van tegenbewijs is toch eensgezindheid mogelijk, kan wetenschappelijke vooruitgang geboekt worden 9. Waarom is het belangrijk dit wetenschappelijk proces te begrijpen? Wetenschappelijke kennis voor iedereen cruciaal: je kan dan maar beter zelf in staat zijn om te beoordelen wat wetenschappelijk is en wat niet … Denk na over rapporten in tijdschriften, kranten, nieuwsuitzendingen (intelligent research consumer) Voordelen kennis over onderzoeksmethoden Onderzoek begrijpen dat relevant is voor beroep Intelligent research consumer in dagelijks leven Kritische denkwijze Autoriteit Speculatief-theoretisch = gedrag verklaren door dagelijkse observaties, creatieve inzichten, religieuze doctrines Null findings = onderzochte variabelen hebben geen verband met het gedrag Evaluatie-onderzoek = effecten van sociale of wettelijke programma’s op het gedrag beoordelen 10. Onderzoekstrategieën a. Beschrijvend onderzoek (enkel beschrijvend) Beschrijft het gedrag, gedachten en gevoelens van een groep of individu. Bv publieke opinie beschrijft de attitudes van een bepaald groep tov bv. Politek – Fundatie van al het andere onderzoek b. Correlationeel onderzoek (correlatie tussen variabelen) Bestuderen van verbanden (=correlaties) tussen verschillende variablen Toont GEEN oorzaak-gevolg aan !! c. Experimenteel onderzoek (causaliteit, condities creeëren) Toont oorzaak-gevolg relatie tussen variabelen aan Manipulatie van de onafhankelijke variabele om zo het effect daarvan te zien op de afhankelijke variabele d. Quasi-experimenteel onderzoek Wanneer de onderzoeker niet in staat is om de onafhankelijke variabele te manipuleren en/of de controlevariabele constant te houden. Een bepaalde variabele onderzoeken die er sowieso is (zonder te manipuleren). Onafhankelijke variabele manipuleren en controle houden over andere factoren. Een afhankelijke variabele = een variabele waarover men een voorspelling doet / een variabele die afhangt van het onderzoekssubject. Een onafhankelijke variabele = een variabele die men gebruikt om voorspelling op te baseren / een experimentele variabele waarvan men aanneemt dat deze invloed heeft op het onderzoeksobject, en die 6 door de onderzoeker wordt gecontroleerd (gemanimpuleerd) en niet door het onderzoeksobject. Een onafhankelijke variabele is dus onafhankelijke van het onderzoekssubject. 11. domeinen in de gedragswetenschappen Ontwikkelingspsychologie Persoonlijkheidspsychologie Sociale psychologie Experimentele psychologie Neurowetenschappen en fysiologische psychologie Cognitieve psychologie Industriële-organisatie psychologie Omgevingspsychologie Educatie psychologie Klinische psychologie “counseling psychology” Onderwijspsychologie “community psychology” Familiestudies Interpersoonlijke communicatie Beschrijven, meten en verklaren van leeftijdsgerelateerde veranderingen in gedrag, gedachten en gevoelens gedurende de levensloop Beschrijven, meten en verklaren van psychologische verschil tussen individu’s De invloed van de sociale omgeving op gedrag, gedachten en gevoelens; interpersoonlijke interactie en relaties Psychologische processen zoals leren, geheugen, sensatie, perceptie, motivatie alsook fysiologische processen Relatie tussen lichaamsstructuren, processen en gedrag Denken, leren en geheugen Gedrag op het werk en andere organisaties, personeelselectie Relatie tussen omgeving en gedrag Processen die een invloed hebben op leren; ontwikkeling van methodes in het onderwijs Oorzaken en behandelingen van emotionele en gedragsproblemen; psychopathologie Oorzaken en behandeling van emotionele en gedragsproblemen; normaal menselijk functioneren Intellectuele, sociale en emotionele ontwikkeling van kinderen (met nadruk op schoolprestaties) Gedrag in natuurlijke situaties en preventie van problemen hierin Relaties tussen familieleden; invloed van het gezin op de ontwikkeling van het kind Verbale e non-verbale communicatie; groepsprocessen 12. gedragswetenschappelijk onderzoek op mensen en dieren Ca. 8% van het psychologisch onderzoek wordt uitgevoerd op dieren Voordelen onderzoek op dieren: 7 Kunnen opgroeien onder gecontroleerde omstandigheden -> geen omgevingseffecten die invloed hebben op de resultaten van het onderzoek Kunnen over lange tijd bestudeerd worden onder gecontroleerde omstandigheden Sommige dingen kunnen niet op mensen gedaan worden, dus worden ze op dieren gedaan (opoffering dieren voor onderzoek botst wel op controversie) We hebben veel processen die ook bij mensen plaatsvinden geleerd door onderzoek op dieren. Door onderzoek op dieren ook dieren helpen. (bv. Het welzijn van dieren in gevangenschap verbeteren). Natuurlijk zijn er ethische vragen rond onderzoek op dieren. Hoofstuk 2: variabiliteit en onderzoek 1. Kern van de cursus Gedragsvariabiliteit: gedrag varieer over situaties, individuen, tijd Bedoeling van het onderzoek Systematiek achter deze variabiliteit (beschrijven) En waarom is dit zo ? (verklaren) KAPSTOK: de hele cursus kan hier aan opgehangen worden ! Principe van variabiliteit is basis voor: o Design van onderzoeksopzet o Analyse van de resultaten (variantie analyse) 2. variabiliteit en het onderzoeksproces a. gedragswetenschappen bestudeert gedragsvariabiliteit gedrag varieert over situaties: eenzelfde persoon gedraagt zich anders in verschillende situaties “Iets wat alle mensen gelijk doen” is niet interessant in de gedragswetenschappen (en kan ook niet) vb. weer (goed vs slecht), context (café vs auditorium) gedrag varieert over individuen: verschillende mensen reageren anders op dezelfde situatie vb. gesloten vs open, gestresseerd vs kalm gedrag verandert over de tijd vb. leesvaardigheid, veroudering b. onderzoeksvragen in de gedragswetenschappen zijn vragen over gedragsvariabiliteit Beschrijven van variabiteit Verklaren van variabiliteit: relatie tussen variabelen / gaat systematische waardeverandering op de ene variabele samen met waardeverandering op de andere variabele c. Een onderzoek moet zo opgezet zijn dat het de onderzoeker optimaal toelaat om vragen over gedragsvariabiliteit te beantwoorden = onderzoek moet optimaal antwoorden geven Vb. gedragsadaptie na fouten Streven naar de maximale variabiliteit in de metingen Vb. Angstcurve: van 1-5 (niet angstige mensen) -> hoe minder angst hoe hoger de score op intelligentietest; 5-9 (angstige mensen) -> hoe meer angst hoe slechter de score op intelligentietest De samenhang tussen deze twee variabelen te onderzoeken zijn er van beide kanten extremen nodig, daarom doet men preselecties om een grote variabiliteit onder de proefpersonen te verkrijgen 8 d. Meten is bepalen van variabiliteit Meten is toekennen van getallen Variabiliteit in getallen ~ variabiliteit in gedrag Als variabiliteit in toegekende getallen de variabiliteit in gedrag niet weerspiegelt is onderzoek waardeloos Vb. depressievragenlijst e. Statistische analyses worden gebruikt om de geobserveerde variabiliteit te beschrijven en te verklaren = onderzoek gaat van het begin tot het einde over variabiliteit in observaties ! Variantie is de statische maat voor variabiliteit Hoeveel van de variabiliteit van één meting wordt verklaard door variabiliteit in de andere meting ? Er zal altijd systematische en niet-systematische variabiliteit zijn, en statistiek is nodig om te weten of systematische variabiliteit belangrijk genoeg is (significant is) Beschrijvende statistiek = gedrag beschrijven, veel scores reduceren tot interpretabele gegevens Inferentiële statistiek = toetsen van hypothesen en het schatten van de steekproefgrootte en hun betrouwbaarheid 3. Variantie: een index van variabiliteit Variantie = spreiding t.o.v. het gemiddelde Minder spreiding betekent kleinere variantie a. Een conceptuele verklaring van variantie Range: verschil tussen grootste en kleinste scores Nadeel: de getallen ertussen worden genegeerd, een uitschieter zorgt meteen voor een ader resultaat Rekenkundig gemiddelde: alle scores opgeteld, gedeeld door het aantal scores Variabiliteit berekenen door te kijken hoeveel de getallen variëren van het gemiddelde. b. Een statistische verklaring van variantie 1. het gemiddelde berekenen = door alle getallen op te tellen en ze te delen door het aantal deelnemers 2. Deviatiescore berekenen (afwijking van het gemiddelde) = door het gewenste getal af te trekken van het gemiddelde 3. de deviatiescore kwadrateren = door de uitgekomen getallen te kwadrateren 4. soms van de kwadraten = door alle kwadraten op te tellen 5. delen door het aantal = door de soms van de kwadraten te delen door het aantal deelnemers -1 9 4. Systematische en errorvariantie Totale variantie = systematische variantie + errorvariantie a. definities Systematische variantie = systematische verandering in beide (variabele X+Y) Errorvariantie= de variantie die niet verklaard kan worden door variabelen die geïntroduceerd worden door de onderzoeker / uitzonderingen die niets te maken hebben met onze vraag, fouten of vergissingen b. Baron en Bell “Electroschokken” toedienen aan persoon in kamer van 22, 29 en 35 graden Agressie werd gemeten door na te gaan hoeveel volt iemand toedient Systematische variantie: meer volt bij hogere temperatuur Error variantie: variantie door verschillende proefpersonen, sociale aspecten c. Scheier en Carver Studie rond optimisme en gezondheid -> vragenlijst in welke mate hebben de proefpersonen bepaalde fysieke symptomen ondervonden Mensen die hoger scoorden op de optimisme-schaal gaven minder symptomen aan Systematische variantie: correlatie tussen optimisme en fysieke symptomen Errorvariantie: slechts 7% van de variantie in de symptomen was gerelateerd aan optimisme d. Systematische variantie onderscheiden van de errorvariantie = opdelen van totale variantie in componenten die systematische variantie reflecteren Adhv statistiek kan men zien welk deel van de totale variantie systematisch is en of er genoeg systematische variantie is om te kunnen besluiten dat het effect reëel is 5. Effect Size Geeft aan wat de proportie van systematische variantie is in totale variantie Effect size van .15 is groot -> 15% is dus al “grote variabiliteit in gedragswetenschappelijk onderzoek, ook al zie je dit verband niet zonder statistiek Meta-analyse = effect size over studies (en welke factoren de invloed mediëren) d-based: grootte van verschil tussen twee groepen r-based: grootte van een correlatie Odds-based: kans dat effect voorkomt in één groep tov andere groep (1=evenveel kans in beide groepen) 6. Variabiliteit conceptueel bekeken Range of spreidingsbreedte is in de statistiek de afstand tussen de hoogste en laatste meting uit een gegevensset. (verschil hoogste en laagste score) 10 Geen goede maat want er wordt alleen maar naar de uitersten gekeken. Alles tussen de uitersten wordt genegeerd. Range zegt niets over de variantie Hoofdstuk 3 : meten Meten in strikte zin is de bepaling van de grootte of de omvang van iets aan de hand va waarneming en uitgedrukt in een getalswaarde of in een eenheid met een aangegeven dimensie. Meting is niet beperkt tot natuurkundige hoeveelheden, maar strekt zich uit tot de kwantificatie van bijna al het denkbare. Psychometrie = studie van het psychologisch meten 1. Types van metingen a. Observationele metingen Van buiten af observeerbaar Agressie: eerst vraag wat is agressie dan pas meten Versprekingen Reactietijd: hierdoor kunnen we uitspraken doen over de moeilijkheden van een bepaalde conditie Temporele metingen: reactietijd vs tijd om een taak af te werken b. Stroopexperiment: zo snel mogelijk de kleur van een stimulus benoemen (woord is niet relevant, kleur wel) Fysiologische metingen Interne fysiologische processen die niet van buiten af observeerbaar zijn adhv elektrodes hersen- en spieractiviteit meten c. Zelf-rapportering Cognitieve zelfrapportering (hoe denk je over…?) Affectieve zelfrapportering (hoe voel je je over…?) Gedragsgerelateerde zelfrapportering (wat doe je… ?) Moeilijkheid: sociale wenselijkheid observationele metingen = triangulatie Fysiologisch metingen convergerende operaties Zelf-rapportering = samenvoeging van verschillende metingen 11 2. Meetniveaus Meten = toekennen van een getallen -> dit wil niet zeggen dat scores zomaar alle kenmerken van het getallensysteem overnemen Meetniveau = tot op welk niveau de scores de kenmerken van het getallensysteem overnemen a. Nominaal Getallen zijn niets meer dan numerieke labels Elke getal is gelijk aan zichzelf maar verschillend aan alle anderen Als groepering/identiteit Er is vrijheid om de gebruikte getallen zo te kiezen dat de gebruikte waarden uniek zijn Één-één transoformatie Vb. Man 1/ vrouw 0 b. Ordinaal Getallen zijn geordend in termen van hun relatieve grootte Enkel volgorde is van belang Monotone transformatie Vb. Hoe vaak zwem je ? 1. Nooit / 2. Zelden / 3. Soms / 4. Vaak c. Interval Voor elke paar naast elkaar liggende getallen is de afstand even groot Vb. IQ test Jan 75; Piet 80 d. >verschillen van 5 =Koen is niet dubbel zo slim Ratio Getallen drukken een absolute grootte uit ten opzichte van een nulpunt o Multiplicatieve transformatie Vb. reactietijd: er is een vast nulpunt (geen reactietijd) BELANGRIJK Er is een hiërarchie: elk niveau impliceert het voorgaande Hoe hoger het meetniveau: hoe preciezer de verkregen informatie > streven naar hoogste Meest nuttige en krachtige statistische analysetechnieken vereisen een interval of ratio niveau Interval niveau niet altijd gemakkelijk bereikbaar, maar bij voldoende categorieën kan men geordende schaal als intervalschaal behandelen zonder grote meetfouten te maken Bij weinig categorieën = ruwe meeting (bv. 2) kan de fout 25% bedragen = fijne meting (bv. 10) kan de fout 5% bedragen (van interval -> ratio) 3. Betrouwbaarheid Bedoeling is dat variabiliteit in numerieke gegevens de variabiliteit weergeeft in datgene wat we willen meten ! Betrouwbaarheid is een maat voor accuraatheid van een meting 12 Geobserveerde score = werkelijke score + meetfout Een meetfout wordt veroorzaak door: Voorbijgaande toestanden van proefpersonen Stabiele kenmerken van proefpersonen Situationele factoren Karakteristieken van de meting Vergissingen/fouten Betrouwbaarheid als systematische variantie Eén score: werkelijke score en meetfout onbekend Maar kan geschat worden door scoren en variabiliteit in de scores te analyseren Totale variantie= variantie (werkelijke scores ) + variantie (meetfout) Betrouwbaarheid = variantie (werkelijkescores/totalevariantie Methoden om betrouwbaarheid te schatten, principe Als twee metingen van hetzelfde gedrag zijn, reflecteren ze dezelfde werkelijke score Als twee metingen van hetzelfde gedrag verschillen is er een meetfout Correlaties tussen metingen berekenen; correlatie-co-coëfficiënt (r) Statistiek die de sterkte van het verband tussen twee metingen uitdrukt Van -1 tot +1 r² = systematische variante/totale variantie Maat voor nauwkeurigheid van metingen: geobserveerde score = werkelijke score + meetfout a. test-hertest betrouwbaarheid Indien de meting weinig fouten bevat, zal de bekomen waarde bij herhaalde metingen steeds ongeveer dezelfde zijn Indien de meting veel fouten bevat, dan zullen er grote verschillen zijn in de bekomen waarden bij herhaling van de meting (zwakke correlatie) De spreiding van de waarden geeft een indicatie over de betrouwbaarheid v/d meting b. Inter-item betrouwbaarheid Bij meetinstrumenten bestaand uit meerdere items o o 13 Item-totaal correlatie= Hoe goed is elk van de item; slechte correleren/elimineren Split-halve betrouwbarheid= Test in twee splitsen; correlatie tussen twee helften Hoe goed is test als geheel ? Probleem: hangt af van hoe gesplitst wordt Cronbach’s alfa coëfficiënt: gemiddelde van alle mogelijk split-halves c. Inter-beoordelaar betrouwbaarheid Meerdere onderzoekers beoordelen gedrag -> als ze totaal verschillende resultaten bekomen is het systeem niet betrouwbaar. Er moet dus een zeker correlatie zijn tussen de resultaten van de verschillende beoordeelaars. Wordt vooral toegepast als er sprake is van interpretatie tijdens het onderzoek 2 methoden: % van de tijd overeenkomen Meningen over deelnemer correleren Betrouwbaarheid verhogen Standaardiseren Gebruik duidelijke instructies en vragen Train observatoren Minimaliseer fouten 4. Validitiet = meet ik het concept dat ik wens te meten ? a. Face validity Volledig gebaseerd op oordeel: is nuttig maar geeft geen garantie (kan soms fout zijn) Lijk het valide? ≠ is het valide ? Vb. intelligentie -> IQ-test of meten we de snelheid van de callosale transfer “Als ik het vraag aan de man op straat, wat zegt hij?” b. c. 14 Construct-validiteit Convergente validiteit: correlatie tussen de test en een gelijkaardig test (bv. Bestaande en nieuw IQ-test) -> hoe hoger correlatie tussen twee tests, hoe beter Divergente of discriminante validiteit: correlatie tussen de test en een andersoortige test ( hoe kleiner hoe beter) o Bv. Nieuwe depressievragenlijst vergelijk met een angstvragenlijst: hoe minder ze correleren hoe beter, want het is niet de bedoeling dat ze hetzelfde meten Criterium validiteit De correlatie tussen de test (x) en een criterium (y) o Selectietest – jobprestatie o IQ-test – schoolprestatie Probleem o Hoe goed is de meting van het criterium o Hoeveel waarde hecht je aan het criterium? Onderscheid o Gelijktijdige criterium validiteit: test – criterium op zelfde moment o Predictieve criterium validiteit: test nu – criterium later (Vooral toegepast in onderzoek) 5. Test bias Bias = afwijking Wanneer een meting niet altijd even zeer geldt voor alle deelnuemers Geslacht, etnische verschillen Vb. een Europeaan kan in Afrika geen hut bouwen, dus lage intelligentie ? Niet gemakkelijk vastelbaar Is er echt een verschil op gemeten variabele of is er bias ? Oplossingen: Mensen met gelijke scores uit verschillende groepen nemen en kijken naar criterium-validiteit Mensen met gelijke totaalscores uit verschillende groepen nemen en scores op specifieke items vergelijken Hoofdstuk 4: meten in de gedragswetenschappen 1. Gedragswetenschappen Variabiliteit in gedrag beschrijven, voorspellen en verklaren in termen van variabiliteit in oorzakelijke variabele Om die variabiliteit vast te stellen moeten we een operationele definitie hebben van gedrag (bv. Agressie meten in termen van volt) en dat meten o Operationele definities: definitie die bruikbaar is in onderzoek; meetbare vorm van een concept. (bv. Hoeveel volt is een proefpersoon beried om te geven) 2. Onderzoeksvraag Voor sommige problemen bestaat er geen specifiek meetinstrument: o Hoe meten we dat iemand ontoerekeningsvatbaar is? o Euthanasie bij ondraaglijk psychisch lijden 3. Benaderingen voor psychologisch meten a. Observatie IN EEN GECONTROLEERDE OMGEVING Meer controle, minder storende variabelen Observatie in labo (controle over temperatuur, licht, …) Nadeel: reactiviteit! Observatie in gecontroleerde buitenwereld (veld experiment) Vb. bewusteloze dakloze vs bewusteloze man in pak) IN EEN NATUURLIJKE OMGEVING 15 In de psychologie wordt er weinig voor deze vorm van onderzoek gekozen Soms is dit noodzakelijk voor de onderzoeksvraag (bv. Onderzoek naar ondervragingstechnieken bij politie) Participant Obseration: observeerder doet mee in het gebeuren (bv. Infiltreren in sekte) Nadeel: niet altijd objectief (te lang bij een bepaald groep: sympathie of antipathie ontwikkelen), beïnvloeding variabelen (gedrag verandert doordat de onderzoeker het observeert) I. Weten de proefpersonen dat ze geobserveerd worden of niet ? REACTIVITEIT: Wanneer mensen weten dat ze geobserveerd worden gaan ze anders reageren -> beïnvloeding OPLOSSING: verborgen observatie Ethische problemen Privacy Informed consent DUS hanteert men een aantal technieken: - - Gedeeltelijk verborgen: deelnemers weten dat ze geobserveerd worden maar niet exact wat geobserveerd wordt Of videotapen en dan vragen (dyadic interaction paradigm) Indirecte maten: onderlijnde stukken in boeken ipv vragen “wat vond je interessant?” II. Registreren van gedrag Narrative records o volledige beschrijving van gedrag of field notes (Piaget: cognitieve evolutie van het kind) o Niet gestructureerd en geen numerieke gegevens -> via content analyse structureren (= gedrag numeriek classificeren zodat het geanalyseerd kan worden) Checklist o Eerst een aantal dimensies vastleggen waarop je gedrag zal beoordelen o Gestructureerd o Interactive Process Analysis: 12 types interactief gedrag o Schalen J/N 0 (niet) 1(beetje) 2(erg) Ook vaag gebruikt in vragenlijsten o Temporele metingen Reactietijd vs tijd om een taak af te werken vb. stroopeffect Reactietijd op zich is niet interessant, het is het verschil in reactietijden tussen condities die ons mogelijks iets kan vertellen over verschillende processen of mechanismen in twee condities 16 Kunnen wij gemakkelijk van taak veranderen en welke mechanismen maken dat mogelijk ? Tijd om van taak te veranderen Welke processen bepalen taakwisselkost? (voorbereidingstijd Feit dat incongruentie trials trager zijn dan congruente geeft bv. Aan dat er een extra proces is in deze trails (conflict resolutie) Om processen van wisselen tussen taken beter te begrijpen kunnen we manipulaties onderzoeken die de wisselkost beïnvloeden Minder sociale wenselijkheid III. Betrouwbaarheid Interbeoordelaars betrouwbaarheid Betrouwbaarheid: instrument bedenken dat betrouwbaar is en waarbij iedere onderzoeker dezelfde resultaten uitkomt Duidelijke operationalisatie (vb. verstaat iedereen hetzelfde onder een “actief” spel) Hiervoor is een duidelijke en specifieke operationele definitie nodig) Oefenen van coderingssysteem b. fysiologische metingen 1. Neurale elektrische activiteit EEG = electroencephalogram Meten elektrische activiteit hersenen vb. slaap/waak/epilepsie/cognitieve functies Event related potentials (hersenactiviteit tijdens verwachte – onverwachte stimulus) Activiteit in motorische cortex meten: meten van intenties via Libett taak (wanneer heeft iemand die intentie om iets uit te voeren: proefpersonen moeten naar een wijzerplaat kijken en op een knopje als de intentie hebben om te duwen, naar de meting van de hersenactiviteit werd gevonden dat de intentie in de hersenen al lang aan het opbouwen is voordat we doorhebben dat we die intentie hebben -> bestaan vrije wil of zijn we “onderworpen” aan de processen in onze hersenen Sinle celle recording = elektrode die de elektrische activiteit van één cel meten Hubel en Wiesel: elektrode in de hersenen van een kat (verantwoordelijk gebied voor visuele informatie), eenvoudige lijnen aanbieden en per stimulus de activiteit van een cel meten. Verschillende cellen reageren meer op verschillende stimuli -> Visuele stimulus wordt volledig gedecompenseerd en terug samengesteld in de hersenen. Open hersenen onderzoek ~ 1 cel isoleren waarbij elektrische activiteit gemeten wordt (klein) met een speciaal staafje voor die meting Is er 1 cel verantwoordelijke voor informatie of een deel van de hersenen die swamenwerken Tegenstanders: etnisch niet verantwoord = je moet een goede reden hebben ! Streepjes: bepaalde cel was duidelijk heel erg actief bij een rechtstaand streepje Er zijn cellen in de visuele cortex specifiek voor rechte of schuine streepjes 2. Beeldvorming PET= positron emissie tomografie 17 Geen beeld van de hersenen, maar van wat dat orgaan aan het doen is Labelen van zuurstof: waar is er het meest zuurstof = waar is er het meest activiteit MRI=Magnetic Resonance Imaging Actieve hersencellen ontvangen meer vers bloed, dit zorgt voor een constante schommeling van gestuurd en/of ontvangen bloed: dit wordt afgelezen (heel duur) Vaststelling hersenletsel, afwijkingen, bepaalde gebieden lokaliseren, nieuwe gebieden ontdekken Verandering van magnetische structuur doordat er meer bloed doorstroomt > actieve delen hersenen bekijken BV. Effecten van hypnose meten (zorgen dat ze de taal niet meer kunnen en activiteit meten tijdens Stroop test) 3. Autonoom zenuwstelsel Hartslag: vertelt veel over bepaald impulsen Gebruik bij leugendetector: elektrische signalen afkomstig van de hartspier Bloeddruk: emotionele veranderingen zijn waarneembaar Temperatuur 4. Precies meten over gedrag EMG=electromyograph Zelfde principe als EEG maar specifiek elektrische activiteit in de spieren 18 Handig bij revalidatie; kunnen bepaald spieren nog actief zijn? Kan minimale elektrische reacties meten, veel beter dan bij observatie TMS= Transcranial Magnetic Stimualtion en motor evoked potentials = wekt elektrisch veld op in de hersenen en verstoort daar de werking 5. Bloedanalyse Hormonen en transmitters Rechtstreekse samenstelling testen / meten -> aanvulling op andere observaties 6. Specifieke metingen Blozen -> toestel ontworpen om blozen te meten Seksuele arousal 7. Conclusie fysiologische metingen Allemaal zeer goede technieken maar ze moeten gebruikt worden voor wat ze dienen ! EEG: temporele aspecten MRI: lokalisatie MRI: structurele MRI fMRI: functionele MRI -> proefpersoon moet iet doen Single Cell: zijn ze cellen (en waar liggen ze) voor een bepaalde taak De eerste en tweede standaard, de derde is veel moeilijker c. Vragenlijsten en interviews 19 observatie of fysiologisch onderzoek is meestal aangewezen maar naar gevoelens, attitudes en ervaringen moet je vragen… Gebruik bestaande vragenlijsten met goede betrouwbaarheid en validiteit Na eventuele vertaling, opnieuw valideren Zelf vragenlijsten ontwikkelen Goede vragen: o Specifiek en precies o Simpel o Maak geen assumpties o Voorwaardelijke informatie vooraan in de vraag o Geen vragen met dubbele bodem o Test de vragen o Juiste antwoordmogelijkheden o Open vragen: hoe lang moet een antwoord zijn en hoe specifiek ? Inhoudsanalyse o Rating scales: range effecten o Multiple choise: mogelijkheiden beïnvloeden antwoord Vragenlijst Minder training nodig van de onderzoeker Kan in groep Kan anoniem Vragen liggen vast Proefpersoenen moet kunnen lezen en moet de vragen begrijpen Interviews Belangrijk een goed getrainde interviewer te hebben Moet individueel Moeilijk anoniem Hier kun je dieper ingaan op iets Je kan altijd uitleg geven bij een vraag Vragenlijsten worden veel gebruikt, ook in experimenteel onderzoek. Bevragen of proefpersonen de manipulatie doorhadden of niet o Ook in bedrijven o Door regering Interviews o Face-to-face of via telefoon o Vriendelijke sfeer o Vriendelijke interesse o Verberg persoonlijk reacties o Structuur o Gebruik exacte bewoording o Legt geen woorden in de andere zijn mond d. Bias Sociale wenselijkheid Krijg je ook bij observatie als ze weten dat ze geobserveerd worden (nefast voor validiteit) o o o Best niet opvallen als onderzoeker bij observatie Neutrale vragen gebruiken Anonimiteit benadrukken Bevestigen/ontkennen Er zijn mensen die geneigd zijn altijd “ja” te zeggen en er zijn er die altijd naar “nee” neigen. Al bij al, kleine effecten e. opzoekingswerk Opzoeken van gegevens in krant Opzoeken van gegevens in rechtbanken Opzoeken van gegevens in dagboeken Meta analyses (effect size over studies) Kan over observaties gaan maar ook over fysiologische gegevens alsook interviews en vragenlijsten Ideaal voor historische gegevens of evoluties Groot nadeel: je moet het er mee doen… 20 Inhoudsanalyse = voor geschreven teksten en mondelinge verhalen Hoe? Tekst omzetten naar betekenisvolle categorieën die relevant zijn voor de onderzoekshypothese Utterance (thema) Computergestuurd (beperkt) Hoofdstuk 5: selecteren van deelnemers Kernvraag is onderzoek opgesteld om een uitspraak te doen over een populatie OF om het verband tussen variabelen aan te tonen ? 1. Types van beschrijven onderzoek a. survey o o o o Vaak telefonisch Soms longitudinaal Internetsurveys Cross-sectional survey design: éénmalige meting van een steekproef Successive independent samples survey design: een sample op moment 1, andere sample om moment 2 Longitudinaal survey design: zelfde groep op twee of meer tijdstippen E-surveys: goedkoop, makkelijke date, waar en wanneer de proefpersoon wilt maar niet voor iederen en wie vult in ? b. Demografisch onderzoek c. epidemiologisch onderzoek meestal binnen geneeskunde maar… ziektes hebben soms te maken met gedrag en epidemiologisch onderzoek naar psychologische aandoeningen o o o o o o Prevelntie: hoeveel % heeft een bepaald ziekte of aandoening op een bepaald moment Morbiditeit: hoeveel gevallen in absolute cijfers Co-morbiditeit: het samengaan van verschillende aandoeningen Incendentie: nieuwe gevallen voor een bepaald periode Moraliteit: sterfgevallen voor een bepaald periode Overlevingskans: kans op overleven na diagnose 2. Gedragswetenschappen o o o 21 Oorzaken van gedrag aantonen EN verband tussen variabele obv een theorie en een daaruit afgeleide hypothese (X en Y) We proberen de variantie van X en Y zo groot mogelijk te maken tov andere storende variantie. Dus gaan we werken met een homogene steekproef, die misschien niet altijd representatief is voor de “populatie” Zelden een probabilistische sample 3. Sampling Niet alleen voor beschrijvende statistiek maar ook voor andere soorten onderzoek (experimenten) Is de steekproef representatief voor de populatie waar je uitspraken over wil doen? Sampling error = fout die veroorzaakt is door het nemen van een steekproef Verschil tussen geobserveerde date uit steekproef en werkelijkheid in de volledige populatie. Dit verschil zul je nooit kennen Error of estimation (schattingsfout) Foutmarge: geeft aan in welke mate je een verschil kan verwachten tussen sample en populatie Hangt af van: o o o Grootte van steekproef Populatiegrootte Variantie in de data Enkel zinvol bij probabilistische samples. Bij niet-probabilistische samples zijn er mogelijks verschillen tussen de sample en de populatie waardoor een inferentie over de populatie obv de sample niet gerechtvaardigd is. a. probabilistische samples o De kans dat een individu uit de populatie wordt geselecteerd kan in een kans uitgedrukt worden Noodzakelijke als het gedrag van een populatie wil beschreven worden adhv een steekproef meting Wordt niet veel gedaan in gedragswetenschappen o Nonresponders = mensen die in de steekproef terecht gekomen zijn maar niet wille meewerken Wanneer responders en nonresponders van elkaar verschillen is onze steekproef niet langer representatief o Fout generalistatie (generaliseren naar andere populatie 22 I. Simple random sampling Iedereen uit populatie heeft evenveel kans om in de steeproef te komen Sampling frame: lijst van de populatie, hier ad random mensen uit halene Meestal hebben we een sample frame en geen idee hoe groot de populatie is OPLOSSING: systematic sampling II. Systematic sampling Wegens gebrek aan een sampling frame Iedere zoveelste persoon wordt geselecteerd Indien ken je de populatiegrootte Niet iedereen had evenveel kans om in de studie terecht te komen -> meer kans dat data steekproef verschilt van data populatie III. Stratified random smapling Eerst onderverdelen in groepen en dan binnen groepen simple random sampling, zodat de aantallen binnen elke groep gecontroleerd zijn Proportioneel aan populatie In elke groep evenveel kans om in steekproef terecht te komen Zorgen dat er genoeg zijn in elke groep IV. Cluster sampling Bij grote populaties zonder volledige lijst b. niet-probabilistisch samples Meestal in wetenschappelijk onderzoek Geen probleem want geen uitspraak over populatie maar over variabelen Onmogelijk om schattingsfout te bepalen I. Convenience sampling Deelnemers die gemakkelijk te verkrijgen zijn Lijkt problematisch voor conclusies maar dat is het niet II. Quota sampling Is niet hetzelfde als stratified sampling Bijzondere vorm van convenience sampling waarbij je er voor zorgt dat er van alle groepen evenveel zijn Wordt meestal toegepast als er verwacht dat er een effect is 4. Hoeveel deelnemers Schattingsfout: ook afhankelijk van populatiegrootte en variantie van steekproef Hoe meer, hoe kleiner de foutmarge, maar toch meestal economische samples (foutmarges: zo klein mogelijk houden, maar toch rekening houden met het aantal proefpersonen en kosten Power: correlatie tussen angst en depressie -> groot effect zal met kleine sample aantgetoond kunnen worden Hoofstuk 6 beschrijvend onderzoek Niet bedoeld om hypothesen te onderzoeken, eerder om bepaalde toestand in kaart te brengen 1. Types van beschrijven onderzoek a. Surveys (rondvraag) 23 Rondvraag dmv interviews, vragenlijsten of andere observationele techniek vaak telefonisch, of via internet Cross-sectional survey design (cross-section van populatie, 1 groep op 1 moment) Successive independent sample survey (twee groepen op verschillend moment) Longitudinaal of panel survey design (zelfde groep twee of meerdere keren na elkaar) b. Demografisch onderzoek NIS: nationaal instituut voor statistiek c. epidemologisch onderzoek Prevalente: hoeveel % heeft een bepaald ziekte of aandoening op een bepaald moment 2. Describing and presenting data Drie criteria om zinvolle gegevens te bekomen o Accuraatheid: altijd zo accuraat mogelijk, MAAR het kan ook te accuraat. Hierbij krijgt de lezer te veel informatie (bv. Ruwe data is heel accuraat maar niet interpreteerbaar) o Verstaanbaarheid o Beknoptheid: van ruwe gegevens naar betekenisvolle en interpreteerbare data Numerieke gegevens o Numerieke methoden: percentages, gemiddelde,… o Grafisch methoden: grafieken 3. frequentieverdelingen Frequentieverdeling = tabel met de verschillende scores en de frequenties ervan a. simple frequency distributions Eerste kolom: scores Tweede kolom: frequentie b. grouped frequency distributions Te veel scores zorgen ervoor dat de simple frequency distributions onoverzichtelijk worden Oplossing: verdelen in klassen Hierbij meestal ook de relatieve frequentie Voorwaarden o Niemand kan in meer dan één klassen vallen o Alle scores worden gerepresenteerd door de klasse-intervallen o Alle klassen hebben een gelijke klassegrootte c. Histogrammen en polygonen Histogram o X-as: klasse-interval o Y-as: scores o Interval- of ratioschaal o Continue variabelen Staafdiagram o Nominale of ordinale variabelen o Niet-continue variabelen Frequentiepolygon o X-as: klasse-interval o Y-as: scores o Interval- of ratioschaal 4. Maten van centrale tendentie a. het rekenkundig gemiddelde 24 Som van alle scores gedeeld door het aantal scores Kan misleidend zijn b. de mediaan Middelste score in de verdeling Minst geaffecteerd door ouliers c. de modus De meest frequente score d. gemiddelden weergeven in grafieken en tabellen Error bars: o Gemiddelde in staafdiagram o Confidence interval Verwachte accuraatheid van het gemiddelde In 95% van de keren dat het onderzoek herhaald wordt valt het gemiddelde tussen dit interval 5. Maten van variabiliteit Range: verschil tussen hoogste en laagste score Variantie: som van de kwadraten van alle scores gedeeld door het aantal scores ( al dan niet -1) -> gemiddelde variabiliteit Standaarddeviatie: vierkantswortel van de variantie Variantie en standaarddeviatie > range want houden rekening met alles scores a. standaarddeviatie en normale verdeling Normale verdeling o 68% van de scores in de range liggen in het interval van 1standaarddeviatie onder het gemiddelde en 1 standaarddeviatie erboven o 95% van de scores in de range liggen in het interval van 2 standaarddeviatie onder het gemiddelde en 2 standaarddeviatie erboven o Weinig onderzoeksgegevens zijn een perfecte normale verdeling, het geldt dus eerder als een benadering Niet-normale verdeling o Postively skewed (=schuin) distribution: meer lage dan hoge scores o Negatively skewed distribution: meer hoge dan lage scores 6. De Z-socre (standaardscore) Toont aan hoeveel standaarddeviaties een score onder of boven het gemiddelde zit (gemiddelde: z=0, één standaarddeviatie daar vandaan: +1) z= (score –gemiddelde)/standaarddeviatie ook zinvol om outliers te identificeren (z-kleiner dan -3 of groter dan 3) hoofdstuk 7: correlationeel onderzoek natuurlijk samen voorkomen (correleren) van observaties correlationeel onderzoek toont een verband aan tussen twee variabelen, maar geen oorzakelijk verband. Dit is geen experimenteel onderzoek 1. beschouwen van een verband 25 Met twee continue variabelen kan een correlatie berekend worden Met twee discrete variabelen moet het anders: de contingentietabel o Contingentietabel = een onderzoeker veronderstelt een verband tussen persoonseigenschappen en al dan niet hebben van een huisdier, meer specifiek gaat hij er van uit dat introverte personen, vaker een huisdier zouden hebben Alle onderzoek waarbij het verband tussen 2 variabelen nagaan zonder zelf te manipuleren is correlationeel onderzoek 2. Manieren om een verband vast te stellen a. de contingentietabel Celfrequenties Marginale totalen b. scatterplot Bij continue variabelen Een onderzoeker veronderstelt een verband tussen intelligentie van ouders en intelligent van kinderen 3. Soorten relaties a. lineair Stijgend Dalend b. niet lineair Logaritmisch: in het begin veel stijging/daling, na een tijdje veel minder stijging/daling 650 600 550 500 450 400 1 26 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Exponentieel: in het begin weinig stijging/daling, na een tijdje veel meer 50 45 40 35 30 25 20 15 10 5 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Sigmoidaal o Begint als exponentieel en wordt logaritmisch: traag begin, dan sneller, dan weer trager (plateau) o Leercurve Kwadratisch (U-vormig verband) o Seriële positiecurve: reeks van 30 woorden horen en nadien zoveel mogelijk herhalen Eerste en laatste woorden worden het best onthouden, woorden in het midden worden meestal vergeten o Omgekeerd U-verband bv. Stress-prestatie Weinig stress = weinig prestatie; matige stress = goeie prestatie; veel stress = weinig prestatie 50 variabele B 40 30 20 10 0 0 10 20 variabele A 30 4. De correlatiecoëfficiënt (r) Geeft de lineaire relatie weer tussen (continue) variabelen Bij sommige niet-lineair verbanden zal de correlatiecoëfficiënt toch nog groot genoeg zijn. ER bestaan ook toetsen om niet-lineaire verbanden na te gaan R ligt tussen -1 en +1 5. Statistische significantie van r 27 Gegeven een bepaalde r voor een steekproef, is het dan mogelijk dat r=0 in de populatie? Als dezze kans 5% of minder is, dan is de steekproefcorrelatie significant Signifcantie hant af van o Grootte steekproef o Welk risico je wenst Verschil tussen directionele en niet-directionele hypothese 6. Factoren die r beïnvloeden a. beperkte range Bij een kleinere range is er een kleinere correlatiecoëfficiënt b. outliers Online outliers: correlatie wordt groter Offline outliers: correlatie wordt kleiner c. betrouwbaarheid van metingen ontbetrouwbare metingen zwakken de correlatie af 7. Correlatie en causaliteit Causaliteit veronderstelt o Covariatie o Richting o Geen derde factor 8. Partiële correlatie Gegeven een correlatie tussen x en y, dan kan o X,Y veroorzaken o Y,x veroorzaken o Z, x en y veroorzaken Partiële correlaties berekenen is een statistische techniek om de variabiliteit van een mediërende variabele uit de data te halen en om dan de correlatie tussen x en y te berekenen 9. Correlationeel onderzoek Toont een verband tussen twee variabelen, maar geen oorzakelijk verband Hoofdstuk 8: advanced correlational strategies 1. voorspellen op basis van correlatie – regressieanalyse 2. mogelijke causaliteit onderzoeken 3. onderliggende dimensies aan meerdere correlaties onderzoeken 28 1. Voorspellen: regressieanalyse Als er een correlatie is tussen twee metingen dan kun je op basis van de ene meting de andere voorspellen. Regressievergelijking Regressiecoëfficiënt Regressieconstante De fit van enkelvoudige functie o r bepaalt hoe goed de voorspelling is o r² geeft aan hoeveel variantie aan y door x kan gevat worden meervoudige regressie analyse o meerdere predictoren om een betere voorspelling te doen standaard Y=b0 + b1x + c1x a. Meervoudige regressieanalyse meerdere predictoren om een betere voorspelling te doen Standaard (stapgewijs) Hiërarchisch 2. Causaliteit Ook al sluit je op basis van partiële correlaties een aantal mediërende factoren uit, dan nog ken je de causaliteit niet a. correlatie over tijdstippen Cross-lagged panel design X en y worden op twee tijdstippen gemeten en de correlatie over tijdstippen gemeten r(x1,y2) en r(x2,y1)µAls x, y veroorzaakt dan moet r(x1, y2) groter zijn dan r(x2,y1) b. structurele vergelijkingsmodellen hypothese x veroorzaak y en y veroorzaakt z dan moet de r(x,y)>r(x,z) 3. Factor analyse a. gebruik van factor analyse 1. Onderliggende structuur van psychologische constructen Kunnen we verschillende vaardigheden terugbrengen tot een reeks basisvaardigheden ? Zijn er basisemoties ? Is er een algemeen IQ ? 2. Reduceren van een groot aantal variabelen 3. Validatie van vragenlijsten b. basis factor analyse Factor matrix: correlatie van variabele en nieuwe factor (latente variabele) Hoofdstuk 9: Experimenteel onderzoek Psychologie = een wetenschappelijke studie van het gedrag 29 Oorzaak van gedrag Gedrag relateren aan iets o Is er een relatie ? o Is er een oorzakelijk verband ? 1. Een verband onderzoeken Is niet causaal verband aantonen Natuurlijk samen voorkomen van observaties Vb. Is er een verband tussen spelen van video spelletjes en cognitieve vaardigheden ? Is er een verband tussen TV gedrag en agressie ? Twee variabelen meten en het verband inschatten (statistisch toetsen) 2. Experimenteel onderzoek Groep vergelijkbare studenten (zonder gaming ervaring) Conditie 1: heel veel gamen Conditie 2: gamen niet Onafhankelijke variabele Beide cognitieve test Afhankelijke variabele Als er een groot verschil is tussen de scores kunnen we een causaal verband leggen Als er storende variabelen zijn die de afhankelijke variabele beïnvloeden is het onderzoek niet valide (vb. geslacht, IQ, leeftijd mogen geen invloed hebben op bovenstaand onderzoek)µ Vermengd met onafhankelijke variabele: als variabele covarieert met onafhankelijke variabele (=confound) => probleem Vb. OV= makkelijke of moeilijke test AV= gelukkiger na makkelijke dan na moeilijk test Confound: aantal fouten op test Geneutraliseerd: wel uitgesloten als mogelijke oorzaak door gebruik van experimentele procedures Om experimenteel onderzoek te mogen doen moet men goedkeuring krijgen van een ethisch comité Oplossing bij onethisch onderzoek: dierenonderzoek 3. Onafhankelijke variabele Veronderstelde oorzaak Wordt gemanipuleerd Soms 1, meestal 2 of meerdere met 1 of meerdere niveaus Zo krijg je verschillende condities in een experiment Controleconditie is conditie zonder behandeling Interne validiteit >< externe validiteit 4. Types onafhankelijke variabele a. omgevingsvariabele Manipulatie van fysische of sociale omgeving 30 Men herinnert zich informatie beter op de locatie waar het geleerd is b. instructie variabele Manipulatie van taakinstructie Vb. snelheid/nauwkeurigheid benadrukken Diepte van verwerking met 3 niveaus Letters tellen (vraag over letters) Rijmwoord vinden (vraag over klanken) Vraag over betekenis => woorden aanbieden met verschillende taken er rond: bij moeilijke taken rond een woord onthoudt men het woord langer dan bij makkelijkere taken c. invasieve variabele Creëren van fysische veranderingen voor operatie of geneesmiddelen (d. subjectvariabelen) Zijn niet gemanipuleerd omdat ze niet manipuleerbaar zijn vb. geslacht, leeftijd, … Als je iets wilt weten over een subjectvariabele, is dit GEEN experiment meer. Je hebt hierbij geen controle meer over je experiment. 5. Validiteit van een experiment Interne validiteit: wordt een effect gevonden dat geldig is binnen de steekproef en de experimentele procedure? Is de verandering in de onafhankelijke variabele echt verantwoordenlijk voor verandering in de afhankelijke variabele Externe validiteit: kan de intern valide conclusie veralgemeend worden naar de populatie en naar de gelijkaardige omstandigheden? Altijd voorkeur geven aan interne validiteit ! 6. Gevaren voor interne validiteit a. fouten in toewijzing Bij between-subjects design: systematische bias in toewijzingsprocedure (selectiebias of pech bij randomisatie) Nefast voor interne validiteit b. uitval van personen Proefpersonen stopt deelname o Bij random verspreiding over condities -> geen probleem o Bij systematische verspreiding over condities -> nefast voor interne validiteit c. pretest sensitisatie 31 Sensitisatie: gevoelig maken voor de manipulatie of zelfs de hypothese o Vooral in within subjects designs omdat proefpersonen de verschillende conditie doorloopt (behalve bij pretest sensitisatie is dit niet noodzakelijk within subject) Baseline meting of zelfs screening (voor aanvang experiment) maakt deelnemers aandachtig voor iets Betere resultaten kunnen gevolg zijn van pretest -> effect manipulatie wordt versterkt door de pretest d. geschiedenis Relevante externe variabelen die zich voordoen buiten de onderzoekssetting Een bepaalde gebeurtenis kan het effect van een training of programma versterken of verzwakken VB: onderzoek naar effect van sponsoring in wielrennen op naambekendheid, maar net groot dopingschandaal (geschiedeniseffect) e. vraagkenmerken Onderzoekssituatie maakt proefpersonen attent op bedoeling en proefpersonen gaan zich er (al dan niet bewust) naar gedragen Informed consent verplicht onderzoekers aardt en doelstelling van experiment bekend te maken Misleiding “mag” in de gedragswetenschappen, niet in medische Double blind procedure: proefpersonen en proefleiders weten niet in welke conditie ze zitten (bv. Alcohol/geen alcohol) f. placebo effect Gerelateerd aan vraagkenmerken o “ik kreeg alcohol dus ik vermoed dat men van mij verwacht dat ik meer fouten zal maken” (vraagkenmerk) o “ik ga er van uit dat ik alcohol kreeg, dus ik vermoed dat men van mij verwacht dat ik meer fouten zal maken” (placebo) Placebo controle groep (double blind placebo controled) op die manier kun je het echte effect van de manipulatie nagaan 7. Experimentele logica Vermengd (confounded) Als variabele convarieert met onafhankelijke variabele => probleem Vb. taak moeilijkheid en aantal fouten Effect van alcohol (alchohol groep komt naar lab en moet 1 uur wachten, anderen beginnen onmiddellijk) Effect van chocolade (chocogroep krijgt iets, andere niet ) Geneutraliseerd Wel uitgesloten als mogelijke oorzaak door gebruik van experimentele procedures 8. Mogelijkheid tot neutralisatie Controle De variabele wordt constant gehouden (zowel alcohol groep als controle groep wacht een uur, zowel de chocoladegroep als de controlegroep krijgen iets) De variabele word gebalanceerd (proefpersonen in conditie A zijn gelijkaardig aan proefpersonen in B voor wat deze variabel betreft) Randomisatie 32 de variabelen wordt op een random wijze gevarieerd (toevallig proefpersonen toewijzen aan condities en hopen dat gemiddelde IQ in beide condities gelijk is) zowel controle als randomisatie zorgen ervoor dat de waarden van de extreme variabelen niet systematisch kunnen covariëren met de onafhankelijke variabele simple random design = proefpersonen worden op volledige toevallige wijze in conditie geplaatst (neutralisatie door randomisatie matched random design= expliciete matching (matchen waardoor ik weet dat het invloed heeft op mijn resultaten. Neutralisatie door balancering repeated measures of within-subjects design= impliciete matching. Elke proefpersoon neemt deel aan elke conditie a simple random design hypothese: perceptuele weerstand. Waarneming van negatieve gebeurtenissen wordt vertraagd in vergelijking met neutrale gebeurtenissen voorspelling: bij een zeer korte stimulus-aanbieding worden woorden met emotionele negatieve valentie minder vaak herkend dan neutrale woorden experiment: o woorden worden getoond gedurende 20 ms o in de controle conditie alleen neutrale woorden o in de experimentele conditie negatieve woorden o de taak van de proefpersoon bestaat erin het woord te noemen Er wordt geregistreerd of het woord correct benoemd is. De proefpersoon doorloopt een reeks dergelijke benoemingsbeurten met telkens een ander woord data onderzoek o is er een invloed of effect? -> de gemiddelde waarden van afhankelijke variabele in de condities verschillen van elkaar o is het effect te wijten aan de onafhankelijke variabele ? -> ja, als alle andere variabelen geneutraliseerd werden Bij simple random design zijn de storende variabelen die gebonden zijn aan de persoon in principe onder controle (in principe: enkel die storende variabelen die gebonden zijn aan een proefpersoon) b. matched random design Zelfde experiment Misschien is angst gerelateerd aan perceptuele weerstand Angst moet geneutraliseerd woorden Hoe ? o Meet angst van proefpersonen o Stel paren proefpersonen samen met gelijke angst. Wijs op basis van toeval 1 persoon het paar toe aan de experimentele conditie en 1 aan de controleconditie c. Repeated measures of within subject designs 33 Impliciete matching: elke deelnemer gematcht met zichzelf Elke proefpersoon neemt deel aan elke conditie Hetzelfde experiment o Proefpersonen doen beide condities o Neutrale en negatieve woorden in blokken VOORDEEL: alle subjectvariabelen zijn onder controle, hogere statische power en minder proefpersonen nodig PROBLEEM: het bekomen effect kan te wijten zijn aan de twee blokken met beurten o Oefeneffecten: sneller worden, stimulusmateriaal beter kennen, geheugeneffecten o Vermoeidheidseffecten: motorisch en cognitief o Sensitisatie: door verschillende niveaus van onafhankelijke variabele te krijgen kunnen deelnemers makkelijker de hypothese achterhalen o Carry-over: ook al stopt of verandert de manipulatie, het effect blijft verder duren Volgorde wordt een probleem dat geneutraliseerd moet worden 9. Oplossingen voor volgorde effecten Contrabalancering (1,2 en 2,1) Alle mogelijke volgordes, elke proefpersoon random toewijzen aan volgorden Niet altijd praktisch o Aantal volgordes neemt snel toe met aantal condities o Aantal mogelijke volgorde = (aantal condities)! o 4!=24; 5!=120 Latijns vierkant elke conditie komt voor op elke ordinale positie elke conditie gaat vooraf aan en wordt gevolgd door elke andere conditie 10. verschil within Ss en between Ss 34 Drie groepen -> zijn de groepen gelijk ? Within Ss met 3 blokken o Blok 1: hoeveel letters (10woorden) o Blok 2: rijmt op? (10 woorden) o Blok 3: eetbaar of niet? o 6 volgordes en proefpersonen random toewijzen o Maar wie zegt dat proefpersonen de oude instructie niet meer opvolgen? (=carry-over) o Within Ss variant: volgorde randomiseren binnen 1 blok = beste manier Nog steeds carry over mogelijk (kunnen proefpersonen wel wisselen van taak) Als carry over te sterk is heeft deze vorm geen nut Manipulaties die enkel within subjects werken o Bv. Beloning 50 cent of 2 euro per correct, effect op aantal fouten o Between subjects: proefpersonen krijgen altijd hetzelfde voor een correct antwoord, ze kunnen dus ook geen verschil merken o Within subject: 1 blok veel, en 1 blok weinig beloning (sensitisatie) Balanceren = matchen Contrabalanceren is het omgekeerde: niet iedereen begint met conditie A en niet iedereen begint met conditie B Hoofdstuk 10: experimentele designs 1. Overzicht a. manipulatie van variabelen One-way design: 1 onafhankelijke variabele Factorieel design: >1 onafhankelijke variabele Mixed design: >/= tussen subject variabele >/= binnen subject variabele b. effecten van variabele Hoofdeffecten Interactie-effecten 2. One-way design Manipulatie van één onafhankelijk variabele o Minimum twee niveaus Dus twee condities in experiment “two-group experimental design o Maximum: “vrij” Toewijzen van proefpersonen o Between subject Gerandomiseerde groepen design Proefpersonen worden op toevallige wijze in een conditie geplaatst Matched-subjects design Expliciete matching o Within subject Repeated measures design Impliciete matching (gevaarlijke voor volgorde-effect) Posttest only design: Afhankelijke variabele gemeten na manipulatie onafhankelijke variabele (meest klassieke design Pretest-posttest design: afhankelijke variabele gemeten voor en na manipulatie onafhankelijke variabele (interventies) o Voordelen tov enkel posttest Controle voor groepsverschillen (bij tussen-subjecten design) Test hoe groot het effect van de onafhankelijke variabele is (deviatiscore) Grotere “power” (statistisch krachtiger) dan enkel posttest o Nadelen Pretest sensitisatie (interne validiteit) Tijd en geld (niet noodzakelijk om te weten of OV effect heeft 3. Factorieel design 35 Manipulatie van >/= 1 onafhankelijke variabelen. Elke van deze variabelen heeft minimum twee niveaus o Aantal niveaus = product van het aantal niveaus op alle onafhankelijke variabelen Minimum: 2x2 = 4 Maximum: ? Terminologie o Aantal onafhankelijke variabelen (x-way design) o o Aantal niveaus per onafhankelijke variabele Aantal condities a. Two way design 2 x 2 design 3 x 3 design 2 x 4 design A A A A1 A2 A1 A2 A3 A1 A2 B1 B1 B1 B2 B2 B B2 B B B3 B3 B4 b. Three way design 3 x 2 x 4 design A A1 A2 A3 B B B B1 B2 B1 B2 B1 C1 C1 C1 C2 C2 C2 C3 C3 C3 C4 C4 C4 C 4. Mixed design 36 Toewijzen van proefpersonen o Tussen-subjecten design Gerandomiseerde groepen design Matched-subjects design o Binnen subjecten design Repeated measures design o Mixed design: combinatie van >/= between-subjects variabele >/= within-subjects variabele B2 5. Overzicht Manipulatie van variabelen o One-way design: 1 onafhankelijke variabele o Factorieel design: > 1 onafhankelijke variabelen o Mixed design: >/= tussen subject variabele >/= binnen subject variabele 6. Hoofdeffecten en interacties a. one-way design variantie te wijten aan onafhankelijke variabele (hoofdeffect) b. Factorieel design Variantie te wijten aan elke onafhankelijke variabele afzonderlijk (hoofdeffect) Variantie te wijten zijn aan de combinatie(s) van onafhankelijke variabelen (interactie) c. hoofdeffect 37 Effect van één onafhankelijke variabele Negeren van (middelen over) andere onafhankelijke variabelen Aantal onafhankelijke variabelen -> aantal hoofdeffecten Is er een verschil tussen de condities d. interactie Wanneer het effect van één onafhankelijke variabele afhangt van de andere onafhankelijke variabele Is er een verschil tussen de verschillen of zijn er niet-parallelle lijn? (niet parallelle lijnen = interactie!) Er is een interactie Er is geen interactie e. tweewegs (two-way) design 2 hoofdeffecten + 1 tweewegs interactie Y = A + B + (AxB) f. Driewegs (three-way) design 3 hoofdeffecten + 3 tweewegs interacties + 1 driewegs interactie Y = A+B+C+(AxB)+(AxC)+(BxC)+(AxBxC) g. problemen Complexiteit Aantal proefpersonen 7. Oefeningen 1.1 Mixed design (2x2x4) Groep (subject variabele) o Klinische populatie o Controlegroep Situatie (onafhankelijke, within-subjects variabele) o Stressvol o Neutraal Medicijn (onafhankelijke between-subjects variabele) o Hoeveel condities zijn er ? o Hoeveel proefpersonen heb je minimaal nodig ? 38 o Zijn er hoofdeffecten en interacties ? Er is hoofdeffect groep Er is een hoofdeffect situatie Er is een hoofdeffect dosis Er is een interactie tussen groep x situatie Er is een interactie tussen groep x dosis Er is een interactie tussen situatie x dosis Interactie tussen groep x situatie Interactie tussen groep x dosis 0 0.1 0.2 0.5 550 540 530 520 510 500 490 Klinisch 39 Controle Interactie tussen situatie x dosis 0 0.1 0.2 0.5 550 540 530 520 510 500 490 Neutraal Stressvol Hoofdstuk 11: Experimentele designs en analyses (enkele slides) Interne validiteit gaat over design. Onafhankelijke variabele X (en A en B?) -> afhankelijke variabele Y o Interne validiteit: is effect in Y daadwerkelijk veroorzaak door manipulatie X? o Statistische significantie: is effect in Y betrouwbaar en niet te wijten aan toeval ? One-way design: manipulatie van één onafhankelijke variabele o Meest eenvoudige design (1 kopje koffie of 3 kopjes koffie: wie heeft het meeste energie) o Diepte van verwerking: three-group experimental design o Enkel hoofdeffecten (variantie te wijten aan onafhankelijke variabele) Factorieel design: manipulatie van één of meer onafhankelijke variabelen o Elke variabele heeft minimum twee niveaus o Hoofdeffecten en interactie (wanneer het effect van één onafhankelijke variabele niet gelijk is binnen elk niveau van andere onafhankelijke variabele / variantie te wijten aan combinaties van onafhankelijke variabelen) Statistische significantie gaat over data zelf. Achter een grafiek zitten er data, meerdere data. Een balkje is een gemiddelde score van meerdere proefpersoenen. Binnen de condities is er veel variabiliteit. Dit is slecht een zeer kleine weergave van data. Logica van statistiek: variabiliteit veroorzaakt door manipulatie. Variantie binnen mijn condities en tussen mijn condities bepaalt of iets significant is of niet. 1. Analyse a. de logica Errorvariantie : variantie die niets met de manipulatie te maken heeft 40 Experiment o Stap 1 = strategie & design o Stap 2 = collectie o Stap 3 = analyse Analyse: o Leidde manipulatie van de onafhankelijke variabele tot systematische verandering in de afhankelijke variabele o o Bevat totale variantie afhankelijke variabele systematische variantie veroorzaak door manipulatie onafhankelijke variantie Totale variantie = systematische variantie + errorvariantie b. de intuïtieve aanpak De intuïtieve aanpak: vergelijken van gemiddelden PROBLEEM -> Gemiddelden verschillen door systematische en error variantie OPLOSSING -> nagaan of het verschil in gemiddelde (op zijn minst gedeeltelijk) te wijten is aan systematische variantie Inferentiële statistiek (<> beschrijvende statistiek) = statistische uitspraken doen die verder gaan dan de zuiver data 2. Inferentiële statistiek Dit is een stap verder dat beschrijvende statistiek Inferentiële statistiek = Schatten hoe groot verschil tussen condities zou zijn als er geen effect zou zijn van onafhankelijke variabele. Als geobserveerd verschil > geschat verschil, dan totale variantie = systematische variantie + error variantie Als geobserveerd verschil < geschat verschil dan totale variantie = error variantie BELANGRIJK ! : statistiek duidt de probabiliteit (p) dat het verschil te wijten is aan enkel error variantie. Wat is de kans dat alles puur toeval ? Negatief antwoord -> wel een effect is ! Omgekeerde redenering omdat we niet kunnen afleiden. Hoe lager deze kans, hoe beter !! (5% door toeval -> statistisch significant) Statistisch significant -> wat is de kans dat het niet bepaald wordt door mn manipulatie. De kans kleiner dan 5 % dan is het statistisch significant. 3. Statistische significantie van r Wat betekent significantie bij correlatie ? Als de kans kleiner dan 5% dat voor de populatie r=0, dan is de steekproefcorrelatie significant Hoe meer proefpersonen, hoe kleiner de kans op toeval Hoe kleiner de steekproef, hoe rapper dat er toeval zal optreden Geldt voor alle effecten -> omgekeerde redenering 4. De nulhypothese De omgekeerde redenering start met de nulhypothese. De situatie waarvan we niet hopen van wat het geval is. We hopen dat we de nulhypothese kunnen verwerpen WANT 41 Nulhypothese = manipulatie van de onafhankelijke variabele leidde niet tot systematisch verandering in de afhankelijke variabele We hopen met de statistiek de nulhypothese te verwerken. Trachten te bewijzen dat de nulhypothese fout is en dat je de alternatieve hypothese wel juist is. Alternatieve/Experimentele hypothese = manipulatie onafhankelijke variabele leidde wel tot systematische verandering in de afhankelijke variabele Statistiek: nulhypothese = vals Hoge probabiliteit -> reject nulhypothese (verwerpen nulhypothese) -> systematische variantie + error variantie -> X1 ≠ X2 DUS de onderzoeker concludeerdt dat de onafhankelijke variabele inderdaad een effect had op de afhankelijke variabele Lage probabiliteit -> fail to reject nulhypothese (mislukken om de nulhypothese te verwerpen) -> error variantie -> X1 ≈ X2 DUS de onderzoeker concludeert dat de onafhankelijke variabele geen effect had op de afhankelijke variabele 5. Type I en type II fouten a. type I fout Onterecht concluderen dat er een effect van onafhankelijke effect van onafhankelijke variabele is. Terwijl het verschil tussen de experimentele condities komt door errorvariantie. Onterecht verwerpen van nulhypothese verwerpen -> correcter Kans op Type I fout = α (significantie niveau, bv.0,05) Alpha level staat op 0.05: onderzoekers verwerpen de nulhypotheses wanneer er 0.05 minder kans is dat de verschillen die ze vinden tussen de gemiddelden van de experimentele condities, komt door errorvariantie. Dan is het verschil tussen de gemiddeldes van de experimentele condities significant. “statistisch significant” als kans op Type I < 5% Als je denkt dat een effect is van de onafhankelijke variabele terwijl er geen is (error variantie) b. type II fout 42 Onterecht concluderen dat onafhankelijke variabele geen effect had Onterecht niet verwerpen naar nulhypothese Onterecht besluiten dat de totale variantie = de error variantie Kans op Type II fout = β Hoe strenger jezelf bent, hoe minder kans op Type I fout. De kans om de volgende experimenten ook een type I fout maken is heel klein. Statistische power = de kans dat een echt effect wordt gedetecteerd in een experiment. Kans dat nulhypothese wordt verworpen wanneer deze ook in realiteit vals is. Statistische power = de kans dat een studie correct de nulhypothese verwerpt, wanneer de nulhypothese vals is. Anders gezegd, power is de kans dat een studie een significant resultaat zal verkrigjen wanneer de experimentele hypothese juist is. 1- β = Power Hoe meer proefpersonen, hoe hoger de power hangt ook af van grootte van effect. Wenselijke power 0.80, maar in psychologie vaak 0.50 Signaal detectie 43 6. Oefeningen OEFENING 1 Type 1 fout OEFENING 2 Type 2 fout Er is in realiteit wel een effect maar in een kleine proef vinden we dit niet terug hierdoor. OEFENING 3 Type 1 fout Eerst iets significant zijn voordat je er iets aan kan koppelen OEFENING 4 Fout in toewijzing van proefpersonen -> niet noodzakelijke een type 1 fout. OEFINGING 5 Type 2 OEFENING 6 Dit verlaagt de power en vergroot de kans op een type 2 fout 7. Analyse van 2-group design We nemen het gemakkelijkste : een experimentele conditie en een controle conditie. Ethische noot: controle groep kan nadien soms toch nog de interventie krijgen wanneer bleek dat interventie werkte of wanneer er goede redenen zijn om te veronderstellen dat er een effect zal zijn (wachtlijst controle groep) Grote van een visueel effect kan je zeer gemakkelijk manipuleren want dit gaat hierbij twee keer over dezelfde data’s. Je kan alleen een uitspraak doen over de significantie als je de data weet. 44 Twee groepen rechtstreeks vergelijken -> adhv t-test Gemiddelde van twee groepen: 20 en 24 Hoeveel zou het verschil tussen de twee groepen zijn obv toeval? Error variantie zit hier in de variantie binnen de condities t = verschilscore/pooled standaard dev ( varianties optellen) zwarte statistische toverkunst zorgt ervoor dat er een bepaald getal bereikt wordt. Als dit geval (t) groter is dan een kritische waarde dan is het verschil significant en is het effect niet te wijten aan errorvariantie Als te grote is dan een kritische waarde dan is verschil significant (waarschijnlijk niet op toeval gebaseerd) Verwerpt H0 Type I fout Correcte beslissing (p = α) (p = 1 – β) 8. analyse van matched Ss en within Ss design Pretest-posttest desing t-test is krachtiger door een betere schatting van de errorvariantie meer statistische power Hfst 12: analyse van complexere designs 10 t-test ? Meerdere t-test verhogen de kans op het maken van een Type 1 fout. 1 t-test 5% kans op Type 1 fout maar de kans op minstens 1 type 1 fout op 10 test is ongeveer 40% Bonferroni correctie = alpha delen door aantal tests dus 0,05 wordt 0,005. Goede bescherming tegen Type 1 fout, maar verhoogt wel de kans op Type 2 Meerdere t-tests verhogen de kans op het maken van een Type 1 fout. Vandaar dat “bijtesten” geen goed idee is. Aantal proefpersonen op voorhand bepalen door powerinschatting en niet 20 en test, 5bij en testen en nog eens 5 bij… We worden zeer strikt in wat we significant noemen hierdoor verlagen de kans op een type 1 fout. De kans is hierop zeer laag Variantie analyse -> één test die effect van onafhankelijke variabele nagaat Variantie analyse is hetzelfde voor een t-test maar dan wel voor meer dan 2 zoals bij een t-test. 1. Variantie analyse Variantie binnen een conditie is error variantie. Als onafhankelijke variabele geen effect heeft, dan zijn ook de verschillen tussen condities error-variantie. Als de variantie tussen de condities beduidend groter is dan de variantie binnen condities, dan moet dit systematisch variantie zijn. 2. Analyse k-group design: anova ANOVA = één test die effect van onafhankelijke variabele nagaat 45 Variantie binnen een conditie = errorvariantie Als de onafhankelijke variabele geen effect heeft dan zijn de verschillen tussen condities ook errorvariantie Als de variantie tussen de condities significant groter is dan de variantie binnen condities, dan wijst dit op systematische variantie De F test zal de verhouding tussen deze twee vormen van variantie weergeven 46 Factoriële designs o Within group variantie, blijft error variantie o Between group variantie: error variantie, HE van geslacht, HE van methode, IA Hoofdstuk 13: quasi-onderzoek Bekom per toeval Ligt tussen een correlationeel onderzoek en een experimenteel onderzoek Correlationeel onderzoek: natuurlijk samen voorkomen van observaties (dus geen manipulatie) o Niet noodzakelijke een lineair verband. Kan ook een niet-lineair verband zijn o Meestal twee continue variabelen, maar soms ook met discrete variabelen (contingentietabel: aantal keer dat een combinatie voorkomt) o Geen conclusie in termen van oorzaak-gevolg mogelijk Experimenteel onderzoek: hier werk je met een manipulatie Quasi-onderzoek: is wanneer een experimenteel onderzoek niet kan voorkomen, het schema klopt niet. o Soms is het niet mogelijke of wenselijke om de onafhankelijke variabele te manipulere Vb. Effect van jarenlang alcoholmisbruik, of van roken, of van sport Als je effect van jarenlang gamen wil onderzoeken o Soms kunnen we proefpersonen niet willekeurig toewijzen aan condities (subject variabelen zoals geslacht, maar soms ook bij interventies) Geslacht heb je niet onder controle Subjects variabelen zijn altijd quasi onafhankelijke variabele (soms is dit een quasi onafhankelijke variabele in een overigens experimenteel onderzoek Vb. Effect van taakmoeilijkheid op ERN voor jong en oud Vb.Effect van emotie inductie op prestatie voor jongens en meisjes DUS: Quasi experimenteel design wanneer proefpersonen niet random worden toegewezen en/of wanneer er geen manipulatie is van de onafhankelijke variabele 1. Verschil tussen Quasi Experimenteel onderzoek en correlationeel onderzoek 47 Verschil met correlationeel onderzoek kan heel subtiel zijn Bij correlationeel onderzoek heb je nooit een manipulatie Bij correlationeel onderzoek heb je geen “condities” vanwege continue numerieke gegevens Hier heeft onafhankelijke variabele twee of meerdere niveaus Quasi experimenteel onderzoek Correlationeel onderzoek Gamers vs niet-gamers vergelijken op Aantal uren gamen correleren met werkgeheugen werkgeheugen Basketbalspelers vs voetballes op oogAantal uren sport correleren met ooghandcoördinatie ( Ik heb zelf niet gekozen wie in handcoördinantie welke groep komt, deze groepen waren er al) Jongens vs. Meisjes op taalvaardigheid Testosteron correleren met taalvaardigheid ERN voor jong vs. Oud Grootte ERN correleren met leeftijd Het verschil tussen quasi experimenteel onderzoek en correlationeel onderzoek is soms onherkenbaar. Voorbeelden zonder correlationele “aanhanger” Quasi experimenteel onderzoek Effect van nieuwe leermethode nagaan Effect van bepaalde interventie (niet-equivalente controle groep) Correlationeel onderzoek Subjects variabelen zoals geslacht, IQ, leeftijd, … zijn altijd quas OV (soms is dit een quasi OV in een overigens experimenteel onderzoek Vb. Effect van taakmoeilijkheid op ERN voor jong en oud Effect van emotie inductie op prestatie voor jongens en meisjes 2. Problemen bij quasi experimenteel onderzoek “opteren”voor een quasi experimenteel design heeft gevolgen voor de oorzaak-gevolg discussie Het belangrijkste blijft steeds wat je kan concluderen. Conclusies zijn beperkter dan bij experimenteel onderzoek omdat je niet kunt manipuleren. Stel je vergelijkt gamers en niet-gamers op een aantal werkgeheugentaken (niet equivalente groepen) Als er dan een verschil is in werkgeheugen, ligt dit dan aan gaming ? -> Zelfde probleem als bij correlationeel onderzoek 3. Interne validiteit Interne validiteit = de sterkte waarmee de onderzoeker weet dat er verandering is in de onafhankelijke variabele door z’n manipulatie. Zijn de verschillen tussen mijn condities echt veroorzaakt door de onafhankelijke variabele In het algemeen is de interne validiteit (veel) lager bij quasi experimentele designs dan bij experimentele designs 4. Soorten quasi experimenteel onderzoek a. Pretest-posttest designs 48 Invloed van medicijnen of interventie. Soms is het onethisch om een bepaald groep te behandeling niet toe te dienen (geen controlegroep) => echt experiment: proefpersonen willekeurig toewijzen aan experimentele- / controle conditie School die een nieuw programma uitvoert Echt exp: proefpersonen willekeurig in experimentele conditie of controle conditie Within Ss design, maar zonder volgorde te contrabalanceren Single group pretest-posttest design ( how not do a study) Obeservatie 1 X Obeservatie 2 Slecht !! Zeer lage interne validiteit Pre-experimenteel design Testing effect: meting Observatie 1 kan soms al voldoende zijn om een bepaald effect te bekomen (aantal sigaretten per dag bevragen kan al een daling veroorzaken zonder dat er klevers of kauwgum aan te pas komen) Natuurlijke genezing “zwak” want er zijn geen vergelijkingspunten VOORBEELD Stel je wilt de effectiviteit van een anti-drug programma testen via een pretest-posttest design. Je kan het druggebruik voor de campagne meten en ook erna. We kunnen het zo voorstellen: Observatie 1 X observatie 2 O1: pretest gebruik van drugs X: introductie van het anti-drugs programma O2: posttest gebruik van drugs Zeer lage interne validiteit ! Veel factoren kunne het druggebruik van de studenten beïnvloedt hebben: Maturatie effecten: studenten zijn ouder geworden en gebruiken daardoor minder Geschiedenis effecten o Een populaire rockbandlid die sterft aan een overdosis o De locale vereniging start een “zeg tegen drug” campagne Pretest sensitisatie Regression to mean Extreme scores die bij hertesting dichter bij het gemiddelde gaan liggen. Bv Iemand selecteert zware rokers, stelt hen aan de quasi-OV bloot (nicotine kauwgum) en hertest die zelfde proefpersoon Statistische tendens: iedere meting heeft een meetfout en die is random verdeeld over alle observaties Maar als je een groep neemt met extreem lage (hoge) scores dan is de kans groter dat de meetfout de scores naar beneden (boven) toe heeft vertekend Vb. Iemand die 2/20 haalt op test zal waarschijnlijk niet meer punten gehaald hebben dan hij verdiende door geluk met de vragen, gokken … (meetfout) maar eerder punten verloren hebben door ongeluk, vermoeidheid, … terwijl net het omgekeerde geld voor iemand die 18/20 haalt op die test. DUS als je die persoon met 2/20 hertest ,is de kans groot dat hij meer haalt, en regression tot he mean vertoont Nonequivalent control group design 49 Resultaten vergelijken met een niet-equivalente controle groep Nonequivalente groep = groep die min of meer overeen komt met de quasi-onafhankelijke variabele Enkel posttest (static group comparison) Je doet een test nadat de ene groep blootgesteld is geweest aan de quasi onafhankelijke variabele Quasi experimentele groep: X O (groep die 60 dagen geen vlees eet) Nonequivalente controle groep- X (groep die gewoon vlees blijft eten) Je zoekt een groep die min of meer op de onderzoeksgroep gelijkt en je meet de afhankelijke variabele PROBLEEM: We hebben geen idee of de quasi experimentele groep en de nonequivalte controle groep gelijk waren voor de behandeling. Indien de twee groepen verschillend waren bij O, dan weten we niet of het komt door de variabele X of dat de groepen verschilden zelfs voor de quasi experimentele groep X verkreeg -> selection bias Non equivalent pretest-posttest Je doet een test voordat de variabele X wordt toegediend en een test erna. Het design wordt dan zo voorgesteld: Quasi experimentele groep: Observatie 1 X Obeservatie 2 Nonequivalente controle groep Observatie 1 – Observatie 2 Vb. Vlaanderen en Wallonië gaan andere belastingsvoeten introduceren en we bekijken de invloed er van op de economische groei Local history effect: er kan zich een gebeurtenis voordoen in de ene groep, maar niet in de andere groep. Selection by history interactie (iets doet zich voor in beide groepen maar doordat ze niet equivalent zijn, reageren ze anders) 2 groepen reageren anders op 1 gebeurtenis b. Time series designs = meerdere metingen Afhankelijke variabele wordt meerdere malen gemeten voor en na de quasi-onafhankelijke variabele zich voordoet simpel onderbroken time series = een aantal pretests doen voor de quasi experimentele variabele en een aantal posttest na de quasi experimentele variabele Om interne validiteit te verhogen meerdere meetmomenten Observatie 1 observatie 2 observatie 3 observatie 4 X observatie 5 observatie 6 observatie 7 observatie 8 o De metingen worden onderbroken door toediening van de quasi experimentele variabele (X) Vb. om de drie maand een drugsgebruik test afnemen en dan na de antidrugs campagne om de drie maand een drugsgebruik test afnemen GEVAAR: local history effect Onderbroken time series met reversal 50 Observatie 1 observatie 2 observatie 3 observatie 4 X observatie 5 observatie 6 –X observatie 7 observatie 8 observatie 9 observatie 10 Met herhaling: observatie 1 observatie 2 observatie 3 observatie 4 X observatie 5 observatie 6 –X observatie 7 observatie 8 observatie 9 X observatie 10 observatie 11 observatie 12 –X observatie 13 observatie 14 observatie 15 Meestal niet mogelijk om quasi experimentele variabel weg te nemen (-X) Ook al neem je variabele weg, het effect kan blijven bestaan Wegnemen van variabele kan van alles veroorzaken Onderbroken time series met niet equivalente controle groep Quasi experimentele groep: Observatie 1 observatie 2 observatie 3 observatie 4 X observatie 5 observatie 6 observatie 7 observatie 8 Niet equivalente controle groep: Observatie 1 observatie 2 observatie 3 observatie 4 – observatie 5 observatie 6 observatie 7 observatie 8 c. Longitudinale studies De quasi experimentele variabele is (leef)TIJD Observatie 1 observatie 2 observatie 3 observatie 4 observatie 5 Moeilijkheden: Moeilijk om proefpersonen te vinden De proefpersonen terugvinden om de zoveel tijd Tijd en geld Cross sectional design: verschillende leeftijdsgroepen vergelijken op één moment in de tijd Vb. geheugen test bij 4-jarige kinderen en bij 8-jarige kinderen PROBLEEM: kunnen geen leeftijdsgerelateerde veranderingen onderscheiden van generatie effecten (de omstandigheden waarin de kinderen zijn opgegroeid) 5. Evaluatie van quasi experimentele designs a. causaliteit Oorzaak moet gevolg vooraf gaan in tijd Er moeten een verband zijn tussen oorzaak en gevolgen Andere alternatieve verklaringen zij nuitgesloten door randomisatie of experimentele controle b. interne validiteit Interne validiteit bedreigt door Geschiedenis Maturatie Regression tot he mean Testing effect Selectie bias Lokale geschiedenis Zonder controle groep Met (niet equivalente) controle groep Interne validiteit is dan we lager dan bij experimentele designs, het is toch beter om een quasi experiment op te zetten als alternatief geen studie is… 51 Wetenschappelijke vooruitgang gaat toch met kleine stapjes, en zelfs met een echt experimentele kunne we enkele ondersteuning vind voor een bepaalde theorie, geen bewijs 52