Designing Social Inquiry King Keohane & Verba Chapter 1 The science in social science 1.1 INTRODUCTION Dit boek gaat over onderzoeksdesign: Hoe stel je vragen en houdt je wetenschappelijk onderzoek waarmee je valide (geldende) beschrijvende en causale inferenties. (conclusies, gevolgtrekkingen) 1.1.1 Two styles of research, one logic of inference Hoofddoel is het verbinden van kwantitatief en kwalitatief onderzoek door in beide een eendrachtige logica door te voeren. De typen van onderzoek zijn (stilistisch gezien)heel verschillend Kwantitatief: gebruikt cijfers en statistische methoden. Gebaseerd op numerieke metingen. Kwalitatief: focus op klein aantal cases. Gebruikt bijv. intensieve interviews, diepte analyses van historisch materiaal. De desbetreffende case wordt in alle details geanalyseerd. Toch ligt voor elke onderzoeksbenadering dezelfde logica ten grondslag. Het meeste onderzoek past niet specifiek in de ene of andere categorie. De een is niet beter dan de ander. Het beste onderzoek combineert kenmerken van beide onderzoekstypen. We disputeren (argue) dat non-statistisch onderzoek meer betrouwbare resultaten levert als onderzoekers meer aandacht aan de regels van statistische inferentie besteden. De regels van inferentie die we bespreken zijn niet voor alle issues relevant. De onderscheidende karakteristiek die sociale wetenschap onderscheid van causale observatie is dat sociale wetenschap uitkijkt naar het komen tot valide inferenties door het systematisch gebruik van een goed gefundeerde procedure van inquiry (enquêtes) Niets in de regels zegt dat we het perfecte experiment moeten doen of alle relevante data moeten verzamelen voordat we een valide sociaal wetenschappelijke enquête kunnen houden. Gelimiteerde informatie is vaak een noodzakelijk kenmerk van social inquiry. De sociale wereld verandert snel en analyses waarmee we de veranderingen proberen te begrijpen vergen dat we ze omschrijven en ze proberen te begrijpen, ook al is de onzekerheid over de conclusies hoog. Door aandacht te vestigen op de regels voor wetenschappelijke inferentie kan betrouwbaarheid, validiteit, zekerheid en eerlijkheid van de conclusies worden verbeterd. Het boek schrijft geen recepten voor wetenschappelijk empirisch onderzoek. Het biedt een aantal principes en regels aan. 1.1.2 Defining scientific research in the social sciences Goed onderzoek, wetenschappelijk onderzoek kan kwantitatief of kwalitatief zijn. In ontwerp heeft wetenschappelijk onderzoek de volgende 4 kenmerken: Zie ook sheets HC 1 Demarkatiecriteria (maar ook kwaliteitscriteria) 1. Het doel is: gevolgtrekkingen maken op basis van empirische informatie. The goal is inference. De informatie halen we uit de wereld om ons heen. 2. Procedures zijn expliciet, vastgelegd en openbaar. The procedures are public Zo kunnen data voortgebracht worden en geanalyseerd worden waarvan vervolgens de betrouwbaarheid kan worden bepaald. 3. De uitkomsten zijn onzeker The conclusions are uncertain Als je aan onderzoek begint moet je bij voorkeur niet al van tevoren het antwoord weten. 4. Het wetenschappelijke schuilt in de methode The content is the method Alles wat wetenschappelijk is aan het onderzoek moet in de methode j=kunnen worden teruggevonden. ‘de manier waarop’. Wetenschap op zijn best is een sociale onderneming. Het draagt bij aan de sociale omgeving. 1.1.3 Science and complexity De waargenomen complexiteit van een situatie hangt deels af van hoe goed we de realiteit kunnen vereenvoudigen. En onze capaciteit tot vereenvoudigen is afhankelijk van of we uitkomsten en verklarende variabelen op een coherente manier kunnen specificeren. Méér observaties kunnen hierbij helpen maar het is vaak onvoldoende. Complexiteit maakt onze inferenties minder zeker maar niet minder wetenschappelijk. Stel: Complexe, unieke gebeurtenissen met enorme vertakkingen. Manieren om zulke gebeurtenissen te begrijpen: - Zoeken naar generalisaties: elke case zien als lid van een ‘class of events’ klasse van gebeurtenissen waarover zinvolle generalisaties kunnen worden gedaan - Engage in counterfactual analyses: de mentale constructie van een course of events die is veranderd door modificaties in een of meer condities, voorwaarden. Wetenschappelijke generalisaties zijn nuttig bij het studeren van zelfs heel ongewone gebeurtenissen die niet in een brede klasse van gebeurtenissen vallen. Zelfs unieke gevallen kunnen wetenschappelijk onderzocht worden als we aandacht besteden aan het verbeteren van - theorie, ( kan meer observeerbare implicaties opleveren en zelfs causal theory van unieke gebeurtenissen testen.) - data ( hierdoor kunnen we meer observeerbare implicaties observeren) - gebruik van data. ( staat toe meer implicaties uit de bestaande dat te halen) 1.2 MAJOR COMPONENTS OF RESEARCH DESIGN Onderzoeksontwerp bestaat uit: - onderzoeksvraag - theorie - data - gebruik van de data deze vier worden gewoonlijk niet los van elkaar ontwikkeld en wetenschappers gebruiken ze niet in een voorbestemde volgorde. Vb kwalitatief onderzoek begint met dataverzameling, en dan pas de rest. 1.2.1 Improving research questions Hoorcollege 1 (3) Mogelijkheden om de onderzoeksvraag te verbeteren De vraag die aan het onderzoek ten grondslag ligt, moet enig maatschappelijk belang hebben Het onderzoeksproject moet een specifieke bijdrage leveren aan de relevante wetenschappelijke literatuur. Die bijdrage ligt in het vergroten van ons collectief vermogen om beproefde wetenschappelijke verklaringen voor een deel van de wereld op te stellen. Er bestaan geen precieze regels voor het kiezen van een onderwerp. Maar alle onderzoeken in de sociale wetenschap zouden eigenlijk wel aan deze twee criteria moeten voldoen: 1. Een onderzoeksproject zou een vraag moeten stellen die ‘belangrijk’ is voor de ‘real world’ maatschappelijk belang. 2. Een onderzoeksproject zou een specifieke bijdrage moeten leveren aan wetenschappelijke literatuur door de collectieve mogelijkheden te vergroten om wetenschappelijke verklaringen van sommige aspecten van de wereld te krijgen. Dit (2) kan op een aantal manieren: - een hypothese kiezen die in de literatuur als belangrijk wordt gezien maar waar nog nooit een volwaardig onderzoek naar is gedaan. Bewijs voor / tegen de hypothese levert een bijdrage. - Kies een in de literatuur geaccepteerde hypothese die je ‘false’ verwacht. En onderzoek of ie inderdaad false is en of een andere theorie correct is. - Etc (pag 17) Deze 2 manieren om onderzoeksvragen te kiezen zijn niet noodzakelijk elkaars tegenstander. Een ontwerpvoorstel dat niet verfijnd kan worden in een specifiek onderzoeksproject dat valide beschrijvende en causale inferentie toelaat zal in de loop der tijd aangepast of verlaten moeten worden. 1.2.2 Improving theory HC 1 (4) Mogelijkheden om de theorie te verbeteren Hanteer theorieën die fout kunnen zijn Hanteer theorieën die zoveel mogelijk waarneembare implicaties kunnen opleveren (4.2) Wees zo concreet mogelijk bij het opstellen van theorieën Aantekeningen 1. De theorie moet verworpen kunnen worden zodat de uitkomsten van de theorie onzeker kunnen zijn ( zie demarkatiecriteria) om zo correcte theorieën te maken. 2. Algemene theorie is bijv: ‘Opkomst bij verkiezingen daalt’ Is een beetje ‘ononderzoekbaar’(alle landen, alle soorten verkiezingen) Maar het levert wel mee waarneembare implicaties op dan wanneer je bijv alleen in NL onderzoekt 3. concreet zijn om in te perken 2 en 3 zijn soms met elkaar in strijd. Rest: boek, nog samenvatten 1.2.3 Improving data quality HC 1 (5) Mogelijkheden om de kwaliteit van de gegevens te verbeteren 1. Leg vast, en rapporteer op welke wijze de gegevens tot stand zijn gekomen 2. Verzamel gegevens over zo veel waarneembare implicaties van de theorie als maar mogelijk is (sluit aan bij 4.2) 3. Maximaliseer de geldigheid van de metingen (is cruciaal) 4. Zorg ervoor dat de methoden van dataverzameling betrouwbaar zijn 5. Zorg ervoor dat alle gegevens en alle analyses zoveel mogelijk repliceerbaar zijn Aantekening Geldigheid en betrouwbaarheid zijn heel belangrijk in het boek Boek: 1. nog doen evt. 2. Verzamel de data in zoveel mog. diverse contexten. Hoe meer waarneembare implicaties die bij de theorie aansluiten, des te krachtiger de verklaring en hoe zekerder de resultaten. In praktijk zullen begrensde bronnen en tijd altijd de dataverzameling tegenwerken. Ookal komt méér informatie de zekerheid van onze gevolgtrekkingen veelal ten goede; beginnende wetenschappers kunnen evengoed verzuipen in te veel gegevens dan ten ondergaan door te weinig gegevens. 3. Validiteit verwijst naar of we meten wat we denken te meten. Over het algemeen is het ’t makkelijkst validiteit te maximaliseren door de data aan tehangen en niet toe te staan dat ongeobserveerde of ongemeten concepten in de weg staan. 4. Betrouwbaarheid houdt in dat het op dezelfde manier toepassen van dezelfde procedure altijd dezelfde meting zal produceren. Als in tussentijd niets is gebeurd zal hetzelfde resultaat worden geobserveerd/gemeten. 5. repliceerbaarheid van de data zodat gezien kan worden of de metingen betrouwbaar zijn, maar ook het hele proces dat gebruikt is bij het komen tot een conclusie. Maar ook zodat andere wetenschappers er mee uit de voeten kunnen, het onderzoek kunnen oppakken of voortzetten. 1.2.4 Improving the use of existing data HC 1 (6) Mogelijkheden om het gebruik van bestaande gegevens te verbeteren 1. Gebruik gegevens die “zuiver” zijn (dwz: gebruik gegevens die geldig zijn) 2. Maximaliseer de efficiëntie van de gegevens (heeft veel te maken met betrouwbaarheid) Aantekening Zuiverheid (unbiased) en geldigheid (valid) hebben veel met elkaar te maken maar zijn niet hetzelfde. Boek: 1. Zuiverheid bereiken hangt af van * het verzamelen van gegevens en * het latere gebruik van de gegevens. Bij het gebruik van data moeten we voorzichtig zijn of er ook bronnen van onzuiverheid over het hoofd gezien zijn tijdens de dataverzameling. 2. Efficiëntie van de gegevens maximaliseren betekent niet alleen alle data gebruiken maar ook alle relevante info die ín de data zitten gebruiken om zo de gevolgtrekkingen te verbeteren. 1.3 THEMES OF THIS VOLUME 1.3.1 Using observable implications to connect theory and data De waarneembare implicaties van een theorie moet onze dataverzameling leiden, en onderscheid helpen maken in relevante en irrelevante feiten. 1.3.2 Maximizing leverage Verklaar zoveel mogelijk met zo weinig mogelijk. Leverage: hefboomwerking Aantekening De hefboom is de theorie, als we de theorie algemener maken kunnen we meer over empirische implicaties zeggen. De theorie moet nét algemeen genoeg zijn om de implicaties te verklaren. Als je veel nodig hebt om weinig uit te leggen dan zou je doel moeten zijn een onderzoek te ontwerpen met meer leverage, hefboomwerking. Verschillende manieren om de hefboomwerking van een onderzoeksprobleem toe te laten nemen: De primaire manier is: toename van het aantal waarneembare implicaties van de hypotheses en zoeken naar bevestiging van de implicaties. (Dit kan de theorie, data, het gebruik van data verbeteren, zodat er meer implicaties uit bestaande data kunnen worden gehaald. Maximaliseren van de hefboomwerking is zo belangrijk dat sterk woordt aangeraden dat onderzoekers routinematig alle mogelijke waarneembare implicaties van hun hypotheses noteren die in hun data of in andere data mogelijk waargenomen worden. Hoe meer bewijs in verschillende contexten wordt gevonden, hoe krachtiger de verklaringen worden en hoe meer vertrouwen wij en anderen zouden moeten hebben in onze conclusies. 1.3.3 Reporting uncertainty Alle kennis en gevolgtrekkingen in kwalitatief en kwantitatief onderzoek zijn onzeker. Goede sociale wetenschappers rapporteren schattingen van de betrouwbaarheid van hun gevolgtrekkingen. 1.3.4 Thinking like a social scientist: skepticism and rival hypotheses Hoofdstuk 2: Beschrijvende inferentie Sociaal wetenschappelijk onderzoek, zowel kwalitatief als kwantitatief, heeft 2 doelstellingen; namelijk beschrijven en verklaren. Dit hoofdstuk gaat over de beschrijvende inferentie. 2.1 Algemene kennis en gedetailleerde feiten Goed wetenschappelijk onderzoek probeert aan de details voorbij te gaan om meer algemene informatie te verkrijgen en alles zo beter te begrijpen. Je leert meer van een specifiek iets door het algemene te bestuderen. Bijv. De Franse Revolutie. Door kennis op te doen over oorzaken van revoluties, kun je meer te weten komen over de oorzaken van de Franse Revolutie. 2.1.1 Interpretatie en Inferentie Sommige historische en antropologische onderzoekers claimen alleen specifieke kennis te zoeken door interpretatie. Volgens de schrijvers van het boek zijn wetenschap en interpretatie niet volledig verschillend. Beide vertrouwen op een goede voorbereiding, het stellen van goede vragen etc. om bewijs te verkrijgen dat de hypotheses ondersteunt. De onderscheidende bijdrage van wetenschap is het presenteren van een aantal procedures om de antwoorden te verkrijgen op nauwkeurig geformuleerde beschrijvende en causale vragen. Bij interpretatie vertrouwt men vaak op de observaties van 1 persoon. Die observaties zouden juist gecompleteerd moeten worden door de logica van wetenschappelijke inferenties. Zonder de mogelijkheid om een theorie te falsificeren, kunnen conclusies nooit wetenschappelijk genoemd worden. Als voorbeeld wordt het knipperen en knipogen gebruikt. De interpretatie kan zijn, hij knipoogt naar me, maar hij heeft misschien alleen een vuiltje in zijn oog. Wetenschap zou zich afvragen waarom de man knippert. 2.1.2 Uniciteit, complexiteit en vereenvoudiging Elke gebeurtenis is uniek. Het punt is niet in hoeverre gebeurtenissen uniek zijn, maar in hoeverre de sleutelkenmerken van sociale realiteit die we willen onderzoeken kunnen worden samengevat uit een massa van feiten. Om dit te kunnen doen is de eerste en moeilijkste taak van sociale wetenschap het simplificeren van de feiten, daarbij oplettende dat je geen belangrijke feiten weglaat. Het boek vindt dat, waar mogelijk, sociale wetenschap zowel algemeen als specifiek moet zijn. Systematische patronen in gelijkwaardige gebeurtenissen moeten toegepast worden op specifieke gebeurtenissen. 2.1.3 Onderzoek naar vergelijkbare gevallen Beschrijvingen van gebeurtenissen moeten zo precies mogelijk, want het is nutteloos om een verklaring te zoeken voor iets wat niet goed beschreven is. Een goede beschrijving is beter dan een slechte verklaring. De ontwikkeling van goede causale hypotheses is aanvullend op een goede beschrijving. Onderzoek naar gebeurtenissen moet systematisch zijn in het beschrijven en verklaren, dat is fundamenteel voor het onderzoek. 2.2 Inferentie: Het wetenschappelijke doel van dataverzamelingen Inferentie is het proces van het gebruiken van bestaande feiten om te leren over nieuwe feiten. Het organiseren van feiten in waarneembare implicaties van een specifieke theorie geeft verschillende belangrijke resultaten in het ontwerpen en het houden van een onderzoek. Je kunt snel herkennen of meer observaties van de implicaties van de theorie in kwestie helpen de theorie te evalueren. Bovendien heb je geen complete theorie nodig voor je alle data verzameld en de theorie ontwikkelt zich gedurende het onderzoek. Ook wordt het duidelijk of je een kwalitatieve of kwantitatieve stijl van onderzoek moet gebruiken. Het onthult het essentiële wetenschappelijke doel van veel kwalitatief onderzoek. De belangrijkste stelregel voor het verzamelen van data en het creëren van een theorie is: Zoek voor meer waarneembare implicaties van een theorie. Deze implicaties moet je systematisch ordenen. Alle feiten zijn misschien niet interessant voor je onderzoek, maar als ze consistent zijn met de theorie, kunnen ze waardevol zijn in het onderbouwen ervan. Het verifiëren van een theorie in andere omstandigheden vergroot het vertrouwen in de theorie. 2.3 Formele modellen voor kwalitatief onderzoek Een model is een simplificatie van een aspect van de wereld. Wij onderzoeken of een model de juiste kenmerken van het origineel heeft. Een model kan niet geëvalueerd worden zonder te weten welke kenmerken van het model je bestudeerd. Er zijn beperkte en onbeperkte modellen. De beperkte modellen zijn duidelijker, abstracter, maar minder realistisch. Onbeperkte modellen zijn gedetailleerd en realistisch, maar moeilijk te benaderen. Het model dat je gebruikt hangt af van het doel waar je het voor wilt gebruiken. De modellen gebruikt in dit boek moeten niet verward worden met kwalitatief onderzoek. Ze zijn bedoeld om duidelijkheid en nieuwe inzichten te verschaffen. 2.4 Een formeel model voor kwalitatief onderzoek De belangrijkste regel voor data verzamelingen is te vermelden hoe de data verkregen is en hoe het in je bezit is gekomen. De data wordt gemodelleerd met variabelen, eenheden en observaties. Een variabele wordt vaak aangegeven door y. Observaties kunnen numeriek, verbaal, visueel of anders zijn. Het is belangrijk een onderscheid te maken tussen het aantal gebeurtenissen en het aantal observaties. De n wordt vaak gebruikt voor het aantal observaties. 2.5 Historische details samenvatten De eerste stap in elke analyse is het samenvatten van de data. Er worden dan nog geen conclusies getrokken, maar opvallende dingen komen wel naar voren. De gebruikte modellen worden statistieken genoemd. Een statistiek is een uitdrukking van de gegevens in verkorte vorm. Bijvoorbeeld het gemiddelde: y = 1/n Σni=1 yi maximum: ymax= maximum (y1, y2 ....yn) Verder zijn er nog minimum, mediaan, modus en variantie. Communiceren met samenvattingen is gemakkelijker en betekenisvoller. Regels voor samenvattingen: Samenvattingen moeten gericht zijn op de uitkomsten die we willen beschrijven of verklaren. Een samenvatting moet informatie simplificeren. 2.6 Beschrijvende inferenties Beschrijvende inferentie is een proces van het begrijpen van ongeobserveerde fenomenen op basis van een aantal observaties. Een van de fundamentele doelen van inferentie is het onderscheiden maken tussen systematische componenten en de niet systematische componenten van het fenomeen dat bestudeerd wordt. Het ene component is niet belangrijker dan het andere, maar ze moeten wel los van elkaar gezien worden. Systematische componenten zijn voorspelbaar en niet-systematische componenten zijn onvoorspelbaar, zoals het weer, terroristische aanslagen etc. y noemen we een gerealiseerde variabele. De waarde varieert over de n eenheden.Y is een willekeurige variabele die willekeurig varieert over de hypothetische replicaties. Een doel van inferentie is om te leren van systematische kenmerken van willekeurige variabelen, ondanks dat we het onderscheid willen maken in systematische en nietsystematische componenten in onze data. In een specifiek geval nemen we een willekeurige variabele en zijn systematische kenmerken. De grote van het niet-systematische component kan berekend worden aan de hand van de variantie. V(Yi) = σ2i σ2 geeft het resultaat van het toepassen van de variantie op de willekeurige variabele Y i . Er zijn 2 perspectieven voor willekeurige variabelen. 1. Een waarschijnlijke wereld. Niets kan voorspeld worden. Teveel niet-systematische componenten. 2. Een vastgestelde wereld. De hele wereld is voorspelbaar. Alleen willekeurige variabelen hebben geen verklaring. Om een beeld te vormen van de willekeurige variabelen waar de observaties van afgeleid zijn en om te proberen hun systematische kenmerken te benaderen, heb je geen grote dataverzameling nodig. Een aanwijzing van een goede historicus is een mogelijkheid om de systematische aspecten te beschrijven. Toch kunnen alleen herhaalde onderzoeken in verschillende contexten de mogelijkheid bieden om systematische patronen te ontdekken of juist willekeur. Systematische factoren zijn persistent en hebben consistente consequenties. Niet-systematische factoren zijn wisselvallig, hun impact valt niet te voorspellen. Als we geen inspanning doen om systematische kenmerken te ontdekken bij een gebeurtenis, dan zijn de geschiedenislessen verloren en leren we niets over welke aspecten van de gebeurtenis waarschijnlijk weer gebeuren of welke aspecten relevant zijn voor toekomstige gebeurtenissen. 2.7 Criteria om beschrijvende inferenties te beoordelen In dit hoofdstuk worden 3 criteria behandeld die vaak worden gebruikt in de statistiek om methoden te beoordelen of om conclusies te trekken. De 3 criteria zijn onbevooroordeeldheid, efficiëntie en consistentie. 2.7.1 Onbevooroordeelde inferenties Als een methode van inferentie steeds maar weer wordt toegepast, dan kunnen de schattingen ver uiteen gaan lopen. Krijg je dan nog het goede antwoord op het gemiddelde? Zo ja dan is de schatter onbevooroordeeld. Onbevooroordeelde schatters verschijnen als de variatie van de ene replica en de andere niet-systematisch is . In het geval van een systematische fout in de replica’s die de schatter een bepaalde kant op trekt dan is er sprake van bevooroordeeldheid. Specifieke datasets kunnen bevooroordeeld zijn. Wat er ook geprobeerd wordt te schatten, altijd is een statistisch onbevooroordeelde schatter gewenst. Mensen die de ruwe informatie leveren, die we gebruiken voor de beschrijvende inferentie hebben vaak redenen om bevooroordeelde schattingen te doen. Bekijk het voorbeeld in het boek op blz 65 2.7.2 Efficiëntie Efficiëntie biedt een manier om onbevooroordeelde schatters te onderscheiden. Het is een relatief concept dat wordt gemeten door de variantie van de schatter in de hypothetische replicaties. Voor onbevooroordeelde schatters geldt, hoe kleiner de variantie, des te efficiënter en beter is de schatter. Efficiëntie is interessant als de bevooroordeeldheid klein is. Vaak is het goed als de kleine bevooroordeeldheid oploopt inruil voor het verkrijgen van veel efficiëntie. Des te meer observaties des te kleiner de variantie. Bekijk het voorbeeld in het boek op blz 70 en blz 71, 72 De formele manier om de bevooroordeeldheid – efficiëntie te evalueren is door de MSE te berekenen (Mean Square Error) dit is een combinatie van de bevooroordeeldheid en de efficiëntie MSE(g) = V(g) + E(g - y)2 = variantie + bias Het idee is om de schatter met de minste MSE te vinden omdat het perfect laat zien hoe een schatter met wat bevooroordeeldheid beter kan zijn als de variantie kleiner was. In theorie prefereren we altijd onbevooroordeelde schatters die zo efficiënt mogelijk zijn. Maar in de echte onderzoek situaties is dit compromis tussen bevooroordeeldheid en efficiëntie erg treffend. Samenvatting Hoofdstuk 3 3.1 Definitie van causaliteit Het boek maakt onderscheid tussen beschrijvende (descriptive) en causale inferentie. Causale inferentie gaat uit van het maken van gevolgtrekkingen (inferentie) aan de hand van observaties en de daaruit voortgekomen informatie (wat beschrijvende inferentie is) 3.1 Definitie: Het causale effect is het verschil tussen de systematische component van waarnemingen wanneer de verklarende variabele een bepaalde waarde aanneemt en de systematische component van vergelijkbare waarnemingen wanneer de verklarende een andere waarde aanneemt (zo staat het echt in het boek) -> is de verandering die de systematische component ondergaat wanneer de verklarende variabele verandert Onderzoekers hebben wat betreft causaliteit te maken met het Fundamenteel Probleem van Causale Inferentie. Dit houdt in dat het onmogelijk is om meerdere situaties tegelijk te laten afspelen. Als één variabele zich in een situatie op een bepaalde manier manifesteert, dan willen wetenschappers bijvoorbeeld weten hoe de uiteindelijke situatie er uit gezien zou hebben als deze variabele andere waarden aan zou nemen. Dit is echter niet mogelijk. Je kunt de geschiedenis zich niet twee keer laten afspelen. Ook is het niet mogelijk om in een tweede experiment alle andere variabelen gelijk te houden. 3.2 Alternatieve definities van causaliteit In dit hoofdstuk laten de schrijvers zien dat andere theorieën die betrekking hebben op causaliteit. En dat deze niet in conflict zijn met de theorie zoals die in hoofdstuk 3.1 beschreven wordt. 3.2.1 Causale Mechanismen Met ‘causale mechanismen’ wordt bedoeld dat een causaal verband vaak bestaat uit meerdere kleinere causale schakelingen. Een causaal verband kan dus een optelsom zijn van meerdere kleinere causale verbanden; dit zijn de causale mechanismen. Doordat je een causaal effect kunt definiëren zonder dat je alle kleinere causale mechanismen binnen dat causaal verband hoeft te doorgronden, blijft de theorie in h3.1 overeind staan. (Het is niet mogelijk om causale mechanismen te herkennen zonder het concept van causaal verband te definiëren). Men moet niet een definitie van causaliteit verwarren met de ongedefinieerde, hoewel vaak nuttige operationele procedure van het definiëren van causale mechanismen. 3.2.2 Meervoudige Causaliteit Met meervoudige causaliteit worden causale verbanden bedoeld met veel verklarende variabelen en weinig waarnemingen. Hiermee wordt bedoeld dat een bepaalde uitkomst de oorzaak kan zijn van verschillende variabelen. Hiermee wordt niet de optelsom bedoeld van die variabelen, maar dat een bepaald uitkomst verschillende oorzaken kan hebben. (zie voorbeeld pag. 88, tweede alinea. Dat verheldert het nogal) 3.2.3. Symmetrische en Asymmetrische Causaliteit Als een bepaalde waarde van de verklarende variabele X toe- of afneemt, dan heeft dit invloed op de te verklaren variabele Y. Een causaal verband is symmetrisch als de toe- of afname bij X evenredige, of omgekeerd evenredige gevolgen heeft voor Y. Als dit niet het geval is, dan is het verband Asymmetrisch. 3.3 Aannames die nodig zijn om causale effecten te bepalen Met de volgende factoren moet men goed rekening houden, wil men het fundamentele causale probleem ontwijken. 3.3.1 Eenheid Homogeniteit Met eenheid (unit) wordt hiermee bedoeld de ‘ruimte’ waarbinnen een experiment zich voordoet. In deze ruimte bevinden zich alle variabelen die invloed hebben op de te verklaren variabele. Binnen dit vastgestelde grensgebied kunnen alle variabelen bepaald worden en zo kan men het onderzoek standaardiseren. Door bij twee of meerdere experimenten er voor te zorgen dat al deze experimenten binnen dezelfde ‘ruimte’ gedaan worden, dus dezelfde variabelen invloed hebben, kan de mate van afwijking (bias) tot een minimum beperkt worden. 3.3.2 Conditionele onafhankelijkheid Conditionele onafhankelijkheid is de aanname dat waarden zijn toegewezen aan verklarende variabelen onafhankelijk van de waarden die de te verklaren variabele aanneemt. 3.4 Criteria om causale inferentie te beoordelen ---3.5 Regels om causale theorieën te construeren regel 1: construeer falsifieerbare theorieën Een theorie die niet fout kan zijn is geen theorie. Een theorie moet makkelijk te falsifiëren zijn; de onderzoeker moet bij het opstellen van de theorie er voor zorgen dat hij simpele constructies inbouwt zodat de theorie makkelijk na te trekken is op falsifieerbaarheid. Popper (1968) ziet het zelfs als volgt: het bevestigen van een theorie is irrelevant; falsifiëren van een theorie is de sleutel tot wetenschap. Een theorie die in het verleden zijn waarde heeft bewezen en nog nooit is gefalsifieerd, kan in de toekomst nog gefalsifieerd worden. Ook kan men nooit met 100% zekerheid zeggen dat een theorie klopt, aangezien er niet oneindig veel experimenten uitgevoerd kunnen worden en je er dus niet van uit kunt gaan dat een theorie niet ooit een keer onjuist zal worden bewezen. De meest nuttige sociale theorieën zijn valide onder bepaalde omstandigheden. Algemene, universele waarheden zijn bij voorbaat niet te falsifiëren en zijn dus van weinig nut. Wetenschappers moeten dan ook altijd duidelijk omschrijven binnen welke grenzen hun theorie geldig is. Regel 2: Maak theorieën die internconsistent zijn Een theorie die intern inconsistent is is niet alleen falsifieerbaar, maar ook ongeldig. Als twee of meer delen van een theorie hypotheses veronderstellen die elkaar tegenspreken is er spraken van interne inconsistentie. Een methode om er voor te zorgen dat theorieën intern consistent zijn is door formal modelling. Hierbij wordt aan de hand van wiskundige of ruimtelijke modellen een theorie beproefd op interne conflicten. (beetje vaag verhaal maar volgens mij bedoelen ze hier het nakijken van simpele wiskundige verbanden die vaak in sociale theorieën terug te vinden zijn). Regel 3: Selecteer afhankelijke variabelen nauwkeurig Bij het selecteren van afhankelijke variabelen worden vaak fouten gemaakt in de wetenschappen. Er zijn drie veel gemaakte fouten: 1. Vaak zijn gekozen afhankelijke variabelen helemaal niet afhankelijk. Gevolgen hiervan kunnen zijn dat deze afhankelijke variabelen veranderingen veroorzaken in de onafhankelijke variabele. 2. Soms worden afhankelijke variabelen gekozen die helemaal niet variabel blijken te zijn. 3. Ook wordt regelmatig een afhankelijke variabele gekozen die niet de variatie die men beschreven wil zien beschrijft. (in het boek staat als aanbeveling: -> choose a dependant variable that represents the variations we wish to explain) Regel 4: Wees concreet Selecteer zo veel mogelijk zaken die daadwerkelijk goed te observeren zijn. Abstracte begrippen zoals cultuur, intenties van personen, beweegredenen spelen een nuttige rol bij het formuleren van een theorie, maar zijn hinderlijk voor empirische evaluatie van theorieën en hypotheses als ze niet meetbaar gemaakt kunnen worden. Een oplossing hiervoor is om subvariabelen te onderscheiden die iets kunnen zeggen over het ‘grote geheel’. Bijvoorbeeld: Als je wilt weten of er in een westers land veel asielzoekers zijn, maar je hebt niet de mogelijkheid om een volkstelling te houden oid dan kun je het aantal moskeeën gaan tellen en aan de hand daarvan de conclusie trekken dat er wel of niet veel buitenlanders in het westerse land zijn. Natuurlijk is niet elke asielzoeker moslim en geeft dit dus een vertekend beeld. Dit is meteen het gevaar van dit soort gevolgtrekkingen. Regel 5. Maak theorieën voor veel gevallen toepasbaar Dit is in eerste instantie tegenstrijdig met regel 1, toch moet een theorie zoveel mogelijk over de wereld uitleggen als mogelijk is. Pas als bewezen wordt dat een theorie niet in een bepaalde situatie geldig is, dan moet men de grenzen van de theorie in gaan perken. Als bijvoorbeeld grijze wolken voor regen zorgen in Nederland dan mag men aannemen dat dat in andere landen ook zo zal zijn. Hiervoor hoeft men niet een nieuw onderzoek in het buitenland te verrichten, maar men mag wachten op onderzoeken die het tegendeel bewijzen. Hoofdstuk 4 Vaststellen wat te observeren Dit hoofdstuk gaat over specifieke praktische problemen van kwalitatief onderzoeksontwerp. Het hoofdstuk concentreert zich op hoe we waarnemingen moeten selecteren voor onze analyse. Om genoeg waarnemingen te hebben moet je jouw waarnemingen opsplitsen. Dus bijvoorbeeld een land opsplitsen in staten en vervolgens observeren in plaats om het als geheel te observeren. Op die manier verhoog je jouw waarnemingen voor je studie, waardoor je kans vergroot is op valide causale gevolgtrekkingen. Je kunt ook bijvoorbeeld waarnemingen van een land van verschillende tijden verzamelen. Dus het is beter om meer waarnemingen te verzamelen in plaats van gevolgtrekkingen, dus niet gedetailleerde informatie verzamelen over een waarneming, maar verzamel informatie over verschillende waarnemingen. 4.1 Ongedetermineerde onderzoeksontwerpen Sommige onderzoeksontwerpen zijn ongedetermineerd onderzoeksontwerp, dit betekent dat niets geleerd kan worden over de causale hypotheses. Ongedetermineerde onderzoeksontwerpen gelden alleen wanneer er een doel is om causale gevolgtrekkingen te maken. Er bestaan twee situaties waarin een ongedetermineerd onderzoeksontwerp ontstaat en ons daardoor geen leverage verschaft: 1. We hebben met meer gevolgtrekkingen te maken dan de opgeleverde waarnemingen. 2. We hebben twee of meer onafhankelijke variabelen in onze data die perfect gecorreleerd zijn met elkaar- in statistische termen. Dit is het probleem van multicollineariteit. 4.1.1 Meer gevolgtrekkingen dan waarnemingen Er is een limiet van hoeveel we kunnen leren van gelimiteerde informatie. Het is een regel dat elke waarneming ons kan helpen om maximaal één gevolgtrekking te maken. Als de waarnemingen afhankelijk zijn maken ze minder gevolgtrekkingen. Dus we hebben veel waarnemingen nodig om een redelijke causale gevolgtrekkingen te maken. Het is niet verstandig om alle mogelijke onafhankelijke variabelen mee te rekenen, dit veroorzaakt namelijk een ongedetermineerde onderzoeksontwerp. Het toevoegen van nieuwe waarnemingen van verschillende niveaus is een geschikte methode om kwalitatief en ongedetermineerd onderzoeksontwerp te realiseren en omitted (weglating) variabele bias te weerstaan. Stel dat we geïnteresseerd zijn in het maken van gevolgtrekkingen over 2 parameters in een causaal model met twee onafhankelijke variabelen en een alleenstaand afhankelijke variabele, maar we hebben maar een waarneming (n=1). De volgende vergelijking wordt hiervoor gebruikt: E(Y)=X1B1+X2B2 B: waarneming X: parameter Het probleem van deze vergelijking is dat het niet over een unieke oplossing beschikt. Zo wijzen verschillende implicaties het causale effect. 4.1.2 Multicollineariteit Dit is een situatie waar je vergelijkend variabelen hebt die met elkaar verbonden zijn, bijv. geboortejaar en leeftijd. Wanneer je weet dat X1=X2 dan wordt de vergelijking: E(Y)=X1B1+X2B2 =X1(B1+B2) Ondanks we nu meer waarnemingen dan parameters hebben, ontstaat hetzelfde probleem: er kan geen unieke schatting van de parameters worden gegeven. Dit kan overigens bij geen enkele methode. Om vertrouwen te vergroten over onze schattingen moeten we onze leverage maximaliseren over ons probleem. Tevens moeten we zoveel mogelijk waarnemingen observeren voor onze theorie. Maximaliseer leverage door minder onafhankelijke variabelen te nemen om een causale gevolgtrekking te maken. Hiermee moet je voorzichtig zijn om geen bias te krijgen door omitted variabele bias (het weglaten van variabelen). Een succesvol project is een dat veel verklaart met zo weinig mogelijk. Het doel is dat een alleenstaande onafhankelijke variabele veel waarnemingen op afhankelijke variabelen verklaart. 4.2 De limieten van willekeurig selectie Je moet willekeurigheid niet verwarren met geluk. Willekeurig selectie betekent dat elke waarneming even veel kans heeft op selectie. Willekeurig selectie van waarnemingen elimineert bias automatisch in grote n-studies. Bij grote nstudies is willekeurige selectie uitvoerbaar, maar dit geldt niet bij kwalitatieve onderzoek waar er weinig n-studies zijn, anders missen hun belangrijke gegevens. 4.3 Selectie Bias Welke waarnemingen moeten we selecteren voor onze studie? Vooral voor kwalitatief onderzoek is dit belangrijk, het bepaalt de betrouwbaarheid van de resultaten. Maar als je willekeurigheid negeert open je veel deuren voor bias, bijv. dat je waarnemingen verzamelt die jouw hypotheses confirmeren. 4.3.1 Selectie op de afhankelijke variabele Regel: selectie moet ons tenminste de mogelijkheid geven op wat variatie op de afhankelijke variabele. Dus niet alleen oorlogen of revoluties bestuderen, maar een variatie van variabelen. Selectie op de afhankelijke variabele riskeert selectie bias op de gevolgtrekkingen. Maar dit kan gecompenseerd worden (zie blz. 131). 4.3.1.1 Voorbeelden van onderzoeker die selectie bias veroorzaakt Selectie bias gebeurt vaak bij onderzoekers die naar het buitenland gaan voor hun studie, omdat sommige overheden toegang verbieden voor buitenlandse onderzoekers. Sommige onderzoekers gebruiken geen controle groep, waardoor ze eigenlijk nooit zeker kunnen weten of zij gelijk hebben of niet. 4.3.1.2 Voorbeelden van selectie bias veroorzaakt door de wereld Wordt door het verzamelen van tientallen waarnemingen in plaats van een steekproef van waarnemingen de kans op selectieve bias vermeden? Dit is blijkbaar niet het geval. Want soms beschikken al die waarnemingen al over selectieve bias door de wereld. De voorzichtige onderzoeker moet altijd de beschikbare selectie bias evalueren: welke gebeurtenissen zijn waarschijnlijk geregistreerd en welke niet? 4.3.2 Selectie op de onafhankelijke variabele Door het beperken van onze key causale variabele, beperken we de algemeenheid van onze conclusie, maar we introduceren geen bias. Controle groepen helpen ook om selectieve bias te vermijden. 4.3.3 Andere typen van selectieve bias Het komt voor dat het causale effect van sommige variabelen variëren. De grootte van het causale effect introduceert bias in schattingen van gemiddelde causale effecten. Als we eenheden verzamelen met grote causale effecten en het gemiddelde daarvan nemen, dan maken we een overschatting van causaal effect. Als we eenheden selecteren met kleine effecten, zullen de gemiddelde causale effecten kleiner zijn dan ze moeten zijn. 4.4 Waarnemingen opzettelijk selecteren Bij opzettelijk selectie bepaal je van tevoren de waarden van relevante variabelen en sluit je willekeurige selectie van waarnemingen helemaal uit. Dit is gevaarlijk, want zo kan je van tevoren alle waarden structureren, waardoor je selectie bias introduceert omdat je jouw hypotheses voorkeur geeft. Er zijn verschillende methodes van opzettelijk selectie van waarnemingen: 4.4.1 Waarnemingen selecteren op de onafhankelijke variabele Dit is de beste manier, omdat je met deze methode opzettelijk waarnemingen selecteert de variatie bieden voor de onafhankelijke variabele (en de controle variabele) zonder van tevoren de afhankelijke variabele te bepalen. 4.4.2 Waarden van de afhankelijke variabele selecteren Op deze manier begint onderzoek meestal: je vindt bijv. iets fascinerend over gedrag en dit wil je graag uitleggen (retrospectief onderzoek ontwerp, case-control study). Deze selectie proces helpt je om een causale gevolgtrekking te maken (niet altijd valide), maar is niet geschikt om een beschrijvende gevolgtrekking te maken. 4.4.3 Waarnemingen selecteren op de onafhankelijke en afhankelijke variabele Dit is een gevaarlijke methode, omdat het dan makkelijk is om per ongeluk bias te introduceren bij het resultaat. Je selecteert waarnemingen die consistent zijn met je hypotheses van je onderzoek. Ondanks de risico’s van deze methode is het best logisch om bij bepaalde gevallen het te gebruiken bij kleine n-studies, omdat je anders misschien geen causale gevolgtrekking kunt maken (case of zero causual effect). 4.4.4 Waarnemingen selecteren zodat de key causale variabele constant is Bij deze benadering kan het causale effect van de onafhankelijke variabele niet variëren en dus ook niet beoordeeld worden (geen valide gevolgtrekking). 4.4.5 Waarnemingen selecteren zodat de afhankelijke variabele constant is Bij deze methode kunnen we ook niets leren. Maar met bepaalde informatie (bijv. extreme variabele die constant zijn) kan deze methode valide causale gevolgtrekkingen maken. Conclusie Uiteindelijk willen we een studie ontwerpen die de onafhankelijke variabele selecteert op basis van onze theorie en de afhankelijke variabele laten variëren. De doelstelling is om relevante informatie te verkrijgen om onze theorie te evalueren zonder bias te introduceren die onze gevolgtrekkingen in gevaar zullen brengen. Hoofdstuk 5 begrijpen wat je wil vermijden Dit hoofdstuk gaat voornamelijk over het efficiënt en het onbevooroordeeld/onvertekend maken van de gekozen observaties. Vertekeningen vermijden (unbiasedness) is het centreren van de interval rond de 'goede schatting'. Efficiëntie is het smaller maken van het geschikte interval. Er zijn vier bronnen voor bevooroordeeld en efficiëntie, nl. : 5.1 Measurement error -- Afmetingsfout 5.2 Excluding relevant variables (Bevooroordeeld) 5.3 Including Irrelevant variables (Onefficiëntie) 5.4 Endogeneity (Als de afhankelijke variabele de verklarende variabele beïnvloed) 5.1 Measurement Error afmetingsfout Als de observaties geselecteerd zijn, moeten de waarden van de variabelen gemeten worden. Bij het meten van observaties zijn er geen grote verschillen tussen kwalitatieve- en kwantitatieve onderzoekers; het enige verschil is dat kwantitatieve onderzoekers gebruik maken van numerieke waarden en kwalitatieve onderzoekers van woorden. Beide onderzoeksgroepen moet hun onzekerheid over eventueel gemaakte meetfouten benoemen. Er bestaan geen universeel correcte antwoorden; alle metingen hangen namelijk af van het probleem wat de onderzoeker zich stelt ; "Use the measure that is most appropriate to our theoretical purposes" . De meeste meetfouten worden gemaakt doordat deze niet refereren naar een theoretische structuur. Ook worden er vaak onnodig groepen gemaakt, welke de resultaten sterk kunnen beïnvloeden. Daarnaast moet er een keus worden gemaakt tussen ordinale en interval-metingen. Tot slot… de meting moet betrouwbaar zijn (Klopt de meting?) en Valide (Meet ik datgene wat ik wil meten?) 5.1.1 systematic measurement error Een voorbeeld van een systematische meetfout is het overschatten van bepaalde variabele; dit kan leiden tot zowel 'vertekeningen' en 'inconsequentie' in het beoordelen van causale verbanden. Een vertekening in de (gemeten) praktijk, zorgt automatisch voor een vertekening in de beschrijving. Als de vertekeningen zich in alle onderdelen van de meting voordoen, zal dit geen gevolgen hebben voor de causale inferentie. Als er zich systematische meetfouten dreigen voor te doen…..dan is het advies als volgt; - Gebruik metingen van andere onderzoekers uit totaal verschillende vakgebieden. De metingen zullen daardoor totaal niet beïnvloed worden door jouw eigen hypotheses. 5.1.2 nonsystematic measurement error Non-systematische meetfouten is een ander probleem voor onderzoekers. Dit zijn metingen met af en toe een te hoge en/of te lage waarde; het gemiddelde wordt hierdoor niet beïnvloed. Nonsystematische meetfouten veroorzaken ook géén 'vertekening'. Als de fout zich in de téverklaren-variabele (afhankelijke )bevindt, dan zal de relatie tussen de verklarende en de teverklaren-variabele, oftewel de correlatie verminderen. 5.1.2.1 Nonsystematic measurement error in the dependent variabele Het gevolg van een nonsystematische meetfout in de te-verklaren-variabele is dat het causale effect minder efficiënt en onzekerder wordt. Er moeten vervolg-studies worden gedaan met een voorzichtigere meting van de te-verklaren-variabele. Dit heeft tot doel meer relevante informatie te verkrijgen voor de gemaakte hypotheses. A formal analysis of random measurement error in Y Er is een model bedacht met de te-verklaren-variabele meting met een foute en foutloze verklarende variabele; De interesse gaat hierbij uit naar de effect-parameter (β): E (Y*) = βX Voor het meten van de variantie; V (Yi*)= σ² Nu wordt er niet verder gemeten met Y*, maar met Y: Y=Y* + U (Y=de geobserveerde te-verklaren-variable, Y* = werkelijke te-verklaren-variable, U = nonsystematische fout) Om te zien wat de beïnvloeding is van de nonsystematische fout in de te-verklaren-variabele op de effect-parameter wordt dit model gebruikt (uit hfdst. 3) .b = Σn i = 1YiXi ---------------Σn i = 1X²i Hierop volgt een model of de efficientie van de estimator in de huidige te-verklarende-variabele mét fout te weten te komen. Σn i = 1XiYi V(b) = V --------------Σn i =1X²i Voor meer modellen en formules zie blz. 162 5.1.2.2 Nonsystematic measurement error in an explanatory (verklarende) variabele Net als non-systematische meetfouten in de te-verklaren-variabele, kunnen meetfouten in de verklarende variabele ook inefficiëntie en onzekerheid veroorzaken. Nu is er sprake van een systematische vertekening in de metingen van de causale relatie. Er zijn twee praktische richtlijnen te noemen; 1. Als een analyse geen effectsuggestie heeft en de richting van vertekening is nog niet duidelijk, dan zal het moeilijk zijn het werkelijke effect vast te leggen. De analyse blijft dan nog erg twijfelachtig en zal ook zo beschreven moeten worden. 2. Als er wordt gesuggereerd dat de verklarende variabele een non-systematische meetfout bevat met een klein positief effect, dan zullen de resultaten gebruikt kunnen worden om te concluderen dat het werkelijke effect misschien wel groter kan zijn dan gevonden. Ditzelfde geld voor een klein negatief effect. A formal analysis of random measurement error in X Als de verklarende variabele mét de fout geobserveerd wordt, dan volgt dit model; E(Y)=βX* Als de 'correcte' X geobserveerd wordt, dan; X=X*+U Ook bij deze verklarende variabele wordt gebruik gemaakt van de estimater-formule, zoals uitgelegd in hfdst.3 (en hierboven) De volgende formule geldt voor de verklarende variabele; .b≈ Σn i =1X*iYi ---------------------------Σn i =1X*²i + Σn i=1U²i 5.2 Excluding Relevant Variables; Bias Soms ontstaan er 'valse' effecten bij het schatten van een causaal effect; het is daarom erg belangrijk de effecten te controleren. 5.2.1 Gauging the bias from omitted variables Soms worden variabelen over het hoofd gezien, wat vervolgens van invloed kan zijn op het causale effect.Het is geen probleem 'controle-variabelen' over het hoofd te zien, ook al hebben ze een sterke invloed op de te-verklaren-variabele. Deze controle-variabelen mogen dan niet (!) verschillen van de bijbehorende verklarende variabele. --- Verder snap ik deze paragraaf niet zo goed. Misschien kun je deze het beste zelf even doorlezen, beginnend op pagina 168 --5.2.2 Examples of Omitted Variable Bias In deze paragraaf worden allerlei voorbeelden gegeven van onderzoeken met over het hoofd geziene variabelen. Uit deze voorbeelden blijkt dat het erg belangrijk is een theoretisch model in je hoofd te hebben om je onderzoek te evalueren. Een goede beschrijving of een beschrijvende inferentie hebben meer waarde dan een verkeerd causaal verband. 5.3 Including Irrelevant Variables; Inefficiency Het is niet de bedoeling dat onderzoekers de effecten gaan bekijken van alle mogelijke verklarende variabelen. Dat zal leiden tot inefficiëntie. Het zit namelijk zo; Hoe meer de (hoofd-) verklarende-variabele is gecorreleerd aan niet-relevante controle variabelen, hoe minder efficiënt de meting is van het causale effect. Het invoegen van niet-relevante variabelen, zal ervoor zorgen dat er meer eisen worden gesteld aan de 'begrensde' data-set, wat zal vervolgens zal leiden tot minder informatie voor elke inferentie. A formal analysis of included variable inefficiencies σ² V (β1) ------------------(1-r²12)Σn i=1 X²1i = V(b1) -------(1-r²12) 5.4 Endogeneity Endogeniteit; Uit zichzelf voorkomend. Het kan zijn dat er geen sprake is van een causaal verband, maar dat A (de verklarende variabele) onderdeel is van B (de te-verklaren-variabele), of dat B, A veroorzaakt. Er zijn 5 manieren om 'om te gaan' met de probleem van Endogeniteit 1. De vertekende inferentie corrigeren 2. De te-verklaren-variabele ontleden en vervolgens alleen die onderdelen bestuderen die gevolgen zijn van de verklarende variabele. 3. De endogeniteit veranderen in een vertekening als gevolg van een over het hoofd geziene variabele. 4. Voorzichtig selecteren van observaties zónder endogeniteits-problemen. 5. Ontleden van de verklarende variabele zodat je er zeker van bent dat alleen die onderdelen met exogeniteit in je analyse aanwezig zijn 5.4.1 Correcting Biased Inferences Hierbij zorg je ervoor dat je de richting van de vertekening te weten komt, zodat je de situatie vervolgens kan corrigeren. E(b) = β + Bias 5.4.2 Parsing the dependent variabele De te-verklaren-variabele goed bekijken. Misschien zitten er elementen in B, dat de oorzaak is van B. Als dat het geval is, moet je alleen dat deel gebruiken van B, dat dus gevolg is van A. A B 5.4.3 Transforming Endogeneity into an Omitted variable problem Vertaal de endogeniteit naar externe factoren. Vervang A bijvoorbeeld door C. A wordt dan een gevolg. C A B 5.4.4 Selecting Observations to Avoid endogeneity Soms zijn er al gevolgen zonder een "oorzaak", zoals er bijvoorbeeld ideeën zijn die pas na een bepaalde (rationele) keuze worden gemaakt (zoals je er nu bijvoorbeeld spijt van hebt van je keuze dat je de UT bent gaan doen hahaha) 5.4.5 Parsing the explanatory variable De verklarende variabele verdeel je in twee componenten; één die volledig exogeen is en één dat voor een deel endogeen is. De onderzoeker zal dan alleen dat deel gebruiken met de exogene informatie. A 5.5 Assigning Values of the Explanatory Variable Deze paragraaf brengt 'de controle over de opdracht' onder de aandacht. Een 'random assignment' is goed bruikbaar bij grote observatie-aantallen, maar niet bij weinig observaties (a small n). Het gebruik van 'random assignment' van de verklarende variabele zullen de kans op endogeniteit, meetfouten en zeker op 'over 't hoofd geziene variabelen' verkleinen. De meest waarschijnlijke manier om 'randomly' data te verzamelen is dit te doen door willekeurig bij een groot aantal eenheden de waarden van de verklarende variabelen te kiezen. Als dit niet mogelijk is, moeten niet zomaar de observaties willekeurig worden geselecteerd. In plaats daarvan moet de bestaande kennis van de beschikbare observaties gebruikt worden. Er moet namelijk een selectie van de observaties gemaakt worden en eventueel een "werkstuk" van de waarden van de verklarende variabele, op zo'n manier dat er geen vertekening en/of inefficiëntie ontstaat. Als een vertekening niet te vermijden is, moet de richting ervan in ieder geval wel genoemd worden. Alle studies moeten hun selectieproces van observaties uitgebreid beschrijven. 5.6 Controlling the research situation Als alles geprobeerd is om meetfouten, over het hoofd geziene variabelen en problemen met endogeniteit te voorkomen, maar het is niet gelukt, dan moeten ze opgemerkt en vastgesteld worden en er moet geprobeerd worden ze te corrigeren. (Zo staat het écht in 't boek; sorry) Bij studies met een kleine n is dit moeilijk te controleren, maar aandacht is essentieel om vertekening te voorkomen. Om situaties onder controle te hebben worden deze situaties/observaties vaak vergeleken met soortgelijke situaties (matching). Hierbij is de kans groot dat onderdelen over het hoofd worden gezien, wat vervolgens weer leidt tot vertekening. Om dit te voorkomen kun je je eigen situatie/observatie vergelijken met een ander, waarin dezelfde meetwaarden worden gebruikt. De onderzoeker kan op twee manieren een eventueel causaal effect aantonen, namelijk één met een willekeurige selectie van observaties (meestal met grote n). Dit is een eenvoudige manier om gelijke eenheden te creëren. Ook zullen er geen relevante variabelen over het hoofd worden gezien en er worden geen observaties geselecteerd welke gecorreleerd zijn met de te-verklaren-variabele. één met een intensieve selectie van observaties (meestal met kleine n) . Deze inferenties nemen meer risico's met zich mee en zijn meer afhankelijk van de mening van de onderzoeker, waardoor de kans op vertekening groter is. Ook is bij dit onderzoek een controle nodig door één verklarende variabele te meten/testen op het causale effect (dit zal ook de invloed op het probleem vergroten). Woordenlijst Inquiry Designing Social 1. Inference conclusie, gevolgtrekking 2. scholarly research wetenschappelijk onderzoek 3. apply aanwenden, doorvoeren, in toepassing brengen, toepassen 4. unified eendrachtig 5. to derive from afgeleid van, afstammen van 6. inquiry enquête (inquiry-office = informatiebureau) 7. distinctive karakteristiek, zich onderscheidend, gedistingeerd 8. establish baseren, funderen, grondvesten, stichten, vestigen bevinden, constateren, vaststellen 9. require hoeven, moeten, nodig hebben, (op)eisen, rekenen, vereisen, vergen, voorschrijven, vorderen 10. to seek snorren, uitkijken naar, uitzien naar, zoeken, opzoeken 11. precept voorschrift, principe, grondregel 12. generate voortbrengen, doen ontstaan, verwekken 13. assess beoordelen, vaststellen, bepalen 14. simplify vereenvoudigen 15. ramification vertakking 16. conceptualizing ideeën maken, beeld vormen 17. meaningful zinvol 18. implication implicering, (onuitgesproken) suggestie 19. scholar scholier, geleerde, wetenschapper 20. refine louteren, raffineren, verfijnen 21. permitting gedogen, toelaten, toestaan, vergunnen, veroorloven 22. adhere to aanhangen 23. leverage hefboomwerking 24. confirmation bevestiging