Samenvatting Designing Social Inquiry

advertisement
Designing Social Inquiry
King Keohane & Verba
Chapter 1 The science in social science
1.1 INTRODUCTION
Dit boek gaat over onderzoeksdesign: Hoe stel je vragen en houdt je wetenschappelijk
onderzoek waarmee je valide (geldende) beschrijvende en causale inferenties.
(conclusies, gevolgtrekkingen)
1.1.1 Two styles of research, one logic of inference
Hoofddoel is het verbinden van kwantitatief en kwalitatief onderzoek door in beide een
eendrachtige logica door te voeren.
De typen van onderzoek zijn (stilistisch gezien)heel verschillend
Kwantitatief: gebruikt cijfers en statistische methoden. Gebaseerd op numerieke
metingen.
Kwalitatief: focus op klein aantal cases. Gebruikt bijv. intensieve interviews, diepte
analyses van historisch materiaal. De desbetreffende case wordt in alle details
geanalyseerd.
Toch ligt voor elke onderzoeksbenadering dezelfde logica ten grondslag.
Het meeste onderzoek past niet specifiek in de ene of andere categorie. De een is niet
beter dan de ander. Het beste onderzoek combineert kenmerken van beide
onderzoekstypen.
We disputeren (argue) dat non-statistisch onderzoek meer betrouwbare resultaten levert
als onderzoekers meer aandacht aan de regels van statistische inferentie besteden.
De regels van inferentie die we bespreken zijn niet voor alle issues relevant.
De onderscheidende karakteristiek die sociale wetenschap onderscheid van causale
observatie is dat sociale wetenschap uitkijkt naar het komen tot valide inferenties door
het systematisch gebruik van een goed gefundeerde procedure van inquiry (enquêtes)
Niets in de regels zegt dat we het perfecte experiment moeten doen of alle relevante data
moeten verzamelen voordat we een valide sociaal wetenschappelijke enquête kunnen
houden.
Gelimiteerde informatie is vaak een noodzakelijk kenmerk van social inquiry. De sociale
wereld verandert snel en analyses waarmee we de veranderingen proberen te begrijpen
vergen dat we ze omschrijven en ze proberen te begrijpen, ook al is de onzekerheid over
de conclusies hoog.
Door aandacht te vestigen op de regels voor wetenschappelijke inferentie kan
betrouwbaarheid, validiteit, zekerheid en eerlijkheid van de conclusies worden verbeterd.
Het boek schrijft geen recepten voor wetenschappelijk empirisch onderzoek. Het biedt
een aantal principes en regels aan.
1.1.2 Defining scientific research in the social sciences
Goed onderzoek, wetenschappelijk onderzoek kan kwantitatief of kwalitatief zijn.
In ontwerp heeft wetenschappelijk onderzoek de volgende 4 kenmerken:
Zie ook sheets HC 1
Demarkatiecriteria (maar ook kwaliteitscriteria)
1. Het doel is: gevolgtrekkingen maken op basis van empirische informatie.
The goal is inference.
De informatie halen we uit de wereld om ons heen.
2. Procedures zijn expliciet, vastgelegd en openbaar.
The procedures are public
Zo kunnen data voortgebracht worden en geanalyseerd worden waarvan
vervolgens de betrouwbaarheid kan worden bepaald.
3. De uitkomsten zijn onzeker
The conclusions are uncertain
Als je aan onderzoek begint moet je bij voorkeur niet al van tevoren het antwoord
weten.
4. Het wetenschappelijke schuilt in de methode
The content is the method
Alles wat wetenschappelijk is aan het onderzoek moet in de methode j=kunnen
worden teruggevonden. ‘de manier waarop’.
Wetenschap op zijn best is een sociale onderneming. Het draagt bij aan de sociale
omgeving.
1.1.3 Science and complexity
De waargenomen complexiteit van een situatie hangt deels af van hoe goed we de
realiteit kunnen vereenvoudigen. En onze capaciteit tot vereenvoudigen is afhankelijk
van of we uitkomsten en verklarende variabelen op een coherente manier kunnen
specificeren.
Méér observaties kunnen hierbij helpen maar het is vaak onvoldoende.
Complexiteit maakt onze inferenties minder zeker maar niet minder wetenschappelijk.
Stel: Complexe, unieke gebeurtenissen met enorme vertakkingen.
Manieren om zulke gebeurtenissen te begrijpen:
- Zoeken naar generalisaties: elke case zien als lid van een ‘class of events’ klasse
van gebeurtenissen waarover zinvolle generalisaties kunnen worden gedaan
- Engage in counterfactual analyses: de mentale constructie van een course of
events die is veranderd door modificaties in een of meer condities, voorwaarden.
Wetenschappelijke generalisaties zijn nuttig bij het studeren van zelfs heel ongewone
gebeurtenissen die niet in een brede klasse van gebeurtenissen vallen.
Zelfs unieke gevallen kunnen wetenschappelijk onderzocht worden als we aandacht
besteden aan het verbeteren van
- theorie,
( kan meer observeerbare implicaties opleveren en zelfs causal theory
van unieke gebeurtenissen testen.)
- data
( hierdoor kunnen we meer observeerbare implicaties observeren)
- gebruik van data. ( staat toe meer implicaties uit de bestaande dat te halen)
1.2 MAJOR COMPONENTS OF RESEARCH DESIGN
Onderzoeksontwerp bestaat uit:
- onderzoeksvraag
- theorie
- data
- gebruik van de data
deze vier worden gewoonlijk niet los van elkaar ontwikkeld en wetenschappers gebruiken
ze niet in een voorbestemde volgorde.
Vb kwalitatief onderzoek begint met dataverzameling, en dan pas de rest.
1.2.1 Improving research questions
Hoorcollege 1
(3)
Mogelijkheden om de onderzoeksvraag te verbeteren

De vraag die aan het onderzoek ten grondslag ligt, moet enig maatschappelijk belang
hebben

Het onderzoeksproject moet een specifieke bijdrage leveren aan de relevante
wetenschappelijke literatuur. Die bijdrage ligt in het vergroten van ons collectief
vermogen om beproefde wetenschappelijke verklaringen voor een deel van de wereld
op te stellen.
Er bestaan geen precieze regels voor het kiezen van een onderwerp.
Maar alle onderzoeken in de sociale wetenschap zouden eigenlijk wel aan deze twee
criteria moeten voldoen:
1. Een onderzoeksproject zou een vraag moeten stellen die ‘belangrijk’ is voor de
‘real world’  maatschappelijk belang.
2. Een onderzoeksproject zou een specifieke bijdrage moeten leveren aan
wetenschappelijke literatuur door de collectieve mogelijkheden te vergroten om
wetenschappelijke verklaringen van sommige aspecten van de wereld te krijgen.
 Dit (2) kan op een aantal manieren:
- een hypothese kiezen die in de literatuur als belangrijk wordt gezien maar waar
nog nooit een volwaardig onderzoek naar is gedaan. Bewijs voor / tegen de
hypothese levert een bijdrage.
- Kies een in de literatuur geaccepteerde hypothese die je ‘false’ verwacht. En
onderzoek of ie inderdaad false is en of een andere theorie correct is.
- Etc (pag 17)
Deze 2 manieren om onderzoeksvragen te kiezen zijn niet noodzakelijk elkaars
tegenstander.
Een ontwerpvoorstel dat niet verfijnd kan worden in een specifiek onderzoeksproject dat
valide beschrijvende en causale inferentie toelaat zal in de loop der tijd aangepast of
verlaten moeten worden.
1.2.2 Improving theory
HC 1
(4)
Mogelijkheden om de theorie te verbeteren

Hanteer theorieën die fout kunnen zijn

Hanteer theorieën die zoveel mogelijk waarneembare implicaties kunnen opleveren
(4.2)

Wees zo concreet mogelijk bij het opstellen van theorieën
Aantekeningen
1. De theorie moet verworpen kunnen worden zodat de uitkomsten van de theorie
onzeker kunnen zijn ( zie demarkatiecriteria) om zo correcte theorieën te maken.
2. Algemene theorie is bijv: ‘Opkomst bij verkiezingen daalt’ Is een beetje
‘ononderzoekbaar’(alle landen, alle soorten verkiezingen) Maar het levert wel
mee waarneembare implicaties op dan wanneer je bijv alleen in NL onderzoekt
3. concreet zijn om in te perken
2 en 3 zijn soms met elkaar in strijd.
Rest: boek, nog samenvatten
1.2.3 Improving data quality
HC 1
(5)
Mogelijkheden om de kwaliteit van de gegevens te verbeteren

1. Leg vast, en rapporteer op welke wijze de gegevens tot stand zijn gekomen

2. Verzamel gegevens over zo veel waarneembare implicaties van de theorie als maar
mogelijk is (sluit aan bij 4.2)

3. Maximaliseer de geldigheid van de metingen (is cruciaal)

4. Zorg ervoor dat de methoden van dataverzameling betrouwbaar zijn
 5. Zorg ervoor dat alle gegevens en alle analyses zoveel mogelijk repliceerbaar zijn
Aantekening
Geldigheid en betrouwbaarheid zijn heel belangrijk in het boek
Boek:
1. nog doen evt.
2. Verzamel de data in zoveel mog. diverse contexten. Hoe meer waarneembare
implicaties die bij de theorie aansluiten, des te krachtiger de verklaring en hoe
zekerder de resultaten.
In praktijk zullen begrensde bronnen en tijd altijd de dataverzameling
tegenwerken. Ookal komt méér informatie de zekerheid van onze
gevolgtrekkingen veelal ten goede; beginnende wetenschappers kunnen evengoed
verzuipen in te veel gegevens dan ten ondergaan door te weinig gegevens.
3. Validiteit verwijst naar of we meten wat we denken te meten. Over het algemeen
is het ’t makkelijkst validiteit te maximaliseren door de data aan tehangen en niet
toe te staan dat ongeobserveerde of ongemeten concepten in de weg staan.
4. Betrouwbaarheid houdt in dat het op dezelfde manier toepassen van dezelfde
procedure altijd dezelfde meting zal produceren. Als in tussentijd niets is gebeurd
zal hetzelfde resultaat worden geobserveerd/gemeten.
5. repliceerbaarheid van de data zodat gezien kan worden of de metingen
betrouwbaar zijn, maar ook het hele proces dat gebruikt is bij het komen tot een
conclusie. Maar ook zodat andere wetenschappers er mee uit de voeten kunnen,
het onderzoek kunnen oppakken of voortzetten.
1.2.4 Improving the use of existing data
HC 1
(6)
Mogelijkheden om het gebruik van bestaande gegevens te verbeteren

1. Gebruik gegevens die “zuiver” zijn (dwz: gebruik gegevens die geldig zijn)

2. Maximaliseer de efficiëntie van de gegevens (heeft veel te maken met
betrouwbaarheid)
Aantekening
Zuiverheid (unbiased) en geldigheid (valid) hebben veel met elkaar te maken maar zijn
niet hetzelfde.
Boek:
1. Zuiverheid bereiken hangt af van * het verzamelen van gegevens en * het latere
gebruik van de gegevens.
Bij het gebruik van data moeten we voorzichtig zijn of er ook bronnen van
onzuiverheid over het hoofd gezien zijn tijdens de dataverzameling.
2. Efficiëntie van de gegevens maximaliseren betekent niet alleen alle data
gebruiken maar ook alle relevante info die ín de data zitten gebruiken om zo de
gevolgtrekkingen te verbeteren.
1.3 THEMES OF THIS VOLUME
1.3.1 Using observable implications to connect theory and data
De waarneembare implicaties van een theorie moet onze dataverzameling leiden, en
onderscheid helpen maken in relevante en irrelevante feiten.
1.3.2 Maximizing leverage
Verklaar zoveel mogelijk met zo weinig mogelijk.
Leverage: hefboomwerking
Aantekening
De hefboom is de theorie, als we de theorie algemener maken kunnen we meer over
empirische implicaties zeggen.
De theorie moet nét algemeen genoeg zijn om de implicaties te verklaren.
Als je veel nodig hebt om weinig uit te leggen dan zou je doel moeten zijn een onderzoek
te ontwerpen met meer leverage, hefboomwerking.
Verschillende manieren om de hefboomwerking van een onderzoeksprobleem toe te laten
nemen:
De primaire manier is: toename van het aantal waarneembare implicaties van de
hypotheses en zoeken naar bevestiging van de implicaties. (Dit kan de theorie, data, het
gebruik van data verbeteren, zodat er meer implicaties uit bestaande data kunnen worden
gehaald.
Maximaliseren van de hefboomwerking is zo belangrijk dat sterk woordt aangeraden dat
onderzoekers routinematig alle mogelijke waarneembare implicaties van hun hypotheses
noteren die in hun data of in andere data mogelijk waargenomen worden.
Hoe meer bewijs in verschillende contexten wordt gevonden, hoe krachtiger de
verklaringen worden en hoe meer vertrouwen wij en anderen zouden moeten hebben in
onze conclusies.
1.3.3 Reporting uncertainty
Alle kennis en gevolgtrekkingen in kwalitatief en kwantitatief onderzoek zijn onzeker.
Goede sociale wetenschappers rapporteren schattingen van de betrouwbaarheid van hun
gevolgtrekkingen.
1.3.4 Thinking like a social scientist: skepticism and rival hypotheses
Hoofdstuk 2:
Beschrijvende inferentie
Sociaal wetenschappelijk onderzoek, zowel kwalitatief als kwantitatief, heeft 2 doelstellingen;
namelijk beschrijven en verklaren. Dit hoofdstuk gaat over de beschrijvende inferentie.
2.1 Algemene kennis en gedetailleerde feiten
Goed wetenschappelijk onderzoek probeert aan de details voorbij te gaan om meer algemene
informatie te verkrijgen en alles zo beter te begrijpen. Je leert meer van een specifiek iets door
het algemene te bestuderen. Bijv. De Franse Revolutie. Door kennis op te doen over oorzaken
van revoluties, kun je meer te weten komen over de oorzaken van de Franse Revolutie.
2.1.1 Interpretatie en Inferentie
Sommige historische en antropologische onderzoekers claimen alleen specifieke kennis te
zoeken door interpretatie. Volgens de schrijvers van het boek zijn wetenschap en interpretatie
niet volledig verschillend. Beide vertrouwen op een goede voorbereiding, het stellen van goede
vragen etc. om bewijs te verkrijgen dat de hypotheses ondersteunt. De onderscheidende bijdrage
van wetenschap is het presenteren van een aantal procedures om de antwoorden te verkrijgen
op nauwkeurig geformuleerde beschrijvende en causale vragen. Bij interpretatie vertrouwt men
vaak op de observaties van 1 persoon. Die observaties zouden juist gecompleteerd moeten
worden door de logica van wetenschappelijke inferenties. Zonder de mogelijkheid om een theorie
te falsificeren, kunnen conclusies nooit wetenschappelijk genoemd worden. Als voorbeeld wordt
het knipperen en knipogen gebruikt. De interpretatie kan zijn, hij knipoogt naar me, maar hij heeft
misschien alleen een vuiltje in zijn oog. Wetenschap zou zich afvragen waarom de man knippert.
2.1.2 Uniciteit, complexiteit en vereenvoudiging
Elke gebeurtenis is uniek. Het punt is niet in hoeverre gebeurtenissen uniek zijn, maar in
hoeverre de sleutelkenmerken van sociale realiteit die we willen onderzoeken kunnen worden
samengevat uit een massa van feiten. Om dit te kunnen doen is de eerste en moeilijkste taak van
sociale wetenschap het simplificeren van de feiten, daarbij oplettende dat je geen belangrijke
feiten weglaat. Het boek vindt dat, waar mogelijk, sociale wetenschap zowel algemeen als
specifiek moet zijn. Systematische patronen in gelijkwaardige gebeurtenissen moeten toegepast
worden op specifieke gebeurtenissen.
2.1.3 Onderzoek naar vergelijkbare gevallen
Beschrijvingen van gebeurtenissen moeten zo precies mogelijk, want het is nutteloos om een
verklaring te zoeken voor iets wat niet goed beschreven is. Een goede beschrijving is beter dan
een slechte verklaring. De ontwikkeling van goede causale hypotheses is aanvullend op een
goede beschrijving. Onderzoek naar gebeurtenissen moet systematisch zijn in het beschrijven en
verklaren, dat is fundamenteel voor het onderzoek.
2.2 Inferentie: Het wetenschappelijke doel van dataverzamelingen
Inferentie is het proces van het gebruiken van bestaande feiten om te leren over nieuwe feiten.
Het organiseren van feiten in waarneembare implicaties van een specifieke theorie geeft
verschillende belangrijke resultaten in het ontwerpen en het houden van een onderzoek. Je kunt
snel herkennen of meer observaties van de implicaties van de theorie in kwestie helpen de
theorie te evalueren. Bovendien heb je geen complete theorie nodig voor je alle data verzameld
en de theorie ontwikkelt zich gedurende het onderzoek. Ook wordt het duidelijk of je een
kwalitatieve of kwantitatieve stijl van onderzoek moet gebruiken. Het onthult het essentiële
wetenschappelijke doel van veel kwalitatief onderzoek. De belangrijkste stelregel voor het
verzamelen van data en het creëren van een theorie is: Zoek voor meer waarneembare
implicaties van een theorie. Deze implicaties moet je systematisch ordenen. Alle feiten zijn
misschien niet interessant voor je onderzoek, maar als ze consistent zijn met de theorie, kunnen
ze waardevol zijn in het onderbouwen ervan. Het verifiëren van een theorie in andere
omstandigheden vergroot het vertrouwen in de theorie.
2.3 Formele modellen voor kwalitatief onderzoek
Een model is een simplificatie van een aspect van de wereld. Wij onderzoeken of een model de
juiste kenmerken van het origineel heeft. Een model kan niet geëvalueerd worden zonder te
weten welke kenmerken van het model je bestudeerd. Er zijn beperkte en onbeperkte modellen.
De beperkte modellen zijn duidelijker, abstracter, maar minder realistisch. Onbeperkte modellen
zijn gedetailleerd en realistisch, maar moeilijk te benaderen. Het model dat je gebruikt hangt af
van het doel waar je het voor wilt gebruiken. De modellen gebruikt in dit boek moeten niet
verward worden met kwalitatief onderzoek. Ze zijn bedoeld om duidelijkheid en nieuwe inzichten
te verschaffen.
2.4 Een formeel model voor kwalitatief onderzoek
De belangrijkste regel voor data verzamelingen is te vermelden hoe de data verkregen is en hoe
het in je bezit is gekomen. De data wordt gemodelleerd met variabelen, eenheden en
observaties. Een variabele wordt vaak aangegeven door y. Observaties kunnen numeriek,
verbaal, visueel of anders zijn. Het is belangrijk een onderscheid te maken tussen het aantal
gebeurtenissen en het aantal observaties. De n wordt vaak gebruikt voor het aantal observaties.
2.5 Historische details samenvatten
De eerste stap in elke analyse is het samenvatten van de data. Er worden dan nog geen
conclusies getrokken, maar opvallende dingen komen wel naar voren. De gebruikte modellen
worden statistieken genoemd. Een statistiek is een uitdrukking van de gegevens in verkorte vorm.
Bijvoorbeeld het gemiddelde: y = 1/n Σni=1 yi
maximum:
ymax= maximum (y1, y2 ....yn)
Verder zijn er nog minimum, mediaan, modus en variantie. Communiceren met samenvattingen
is gemakkelijker en betekenisvoller. Regels voor samenvattingen:
 Samenvattingen moeten gericht zijn op de uitkomsten die we willen beschrijven of
verklaren.
 Een samenvatting moet informatie simplificeren.
2.6 Beschrijvende inferenties
Beschrijvende inferentie is een proces van het begrijpen van ongeobserveerde fenomenen op
basis van een aantal observaties. Een van de fundamentele doelen van inferentie is het
onderscheiden maken tussen systematische componenten en de niet systematische
componenten van het fenomeen dat bestudeerd wordt. Het ene component is niet belangrijker
dan het andere, maar ze moeten wel los van elkaar gezien worden. Systematische componenten
zijn voorspelbaar en niet-systematische componenten zijn onvoorspelbaar, zoals het weer,
terroristische aanslagen etc. y noemen we een gerealiseerde variabele. De waarde varieert over
de n eenheden.Y is een willekeurige variabele die willekeurig varieert over de hypothetische
replicaties. Een doel van inferentie is om te leren van systematische kenmerken van willekeurige
variabelen, ondanks dat we het onderscheid willen maken in systematische en nietsystematische componenten in onze data. In een specifiek geval nemen we een willekeurige
variabele en zijn systematische kenmerken. De grote van het niet-systematische component kan
berekend worden aan de hand van de variantie.
V(Yi) = σ2i
σ2 geeft het resultaat van het toepassen van de variantie op de willekeurige variabele Y i . Er zijn 2
perspectieven voor willekeurige variabelen.
1. Een waarschijnlijke wereld. Niets kan voorspeld worden. Teveel niet-systematische
componenten.
2. Een vastgestelde wereld. De hele wereld is voorspelbaar. Alleen willekeurige variabelen
hebben geen verklaring.
Om een beeld te vormen van de willekeurige variabelen waar de observaties van afgeleid zijn en
om te proberen hun systematische kenmerken te benaderen, heb je geen grote dataverzameling
nodig. Een aanwijzing van een goede historicus is een mogelijkheid om de systematische
aspecten te beschrijven. Toch kunnen alleen herhaalde onderzoeken in verschillende contexten
de mogelijkheid bieden om systematische patronen te ontdekken of juist willekeur. Systematische
factoren zijn persistent en hebben consistente consequenties. Niet-systematische factoren zijn
wisselvallig, hun impact valt niet te voorspellen. Als we geen inspanning doen om systematische
kenmerken te ontdekken bij een gebeurtenis, dan zijn de geschiedenislessen verloren en leren
we niets over welke aspecten van de gebeurtenis waarschijnlijk weer gebeuren of welke
aspecten relevant zijn voor toekomstige gebeurtenissen.
2.7 Criteria om beschrijvende inferenties te beoordelen
In dit hoofdstuk worden 3 criteria behandeld die vaak worden gebruikt in de statistiek om
methoden te beoordelen of om conclusies te trekken. De 3 criteria zijn onbevooroordeeldheid,
efficiëntie en consistentie.
2.7.1 Onbevooroordeelde inferenties
Als een methode van inferentie steeds maar weer wordt toegepast, dan kunnen de schattingen
ver uiteen gaan lopen. Krijg je dan nog het goede antwoord op het gemiddelde? Zo ja dan is de
schatter onbevooroordeeld. Onbevooroordeelde schatters verschijnen als de variatie van de ene
replica en de andere niet-systematisch is . In het geval van een systematische fout in de replica’s
die de schatter een bepaalde kant op trekt dan is er sprake van bevooroordeeldheid. Specifieke
datasets kunnen bevooroordeeld zijn. Wat er ook geprobeerd wordt te schatten, altijd is een
statistisch onbevooroordeelde schatter gewenst. Mensen die de ruwe informatie leveren, die we
gebruiken voor de beschrijvende inferentie hebben vaak redenen om bevooroordeelde
schattingen te doen.
Bekijk het voorbeeld in het boek op blz 65
2.7.2 Efficiëntie
Efficiëntie biedt een manier om onbevooroordeelde schatters te onderscheiden. Het is een
relatief concept dat wordt gemeten door de variantie van de schatter in de hypothetische
replicaties. Voor onbevooroordeelde schatters geldt, hoe kleiner de variantie, des te efficiënter en
beter is de schatter. Efficiëntie is interessant als de bevooroordeeldheid klein is. Vaak is het goed
als de kleine bevooroordeeldheid oploopt inruil voor het verkrijgen van veel efficiëntie. Des te
meer observaties des te kleiner de variantie.
Bekijk het voorbeeld in het boek op blz 70 en blz 71, 72
De formele manier om de bevooroordeeldheid – efficiëntie te evalueren is door de MSE te
berekenen (Mean Square Error) dit is een combinatie van de bevooroordeeldheid en de
efficiëntie
MSE(g)
= V(g) + E(g - y)2
= variantie + bias
Het idee is om de schatter met de minste MSE te vinden omdat het perfect laat zien hoe een
schatter met wat bevooroordeeldheid beter kan zijn als de variantie kleiner was. In theorie
prefereren we altijd onbevooroordeelde schatters die zo efficiënt mogelijk zijn. Maar in de echte
onderzoek situaties is dit compromis tussen bevooroordeeldheid en efficiëntie erg treffend.
Samenvatting Hoofdstuk 3
3.1 Definitie van causaliteit
Het boek maakt onderscheid tussen beschrijvende (descriptive) en causale inferentie. Causale
inferentie gaat uit van het maken van gevolgtrekkingen (inferentie) aan de hand van observaties
en de daaruit voortgekomen informatie (wat beschrijvende inferentie is)
3.1
Definitie:
Het causale effect is het verschil tussen de systematische component van waarnemingen
wanneer de verklarende variabele een bepaalde waarde aanneemt en de systematische
component van vergelijkbare waarnemingen wanneer de verklarende een andere waarde
aanneemt (zo staat het echt in het boek)
-> is de verandering die de systematische component ondergaat wanneer de verklarende
variabele verandert
Onderzoekers hebben wat betreft causaliteit te maken met het Fundamenteel Probleem van
Causale Inferentie. Dit houdt in dat het onmogelijk is om meerdere situaties tegelijk te laten
afspelen. Als één variabele zich in een situatie op een bepaalde manier manifesteert, dan willen
wetenschappers bijvoorbeeld weten hoe de uiteindelijke situatie er uit gezien zou hebben als
deze variabele andere waarden aan zou nemen. Dit is echter niet mogelijk. Je kunt de
geschiedenis zich niet twee keer laten afspelen. Ook is het niet mogelijk om in een tweede
experiment alle andere variabelen gelijk te houden.
3.2 Alternatieve definities van causaliteit
In dit hoofdstuk laten de schrijvers zien dat andere theorieën die betrekking hebben op
causaliteit. En dat deze niet in conflict zijn met de theorie zoals die in hoofdstuk 3.1 beschreven
wordt.
3.2.1 Causale Mechanismen
Met ‘causale mechanismen’ wordt bedoeld dat een causaal verband vaak bestaat uit meerdere
kleinere causale schakelingen. Een causaal verband kan dus een optelsom zijn van meerdere
kleinere causale verbanden; dit zijn de causale mechanismen. Doordat je een causaal effect
kunt definiëren zonder dat je alle kleinere causale mechanismen binnen dat causaal verband
hoeft te doorgronden, blijft de theorie in h3.1 overeind staan. (Het is niet mogelijk om causale
mechanismen te herkennen zonder het concept van causaal verband te definiëren).
Men moet niet een definitie van causaliteit verwarren met de ongedefinieerde, hoewel vaak
nuttige operationele procedure van het definiëren van causale mechanismen.
3.2.2 Meervoudige Causaliteit
Met meervoudige causaliteit worden causale verbanden bedoeld met veel verklarende variabelen
en weinig waarnemingen. Hiermee wordt bedoeld dat een bepaalde uitkomst de oorzaak kan zijn
van verschillende variabelen. Hiermee wordt niet de optelsom bedoeld van die variabelen, maar
dat een bepaald uitkomst verschillende oorzaken kan hebben. (zie voorbeeld pag. 88, tweede
alinea. Dat verheldert het nogal)
3.2.3. Symmetrische en Asymmetrische Causaliteit
Als een bepaalde waarde van de verklarende variabele X toe- of afneemt, dan heeft dit invloed
op de te verklaren variabele Y. Een causaal verband is symmetrisch als de toe- of afname bij X
evenredige, of omgekeerd evenredige gevolgen heeft voor Y. Als dit niet het geval is, dan is het
verband Asymmetrisch.
3.3 Aannames die nodig zijn om causale effecten te bepalen
Met de volgende factoren moet men goed rekening houden, wil men het fundamentele causale
probleem ontwijken.
3.3.1 Eenheid Homogeniteit
Met eenheid (unit) wordt hiermee bedoeld de ‘ruimte’ waarbinnen een experiment zich voordoet.
In deze ruimte bevinden zich alle variabelen die invloed hebben op de te verklaren variabele.
Binnen dit vastgestelde grensgebied kunnen alle variabelen bepaald worden en zo kan men het
onderzoek standaardiseren. Door bij twee of meerdere experimenten er voor te zorgen dat al
deze experimenten binnen dezelfde ‘ruimte’ gedaan worden, dus dezelfde variabelen invloed
hebben, kan de mate van afwijking (bias) tot een minimum beperkt worden.
3.3.2 Conditionele onafhankelijkheid
Conditionele onafhankelijkheid is de aanname dat waarden zijn toegewezen aan verklarende
variabelen onafhankelijk van de waarden die de te verklaren variabele aanneemt.
3.4 Criteria om causale inferentie te beoordelen
---3.5 Regels om causale theorieën te construeren
regel 1: construeer falsifieerbare theorieën
Een theorie die niet fout kan zijn is geen theorie. Een theorie moet makkelijk te falsifiëren zijn; de
onderzoeker moet bij het opstellen van de theorie er voor zorgen dat hij simpele constructies
inbouwt zodat de theorie makkelijk na te trekken is op falsifieerbaarheid.
Popper (1968) ziet het zelfs als volgt: het bevestigen van een theorie is irrelevant; falsifiëren van
een theorie is de sleutel tot wetenschap.
Een theorie die in het verleden zijn waarde heeft bewezen en nog nooit is gefalsifieerd, kan in de
toekomst nog gefalsifieerd worden. Ook kan men nooit met 100% zekerheid zeggen dat een
theorie klopt, aangezien er niet oneindig veel experimenten uitgevoerd kunnen worden en je er
dus niet van uit kunt gaan dat een theorie niet ooit een keer onjuist zal worden bewezen.
De meest nuttige sociale theorieën zijn valide onder bepaalde omstandigheden. Algemene,
universele waarheden zijn bij voorbaat niet te falsifiëren en zijn dus van weinig nut.
Wetenschappers moeten dan ook altijd duidelijk omschrijven binnen welke grenzen hun theorie
geldig is.
Regel 2: Maak theorieën die internconsistent zijn
Een theorie die intern inconsistent is is niet alleen falsifieerbaar, maar ook ongeldig. Als twee of
meer delen van een theorie hypotheses veronderstellen die elkaar tegenspreken is er spraken
van interne inconsistentie. Een methode om er voor te zorgen dat theorieën intern consistent zijn
is door formal modelling. Hierbij wordt aan de hand van wiskundige of ruimtelijke modellen een
theorie beproefd op interne conflicten. (beetje vaag verhaal maar volgens mij bedoelen ze hier
het nakijken van simpele wiskundige verbanden die vaak in sociale theorieën terug te vinden
zijn).
Regel 3: Selecteer afhankelijke variabelen nauwkeurig
Bij het selecteren van afhankelijke variabelen worden vaak fouten gemaakt in de wetenschappen.
Er zijn drie veel gemaakte fouten:
1. Vaak zijn gekozen afhankelijke variabelen helemaal niet afhankelijk. Gevolgen hiervan
kunnen zijn dat deze afhankelijke variabelen veranderingen veroorzaken in de
onafhankelijke variabele.
2. Soms worden afhankelijke variabelen gekozen die helemaal niet variabel blijken te zijn.
3. Ook wordt regelmatig een afhankelijke variabele gekozen die niet de variatie die men
beschreven wil zien beschrijft. (in het boek staat als aanbeveling: -> choose a dependant
variable that represents the variations we wish to explain)
Regel 4: Wees concreet
Selecteer zo veel mogelijk zaken die daadwerkelijk goed te observeren zijn. Abstracte begrippen
zoals cultuur, intenties van personen, beweegredenen spelen een nuttige rol bij het formuleren
van een theorie, maar zijn hinderlijk voor empirische evaluatie van theorieën en hypotheses als
ze niet meetbaar gemaakt kunnen worden. Een oplossing hiervoor is om subvariabelen te
onderscheiden die iets kunnen zeggen over het ‘grote geheel’. Bijvoorbeeld: Als je wilt weten of
er in een westers land veel asielzoekers zijn, maar je hebt niet de mogelijkheid om een
volkstelling te houden oid dan kun je het aantal moskeeën gaan tellen en aan de hand daarvan
de conclusie trekken dat er wel of niet veel buitenlanders in het westerse land zijn. Natuurlijk is
niet elke asielzoeker moslim en geeft dit dus een vertekend beeld. Dit is meteen het gevaar van
dit soort gevolgtrekkingen.
Regel 5. Maak theorieën voor veel gevallen toepasbaar
Dit is in eerste instantie tegenstrijdig met regel 1, toch moet een theorie zoveel mogelijk over de
wereld uitleggen als mogelijk is. Pas als bewezen wordt dat een theorie niet in een bepaalde
situatie geldig is, dan moet men de grenzen van de theorie in gaan perken. Als bijvoorbeeld grijze
wolken voor regen zorgen in Nederland dan mag men aannemen dat dat in andere landen ook zo
zal zijn. Hiervoor hoeft men niet een nieuw onderzoek in het buitenland te verrichten, maar men
mag wachten op onderzoeken die het tegendeel bewijzen.
Hoofdstuk 4
Vaststellen wat te observeren
Dit hoofdstuk gaat over specifieke praktische problemen van kwalitatief onderzoeksontwerp. Het
hoofdstuk concentreert zich op hoe we waarnemingen moeten selecteren voor onze analyse.
Om genoeg waarnemingen te hebben moet je jouw waarnemingen opsplitsen. Dus bijvoorbeeld
een land opsplitsen in staten en vervolgens observeren in plaats om het als geheel te
observeren. Op die manier verhoog je jouw waarnemingen voor je studie, waardoor je kans
vergroot is op valide causale gevolgtrekkingen. Je kunt ook bijvoorbeeld waarnemingen van een
land van verschillende tijden verzamelen. Dus het is beter om meer waarnemingen te verzamelen
in plaats van gevolgtrekkingen, dus niet gedetailleerde informatie verzamelen over een
waarneming, maar verzamel informatie over verschillende waarnemingen.
4.1 Ongedetermineerde onderzoeksontwerpen
Sommige onderzoeksontwerpen zijn ongedetermineerd onderzoeksontwerp, dit betekent dat
niets geleerd kan worden over de causale hypotheses. Ongedetermineerde
onderzoeksontwerpen gelden alleen wanneer er een doel is om causale gevolgtrekkingen te
maken.
Er bestaan twee situaties waarin een ongedetermineerd onderzoeksontwerp ontstaat en ons
daardoor geen leverage verschaft:
1. We hebben met meer gevolgtrekkingen te maken dan de opgeleverde waarnemingen.
2. We hebben twee of meer onafhankelijke variabelen in onze data die perfect gecorreleerd
zijn met elkaar- in statistische termen. Dit is het probleem van multicollineariteit.
4.1.1 Meer gevolgtrekkingen dan waarnemingen
Er is een limiet van hoeveel we kunnen leren van gelimiteerde informatie. Het is een regel dat
elke waarneming ons kan helpen om maximaal één gevolgtrekking te maken. Als de
waarnemingen afhankelijk zijn maken ze minder gevolgtrekkingen. Dus we hebben veel
waarnemingen nodig om een redelijke causale gevolgtrekkingen te maken.
Het is niet verstandig om alle mogelijke onafhankelijke variabelen mee te rekenen, dit
veroorzaakt namelijk een ongedetermineerde onderzoeksontwerp. Het toevoegen van nieuwe
waarnemingen van verschillende niveaus is een geschikte methode om kwalitatief en
ongedetermineerd onderzoeksontwerp te realiseren en omitted (weglating) variabele bias te
weerstaan.
Stel dat we geïnteresseerd zijn in het maken van gevolgtrekkingen over 2 parameters in een
causaal model met twee onafhankelijke variabelen en een alleenstaand afhankelijke variabele,
maar we hebben maar een waarneming (n=1). De volgende vergelijking wordt hiervoor gebruikt:
E(Y)=X1B1+X2B2
B: waarneming
X: parameter
Het probleem van deze vergelijking is dat het niet over een unieke oplossing beschikt. Zo wijzen
verschillende implicaties het causale effect.
4.1.2 Multicollineariteit
Dit is een situatie waar je vergelijkend variabelen hebt die met elkaar verbonden zijn, bijv.
geboortejaar en leeftijd.
Wanneer je weet dat X1=X2 dan wordt de vergelijking:
E(Y)=X1B1+X2B2
=X1(B1+B2)
Ondanks we nu meer waarnemingen dan parameters hebben, ontstaat hetzelfde probleem: er
kan geen unieke schatting van de parameters worden gegeven. Dit kan overigens bij geen enkele
methode.
Om vertrouwen te vergroten over onze schattingen moeten we onze leverage maximaliseren over
ons probleem. Tevens moeten we zoveel mogelijk waarnemingen observeren voor onze theorie.
Maximaliseer leverage door minder onafhankelijke variabelen te nemen om een causale
gevolgtrekking te maken. Hiermee moet je voorzichtig zijn om geen bias te krijgen door omitted
variabele bias (het weglaten van variabelen).
Een succesvol project is een dat veel verklaart met zo weinig mogelijk. Het doel is dat een
alleenstaande onafhankelijke variabele veel waarnemingen op afhankelijke variabelen verklaart.
4.2 De limieten van willekeurig selectie
Je moet willekeurigheid niet verwarren met geluk. Willekeurig selectie betekent dat elke
waarneming even veel kans heeft op selectie.
Willekeurig selectie van waarnemingen elimineert bias automatisch in grote n-studies. Bij grote nstudies is willekeurige selectie uitvoerbaar, maar dit geldt niet bij kwalitatieve onderzoek waar er
weinig n-studies zijn, anders missen hun belangrijke gegevens.
4.3 Selectie Bias
Welke waarnemingen moeten we selecteren voor onze studie? Vooral voor kwalitatief onderzoek
is dit belangrijk, het bepaalt de betrouwbaarheid van de resultaten.
Maar als je willekeurigheid negeert open je veel deuren voor bias, bijv. dat je waarnemingen
verzamelt die jouw hypotheses confirmeren.
4.3.1 Selectie op de afhankelijke variabele
Regel: selectie moet ons tenminste de mogelijkheid geven op wat variatie op de afhankelijke
variabele. Dus niet alleen oorlogen of revoluties bestuderen, maar een variatie van variabelen.
Selectie op de afhankelijke variabele riskeert selectie bias op de gevolgtrekkingen. Maar dit kan
gecompenseerd worden (zie blz. 131).
4.3.1.1 Voorbeelden van onderzoeker die selectie bias veroorzaakt
Selectie bias gebeurt vaak bij onderzoekers die naar het buitenland gaan voor hun studie, omdat
sommige overheden toegang verbieden voor buitenlandse onderzoekers.
Sommige onderzoekers gebruiken geen controle groep, waardoor ze eigenlijk nooit zeker kunnen
weten of zij gelijk hebben of niet.
4.3.1.2 Voorbeelden van selectie bias veroorzaakt door de wereld
Wordt door het verzamelen van tientallen waarnemingen in plaats van een steekproef van
waarnemingen de kans op selectieve bias vermeden? Dit is blijkbaar niet het geval. Want soms
beschikken al die waarnemingen al over selectieve bias door de wereld. De voorzichtige
onderzoeker moet altijd de beschikbare selectie bias evalueren: welke gebeurtenissen zijn
waarschijnlijk geregistreerd en welke niet?
4.3.2 Selectie op de onafhankelijke variabele
Door het beperken van onze key causale variabele, beperken we de algemeenheid van onze
conclusie, maar we introduceren geen bias. Controle groepen helpen ook om selectieve bias te
vermijden.
4.3.3 Andere typen van selectieve bias
Het komt voor dat het causale effect van sommige variabelen variëren. De grootte van het
causale effect introduceert bias in schattingen van gemiddelde causale effecten. Als we
eenheden verzamelen met grote causale effecten en het gemiddelde daarvan nemen, dan maken
we een overschatting van causaal effect. Als we eenheden selecteren met kleine effecten, zullen
de gemiddelde causale effecten kleiner zijn dan ze moeten zijn.
4.4 Waarnemingen opzettelijk selecteren
Bij opzettelijk selectie bepaal je van tevoren de waarden van relevante variabelen en sluit je
willekeurige selectie van waarnemingen helemaal uit. Dit is gevaarlijk, want zo kan je van tevoren
alle waarden structureren, waardoor je selectie bias introduceert omdat je jouw hypotheses
voorkeur geeft.
Er zijn verschillende methodes van opzettelijk selectie van waarnemingen:
4.4.1 Waarnemingen selecteren op de onafhankelijke variabele
Dit is de beste manier, omdat je met deze methode opzettelijk waarnemingen selecteert de
variatie bieden voor de onafhankelijke variabele (en de controle variabele) zonder van tevoren de
afhankelijke variabele te bepalen.
4.4.2 Waarden van de afhankelijke variabele selecteren
Op deze manier begint onderzoek meestal: je vindt bijv. iets fascinerend over gedrag en dit wil je
graag uitleggen (retrospectief onderzoek ontwerp, case-control study). Deze selectie proces helpt
je om een causale gevolgtrekking te maken (niet altijd valide), maar is niet geschikt om een
beschrijvende gevolgtrekking te maken.
4.4.3 Waarnemingen selecteren op de onafhankelijke en afhankelijke variabele
Dit is een gevaarlijke methode, omdat het dan makkelijk is om per ongeluk bias te introduceren
bij het resultaat. Je selecteert waarnemingen die consistent zijn met je hypotheses van je
onderzoek. Ondanks de risico’s van deze methode is het best logisch om bij bepaalde gevallen
het te gebruiken bij kleine n-studies, omdat je anders misschien geen causale gevolgtrekking
kunt maken (case of zero causual effect).
4.4.4 Waarnemingen selecteren zodat de key causale variabele constant is
Bij deze benadering kan het causale effect van de onafhankelijke variabele niet variëren en dus
ook niet beoordeeld worden (geen valide gevolgtrekking).
4.4.5 Waarnemingen selecteren zodat de afhankelijke variabele constant is
Bij deze methode kunnen we ook niets leren. Maar met bepaalde informatie (bijv. extreme
variabele die constant zijn) kan deze methode valide causale gevolgtrekkingen maken.
Conclusie
Uiteindelijk willen we een studie ontwerpen die de onafhankelijke variabele selecteert op basis
van onze theorie en de afhankelijke variabele laten variëren. De doelstelling is om relevante
informatie te verkrijgen om onze theorie te evalueren zonder bias te introduceren die onze
gevolgtrekkingen in gevaar zullen brengen.
Hoofdstuk 5
 begrijpen wat je wil vermijden
Dit hoofdstuk gaat voornamelijk over het efficiënt en het onbevooroordeeld/onvertekend maken
van de gekozen observaties.
Vertekeningen vermijden (unbiasedness) is het centreren van de interval rond de 'goede
schatting'. Efficiëntie is het smaller maken van het geschikte interval.
Er zijn vier bronnen voor bevooroordeeld en efficiëntie, nl. :
5.1 Measurement error -- Afmetingsfout
5.2 Excluding relevant variables (Bevooroordeeld)
5.3 Including Irrelevant variables (Onefficiëntie)
5.4 Endogeneity (Als de afhankelijke variabele de verklarende variabele beïnvloed)
5.1 Measurement Error  afmetingsfout
Als de observaties geselecteerd zijn, moeten de waarden van de variabelen gemeten worden. Bij
het meten van observaties zijn er geen grote verschillen tussen kwalitatieve- en kwantitatieve
onderzoekers; het enige verschil is dat kwantitatieve onderzoekers gebruik maken van numerieke
waarden en kwalitatieve onderzoekers van woorden. Beide onderzoeksgroepen moet hun
onzekerheid over eventueel gemaakte meetfouten benoemen. Er bestaan geen universeel
correcte antwoorden; alle metingen hangen namelijk af van het probleem wat de onderzoeker
zich stelt ; "Use the measure that is most appropriate to our theoretical purposes" .
De meeste meetfouten worden gemaakt doordat deze niet refereren naar een theoretische
structuur. Ook worden er vaak onnodig groepen gemaakt, welke de resultaten sterk kunnen
beïnvloeden.
Daarnaast moet er een keus worden gemaakt tussen ordinale en interval-metingen. Tot slot… de
meting moet betrouwbaar zijn (Klopt de meting?) en Valide (Meet ik datgene wat ik wil meten?)
5.1.1 systematic measurement error
Een voorbeeld van een systematische meetfout is het overschatten van bepaalde variabele; dit
kan leiden tot zowel 'vertekeningen' en 'inconsequentie' in het beoordelen van causale
verbanden.
 Een vertekening in de (gemeten) praktijk, zorgt automatisch voor een vertekening in de
beschrijving.
 Als de vertekeningen zich in alle onderdelen van de meting voordoen, zal dit geen
gevolgen hebben voor de causale inferentie.
Als er zich systematische meetfouten dreigen voor te doen…..dan is het advies als volgt;
- Gebruik metingen van andere onderzoekers uit totaal verschillende vakgebieden. De metingen
zullen daardoor totaal niet beïnvloed worden door jouw eigen hypotheses.
5.1.2 nonsystematic measurement error
Non-systematische meetfouten is een ander probleem voor onderzoekers. Dit zijn metingen met
af en toe een te hoge en/of te lage waarde; het gemiddelde wordt hierdoor niet beïnvloed. Nonsystematische meetfouten veroorzaken ook géén 'vertekening'. Als de fout zich in de téverklaren-variabele (afhankelijke )bevindt, dan zal de relatie tussen de verklarende en de teverklaren-variabele, oftewel de correlatie verminderen.
5.1.2.1 Nonsystematic measurement error in the dependent variabele
Het gevolg van een nonsystematische meetfout in de te-verklaren-variabele is dat het causale
effect minder efficiënt en onzekerder wordt. Er moeten vervolg-studies worden gedaan met een
voorzichtigere meting van de te-verklaren-variabele. Dit heeft tot doel meer relevante informatie
te verkrijgen voor de gemaakte hypotheses.
A formal analysis of random measurement error in Y
Er is een model bedacht met de te-verklaren-variabele meting met een foute en foutloze
verklarende variabele; De interesse gaat hierbij uit naar de effect-parameter (β):
E (Y*) = βX
Voor het meten van de variantie; V (Yi*)= σ²
Nu wordt er niet verder gemeten met Y*, maar met Y: Y=Y* + U
(Y=de geobserveerde te-verklaren-variable, Y* = werkelijke te-verklaren-variable, U =
nonsystematische fout)
Om te zien wat de beïnvloeding is van de nonsystematische fout in de te-verklaren-variabele op
de effect-parameter wordt dit model gebruikt (uit hfdst. 3)
.b =
Σn i = 1YiXi
---------------Σn i = 1X²i
Hierop volgt een model of de efficientie van de estimator in de huidige te-verklarende-variabele
mét fout te weten te komen.
Σn i = 1XiYi
V(b) = V
--------------Σn i =1X²i
Voor meer modellen en formules zie blz. 162
5.1.2.2 Nonsystematic measurement error in an explanatory (verklarende) variabele
Net als non-systematische meetfouten in de te-verklaren-variabele, kunnen meetfouten in de
verklarende variabele ook inefficiëntie en onzekerheid veroorzaken. Nu is er sprake van een
systematische vertekening in de metingen van de causale relatie.
Er zijn twee praktische richtlijnen te noemen;
1. Als een analyse geen effectsuggestie heeft en de richting van vertekening is nog niet
duidelijk, dan zal het moeilijk zijn het werkelijke effect vast te leggen. De analyse blijft
dan nog erg twijfelachtig en zal ook zo beschreven moeten worden.
2. Als er wordt gesuggereerd dat de verklarende variabele een non-systematische meetfout
bevat met een klein positief effect, dan zullen de resultaten gebruikt kunnen worden om
te concluderen dat het werkelijke effect misschien wel groter kan zijn dan gevonden.
Ditzelfde geld voor een klein negatief effect.
A formal analysis of random measurement error in X
Als de verklarende variabele mét de fout geobserveerd wordt, dan volgt dit model;
E(Y)=βX*
Als de 'correcte' X geobserveerd wordt, dan; X=X*+U
Ook bij deze verklarende variabele wordt gebruik gemaakt van de estimater-formule, zoals
uitgelegd in hfdst.3 (en hierboven)
De volgende formule geldt voor de verklarende variabele;
.b≈
Σn i =1X*iYi
---------------------------Σn i =1X*²i + Σn i=1U²i
5.2 Excluding Relevant Variables; Bias
Soms ontstaan er 'valse' effecten bij het schatten van een causaal effect; het is daarom erg
belangrijk de effecten te controleren.
5.2.1 Gauging the bias from omitted variables
Soms worden variabelen over het hoofd gezien, wat vervolgens van invloed kan zijn op het
causale effect.Het is geen probleem 'controle-variabelen' over het hoofd te zien, ook al hebben ze
een sterke invloed op de te-verklaren-variabele. Deze controle-variabelen mogen dan niet (!)
verschillen van de bijbehorende verklarende variabele.
--- Verder snap ik deze paragraaf niet zo goed. Misschien kun je deze het beste zelf even
doorlezen, beginnend op pagina 168 --5.2.2 Examples of Omitted Variable Bias
In deze paragraaf worden allerlei voorbeelden gegeven van onderzoeken met over het hoofd
geziene variabelen. Uit deze voorbeelden blijkt dat het erg belangrijk is een theoretisch model in
je hoofd te hebben om je onderzoek te evalueren. Een goede beschrijving of een beschrijvende
inferentie hebben meer waarde dan een verkeerd causaal verband.
5.3 Including Irrelevant Variables; Inefficiency
Het is niet de bedoeling dat onderzoekers de effecten gaan bekijken van alle mogelijke
verklarende variabelen. Dat zal leiden tot inefficiëntie. Het zit namelijk zo;
Hoe meer de (hoofd-) verklarende-variabele is gecorreleerd aan niet-relevante controle
variabelen, hoe minder efficiënt de meting is van het causale effect.
Het invoegen van niet-relevante variabelen, zal ervoor zorgen dat er meer eisen worden gesteld
aan de 'begrensde' data-set, wat zal vervolgens zal leiden tot minder informatie voor elke
inferentie.
A formal analysis of included variable inefficiencies
σ²
V (β1) ------------------(1-r²12)Σn i=1 X²1i
=
V(b1)
-------(1-r²12)
5.4 Endogeneity
Endogeniteit; Uit zichzelf voorkomend. Het kan zijn dat er geen sprake is van een causaal
verband, maar dat A (de verklarende variabele) onderdeel is van B (de te-verklaren-variabele), of
dat B, A veroorzaakt.
Er zijn 5 manieren om 'om te gaan' met de probleem van Endogeniteit
1. De vertekende inferentie corrigeren
2. De te-verklaren-variabele ontleden en vervolgens alleen die onderdelen bestuderen die
gevolgen zijn van de verklarende variabele.
3. De endogeniteit veranderen in een vertekening als gevolg van een over het hoofd geziene
variabele.
4. Voorzichtig selecteren van observaties zónder endogeniteits-problemen.
5. Ontleden van de verklarende variabele zodat je er zeker van bent dat alleen die
onderdelen met exogeniteit in je analyse aanwezig zijn
5.4.1 Correcting Biased Inferences
Hierbij zorg je ervoor dat je de richting van de vertekening te weten komt, zodat je de situatie
vervolgens kan corrigeren.
E(b) = β + Bias
5.4.2 Parsing the dependent variabele
De te-verklaren-variabele goed bekijken. Misschien zitten er elementen in B, dat de oorzaak is
van B. Als dat het geval is, moet je alleen dat deel gebruiken van B, dat dus gevolg is van A.
A
B
5.4.3 Transforming Endogeneity into an Omitted variable problem
Vertaal de endogeniteit naar externe factoren. Vervang A bijvoorbeeld door C. A wordt dan een
gevolg.
C
A
B
5.4.4 Selecting Observations to Avoid endogeneity
Soms zijn er al gevolgen zonder een "oorzaak", zoals er bijvoorbeeld ideeën zijn die pas na een
bepaalde (rationele) keuze worden gemaakt (zoals je er nu bijvoorbeeld spijt van hebt van je
keuze dat je de UT bent gaan doen hahaha)
5.4.5 Parsing the explanatory variable
De verklarende variabele verdeel je in twee componenten; één die volledig exogeen is en één dat
voor een deel endogeen is. De onderzoeker zal dan alleen dat deel gebruiken met de exogene
informatie.
A
5.5 Assigning Values of the Explanatory Variable
Deze paragraaf brengt 'de controle over de opdracht' onder de aandacht.
Een 'random assignment' is goed bruikbaar bij grote observatie-aantallen, maar niet bij weinig
observaties (a small n). Het gebruik van 'random assignment' van de verklarende variabele zullen
de kans op endogeniteit, meetfouten en zeker op 'over 't hoofd geziene variabelen' verkleinen.
De meest waarschijnlijke manier om 'randomly' data te verzamelen is dit te doen door willekeurig
bij een groot aantal eenheden de waarden van de verklarende variabelen te kiezen. Als dit niet
mogelijk is, moeten niet zomaar de observaties willekeurig worden geselecteerd. In plaats
daarvan moet de bestaande kennis van de beschikbare observaties gebruikt worden. Er moet
namelijk een selectie van de observaties gemaakt worden en eventueel een "werkstuk" van de
waarden van de verklarende variabele, op zo'n manier dat er geen vertekening en/of inefficiëntie
ontstaat. Als een vertekening niet te vermijden is, moet de richting ervan in ieder geval wel
genoemd worden.
Alle studies moeten hun selectieproces van observaties uitgebreid beschrijven.
5.6 Controlling the research situation
Als alles geprobeerd is om meetfouten, over het hoofd geziene variabelen en problemen met
endogeniteit te voorkomen, maar het is niet gelukt, dan moeten ze opgemerkt en vastgesteld
worden en er moet geprobeerd worden ze te corrigeren. (Zo staat het écht in 't boek; sorry)
Bij studies met een kleine n is dit moeilijk te controleren, maar aandacht is essentieel om
vertekening te voorkomen.
Om situaties onder controle te hebben worden deze situaties/observaties vaak vergeleken met
soortgelijke situaties (matching). Hierbij is de kans groot dat onderdelen over het hoofd worden
gezien, wat vervolgens weer leidt tot vertekening. Om dit te voorkomen kun je je eigen
situatie/observatie vergelijken met een ander, waarin dezelfde meetwaarden worden gebruikt.
De onderzoeker kan op twee manieren een eventueel causaal effect aantonen, namelijk

één met een willekeurige selectie van observaties (meestal met grote n). Dit is een
eenvoudige manier om gelijke eenheden te creëren. Ook zullen er geen relevante
variabelen over het hoofd worden gezien en er worden geen observaties geselecteerd
welke gecorreleerd zijn met de te-verklaren-variabele.

één met een intensieve selectie van observaties (meestal met kleine n) . Deze inferenties
nemen meer risico's met zich mee en zijn meer afhankelijk van de mening van de
onderzoeker, waardoor de kans op vertekening groter is. Ook is bij dit onderzoek een
controle nodig door één verklarende variabele te meten/testen op het causale effect (dit
zal ook de invloed op het probleem vergroten).
Woordenlijst
Inquiry
Designing Social
1. Inference
conclusie, gevolgtrekking
2. scholarly research
wetenschappelijk onderzoek
3. apply
aanwenden, doorvoeren, in toepassing brengen,
toepassen
4.
unified
eendrachtig
5.
to derive from
afgeleid van, afstammen van
6.
inquiry
enquête (inquiry-office = informatiebureau)
7. distinctive
karakteristiek, zich onderscheidend, gedistingeerd
8. establish
baseren, funderen, grondvesten, stichten, vestigen
bevinden, constateren, vaststellen
9. require
hoeven, moeten, nodig hebben, (op)eisen, rekenen,
vereisen, vergen, voorschrijven, vorderen
10. to seek
snorren, uitkijken naar, uitzien naar, zoeken, opzoeken
11. precept
voorschrift, principe, grondregel
12. generate
voortbrengen, doen ontstaan, verwekken
13. assess
beoordelen, vaststellen, bepalen
14. simplify
vereenvoudigen
15. ramification
vertakking
16. conceptualizing
ideeën maken, beeld vormen
17. meaningful
zinvol
18. implication
implicering, (onuitgesproken) suggestie
19. scholar
scholier, geleerde, wetenschapper
20. refine
louteren, raffineren, verfijnen
21. permitting
gedogen, toelaten, toestaan, vergunnen, veroorloven
22. adhere to
aanhangen
23. leverage
hefboomwerking
24. confirmation
bevestiging
Download