Samenvatting hoofdstuk 1 t/m 12 Baarda en de Goede Woord vooraf Empirisch= door waarneming vaststellen wat zich in de werkelijkheid( empirie) afspeelt Bij empirisch onderzoek heb je onderzoeksgegevens nodig bij theoretisch niet Kwantitatief onderzoek: onderzoek waarbij cijfers gebruikt worden Kwalitatief onderzoek: niet om hoeveelheden maar kwaliteiten ervaringen belevingen, Andere typen data (verslagen, beschrijvingen, interpretaties etc) Hoofdstuk 1 1.1 Doelstelling: geeft aan waarom je onderzoek wilt doen en wat je ermee wilt bereiken, geeft de relevantie van het onderzoek aan, waarom zinvol o Theoretisch: onderzoek draagt bij aan kennis op specifiek terrein o Praktisch: oplossen van specifiek probleem of situatie verbeteren Eigenschapsbegrippen: kenmerken die je wilt gaan meten Onderzoekseenheden: waar of degene bij wie je de eigenschapsbegrippen meet Haalbaarheid onderzoek afhankelijk van tijd, kosten en bereikbaarheid van info Onderzoeksvragen: o Frequentieonderzoeksvraag: hoeveel? Hoe vaak?, gaat om beschrijving, uitkomst vaak in tabel, (cirkel)diagram of histogram o Verschilonderzoeksvraag: vergelijking groepen of situaties, o Samenhangonderzoeksvraag: samenhang, vaak correlatie berekenen, onderzoek begint vaak met een probleemstelling, dan met het schetsen van een gewenste situatie, dan komt het vergelijken van de huidige met de geschetste situatie normatieve uitspraak: schetsen van iets of iemand als probleem of schetsen van wenselijke situatie we ontlenen bepaalde maatstaven/ normen aan de wenselijke om zo de bestaande situatie te beoordelen, dit is dus subjectief omdat iedereen andere normen heeft probleemverheldering: directe interventie of eerst (voor)onderzoek onderzoeker is degene die kennis levert, de directie moet maatregelen nemen en de oplossing bedenken, specialisten hebben daarbij de rol van raadgever praktische relevantie: via onderzoek info verkrijgen die je kan benutten voor een oplossing zodat een probleemsituatie in een gewenste situatie veranderd Theoretische relevantie: niet per se een probleem oplossen maar een theorie opstellen met de gevonden info en zo bijdragen aan de wetenschappelijke kennis 1.2 Bij een onderzoek 3 partijen de onderzoeker, opdrachtgever en respondent Een onderzoek is ethisch als: de respondent vrijwillig meewerkt en geen valse voorstelling van zaken krijgt, zijn gegevens anoniem zijn en de uitkomst geen nadelig effect heeft. Als het onderzoek controleerbaar en eerlijk voor de opdracht gever is en als de opdrachtgever alleen de resultaten als zijn eigendom beschouwt en de bron vermeld bij publicatie. Gedragscodes en privacywetgeving zorgen voor ethisch onderzoek 1.3 Een onderzoeksvraag is meestal een reductie van de vraagstelling. Hij is niet meer breed zoals de vraagstelling Onderzoeksvragen met Waarom en Hoe zijn te vaag en te globaal en daardoor te open. Het is zo voor de onderzoeker onduidelijk waar hij precies naar moet kijken Onderzoeksvragen met Hoe vragen zijn vaak beleidsvragen die meteen om een oplossing vragen. Het onderzoek kan wel een bijdrage leveren aan het vinden van die oplossing maar de oplossing zelf kan nooit gegeven worden. De onderzoeksvraag kan niet beantwoord worden omdat de onderzoeker hoogstens een diagnose kan stelle Normatieve vragen zijn met onderzoek niet te beantwoorden, omdat het om ethische vragen gaat. En iedereen heeft andere normen en waarden ( bv het woord Goed of Slecht) Een esthetische vraag is ook een normatieve vraag wat mooi is is niet te beantwoorden met een onderzoek De onderzoeksvraag geeft aan wat je precies wilt weten hij wordt gevormd na de brede vraagstelling mbv oriëntatie (gesprekken opdrachtgevers, deskundigen, vooronderzoek en literatuuronderzoek) 1.4 Een eigenschapsbegrip of variabele is een begrip dat een kenmerk is van iemand of iets, dit begrip is meetbaar. Deze kunnen variëren en zijn meetbaar. Een eenheidsbegrip geeft aan aan wie of wat de eigenschap toebehoort. Alle eenheden samen zijn de populatie Een afgebakende groep eenheden in zijn geheel is een poulatie Het belangrijkste verschil tussen eenheids- en eigenschapsbegrippen is variatie ( verschil bv in meer of minder) 1.5 Concepten= begrippen Conceptueel model:verbanden tussen concepten grafisch weergegeven in een model Bij een verschil- en samenhang onderzoek gaat de onderzoeker eigenlijk al uit van samenhang tussen begrippen/concepten Lijn= verband tussen begrippen waarbij onduidelijk is wat de oorzaak en wat het gevolg is, is dat wel duidelijk dan kan je een pijl neerzetten Causaal model: duidelijk wat oorzaak en wat gevolg is, is weergegeven met pijlen Een causaal verband aanduiden vereist veel onderzoek verdeeld over meerdere jaren of soms kan een experiment duidelijkheid geven Empirische toetsing: controleren van modellen Controlebegrip/variabele: begrip dat samenhangt met een begrip en zo het verband tussen dat begrip en een ander beïnvloed Vals of schijnbaar verband: verband tussen 2 begrippen dat niet direct is maar geheel door een 3e begrip wordt bepaald en dus eigenlijk via het 3e begrip loopt Interveniërende of mediërende begrippen geven het verband aan tussen begrippen het zijn kwantitatieve controlevariabelen, ze kunnen varieren er is sprake van meer minder lager hoger of zwakker sterker 1.6 Uitvoerbaarheid onderzoek beperkt door: tijd geld bereidheid en bereikbaarheid respondenten en proefpersonen Het is verstandig voor je onderzoek een balans/begroting op te stellen om de haalbaarheid te testen 1.7 Als een begrip een beperkt aantal categorieën heeft gaat het meestal om een verschil en niet een samenhangonderzoeksvraag Bedenk bij de opzet van je onderzoeksontwerp al wat het karakter van je onderzoeksvraag is. Een specificatie of interactiebegrip verhult een verband tussen begrippen doordat het verband voor verschillende subbegrippen anders is Hoofdstuk 2 2.1 Onderzoeksvraag: geeft aan wat je wilt weten, doelstelling waarom je dat wilt weten Vergelijkbaar onderzoek: onderzoek dat bruikbaar is voor de beantwoording van je onderzoeksvraag Nederlandse CBS en Vlaamse APS verzamelen info ´SRM = social research methodology: bestand dat onderzoekspublicaties bekijkt op methodologische aspecten de belangrijkste redenen om literatuur onderzoek te doen zijn: nagaan of anderen al vergelijkbaar onderzoek hebben gedaan, dat door anderen al bruikbare gegevens zijn verzameld, info vinden die relevant is voor de opzet van je onderzoek en het definiëren en operationaliseren van de begrippen 2.2 zoektermen gebruik je om gewenste info te vinden, gebruik ook synoniemen, verwante termen of anoniemen( tegenovergestelde betekenissen van je begrippen) Auteur: achternaam, voorletters of voornamen Amerikanen plannen tussenvoegsels vaak voor aan de achternaam vast Vanderdeijl Onderzoek of research toevoegen aan zoekterm zorgt voor meer relevante resultaten of overzicht of review Trefwoorden/descriptoren: bepaalde vaste termen uit een lijst die de inhoud van een artikel karakteriseren Een thesaurus is een lijst van trefwoorden die bij elke term aangeeft welke andere termen daaraan gerelateerd zijn, je krijgt naast synoniemen bredere en smallere begrippen ( bv online woordenboek Hyperdictionary) 2.3 Bij het zoeken naar info zijn tijd en geld beperkingen, zorg dat je ook op andere wijze je zoekproces beperkt of begrensd ( bv alleen recente bronnen, taal) 2.4 Directory´s, gateway´s, meta-indexen, portals of onderwerpgidsen: zorgvuldig georganiseerde en geselecteerde overzichten van websites voor verschillende gebieden/onderwerpen ( Infomine, pinakes, SocioSite, DebWeb, Biz, WebEC, Complete Planet) Scirus: zoekmachine voor wetenschappelijke publicaties Je kan deskundigen raadplegen te vinden op gespecialiseerde instituten, universiteit, ministerie NOD= Nederlandse Onderzoek Databank: beschrijvingen van projecten en namen + adressen onderzoekers SER heeft site met tips voor scriptie Pyttersen´s Almanak: op cd-rom overzicht alle organisaties met gegevens Kan nieuws of discussiegroepen op internet vinden, discussiegroep is serieuzer (google Groups) Gebruk recente tijdschift artikelen, elektronisch full-text, e-magazines, blader door inhoudsopgaven of doorzoek current-content of attenderingstijdschriften waarin de inhoud van tijdschriften wordt opgenomen ( Current contents, SetsWise, IngentaConnect, Pica) Abstracttijdschriften: presenteren selectie van relevante artikelen, voegen refwoorden of codes toe om inhoud aan te geven en geven een samenvatting van de inhoud Sneeuwbalmethode: literatuurlijst van artikel raadplegen om zo andere maar wel oudere bronnen te vinden Citaatindexen: kan je in vooruitzoeken op literatuurlijsten bij artikelen, om zo te zien voor welk artikel je gevonden artikel als bron is gebruikt ( Science Citaton Index,, google scolar) Reviewartikel:overzichtartikel waarin auteurs de literatuur beschrijven en een overzicht van stand van zaken bij een onderzoeksgebied geven( zoekterm + review) NCC = Nederlandse centrale Catalogus: bibliografische gegevens en vindplaatsen van heel veel boeken en tijdschriften Zoek naar proefschriften of scripties( Dissetation Abstracts International) Rapporten zijn grijze literatuur: niet officieel door uitgever uitgegeven (GLIN) Inaugurele redes: toespraken van nieuw benoemde hoogleraren bij officiële aanvaarding van hun ambt Browsen = rondneuzen 2.5 Zoekplan: doel aangeven van literatuuronderzoek, relevante zoektermen Randvoorwaarden: tijd voor zoeken/lezen, geld, recentheid of taal literatuur, relevant Relevant: sluit aan bij je doel, van recente datum, voldoende kwaliteit, gerommeerd auteur en tijdschrift of goede uitgeer, valide en betrouwbaar, te controleren, beschikbaar en toegankelijk Maakt Logboek, waarin in alle die info over bronnen staan, en kwaliteit, relevantie, Vuistregels informatie zoeken: o Bekijk nauwkeurig de literatuurlijst je het meest recente artikel over jouw onderwerp dat mag niet ouder zijn dan een jaar o Schrap verwijzingen naar algemene naslagwerken of methodologische literatuur o Je moet tenminste 80% van alle verwijzingen die je had kunnen vinden ook werkelijk gevonden hebben. Literatuurlijst APA richtlijn: literatuur alfabetisch ordenen op namen van de eerste auteurs, waarbij je de voorvoegsels moet negeren, geen auteur dan instituursnaam, titels boeken en tijschriften en het tijdschriftnummer staan altijd cursief, het pagina nummer niet, &- amperstand tussen 2 auteurs, met meer een komma en een & tussen de laatste 2, met meer dan 7 6 volledig en de rest met et al, na auteursnaam (oublicatiejaar). Titel. Plaats van uitgave: uitgever Bij sites vindplaats en datum van bezoek vindplaats ( geraadpleegd op/ retrieved from) 2.6 CBS, APS: statistische databestanden SCP, Steinmetzarchief, Data News, in zoekmachine zoekterm databestanden of datasets Hoofdstuk 3 3.1 Beschrijven onderzoek: nauwkeurige opsomming zonder nadere aanduiding van verbanden tussen kenmerken of verklaringen daarvoor, categoriseren en tellen en tabellen en grafieken maken. Je probeert antwoord te krijgen op frequentieonderzoeksvragen Kapstok/containervariabele: een variabele die het begrip lijkt te beïnvloeden, maar dat eigenlijk niet doet, omdat het eigenlijk beïnvloed wordt door andere met die variabele samenhangende variabelen 3.2 Een exploratief onderzoek is gericht op de ontwikkeling van een theorie en of scherpe formulering van hypothesen. Het is aan de orde als het erom gaat antwoord te krijgen op verschil en of samenhangonderzoeksvragen het is een tussenvorm tussen een beschrijvend en een toetsingsonderzoek, er is al een verwachting bij de onderzoeker, hij let alleen op bepaalde verbanden 3.3 Een toetsingsonderzoek is een type onderzoek waarbij je vooraf een of meer hypothesen formuleert die je confronteert met de empirie. Je gaat dus na of een of meer hypothesen kloppen. Je gaat dit onderzoek doen als je al enigszins weet wat er aan de hand is op grond van een eerder beschrijvend onderzoek. Je spreekt van een theorie of propositie als de beweringen over een deel van de werkelijkheid logisch samenhangen, niet tegenstrijdig zijn, zo zijn geformuleerd dat minstens 1 empirisch toetsbare hypothese is af te leiden en er een mechanisme is dat het waarom van de bewering in de hypothese verklaart Een hypothese is een voorlopig antwoord op de vraag in de vraagstelling. Een voorspelling is de vertaling van een hypothese in meetbare termen. Evaluatieonderzoek: m.b.v. een onderzoek de waarde van een maatregel bepalen. Dus bekijken of de aanpassing nut heeft gehad Verklaringsmechanisme: mechanisme dat het hoe en waarom van de bewering in de hypothese verklaart Negatieve samenhang: hoge score op het ene kenmerk gaat samen met een lage score op het andere kenmerk hypothese moet zo geformuleerd zijn dat je concrete verifieerbare voorspellingen kan af leiden om de hypothese te toetsen operationaliseren: de concrete vertaling van een begrip in meetbare termen, geeft aan welke operaties of handelingen moeten worden uitgevoerd verifiëren: waarmaken van een voorspelling de voorspelling komt uit en is dus waar falsifiëren: het niet waarmaken van een voorspelling, de voorspelling komt niet uit: Hoofdstuk 4 4.1 experiment:de causale invloed aantonen van een onafhankelijke variabele ( oorzaakvariabele of experimentele variabele) op een afhankelijke variabele (gevolg of effect variabele) 4.2 Een onafhankelijke variabele is een variabele waarvan e waarden niet veranderen als gevolg van de invloed van andere variabelen. Bij een afhankelijke variabele kan de eigenschap kenmerk of grootheid wel variëren. De experimentele variabele is een onafhankelijke variabele Bij een pre-experimenteel ontwerp is er niet of in onvoldoende mate sprake van een vergelijkingsbasis op grond waarvan je kunt besluiten dat een onafhankelijke variabele effect heeft op een afhankelijke variabele. Er zijn drie vormen van pre-experiment, namelijk: o pre-experimenteel ontwerp 1:één groep, alleen nameting; o pre-experimenteel ontwerp 2:één groep, voor- en nameting; o pre-experimenteel ontwerp 3:vergelijking van twee (bestaande) groepen met alleen een nameting De experimentele groep is de groep die de experimentele variabele of experimentele behandeling krijgt toegediend. De controle groep is de groep waarbij niks veranderd. Er is sprake van interne validiteit of interpretatie-exclusiviteit als het zeker is dat het experiment geldig is Een tussentijds voorval is een gebeurtenis die kan plaatsvinden tussen de voormeting en de nameting van een experiment en die verantwoordelijk is voor een geconstateerd effect na introductie van de experimentele variabele. Ten onrechte wordt dan het effect toegeschreven aan de experimentele variabele Groei-effect: onderzoekseenheden veranderen door de tijd tussen de voor en de nameting. Bijvoorbeeld door vermoeidheid, ervaring, honger, enz Testeffect/ effect van herhaald testen: leereffect door afname van dezelfde test als bij de voormeting Instrumentatie: andere interpretatie van een conclusie uit een experiment door verandering van/ in het meetinstrument of degene die het instrument hanteert Statistische regressie ( terugval): Extreem) hoge en (extreem) lage scores dalen/stijgen naar de gemiddelde waarde op de afhankelijke variabele van de groep onderzoekseenheden als geheel. Daarom wordt ook wel gesproken van regressie naar het gemiddelde. Als de score al heel hoog of laag is kan hij namelijk haast niet hoger of lager worden gemeten Selectie is de specifieke samenstelling van de groepen voor het experiment, alleen al door die samenstelling zouden er al verschillende uitkomsten kunnen ontstaan Mortaliteit:uitval van mensen die meedoen aan een experiment door overlijden Door al deze storende factoren vormen pre-experimentele ontwerpen geen solide basis om uitspraken te doen over causale verbanden. 4.3 Randomiseren: onderzoekseenheden volgens toeval aan een groep toewijzen (R) en bepalen welke de experimentele en welke de controle groep is, zo zorg je dat beide groepen gelijk of uitwisselbaar zijn Om van een zuiver experiment te kunnen spreken moet er in ieder geval worden gerandomiseerd en moet er (in principe) naast de experimentele groep minstens één controlegroep bij het onderzoek worden betrokken. Daarnaast moet de experimentele variabele gevarieerd of gemanipuleerd kunnen worden. Er zijn drie vormen van zuiver experiment: o zuiver experimenteel ontwerp 1: alleen nameting met controlegroep; o zuiver experimenteel ontwerp 2: voor- en nameting, met controlegroep; o zuiver experimenteel ontwerp 3: Solomon 4 groepenontwerp; betreft een combinatie van experimenteel ontwerp 1 en experimenteel ontwerp 2. Met het solomon groepen ontwerp kan je controleren of er geen testeffect heeft plaatsgevonden Laboratoriumexperiment: onderzoekseenheden worden in een kunstmatige situatie gebracht De resultaten zijn extern valide als je ze zonder meer kunt generaliseren naar ander plaatsen, tijdstippen en omstandigheden (als ze daar ook kloppen) Matchen wil letterlijk zeggen: het gelijkmaken van twee (of meer groepen o Precisiematching/controle :paren van onderzoekseenheden samengesteld en grotendeels gelijk gemaakt op kenmerken waarvan een onderzoeker denkt dat ze van invloed zijn op de afhankelijke variabele o globale/ fequentieverdelings controle/ matching: ernaar streven dat de frequentieverdeling van een aantal kenmerken, zoals leeftijd, sekse en opleiding in de experimentele en controlegroep aan elkaar gelijk zijn. Matchen en homogeniseren zijn geen alternatief voor randomiseren, je mag ze er wel naast gebruiken 4.4 Een quasi-experiment is een experimenteel ontwerp waar bij de te vergelijken groepen niet volgens toeval worden samengesteld. Je hebt minder controle op de storende variabelen o quasi-experimenteel ontwerp 1: voor- en nameting met controlegroep; geen randomisatie; o quasi-experimenteel ontwerp 2: enkelvoudige tijdreeks; o quasi-experimenteel ontwerp 3: meervoudige tijdreeks; geen randomisatie. Tijdreeks: zelfde onderzoekseenheden op verschillende tijdstippen verrichten Non-reactieve meting:onderzoeksgegevens verkregen zonder bemoeienis van een onderzoeker, ze ontstaan en worden administratief opgeslagen Wees altijd alert op alternatieve verklaringen 4.5 Surveyonderzoek: over een groot aantal onderzoekseenheden gegevens verzamelen via systematische ondervraging of observatie, is een steekproef op een bepaald moment of een bepaalde periode, dus een momentopname, vooral bij beschrijvend, exploratief en een beetje bij toetsend onderzoek, moeilijk om causaliteit aan te tonen, kan el generaliseren, heeft vooral een lage interne maar een hoge externe validiteit Longitudinaal surveyonderzoek: op meer tijdstippen gegevens verzamelen panelonderzoek= bij de zelfde onderzoekseenheden op verschillende tijdstippen dezelfde gegevens verzamelen) trendonderzoek= op verschillende tijdstippen gegevens verzamelen bij steeds andere personen prospectief onderzoek: op de toekomst gericht surveyonderzoek, op verschillende tijdstippen gegevens verzamelen en als onderzoeker experimentele conditie nabootsen. Onderzoekseenheden worden op grond van e dataverzameling van tijdstip 1 ingedeeld in experimentele en controle groep om een voorspelling te doen om die op tijdstip 2 en 3 enz. te testen. 4.6 Om van causaliteit te kunnen spreken moet je zeker weten dat een onafhankelijke variabele (kenmerk 1) de oorzaak is van of van invloed is op een afhankelijke variabele (kenmerk 2). =oorzakelijk verband, moet worden voldaan aan drie voorwaarden: o er moet covariatie of een statistisch verband zijn tussen kenmerk 1 en kenmerk 2; o de variabele die als veroorzakende onafhankelijke variabele (kenmerk 1) wordt beschouwd dient in de tijd vooraf te gaan aan de afhankelijke variabele (kenmerk 2); o er moet aangetoond worden dat het verband tussen kenmerk 1 en kenmerk 2 niet spurius of vals is, in die zin dat andere variabelen in het spel zijn die bijvoorbeeld zowel van invloed zijn op kenmerk 1 als op kenmerk 2. Covariatie of statistisch verband: samenhang tussen 2 begrippen< Schijnsamenhang of valse of schijncorrelatie:er is wel een statistische samenhang, maar geen oorzakelijk verband Het zuivere experiment is de beste grondvorm om aan de causaliteitsvoorwaarden te voldoen en dus om uitspraken te doen over causale verbanden. Het pre- en quasiexperimenteel ontwerp is daarvoor minder geschikt. Non-experimenteel onderzoek, zoals survey-onderzoek, zijn niet of nauwelijks geschikt om uitspraken over causale verbanden te doen. Hoofdstuk 5 5.1 Kenmerken van onderzoekseenheden kunnen variëren dus heten ze ook wel variabelen De onderzoekseenheden hoeven geen respondenten te zijn. onderzoekseenheden zijn de personen of objecten waarover in de specifieke onderzoeksvragen en of hypothesen een uitspraak wordt gedaan en die in een onderzoek worden betrokken. Onderzoekskenmerken zijn de eigenschappen van deze personen of objecten, die kenmerken kunnen variëren 5.2 populatie = verzameling onderzoekseenheden, het is belangrijk deze af te bakenen en te beslissen of je alle eenheden gebruikt of slechts een deel van de populatie steekproef: slechts een deel van de populatie in het onderzoek betrekken kans of aselecte steekproef: alle eenheden van de populatie hebben gelijke kans om in de steekproef terecht te komen niet-kans of selecte steekproef: hierbij gelden de resultaten alleen voor de in je onderzoek betrokken eenheden, minder generalisatie en geen inductieve statistiek inductieve statistiek: analyseren in hoeverre resultaten van een steekproef met een zekere foutenmarge voor de gehele populatie gelden universum/theoretische populatie: het totaal van alle voorkomende eenheden een operationele populatie is alleen het daadwerkelijk onderzochte deel van de populatie, dus alleen de eenheden die in het onderzoek werden betrokken (aanvankelijke) respons: het deel van de steekproef dat in feite meedoet aan het onderzoek Dataproducerende steekproef of uiteindelijke respons<: het deel van de steekproef dat aan het onderzoek mee doet en bruikbare gegevens opleverde en dus in de dataanalyse werd betrokken Om van de steekproef tot de bruikbare respons te komen ga je via de theoretische populatie, de operationele populatie, de steekproef de aanvankelijke respons naar de uiteindelijke respons. Steekproefkader: een vorm van administratie waarin de onderzoekseenheden zijn geregistreerd zodat je aseledt objecten of personen kan trekken. Je kan gebruikmaken van persoonsregisters( zeer moeilijk om toegang te krijgen) knp of Belgacom telefoonnummerbestand, afgistepuntebestand van tnt post en het postcode bestand, kamers van koophandel, ledenlijsten brancheorganisaties 5.3 Voor een enkelvoudige aselecte steekproef : bestand van alle populatie elementen nodig ( administratief kader), zo heeft elke werknemer gelijke kans om in de steekproef te komen www.randomizer.org om randum nummers te trekken Loterijmethode: alle populatieelementen op kaartjes zetten en dan gaan trekken Houd altijd rekening met de non-responsgroep Bij een systematische steekproef met aselect begin wordt alleen de eerste eenheid aselect gekozen en daarna steeds een vast getal (gewenste omvang van steekproef/ omvang populatie) erbij opgeteld Deelpopulaties/strata: op vastgestelde kenmerken ingedeelde delen van de populatie, zoadat je goed naar de verschillen kan kijken. Zo kan je makkelijk bepalen wat voor percentage je per strata voor je steekproef gebruikt Proportioneel gestrafificeerde steekproef: de steekproef op je populatie laten lijken door uit de strata de zelfde %’s te nemen als die in de populatie voorkomen. Disproportioneel gestratificeerde steekproef: een gelijk aantal personen uit verschillende strata nemen en zo een steekproef krijgen die niet representatief is voor de totale populatie 5.4 Meertrapssteekproef: je kan niet rechtstreeks uit een bestand eenheden trekken maar past vaker aselecte steekproefen toe. Bijv eerst land aselect kiezen, dan gemeente, dan bedrijf, dan medewerkers Clustersteekproef: hele clusters van eenheden worden samen genomen in de steekproef Birthday rule: degene die het eerst jarig is wordt geselecteerd 5.5 Toevallige of beschikbare steekproef: steekproef waarbij een vooraf bepaald aantal eenheden geselecteerd wordt zonder een toevalsprocedure Bij een quotasteekproef wordt de populatie ook eerst verdeeld in strata, maar daana wordt uit die strata select een steekproef getrokken aan de hand van een vooraf gesteld quotum ( de hoeveelheid een heden per strata) Een doelgerichte steekproef is een selecte steekproef waarbij een combinatie van eenheden (die karakteristiek voor de gehele populatie kunnen worden beschouwd) wordt beschouwd als een steekproef uit die populatie. Het is een gerichte steekproef die in of meer representatief is voor de grote groep Een sneeuwbalsteekproef is een steekproef waarbij je aan een of enkele personen vraagt of zij mensen kennen met kenmerken die van belang zijn voor je onderzoek en dan vraag je hetzelfde aan die personen. (vb om drugsgebruikers te vinden) Waarbij het slim is omdan de personen die ze het slechts kennente nemen, zodat je niet in een sociale kring blijft hangen 5.6 Trek een steekproef als de operationele populatie te groot is om de gehele populatie in je onderzoek te betrekken, ga na of je toegang hebt tot een steekproefkader(s), bepaal of je strata gebruikt aan de hand van je d oel ne vraagstelling De omvang van je steekproef hangen af van: o Heterogeniteit van je populaite: de variatie in mogelijke antwoorden of reacties, die zal groter zijn naarmate de populatie groter is o De vereiste nauwkeurigheid, de steekproef is nauwkeuriger als de aselecte steekproef groter is o Het karakter van je onderzoek, want voor een experiment zijn minder respondenten nodig dan voor een survey Poweranalyse: gebruikt om bij iedere spreidingswaarden en ieder niveau van zekerheid en foutenmage uit te rekenen wat de minimumomvang van je steekproef moet zijn Het absulute minimum voor je steekproef is 30 eenheden nodig, maar het is beter uit te gaan van 100 en bij vergelijkingen van groepen 30x aantal groepen. Anticiperen op operationalisatie: je anticipeert dan op de begrippen die je wilt operationaliseren, door categorien te maken (vb heel tevreden tot heel ontevreden en man en vrouw) daarvan maak je een kruistabel die dus cellen geeft. En dan minimaal 25 eenheden keer het aantal cellen dus zo weet je hoeveel eenheden je steekproef moet bevatten. Hoofdstuk 6 6.1 Begrip zoals bedoeld: het begrip waar je naar benieuwd bent. Het begrip zoals bepaald: de manier waarop je het begrip vraagt of welke vraag je hebt gesteld Indicator: onderdeel van de variabele die staat voor een abstract kenmerk Operationaliseren: het vertalen van een begrip in meetbare termen Definieren: het omschrijven van het begrip dat je wilt gaan operationaliseren dus de definitie geven Heterogeen begrip: kenmerk waaraan verschillende aspecten, facetten of dimensies zijn te onderscheiden Homogeen begrip: kenmerk waaraan maar een facet, aspect of dimensie is te onderscheiden Defineren en operationaliseren is nodig bij complexe en/of abstracte eigenschapsbegrippen. Let daarbij op de verschillende dimensies. 6.2 Je kunt het beste van bestaande gegevens gebuikmaken, omdat de kosten laag zijn en je geen mensen lastig valt, vaak is er al info die je onderzoeksvraag beantwoord voorhanden Als er geen info voorhanden is moet je gaan oberserveren of interviewen. Het is beter te interviewen als het gaat om gevoelen, attitudes, kennis, houdingen of opinies Je kan beter observeren als je onderzoek gedrag betreft, omdat mensen bij bevraging niet eens weten wat ze precies doen of gedaan hebben Observatie geniet de voorkeur boven interviewen maar heeft geen zin bij sporadisch, ongewenst en intiem gedrag (beter interviewen) sporadisch voorkomend gedrag is een probleem omdat het moeilijk is vast te stellen met observatie. Het komt niet vaak voor en je moet je onopvallend opstellen om als het voorkomt het te kunnen observeren 6.3 Je verzameld gestructureerd informatie als er van te voren precies bekend is wat voor informatie nodig is. Je stelt dan gerichte vragen of doet gerichte observaties waabij het antwoord of gedragsalternatief kan worden aangekruisd. Dit kan je doen als je onderzoeksontwerp duidelijk is afgebakend als je voorkennis hebt of al het nodige weet. Je verzameld ongestructureerd informatie als er van te voren niet vast staat wat voor informatie je wilt hebben. En dus ook niet wat voor informatie je zult verkrijgen. Je stelt een lijst samen van definitieve aandachtspunten voor je onderzoek dat de basis is voor je onderzoek en ervoor zorgt dat je later gestructureerd informatie kan zoeken 6.4 Verzamel indirect informatie bij bedreigende onderwerpen ( inkomen, seksualiteit, problemen, crimineel gedrag) en gedragsdomeinen waarbij mensen niet bewust zijn van wat ze denken of doen. Je doet dat door een omweg te gebruiken om zo toch achter de gewenste info te komen. Of door observeren Direct informatie verzamelen geniet de voorkeur, want je weet dan meteen/ direct wat je wilt weten 6.5 Nominale metingen/ categorische gegevens: de waarden(getallen) va neen variabele zijn alleen te interpreteren als etiket of naamgeving Niet nominale metingen/ niet categorische gegevens: hier is sprake van meer of minder er wordt onderscheid gemaakt tussen: o Ordinale gegevens: sprake van meer of minder, maar de onderlinge verschillen tussen de categorieën zijn niet in een getal uit te drukken o Interval- en rationiveau: wel sprake van een maat van meer of minder die in een getal is uit te drukken, waarbij bij een rationiveau sprake is van een natuurlijk nulpunt, maar bij een intervalniveau niet. Deze gegevens verkrijg je op dit niveau door te tellen hoeveel indicatoren van toepassing zijn voor iedere respondent. Het gaat om meetbare verschillen Meetniveau hoger dan kunnen meer statistische analyseprocedures worden uitgevoerd Vragenlijsten maken gebruik van antwoordschalen en gegevens op ordinaal niveau Betrouwbaarheid wil zeggen dat de onderzoeksresultaten zo min mogelijk van toeval afhankelijk zijn. Betrouwbaarheid is geen garantie, maar wel een voorwaarde voor validiteit 6.6 Hoe minder de meting afhankelijk is van toeval hoe betrouwbaarder. Betrouwbaarheid wordt nadelig beïnvloed door omgeving van observatie of afname onderzoek, de persoon van de geïnterviewde en observator, de interviewer,vragenlijst of observatieinstrument Test-hertestmethode: na verloop van tijd het onderzoek nog een keer doen en de correlatie van de scores vormt de indicatie voor stabiliteit Homogeniteit van de vragen is belangrijk in vragenlijsten, zo kan je een begrip op meerdere manieren meten en zo de kans op toeval verkleinen Interbeoordelaarsbetrouwbaardheid moet de vragenlijst duidelijk zijn en goede instructies bevatten, stel je vast door verschillende beoordelaars op hetzelfde moment te laten observeren 6.7 Valide: je hebt gemeten wat je wou meten o Begripsvaliditeit: stel je vast door de samenhang van een meting met de meting van een ander, verwant begrip als criterium na te gaan o Predictieve validiteit: de vraag in welke mate scores andere scores kunnen voorspellen Conclusion validity: is er inderdaad een relatie tussen de begrippen en klopt de conclusie Interne validiteit: kwaliteit van de conclusie van het onderzoek, klopt de interpretatie ? Hoofdstuk 7: 7.1 Bestaande gegevens: Gegevens van ongestructureerde aard: zoals artikelen, advertenties etc. Deze kunnen begripsmatig worden gecategoriseerd (kwalitatieve inhoudanalyse) of worden omgezet in getallen (kwantitatieve inhoudsanalyse) Bestaande, al dan niet digitale, numerieke gegevens: voorbeelden zijn de cijfermatige en statistische gegevens die door tal van instanties worden verzameld. Hergebruik van onderzoeksgegegevens: Numerieke gegevns uit eerdere onderzoeken kunnen worden hergebruikt in een nieuw onderzoek. zowel bij de analyse van gebruikte onderzoeksgegevens als van bestaande numerieke gegevens spreken we van secundaire analyse Analyse van uitkomsten van verricht onderzoek: de resultaten en uitkomsten van verricht onderzoek kunnen opnieuw worden geanalyseerd om ze op een hoger abstractieniveau te brengen, wat een meta-analyse worden genoemd Analyse: Kwalitatief: wordt een documentenanalyse genoemd (niet te verwarren met literatuuronderzoek! wat vooraf gaat aan data verzameling) Kwantitatief: wordt onderzoek met bestaande gegevens genoemd 7.2 Bestaande gegevens: Data- of gegevensbestanden: als de registratie en opslag van gegevens systematisch gebeurt en bij voorkeur over een langere periode en van enige omvang. Databronnen: locaties met gegevens die je zou kunnen gebruiken voor je onderzoek Censusdata: grootschalige hoeveelheden informatie die over meest uiteenlopende onderwerpen structureel door enkele landelijke instanties wordt georganiseerd. Datamanagement: Het bijhouden van je geregistreerde informatie om zo steeds verder je database op te bouwen. 7.3 Voordelen bestaande gegevens: Prijs en snelheid: data die al bestaat is naar verhouding goedkoop en snel verkrijgbaar (mits ze vrij toegankelijk zijn) Non-reactiviteit: de data zijn niet beïnvloed door de activiteiten van een onderzoeker, ze zijn in beginsel non-reactief verzameld Toegankelijkheid: ontoegankelijke data, kan vaak toch worden ontsloten. Mogelijkheden voor longitudinaal onderzoek: data wordt vaak al jarenlang verzameld en is geschikt voor een trendonderzoek. Er wordt dan onderzoek gedaan naar de ontwikkelingen in bijvoorbeeld werkloosheid, gezondheid etc. Omvang databestanden: vaak kan gebruik worden gemaakt van grote hoeveelheden data 7.4 Praktijk data (bestaande data) is lang niet altijd geschikt als onderzoeksdata. Om vast te stellen of deze gegevens toegankelijk zijn moet je rekening houden met: Principiële ontoegankelijkheid: o Privacygevoeligheid: gegevens die niet openbaar mogen worden gemaakt, wegens privacyredenen. Dit zijn gegevens die te maken hebben met de persoonlijke levenssfeer van personen zoals registers van sociale diensten o Officiële toestemming nodig: vele gegevens zijn juridisch afgeschermd, en mogen vanwege o.a. de privacybescherming pas na tal van procedures worden vrijgegeven. o Eisen zoals anonimisering van de gegevens: als formele toestemming is gevraagd worden vaak nog specifieke aanvullende eisen opgesteld zoals het anoniem houden van de onderzoeksgegevens. o Kosten: de principiële toegankelijkheid is ook in het geding als er eigendomsof auteursrechten verbonden zijn aan de benodigde gegevens of te gebruiken onderzoeksinstrumenten. Praktische toegankelijkheid: o Als de principiële toegankelijkheid is gewaarborgd moeten de gegevens volgens de praktische zijn of worden gemaakt o hierbij kunnen drie obstakels in de weg komen Spreidingsprobleem: benodigde gegevens komen weinig of verspreid voor en zijn dus moeilijk te bemachtigen Overdrachtsprobleem: soms kun je gegevens niet eenvoudig kopieren van de ene naar de ander pc. Conditieprobleem: gegevens kunnen ook nauwelijks of niet is staat zijn te kunnen worden gebruikt zonder ze ernstig te beschdigen, zoals oude scheepdocumenten. 7.5 Nagaan van de kwaliteit van de gevonden gegevens: Doel bij de verzameling van gegevens Wijze van dataverzameling o Kwaliteit van de invuller (in de invoering van de gegevens wel deskundig gebeurt?) o Standaardisatie en aard van de informatie (zijn de vragen wel van niveau etc.) o Verandering in wijze van dataverzamelen (heeft er een verandering plaatsgevonden in het dataverzamelen of gebruik van meetinstrumenten etc.) Definitieprobleem van de gegevens o de beschrijvingen van fenomenen waarop de gegevens zijn gebaseerd kunnen in de loop der tijd veranderd zijn en daardoor een vertekend beeld geven Hoofdstuk 8: 8.1 Een interview is de aangewezen methode om informatie te verkrijgen over wat iemand doet of denkt maar vooral ook waarom hij/zij dat doet of denkt. Het interview heeft enkele nadelen: De verkregen informatie is niet altijd betrouwbaar, omdat mensen zich niet altijd bewust zijn van hun eigen gedrag. Mensen hebben vaak een selectief geheugen, en vergeten daarom vaak belangrijke voorbeelden te geven. Vraag daarom zo min mogelijk naar indrukken en zo vele mogelijk naar feiten. Sociale wenselijkheid is ook een probleem. Mensen laten zich het liefst van hun goede kant zien en geven daarom vaak een antwoord waarmee ze een goede indruk kunnen maken. Door het creëren van een gunstige interviewsituatie en controlevragen kun je dit effect verkleinen. Non-respons is een ander nadeel van een interview. Je gaat uit van de medewerking van bepaalde mensen, maar omdat de ene te onderzoeken groep misschien minder meewerkt aan ene interview ontstaat er ene vertekend beeld. 8.2 Bij een interview moet je kiezen tussen mondeling of schriftelijk. de voor en nadelen zijn: Mondeling: voordelen Schriftelijk: nadelen minder voorbereiding veel voorbereiding geschikt voor open/ingewikkelde vragen ongeschikt voor open/ingewikkelde vragen veel vragen niet te veel vragen goede controle op invullen gene controle op invullen weinig onvolledige lijsten vele onvolledige lijsten relatief weinig non-respons veel non-respons Mondeling: nadelen Schriftelijk; voordeel duur (tijd,geld) goedkoop moeilijk te organiseren makkelijke te organiseren niet anoniem anoniem gevoelig voor sociale wenselijkheid ongevoelig voor sociale wenselijkheid 8.3 Specifieke vormen van interviewen: Interviewen Voordelen Nadelen Groepsgewijs minder tijd lokt uit tot overleg meer respondenten minder non-respons controle op volledig invullen Telefonisch goede routing (niet van toepassing ongeschikt bij lange ingewikkelde = ander onderwerp) lijsten meer respondenten van tevoren brief sturen minder sociale wenselijkheid minder tijd snelle verwerking resultaten Elektronisch goede routing ongeschikt bij lange ingewikkelde lijsten meer respondenten anonimiteit goed te waarborgen minder sociale wenselijkheid minder tijd snelle verwerking resultaten 8.4 Een gestructureerde vragenlijst bestaat grotendeels uit gesloten vragen. Hierbij liggen de antwoordmogelijkheden vast. Bij open vragen is dit niet het geval. Als je onvoldoende voorkennis over het onderwerp hebt, moet je eerst open interviews houden. Als de 1e vraag een open vraag is, kan de respondent zich voorbereiden op de rest van de vragen, als de laatste vraag open is, kan hij zelf nog wat toevoegen wat hij gemist heeft. Het verwerken van open vragen kost veel tijd, en deze vragen kun je dna ook maar beter vermijden. 8.5 Formulering van de vragen: Vragen moeten duidelijk en slechts voor 1 uitleg vatbaar zijn o dus niet: hoe belangrijk vind u goede informatie betreffende de aanschaf van een pc? Behandel 1 onderwerp tegelijk o dus niet: hoe is het contact met uw collega's en uw chef? Gebruik geen ingewikkelde taal o gebruik korte zinnen o gebruik geen bijzinnen o gebruik werkwoorden in de actieve vorm o gebruik liever geen ontkenningen o positief geformuleerde vragen, worden beter beantwoord dan negatief geformuleerde vragen Formuleer de vragen zo neutraal mogelijk o dus niet: Hoe vaak heeft u een meningsverschil met uw baas? Veronderstel niet zonder meer feiten als bekend o dus niet:bent u het eens met de regels omtrent ziekteverzuim die uw bedrijf hanteert? 8.6 Formulering van antwoordmogelijkheden nominale gegevens: o uitputtende antwoordmogelijkheden (alle mogelijkheden moeten bekend zijn) en evt. als laatste antwoord een open antwoord mogelijkheid o antwoordcategorieën moeten elkaar aansluiten: je moet rekening houden met het geval dat er meerdere antwoorden op een vraag mogelijk zijn. Dit doe je door aparte vragen te stellen of aan te geven dat meerdere antwoorden mogelijk zijn. ordinale, interval- en ratiogegevens: o gebruik van antwoordschalen (meer of minder) het aantal is afhankelijk van de complexiteit van de vraag oven of oneven aantal bepaald of je iemand tot een mening wil dwingen (even aantal) of ook de mogelijkheid geeft neutraal te blijven (oneven aantal) "weet niet" of "geen mening" is alleen van toepassing als antwoordschaal als het ook echt mogelijk is om het niet te weten of gene mening te hebben. streven naar een logische volgorde van de antwoordschalen 8.7 Opzetten van een vragenlijst: Volgorde vragen: o Je begint met sociale en demografische gegevens o Je zorgt dat de moeilijke onderwerpen niet helemaal aan het begin of helmaal aan het eind zitten. Afnemen vragenlijst: o Als je ene nieuw onderwerp begint moet je dat aankondigen o Let op dat antwoorden, geen vragen verderop kunnen beïnvloeden o Breng afwisseling aan in de lijst o geef bij de afsluiting ruimte voor extra opmerkingen Hoofdstuk 9: 9.1 Voor- en Nadelen van observeren: Voordeel: o Je kunt feitelijk gedrag vaststellen Nadeel: o Kost vaak veel tijd o Mensen gedragen zich anders als ze weten dat ze geobserveerd worden o Sporadisch gedrag is moeilijk te observeren o Achterliggende motieven voor gedrag kunnen niet worden achterhaald o Van tevoren moet worden vastgesteld wat moet worden geobserveerd 9.2 Wat observeren? Je moet duidelijk aangeven wat je wil gaan observeren, en centrale begrippen goed operationaliseren en definiëren zodat het doel duidelijk word. Vervolgens ontwikkel je een categorieënsysteem, op grond van de waarnemingen die je registreert. Hierbij kun je letten op frequentie, duur en intensiteit of overige categorieën. o Frequentie: hoe vaak komt iets voor? we noemen dit "event-sampling" met als event het te onderzoeken gedrag. bij gedrag dat veel voorkomt kun je intervalcodering toepassen je meet elke keer in ene bepaalde tijdsperiode of er dan de gehele tijd een te meten event plaatsvindt (let dit kind de komende 10 seconde op in de les?) of je doet een puntmeting waarbij je om de zoveel tijd kijkt of er op een bepaald moment een event plaatsvindt (let dit kind nu en over 20 seconde en over 40 seconde op in de les?) of je gebruikt een time-sampling methode waarbij je gedurende tijdsinterval 1 het 1e kind, tijdens tijdsinterval 2 het 2e kind etc. bestudeerd. je trekt als het ware steekproeven (daarvan het woord sampling) o Duur: hoe lang duurt het gedrag wat je aan het observeren bent? je meet dan bijvoorbeeld hoe lang achter elkaar meisjes en jongens hun aandahct bij de les kunnen houden o Intensiteit: hoe erg/sterk/veel is iets? je kunt bijvoorbeeld de snelheid meten waarmee verkeersdeelnemers op een rotonde komen afgescheurd. o Overig: andere dingen zoals automerk, leeftijd en dergelijke wil je natuurlijk ook observeren. Als je gaat schatten naar bijvoorbeeld de leeftijd, heeft dit een rating. Hoe observeren? Nu je weet wat je gaat observeren, kijk je hoe je dat gaat doen o Het onderzoeksobject(en) moet via van tevoren vastgestelde criteria worden geselecteerd. o Er moet op verschillende tijdstippen worden geobserveerd o Bij veel onderzoeken is het gebruik van videocamera's het handigst (deze moeten we verdekt worden opgesteld en je moet het blikveld goed bepalen zodat je geen gedrag kunt "missen") o Je kunt meerdere observatoren laten beoordelen (intercodeursbetrouwbaarheid) o Bij snelheidsmeting e.d. kun je ook gebruik maken van meetapparatuur. o Bij schattingen die je doet kun je gebruik maken van een rating-scale. Als je de leeftijd wil weten, stel je een rating-scale op waarbij de observator ene schatting moet maken van de leeftijd in jaren probleem: ratings doen een beroep op het inschattingvermogen van de beoordelaar. Er kunnen contextinvloeden optreden, zoals het bepalen van de leeftijd van de bestuurder aan de hand van de auto waarin hij/zijn rijdt. Ratings doen af aan de betrouwbaarheid van de meting 9.3 Hoe registreer je observaties? Het is belangrijk dat je observaties zo snel mogelijk vastlegt o Direct invullen op een observatieformulier (van te voren goed uittesten) o Gebruik maken van een memorecorder 9.4 Betrouwbaarheid van observaties interobservatorbetrouwbaarheid (meerdere beoordelaars) o berekenen overeenstemmingpercentage bijvoorbeeld 9 van de 10 keer overeenstemming 9/10 * 100 = 90% overeenstemming rekenkundig gezien is kans op overeenstemming 50% dus houd er rekening mee dat niet alles zo hoog is als het lijkt o Cohens Kappa: K = (P0 – Pc) / (1 – Pc) Pc is proportie overeenstemming op basis van kans (ja observator 1 * ja observator 2 + nee observator 1 * nee observator 2)/ totaal^(aantal observators) P0 is het overeenstemmingpercentage o bij gegevens van ene hoger meetniveau (zoals leeftijd) kun je beter als overeenstemmingmaat de correlatiecoëfficiënt uitrekenen (meer daarover in hoofdstuk 11). 9.5 Validiteit van observaties Nadat je bent nagegaan of de observaties betrouwbaar zijn, kun je nagaan of ze valide zijn. Bij zoiets simpels als wel of niet stoppen bij een rotonde hoeft dit niet, dan spreken de betrouwbare gegevens voor zich. Bij observatie sis daarom de validiteit meestal minder in t geding. als het om bijvoorbeeld gedragingen als agressie gaat is het wel belangrijk vast te stellen of je gemeten hebt wat je beoogde te meten. Gegevens uit interviews worden vak gebruikt om observatiemetingen te valideren Hoofdstuk 10: 10.1 Datamatrix en coderen SPSS: Superior Package for Statistical Services Een datamatrix is een gegevensbestand in de vorm van tabellen, waarin je overzichtelijk je data in kunt verwerken. Codeerschema: een schema waarin je elke vraag en variabele van een code voorziet en deze helemaal uitschrijft (als een soort legenda voor je dataverwerking) Identificatienummer: nummer dat correspondeert met de gegevens van een bepaald persoon, staat in de eerste kolom van een datamatrix zodat je makkelijk kunt controleren of je alle gegevens van een persoon hebt en of de gegevens kloppen Ontbrekende gegevens: zorg dat het systeem dit invult als een ‘missing value’ door het zetten van een spatie. Het systeem SPSS zal daar dan zelf een komma van maken. Meerdere antwoorden mogelijk: Het is heel lastig is om alle mogelijke antwoordcombinaties een code te geven. Het is makkelijker om van alle mogelijke antwoordalternatieven een aparte variabele te maken. Voor niet van toepassing kun je een apart code gebruiken 10.2 Hercoderen van gegevens: Hercoderen betekend dat je de antwoorden van een onderzochte vraag achteraf anders/opnieuw gaat coderen. Dit is noodzakelijk als je een totaalscore of index wilt berekenen, omdat het dan de bedoeling is dat alle variabelen die je daarbij betrekt in dezelfde richting schalen. Dit heeft meestal te maken met een positieve of negatieve stelling van bepaalde deelvragen, waardoor de schaalberekening moet worden omgekeerd bij sommige vragen. 10.3 Controle op kwaliteit van de gegevens Nadat de gegevns zijn verzameld wordt er een frequentieberekening uitgevoerd o (hoeveel mannen, hoevele vrouwen, hoe vaak antwoord 1 hoe vaak antwoord 2 etc.) o dit is tevens om te controleren of je codeer of typefouten hebt gemaakt Voor je categorische variabelen (variabele met een beperkt aantal waarden), moet je nagaan of elke mogelijke categorie ook wel echt voorkomt in je steekproef. Mocht een waarde slechts zeer gering aanwezig zijn, dan heb je niet genoeg vergelijkingsmateriaal en zou je over kunnen gaan tot het buiten beschouwing laten van deze categorie. Voor je niet categorische variabelen (variabelen die een groot aantal waarden hebben zoals leeftijd en werkstress) moet je controleren of er spreiding is en hoe de verdeling van de waarden is. Dit kun je nagaan met het maken van een histogram Bij een normaalverdeling (zoals bij leeftijd) moet je frequentiegrafiek klokvormig zijn Als er geen normale verdeling is (zoals bij ziekteverzuim, waar de extreme waarden 0 is) krijg je een scheve verdeling, en kun je overwegen om categorieën van verschillende waarden te maken. 10.4 Controle op de homogeniteit van schalen: Als je scores van meerdere items bij elkaar op gaat tellen, moet je eerst nagaan of dit wel mogelijk en verantwoord is. Je mag ze namelijk alleen maar bij elkaar optellen als ze min of meer hetzelfde zijn en de schaal dus homogeen is. o homogeniteit kun je berekenen met itemanalyse o homogeniteit wordt berekend en uitgedrukt in Cronbachs Alpha en kan variëren van niet homogeen (0) tot homogeen (1,00) Hoofdstuk 11: 11.1 Bij de keuze van statistische techniek vormt de onderzoeksvraag het uitgangspunt. Globaal zijn er drie soorten onderzoeksvragen te onderscheiden: Vragen waarbij gaat om hoe vaak of in welke mate iets voorkomt (frequentie) Vragen waarbij jet gaat om verschillen Vragen waarbij het gaat om samenhang Welke statistische techniek je kunt gebruiken is vervolgens afhankelijk van de aard van de gegevens die je verzameld hebt. Welke techniek je gebruikt is afhankelijk van het meetniveau van je gegevens. Verder is het voor je analyse van belang om vast te stellen of het om een steekproef of populatie gaat. Bij een steekproef moet je nagaan of de gemeten verschillen, frequenties of samenhang van het toeval afhankelijk zijn, om te weten of je je gegevens mag generaliseren voor een hele populatie. Tot slot is het aantal onderzoekseenheden waarvan je gegevens hebt verzameld van belang. Het spreekt voor zich dat de toevalskans, en daarmee de foutenmarge groter is bij ene kleine steekproef. Er zijn speciale non-parametrische statische technieken die je bij kleine steekproeven (kleiner dan 25 eenheden) kunt gebruiken. Deze technieken zijn ook goed bruikbaar wanneer je met ordinale gegevens moet werken. deze technieken maken alleen gebruik van een hogere of lagere score dan een andere score. Vaak wordt daarbij met rangorde gewerkt. Bij parametrische technieken wordt tevens gebruik gemaakt van hoeveel de score hoger of lager is dan een andere score. 11.2.1 Bij een populatie is tellen de aangewezen procedure bij nominale gegevens zoals geslacht en bij ordinale gegevens zoals opleidingsniveau. Percentages kun je gebruiken om het geheel overzichtelijker te maken. Om deze percentages te presenteren kun je gebruik maken van: o een sectordiagram (ookwel piechart) o een staafdiagram Bij interval- of ratiogegevens met veel waarden (zoals leeftijd) is het handig om een histogram te maken die de opbouw van verschillende waarden goed illustreert. 11.2.2 Gemiddelde, mediaan, variantie en standaarddeviatie; Het gemiddelde is de som van alle gevonden waarden gedeeld door het aantal eenheden o μ is het teken voor het gemiddelde bij populatie statistieken o M is het teken voor het gemiddelde bij steekproeven De modus is de waarde die het meeste voorkomt De mediaan is middelste waarde, wanneer alle waarden zijn gerangschikt van laag naar hoog De standaardafwijking/standaarddeviatie is de gemiddelde afwijking tot het gemiddelde. Het is de wortel uit de variantie. een kleine standaarddeviatie geeft dus een kleine spreiding aan. o σ is het teken voor de standaarddeviatie bij populatie statistieken o s is het teken voor de standaarddeviatie bij steekproeven De variantie ( σ^2) is de meest gebruikt spreidingsmaat, hij geeft aan hoe de gevonden waarden rond het gemiddelde liggen, hoe kleiner de variantie is hoe dichterbij het gemiddelde de meeste waarden liggen Normaalverdeling: 2/3 van de gevonden waarden liggen tussen de μ+ σ en μ- σ 95% van de gevonden waarden liggen tussen μ+2 σ en μ- 2σ 11.2.3 Bij nominale en ordinale gegevens in ene steekproef kunnen tellingen worden toegepast en frequenties worden berekend. Er is bij gebruik van een steekproef altijd sprake van een foutenmarge op basis van toeval. Die schattingsmarge wordt de schattingfout genoemd. deze fout is kleiner naarmate de steekproef groter wordt. formule voor berekenen schattingsfout bij nominale gegevens o Schattingsfout van proporties (Qp) = wortel van ((p * q)/n) o p = % tevreden, goed of anders o q = 100-p o n = aantal steekproefelementen 11.2.4 Als het om schattingen gaat wordt er bij elk teken voor gemiddelde, standaarddeviatie etc. een dakje op het teken gezet. 11.3 en 11.4 De statistische toetstechnieken: Chi-kwadraat: het meetniveau van de variabelen moet bestaan uit nominalesplitsingsof testvariabelen Fishers exact test: er moeten 2 dichotome variabelen zijn Mann-Whitney U test: heeft minimaal een variabele van tenminste ordinaal niveau nodig Kolmogorov-Smirnov test: heeft minimaal een variabele van tenminste ordinaal niveau nodig Wilcoxon Matched-pairs test: het moeten afhankelijke steekproeven zijn T-test is om verschillen te toetsen tussen 2 groepen op een afhankelijke of testvariabele die op ratio- of intervalniveau is gemeten Variatieanalyse: variabelen in verschillende populaties de df: Betekent degrees of freedom of te wel vrijheidsgraden Het is het aantal kolommen – 1 * het aantal rijen – 1 dus df=(r-1)(k-1) Eenzijdige en tweezijdige toetsing: Wanneer je verschillen of samenhangen toetst en al een verwachting hebt, is er sprake van eenzijdige toetsing; Als je niet bij voorbaat bepaalde verwachtingen hebt, is er sprake van tweezijdig toetsen. Je gebruikt een rangordecorrelatie om de samenhang te berekenen als je de samenhang wilt nagaan tussen 2 variabelen die beide minstens op ordinaal niveau gemeten zijn. Je gebruikt de Pearson-productmomentcorrelatie als je de samenhang wilt bepalen tussen 2 variabelen die op interval- of rationiveau gemeten zijn. Hoofdstuk 12 12.1 Het uiteindelijke resultaat van je onderzoek ontstaat tijdens het schrijven. We raden je aan daar de nodige tijd en aandacht aan te besteden. Het is aan te bevelen verschillende versies van je onderzoeksrapport te maken als je verschillende doelgroepen van lezers op het oog hebt. Sluit deze versies aan op de voorkennis die je hebt van deze groepen. Voor de planning is het goed een gedetailleerde inhoudsopgave te maken en eventueel een aangeklede inhoudsopgave (waar instaat wat in welk hoofdstuk bij welke paragraaf moet komen). Aan de hand daarvan kun je een tijdspad opstellen voor het schrijven van een onderzoeksrapport. Plan ook tijd in voor het laten nakijken en lezen door anderen. Het is gebruikelijk een kleine samenvatting van het onderzoek naar de mensen te sturen die eraan hebben meegedaan. o Onderstreep in elke alinea of paragraaf de kernzin/kernbegrip en zet deze bij elkaar. Maak er een vloeiend lopende tekst van. o Respondentbederf treed op als respondenten door slechte ervaringen met voorgaande onderzoeken (zoals het niet krijgen van een samenvatting, terwijl dit wel beloofd werd) niet meer willen meedoen aan ene volgend onderzoek. 12.2 Een rapportage hoeft niet altijd een schriftelijk verslag te zijn. Er kan ook gebruik gemaakt worden van een ander medium zoals een dvd of powerpoint presentatie. Maak van tevoren een materiële begroting voor de verspreiding van het rapport. 12.3 Een vaste standaardindeling: Samenvatting Inhoudsopgave Voorwoord 1. Inleiding 2. Inhoudelijke oriëntatie (Literatuurverkenning) 3. 4. 5. 6. 7. 8. Onderzoeksvraag en definiëring begrippen Theorie en hypothesen Opzet en uitvoering onderzoek Resultaten Conclusie en discussie Evaluatie o productevaluatie bij evaluatie van resultaten o procesevaluatie bij evaluatie van het proces waarin dit product tot stand is gekomen Literatuur Bijlagen