Baarde en de goede Hoofdstuk 10: Datapreparatie Contact Dit document is samengesteld door onderwijsbureau Bijles en Training. Wij zijn DE expert op het gebied van bijlessen en trainingen in de exacte vakken, van VMBO tot universiteit. Zowel voor individuele lessen op maat als voor doelgerichte groepstrainingen die je voorbereiden op een toets of tentamen. Voor meer informatie kun je altijd contact met ons opnemen via onze website: http://www.wiskundebijlessen.nl of via e-mail: marc\[email protected] Disclaimer Alle informatie in dit document is met de grootst mogelijke zorg samengesteld. Toch is het niet uit te sluiten dat informatie niet juist, onvolledig en/of niet up-to-date is. Wij zijn hiervoor niet aansprakelijk. Op geen enkele wijze kunnen rechten worden ontleend aan de in dit document aangeboden informatie. Auteursrecht Op dit document berust auteursrecht. Het is niet toegestaan om dit document zonder voorafgaande schriftelijke toestemming van de auteur te kopieren en/of te verspreiden in welke vorm dan ook. Verwerken gegevens Codeboek = overzicht van mogelijke antwoorden per vraag en de code die bij het antwoord hoort Nr Omschrijving Variabele naam Codes 1 Geslacht patient Geslacht 1 vrouw 2 man 2 Leeftijd in jaren Leeftijd 1, 2, 3, … 3 Woonplaats Woonplaats Kan pas na de enquete gecodeerd worden ! 4 Tevreden over studie Tevredenstudie 1. 2. 3. Ja Nee neutraal Controleren kwaliteit data 1 Het controleren van de data zul je moeten doen met behulp van een frequentietabel, histogram etc. Aandachtspunten: 1. Komen er, door tikfouten, niet-toegestane codes voor ? 2. Zijn bepaalde codes niet of nauwelijks als antwoord gekozen ? In dat geval is het niet zinnig deze codes bij je analyse te gebruiken. 3. Is er bij numerieke variabelen voldoende spreiding en wat is de verdeling ? Controleren kwaliteit data 2 Controleren kwaliteit data 3 Homogeniteit 1 Vaak stel je meerdere vragen over hetzelfde onderwerp. Deze vragen wil je in je uiteindelijke analyse combineren. MAG DAT ? Om dat te weten te komen bereken je de homogeniteit; meten deze vragen echt hetzelfde ? Homogeniteit gemeten door Cronbach’s Alpha. Moet groter dan 0.7 zijn. Homogeniteit 2 Wat als de homogeniteit te laag is ? 1.Gooi 1 vraag weg en kijk of de homogeniteit daarmee verbeterd. 2.Probeer of je de vragen kunt verdelen in een aantal groepjes die WEL hetzelfde meten, en kijk of je daarmee dan meerdere ‘deelvragen’ kunt beantwoorden. Homogeniteit 3 Hercoderen 1 Voor het bepalen van de homogeniteit moeten de vragen wel ‘hetzelfde’ zijn. Dat betekent: 1. De vragen moeten evenveel antwoordcategorieen bevatten 2. De antwoordcategorieen moeten ongeveer hetzelfde betekenen Hercoderen 2 voorbeeld Hoe moeten de volgende twee vragen over de informatievoorziening bij een trammaatschappij worden aangepast en / of gehercodeerd ? De dienstregeling is onoverzichtelijk Mee eens 0 0 0 0 0 Niet mee eens De conducteurs zijn behulpzaam 0 Ja 0 Nee Oefening 1. Controleer de variabelen op onmogelijke codes en verdeling van waarnemingen. Verbeter waar nodig. 2. Hoe staan missing values in het bestand ? Hoe weet SPSS wat de missing values zijn ? 3. Er zijn in totaal 5 variabelen die horen bij het begrip psychische belasting en 5 variabelen die horen bij het begrip betrokkenheid. Controleer voor iedere variabele of deze voor de homogeniteitsanalyse gehercodeerd moet worden. Als je een variabele hercodeerd, maak dan een nieuwe variabele aan, en geef de nieuwe variabele een naam, variable label, value labels, en het juiste meetniveau. 4. Voer voor elk van de twee begrippen een homogeniteitsanalyse uit. Onderzoek of het zinvol is om 1 of meer variabelen te verwijderen.