Kwaliteit van je data

advertisement
Baarde en de goede
Hoofdstuk 10:
Datapreparatie
Contact
Dit document is samengesteld door onderwijsbureau Bijles en Training. Wij zijn DE expert
op het gebied van bijlessen en trainingen in de exacte vakken, van VMBO tot universiteit.
Zowel voor individuele lessen op maat als voor doelgerichte groepstrainingen die je
voorbereiden op een toets of tentamen. Voor meer informatie kun je altijd contact met ons
opnemen
via onze website: http://www.wiskundebijlessen.nl
of via e-mail: marc\[email protected]
Disclaimer
Alle informatie in dit document is met de grootst mogelijke zorg samengesteld. Toch is het
niet uit te sluiten dat informatie niet juist, onvolledig en/of niet up-to-date is. Wij zijn hiervoor
niet aansprakelijk. Op geen enkele wijze kunnen rechten worden ontleend aan de in dit
document aangeboden informatie.
Auteursrecht
Op dit document berust auteursrecht. Het is niet toegestaan om dit document zonder
voorafgaande schriftelijke toestemming van de auteur te kopieren en/of te verspreiden in
welke vorm dan ook.
Verwerken gegevens
Codeboek = overzicht van mogelijke antwoorden per
vraag en de code die bij het antwoord hoort
Nr
Omschrijving
Variabele naam
Codes
1
Geslacht patient
Geslacht
1 vrouw
2 man
2
Leeftijd in jaren
Leeftijd
1, 2, 3, …
3
Woonplaats
Woonplaats
Kan pas na de enquete
gecodeerd worden !
4
Tevreden over studie
Tevredenstudie
1.
2.
3.
Ja
Nee
neutraal
Controleren kwaliteit data 1
Het controleren van de data zul je moeten doen met
behulp van een frequentietabel, histogram etc.
Aandachtspunten:
1. Komen er, door tikfouten, niet-toegestane codes voor
?
2. Zijn bepaalde codes niet of nauwelijks als antwoord
gekozen ? In dat geval is het niet zinnig deze codes bij
je analyse te gebruiken.
3. Is er bij numerieke variabelen voldoende spreiding
en wat is de verdeling ?
Controleren kwaliteit data 2
Controleren kwaliteit data 3
Homogeniteit 1
Vaak stel je meerdere vragen over hetzelfde
onderwerp. Deze vragen wil je in je
uiteindelijke analyse combineren.
MAG DAT ?
Om dat te weten te komen bereken je de
homogeniteit; meten deze vragen echt
hetzelfde ?
Homogeniteit gemeten door Cronbach’s
Alpha. Moet groter dan 0.7 zijn.
Homogeniteit 2
Wat als de homogeniteit te laag is ?
1.Gooi 1 vraag weg en kijk of de
homogeniteit daarmee verbeterd.
2.Probeer of je de vragen kunt verdelen in
een aantal groepjes die WEL hetzelfde
meten, en kijk of je daarmee dan
meerdere ‘deelvragen’ kunt
beantwoorden.
Homogeniteit 3
Hercoderen 1
Voor het bepalen van de homogeniteit moeten de
vragen wel ‘hetzelfde’ zijn. Dat betekent:
1. De vragen moeten evenveel antwoordcategorieen
bevatten
2. De antwoordcategorieen moeten ongeveer hetzelfde
betekenen
Hercoderen 2 voorbeeld
Hoe moeten de volgende twee
vragen over de informatievoorziening
bij een trammaatschappij worden
aangepast en / of gehercodeerd ?
De dienstregeling is onoverzichtelijk
Mee eens 0
0
0
0
0 Niet mee eens
De conducteurs zijn behulpzaam
0
Ja 0
Nee
Oefening
1. Controleer de variabelen op onmogelijke codes en
verdeling van waarnemingen. Verbeter waar nodig.
2. Hoe staan missing values in het bestand ? Hoe weet SPSS
wat de missing values zijn ?
3. Er zijn in totaal 5 variabelen die horen bij het begrip
psychische belasting en 5 variabelen die horen bij het
begrip betrokkenheid. Controleer voor iedere variabele of
deze voor de homogeniteitsanalyse gehercodeerd moet
worden.
Als je een variabele hercodeerd, maak dan een nieuwe
variabele aan, en geef de nieuwe variabele een naam,
variable label, value labels, en het juiste meetniveau.
4. Voer voor elk van de twee begrippen een
homogeniteitsanalyse uit. Onderzoek of het zinvol is om 1
of meer variabelen te verwijderen.
Download