Definities Hoe meet je of er een verband is tussen

advertisement
Definities
1. Centrummaten
* modus/mean
= waarde met de hoogste frequentie (de meest typische waarde, de waarde die meest
voorkomt)
* mediaan
= middenpunt bij een chronologische volgorde
= Q2
* Kwartielen (Q1 = 25% en Q3 = 75%)
= gaat uit van de mediaan  1
2
10
11
3
4
5
Q1
6
Q2
7
8
9
Q3
* Rekenkundig gemiddelde
2. Spreidingsmaten
* Interkwartielafstand
= Q3 – Q1
* variatiebreedte/range
= verschil tussen de hoogste en de laagste waarde
* variantie/variance/s²
= hoe ver een waarneming van het gemiddelde ligt
* standaardafwijking/std.dev./s
= gemiddelde van de gemeten variantie
Hoe meet je of er een verband is tussen variabelen?
1. Maak een hypothese
- maak met de variabelen een nulhypothese  “er is geen verschil in uitspraak/er is geen
verschil in observaties/…
- dit betekent dat je gaat testen dat er GEEN verband is tussen de
variabelen/kenmerken
- wanneer je de nulhypothese kan verwerpen = er is dus wel een verband tussen de
variabelen
- maak met de variabelen een alternatieve hypothese  “er is wel een verschil”
- dit betekent dat je gaat testen dat er WEL een verband is tussen de variabelen/kenmerken
- de alternatieve hypothese geldt wanneer je de nulhypothese kan verwerpen
Eva Van Meirhaeghe
Statistiek 2015
UGent
2. Hoe test je de nulhypothese?
- met de Chi²-toets of de correlatie-toets
- meet deze uitkomst ook af aan de p-waarde
* de p-waarde moet < 0.05 om te spreken van een significant verband tussen
variabelen
Wanneer de p-waarde < 0.05 betekent dit eigenlijk:
- “er is minder dan 0.05 kans dat er geen verband (dit is dus een heel kleine kans dat
er geen verband is, maw: er is een verband)”
- “de kans dat in de steekproef dit verband voorkomt en het verband niet zou
voorkomen in de populatie, is kleiner dan 5%”
- “er is minder dan 5% kans dat de nulhypothese waar is (en dat het dus waar is dat
er geen verband is)”
* wanneer de p-waarde < 0.05 is  verwerpen van de nulhypothese (de alternatieve
hypothese geldt)
3. Waar vind ik deze testen in SPSS?
- voor categorische variabelen: maak een kruistabel
(descriptive statistics > crosstabs > cells >  observed en expected > statistics “Chi²” (voor de
sterkte van het verband (volgende titel): duidt hier ook Phi en Cramer aan)
* op de rij (x-as): afhankelijke variabele
* op de kolom (y-as): onafhankelijke variabele/oorzakelijke variabele
* chi-waarde = value / p-waarde = asymp. Sig.
- voor metrische variabelen: maak een nulpuntwolk
(1) data > select cases > “if condition is satisfied” >  “if” > selecteer de gehele verzameling
van de deelverzamelingen die je test (“group”) > group “= 1” > continue
(2) graphs > legacy dialogs > dot > y-as = onafh variabele, x-as = afh variabele
(3) testen van het verband / correlate-test: analyse > correlate > variabelen invoeren
* r-waarde = pearson correlate / p-waarde = sig 2-tailed
- voor een combinatie van metrische en categorische variabelen:
Analyse > compare means > independent samples T-test > de betrokken metrische variabele
= test variabele / de betrokken categorische variabele = grouping variabele > define groups >
groep 1 = 0, groep 2 = 1 > OK
* p-waarde = sig 2 tailed = of er een verband is
* je kijkt dan naar de mean-waarde: het verschil tussen waarde 1 en waarde 2 = ttoets = sterkte van het verband (zie volgende titel)
Eva Van Meirhaeghe
Statistiek 2015
UGent
Hoe meet je de sterkte van zo een verband?
Phi
Cramer
N-N, N-O
2x2
N-N, N-O
rxk
0 = geen
verband
> 0 = hoe
groter, hoe
sterker het
verband
0 = geen
verband
> 0 = hoe
groter, hoe
sterker het
verband
Kendall en
Gamma
O-O
Correlate
T-toets
F-toets
I-I, R-R, R-I
Cat-Metr
X-as (Cat): +2
0 = geen
verband
> 0 = hoe
groter, hoe
sterker het
verband
(+ / verband)
0 = geen
verband
<, > 0 = hoe
groter, hoe
sterker het
verband (+ /
- verband)
(R > 0.50 =
sterke
correlatie)
Cat-Metr
X-as (Cat): 2
categ.
Kijken naar de
gemiddelden
/mean
Kijken naar de
gemiddelden
/mean
1. Voor categorische variabelen
- N-N/N-O: Phi (2x2-tabel) en Cramer (rxk-tabel) toets
- O-O: Kendall en Gamma toets
- maak een kruistabel + vink de toetsen aan bij crosstabs-statistics
- toets de uitkomst aan de p-waarde
* value = uitkomst van de toets
* Asymp. Sig = p-waarde  kijken of p < 0.05
- ordinale variabelen: je kan testen welke richting het verband is:
De value zal positief of negatief zijn
2. Voor metrische variabelen
- I-I / R-R / R-I: correlatie-toets/r-waarde
- maak een nulpuntwolk + “analyze > correlate > bivariate > variabels”
* Pearson correlation value/r-waarde  mag niet 0 zijn om een verband te hebben
* toetsen aan de p-waarde = sig. 2 tailed
- je test bij metrische variabelen ook de waarde van het verband: de r-waarde zal positief of
negatief zijn
- bv:
r-waarde = 0.659 (=/=0) = er is een lineair verband
p-waarde = 0.001 = < 0.05 = er is een verband
 er is een positief lineair verband
Eva Van Meirhaeghe
Statistiek 2015
UGent
3. Voor een combinatie van categorische en metrische variabelen
- 2 categorieën op de x-as: T-toets
- meer dan 2 categorieën op de x-as: F-toets
- !!! “data” in SPSS moet op “All cases” staan
- analyze > compare means > independent sample T-test > variabelen invullen en groep
definiëren
* p-waarde = sig. 2-tailed  kijk hiernaar om te kijken of er een verband is
* sterkte van het verband?
- kijk naar de uitkomsten in “mean”: je krijgt 2 waarden: het verschil tussen deze 2
waarden is de uitkomst van de t-toets
- bv:
ESTIMATE
27
MEMORY
85
 dit betekent dat de werkelijke waarde 85 is en de
ingeschatte waarde 27
Er is dus een vrij groot verschil tussen deze waarden,
een speling van bijna 60
Hoe schat je het hele onderzoek in?
- er kunnen 4 problemen zijn die zich voor doen binnen statistische gegevens:
1. Interne validiteit
= in welke mate toont de studie iets aan over de relatie tussen de variabelen? Zijn er
alternatieve verklaringen aangereikt?
2. Externe validiteit
= in welke mate is de steekproef representatief voor de populatie? Kan er een
veralgemening gebeuren naar de populatie?
3. Construct validiteit
= in welke mate meet je wat je beoogde te meten? Heb je je doelstelling wel gemeten (je
onderzoeksvraag)?
4. Betrouwbaarheid
= zijn de gebruikte gegevens betrouwbaar?
Eva Van Meirhaeghe
Statistiek 2015
UGent
Download