Definities 1. Centrummaten * modus/mean = waarde met de hoogste frequentie (de meest typische waarde, de waarde die meest voorkomt) * mediaan = middenpunt bij een chronologische volgorde = Q2 * Kwartielen (Q1 = 25% en Q3 = 75%) = gaat uit van de mediaan 1 2 10 11 3 4 5 Q1 6 Q2 7 8 9 Q3 * Rekenkundig gemiddelde 2. Spreidingsmaten * Interkwartielafstand = Q3 – Q1 * variatiebreedte/range = verschil tussen de hoogste en de laagste waarde * variantie/variance/s² = hoe ver een waarneming van het gemiddelde ligt * standaardafwijking/std.dev./s = gemiddelde van de gemeten variantie Hoe meet je of er een verband is tussen variabelen? 1. Maak een hypothese - maak met de variabelen een nulhypothese “er is geen verschil in uitspraak/er is geen verschil in observaties/… - dit betekent dat je gaat testen dat er GEEN verband is tussen de variabelen/kenmerken - wanneer je de nulhypothese kan verwerpen = er is dus wel een verband tussen de variabelen - maak met de variabelen een alternatieve hypothese “er is wel een verschil” - dit betekent dat je gaat testen dat er WEL een verband is tussen de variabelen/kenmerken - de alternatieve hypothese geldt wanneer je de nulhypothese kan verwerpen Eva Van Meirhaeghe Statistiek 2015 UGent 2. Hoe test je de nulhypothese? - met de Chi²-toets of de correlatie-toets - meet deze uitkomst ook af aan de p-waarde * de p-waarde moet < 0.05 om te spreken van een significant verband tussen variabelen Wanneer de p-waarde < 0.05 betekent dit eigenlijk: - “er is minder dan 0.05 kans dat er geen verband (dit is dus een heel kleine kans dat er geen verband is, maw: er is een verband)” - “de kans dat in de steekproef dit verband voorkomt en het verband niet zou voorkomen in de populatie, is kleiner dan 5%” - “er is minder dan 5% kans dat de nulhypothese waar is (en dat het dus waar is dat er geen verband is)” * wanneer de p-waarde < 0.05 is verwerpen van de nulhypothese (de alternatieve hypothese geldt) 3. Waar vind ik deze testen in SPSS? - voor categorische variabelen: maak een kruistabel (descriptive statistics > crosstabs > cells > observed en expected > statistics “Chi²” (voor de sterkte van het verband (volgende titel): duidt hier ook Phi en Cramer aan) * op de rij (x-as): afhankelijke variabele * op de kolom (y-as): onafhankelijke variabele/oorzakelijke variabele * chi-waarde = value / p-waarde = asymp. Sig. - voor metrische variabelen: maak een nulpuntwolk (1) data > select cases > “if condition is satisfied” > “if” > selecteer de gehele verzameling van de deelverzamelingen die je test (“group”) > group “= 1” > continue (2) graphs > legacy dialogs > dot > y-as = onafh variabele, x-as = afh variabele (3) testen van het verband / correlate-test: analyse > correlate > variabelen invoeren * r-waarde = pearson correlate / p-waarde = sig 2-tailed - voor een combinatie van metrische en categorische variabelen: Analyse > compare means > independent samples T-test > de betrokken metrische variabele = test variabele / de betrokken categorische variabele = grouping variabele > define groups > groep 1 = 0, groep 2 = 1 > OK * p-waarde = sig 2 tailed = of er een verband is * je kijkt dan naar de mean-waarde: het verschil tussen waarde 1 en waarde 2 = ttoets = sterkte van het verband (zie volgende titel) Eva Van Meirhaeghe Statistiek 2015 UGent Hoe meet je de sterkte van zo een verband? Phi Cramer N-N, N-O 2x2 N-N, N-O rxk 0 = geen verband > 0 = hoe groter, hoe sterker het verband 0 = geen verband > 0 = hoe groter, hoe sterker het verband Kendall en Gamma O-O Correlate T-toets F-toets I-I, R-R, R-I Cat-Metr X-as (Cat): +2 0 = geen verband > 0 = hoe groter, hoe sterker het verband (+ / verband) 0 = geen verband <, > 0 = hoe groter, hoe sterker het verband (+ / - verband) (R > 0.50 = sterke correlatie) Cat-Metr X-as (Cat): 2 categ. Kijken naar de gemiddelden /mean Kijken naar de gemiddelden /mean 1. Voor categorische variabelen - N-N/N-O: Phi (2x2-tabel) en Cramer (rxk-tabel) toets - O-O: Kendall en Gamma toets - maak een kruistabel + vink de toetsen aan bij crosstabs-statistics - toets de uitkomst aan de p-waarde * value = uitkomst van de toets * Asymp. Sig = p-waarde kijken of p < 0.05 - ordinale variabelen: je kan testen welke richting het verband is: De value zal positief of negatief zijn 2. Voor metrische variabelen - I-I / R-R / R-I: correlatie-toets/r-waarde - maak een nulpuntwolk + “analyze > correlate > bivariate > variabels” * Pearson correlation value/r-waarde mag niet 0 zijn om een verband te hebben * toetsen aan de p-waarde = sig. 2 tailed - je test bij metrische variabelen ook de waarde van het verband: de r-waarde zal positief of negatief zijn - bv: r-waarde = 0.659 (=/=0) = er is een lineair verband p-waarde = 0.001 = < 0.05 = er is een verband er is een positief lineair verband Eva Van Meirhaeghe Statistiek 2015 UGent 3. Voor een combinatie van categorische en metrische variabelen - 2 categorieën op de x-as: T-toets - meer dan 2 categorieën op de x-as: F-toets - !!! “data” in SPSS moet op “All cases” staan - analyze > compare means > independent sample T-test > variabelen invullen en groep definiëren * p-waarde = sig. 2-tailed kijk hiernaar om te kijken of er een verband is * sterkte van het verband? - kijk naar de uitkomsten in “mean”: je krijgt 2 waarden: het verschil tussen deze 2 waarden is de uitkomst van de t-toets - bv: ESTIMATE 27 MEMORY 85 dit betekent dat de werkelijke waarde 85 is en de ingeschatte waarde 27 Er is dus een vrij groot verschil tussen deze waarden, een speling van bijna 60 Hoe schat je het hele onderzoek in? - er kunnen 4 problemen zijn die zich voor doen binnen statistische gegevens: 1. Interne validiteit = in welke mate toont de studie iets aan over de relatie tussen de variabelen? Zijn er alternatieve verklaringen aangereikt? 2. Externe validiteit = in welke mate is de steekproef representatief voor de populatie? Kan er een veralgemening gebeuren naar de populatie? 3. Construct validiteit = in welke mate meet je wat je beoogde te meten? Heb je je doelstelling wel gemeten (je onderzoeksvraag)? 4. Betrouwbaarheid = zijn de gebruikte gegevens betrouwbaar? Eva Van Meirhaeghe Statistiek 2015 UGent