Statistiek 2, theorie H10-12. Toetsen. Inzichtelijk overzicht intervallen. Een formule voor een interval heeft de volgende vorm (σ2=uitzondering): schatting ± onzekerheidsmarge onzekerheidsmarge= tabelwaarde * standaardfout(schatting) Intervallen voor: - Het gemiddelde μ met σ bekend. - Het gemiddelde μ met σ=s geschat. - De kans p - De variantie σ2 - Interval voor het gemiddelde μ met σ bekend. _ X ± z * σ/√n z in onderste regel t-tabel n die een maximale halflengte B van het interval garandeert. z * n= ( )2 B z in onderste regel t-tabel - Interval voor het gemiddelde μ met σ=s geschat. _ X ± t * s/√n t in t-tabel met df=n-1 n= aantal waarnemingen in de steekproef - Interval voor de kans p p ± z * √[p * (1-p)/n] p= aantal goeden in de steekproef/aantal waarnemingen in de steekproef z in onderste regel t-tabel n die een maximale halflengte B van het interval garandeert. z * √p(1-p) n= ( )2 B - Interval voor variantie σ2: (n-1) * s² (n-1) * s² < ² < 2df 2df Ondergrens: rechterkant X2-tabel met df=n-1 Bovengrens: linkerkant X2-tabel met df=n-1 Toetsen met een interval. Als H0 in het interval ligt -> H0 niet verwerpen. Als H0 niet in het interval ligt -> H0 wel verwerpen. Voorbeeld: μ=10 en btbhi (9, 13) en de H0 wordt niet verworpen. H0 ligt niet in het btbhi en wordt verworpen. Voorbeeld: μ=10 en btbhi (6, 9) en de H0 wordt verworpen. - Toets voor het gemiddelde μ met σ populatie. H0: µ=c H1: µc, <c, >c _ X - μ0 z= z ~ N(0, 1) σ/√n Rejection Region onderste regel t-tabel p-value rechtszijdig: p(Z > z-waarde) p-value linkszijdig: p(Z < z-waarde) Als 2-zijdig: 2 * p(kleinste staart) - Toets voor het gemiddelde μ met s steekproef. H0: µ=c H1: µc, <c, >c _ X - μ0 t= s/√n Kritieke waarde in t-tabel met df=n-1 n= aantal waarnemingen in de steekproef Voorwaarden t-verdeling: - Random steekproef. - Normaal verdeelde populatie. Het verschil tussen 2 gemiddelden μ1 – μ2 met σ1 en σ2 bekend. H0: μ1 = μ2 H1: μ1 <, ≠, > μ2 _ _ (x1 - x2) – (μ1-μ2)=0 z = KW z met onderste regel t-tabel σ21 σ22 √( + ) n1 n2 - Toets voor de kans p H0: p=c H1: pc, <c, >c p - p0 z= √p0 * (1-p0)/n p= aantal goeden in de steekproef/aantal waarnemingen in de steekproef Kritieke waarde z in onderste regel t-tabel Voorwaarden: - onafhankelijke waarnemingen, constante kans. - steekproef groot genoeg: n*p>5 en n*(1-p)>5 anders: binomiale verdeling. Testen van ² H0: ²=c H1: ²c, <c, >c (n-1) * s² 2= c=H0 Linker grenswaarde: linkerkant X2-tabel met df= n-1 Rechter grenswaarde: rechterkant X2-tabel met df= n-1 Toetsen met toetsingsgrootheid in 9 stappen. 1. H0 en H1. 2. De toetsingsgrootheid. 3. Onder de H0 is de tg. een x-verdeling met x vrijheidsgraden. 4. Onder de H1 neigt de tg. naar grote en/of kleine waarden en dus rechtse en/ of linkse Rejection Region. 5. Bepaal Rejection Region 6. Uitkomst toetsingsgrootheid wel/niet in Rejection Region. 7. H0 wel/niet verwerpen. 8. H1 wel/niet aangetoond. 9. Conclusie in woorden. Toetsen met p-waarde en Statistische Significantie α. Als de p-waarde < α -> H0 verwerpen. Als de p-waarde > α -> H0 niet verwerpen. Significantie α. Uitgangspunt: H0 is waar. α is de kans dat een ware H0 wordt verworpen. Als een ware H0 wordt verworpen is Type-I fout. α het liefst 0, maar in de praktijk meestal 0,05. α=0,05 betekent maximaal 5% kans dat ware H0 wordt verworpen. Kans op Type-I fout= p(H0 in Rejection Region) Bereken α: z=(Kritieke Waarde - µ0)/σX (=σX/√n) Type-II fout. Uitgangspunt: H1 is waar. Het vermogen (power) is de kans dat een ware H1 wel wordt aangetoond. Type-II fout β is de kans dat een ware H1 niet wordt aangetoond. Type-II fout= 1 - power. power het liefst 100%. β=0,20 betekent 20% kans dat een ware H1 niet wordt aangetoond en 80% power dat de ware H1 wel wordt aangetoond. Type-II fout= p(H1 niet in Rejection Region) Power= p(H1 wel in Rejection Region) Bereken Type-II fout/power: z=(Kritieke Waarde - µ1)/σX p-waarde. Uitgangspunt: H0 is waar. De p-waarde is de waarschijnlijkheid van een uitkomst die zo extreem is, of nog extremer, als de H0 waar is. p-waarde is oppervlakte in de staart. Bereken p-waarde: z=(Uitkomst - µ0)/σX One-tailed meer power dan two-tailed. Logica: Bij one-tailed weet je al in welke richting je moet zoeken en dat verhoogt de kans dat je wat vindt. α groter -> power groter= Type-II fout kleiner. Logica: Als H0 makkelijk te verwerpen, H1 makkelijker aan te tonen. Steekproef groter -> power groter. Als steekproef groter wordt, beter beeld en worden foutkansen kleiner. Verschil μ1 – μ0 Als verschil groter -> power groter. Logica: een groot verschil tussen H1 en H0 is makkelijker aan te tonen. H9. Steekproeven verdelingen. _ Steekproevenverdeling van X. Je doet een steekproef uit populatie waarvan gemiddelde en bekend zijn. Het gemiddelde van de steekproef is niet bekend en de steekproevenverdeling geeft de kansverdeling van de mogelijke uitkomsten van dat gemiddelde. Steekproevenverdeling X heeft gemiddelde µ en Standard Error Mean= σX=σX/√n Als n groter, verdeling normaler en de Standard Error Mean kleiner. _ Rekenen met X. gemiddelde steekproef – μ0 p(Z < ) σX Centrale limietstelling: _ Als populatie normaal is kansverdeling X altijd normaal verdeeld. Als n > 30 altijd normaal benaderen, ook als populatie niet normaal. Steekproevenverdeling van p geeft mogelijke uitkomsten in de steekproef (als p in de populatie bekend is). Je verwacht dat p in de steekproef gelijk is aan p in de populatie: Ep= p p*(1-p) p*(1-p) σ2p= -> σp= √[ ] n n Rekenen met steekproevenverdeling van p. Als H0: p= p0 p steekproef - p0 p(Z < ) σp Vuistregel: n*p0 > 5 en n*(1-p0)>5 Theorie Sign-Test. Essentie: data wordt zo gemanipuleerd dat je kan testen met binomiale verdeling met p=0,5 Voor Likertschaal. Likertschaal: 1.Zeer oneens, 2.Oneens, 3.Neutraal, 4.Eens, 5.Zeer mee eens. p- -> 1,2 pZERO=3 p+ -> 4,5 H0: p+ = pn= aantal personen (Neutraal niet meetellen) X+= aantal 4,5 X+ binomiaal verdeeld met n en p=0,5 Normale benadering (als n≥10): X+ - 0,5n Z= 0,5√n Voor mediaan. H0: Mediaan= M0 (=getal) n= aantal personen (scores precies M0 niet meetellen) X+= aantal personen hoger dan mediaan X+ binomiaal verdeeld met n en p=0,5 Normale benadering (als n≥10): X+ - 0,5n Z= 0,5√n