Statistiek 1, theorie les 1

advertisement
Statistiek 2, theorie H10-12. Toetsen.
Inzichtelijk overzicht intervallen.
Een formule voor een interval heeft de volgende vorm (σ2=uitzondering):
schatting ± onzekerheidsmarge
onzekerheidsmarge= tabelwaarde * standaardfout(schatting)
Intervallen voor:
- Het gemiddelde μ met σ bekend.
- Het gemiddelde μ met σ=s geschat.
- De kans p
- De variantie σ2
- Interval voor het gemiddelde μ met σ bekend.
_
X ± z * σ/√n
z in onderste regel t-tabel
n die een maximale halflengte B van het interval garandeert.
z * 
n= (
)2
B
z in onderste regel t-tabel
- Interval voor het gemiddelde μ met σ=s geschat.
_
X ± t * s/√n
t in t-tabel met df=n-1
n= aantal waarnemingen in de steekproef
- Interval voor de kans p
p ± z * √[p * (1-p)/n]
p= aantal goeden in de steekproef/aantal waarnemingen in de steekproef
z in onderste regel t-tabel
n die een maximale halflengte B van het interval garandeert.
z * √p(1-p)
n= (
)2
B
- Interval voor variantie σ2:
(n-1) * s²
(n-1) * s²
< ² <
2df
2df
Ondergrens: rechterkant X2-tabel met df=n-1
Bovengrens: linkerkant X2-tabel met df=n-1
Toetsen met een interval.
Als H0 in het interval ligt
-> H0 niet verwerpen.
Als H0 niet in het interval ligt -> H0 wel verwerpen.
Voorbeeld: μ=10 en btbhi (9, 13) en de H0 wordt niet verworpen.
H0 ligt niet in het btbhi en wordt verworpen.
Voorbeeld: μ=10 en btbhi (6, 9) en de H0 wordt verworpen.
- Toets voor het gemiddelde μ met σ populatie.
H0: µ=c
H1: µc, <c, >c
_
X - μ0
z=
z ~ N(0, 1)
σ/√n
Rejection Region onderste regel t-tabel
p-value rechtszijdig: p(Z > z-waarde)
p-value linkszijdig: p(Z < z-waarde)
Als 2-zijdig: 2 * p(kleinste staart)
- Toets voor het gemiddelde μ met s steekproef.
H0: µ=c
H1: µc, <c, >c
_
X - μ0
t=
s/√n
Kritieke waarde in t-tabel met df=n-1
n= aantal waarnemingen in de steekproef
Voorwaarden t-verdeling:
- Random steekproef.
- Normaal verdeelde populatie.
Het verschil tussen 2 gemiddelden μ1 – μ2 met σ1 en σ2 bekend.
H0: μ1
=
μ2
H1: μ1 <, ≠, > μ2
_
_
(x1 - x2) – (μ1-μ2)=0
z =
KW z met onderste regel t-tabel
σ21
σ22
√(
+
)
n1
n2
- Toets voor de kans p
H0: p=c
H1: pc, <c, >c
p - p0
z=
√p0 * (1-p0)/n
p= aantal goeden in de steekproef/aantal waarnemingen in de steekproef
Kritieke waarde z in onderste regel t-tabel
Voorwaarden:
- onafhankelijke waarnemingen, constante kans.
- steekproef groot genoeg: n*p>5 en n*(1-p)>5 anders: binomiale verdeling.
Testen van ²
H0: ²=c
H1: ²c, <c, >c
(n-1) * s²
2=
c=H0
Linker grenswaarde: linkerkant X2-tabel met df= n-1
Rechter grenswaarde: rechterkant X2-tabel met df= n-1
Toetsen met toetsingsgrootheid in 9 stappen.
1. H0 en H1.
2. De toetsingsgrootheid.
3. Onder de H0 is de tg. een x-verdeling met x vrijheidsgraden.
4. Onder de H1 neigt de tg. naar grote en/of kleine waarden en dus rechtse
en/ of linkse Rejection Region.
5. Bepaal Rejection Region
6. Uitkomst toetsingsgrootheid wel/niet in Rejection Region.
7. H0 wel/niet verwerpen.
8. H1 wel/niet aangetoond.
9. Conclusie in woorden.
Toetsen met p-waarde en Statistische Significantie α.
Als de p-waarde < α -> H0 verwerpen.
Als de p-waarde > α -> H0 niet verwerpen.
Significantie α.
Uitgangspunt: H0 is waar.
α is de kans dat een ware H0 wordt verworpen.
Als een ware H0 wordt verworpen is Type-I fout.
α het liefst 0, maar in de praktijk meestal 0,05.
α=0,05 betekent maximaal 5% kans dat ware H0 wordt verworpen.
Kans op Type-I fout= p(H0 in Rejection Region)
Bereken α:
z=(Kritieke Waarde - µ0)/σX (=σX/√n)
Type-II fout.
Uitgangspunt: H1 is waar.
Het vermogen (power) is de kans dat een ware H1 wel wordt aangetoond.
Type-II fout β is de kans dat een ware H1 niet wordt aangetoond.
Type-II fout= 1 - power.
power het liefst 100%.
β=0,20 betekent 20% kans dat een ware H1 niet wordt aangetoond
en 80% power dat de ware H1 wel wordt aangetoond.
Type-II fout= p(H1 niet in Rejection Region)
Power=
p(H1 wel in Rejection Region)
Bereken Type-II fout/power:
z=(Kritieke Waarde - µ1)/σX
p-waarde.
Uitgangspunt: H0 is waar.
De p-waarde is de waarschijnlijkheid van een uitkomst
die zo extreem is, of nog extremer, als de H0 waar is.
p-waarde is oppervlakte in de staart.
Bereken p-waarde:
z=(Uitkomst - µ0)/σX
One-tailed meer power dan two-tailed.
Logica: Bij one-tailed weet je al in welke richting je moet zoeken
en dat verhoogt de kans dat je wat vindt.
α groter -> power groter= Type-II fout kleiner.
Logica: Als H0 makkelijk te verwerpen, H1 makkelijker aan te tonen.
Steekproef groter -> power groter.
Als steekproef groter wordt, beter beeld en worden foutkansen kleiner.
Verschil μ1 – μ0
Als verschil groter -> power groter.
Logica: een groot verschil tussen H1 en H0 is makkelijker aan te tonen.
H9. Steekproeven verdelingen.
_
Steekproevenverdeling van X.
Je doet een steekproef uit populatie waarvan gemiddelde  en  bekend zijn.
Het gemiddelde van de steekproef is niet bekend en de steekproevenverdeling
geeft de kansverdeling van de mogelijke uitkomsten van dat gemiddelde.
Steekproevenverdeling X heeft gemiddelde µ en Standard Error Mean= σX=σX/√n
Als n groter, verdeling normaler en de Standard Error Mean kleiner.
_
Rekenen met X.
gemiddelde steekproef – μ0
p(Z <
)
σX
Centrale limietstelling:
_
Als populatie normaal is kansverdeling X altijd normaal verdeeld.
Als n > 30 altijd normaal benaderen, ook als populatie niet normaal.
Steekproevenverdeling van p geeft mogelijke uitkomsten in de steekproef
(als p in de populatie bekend is).
Je verwacht dat p in de steekproef gelijk is aan p in de populatie: Ep= p
p*(1-p)
p*(1-p)
σ2p=
-> σp= √[
]
n
n
Rekenen met steekproevenverdeling van p.
Als H0: p= p0
p steekproef - p0
p(Z <
)
σp
Vuistregel: n*p0 > 5
en n*(1-p0)>5
Theorie Sign-Test.
Essentie: data wordt zo gemanipuleerd dat je kan testen
met binomiale verdeling met p=0,5
Voor Likertschaal.
Likertschaal: 1.Zeer oneens, 2.Oneens, 3.Neutraal, 4.Eens, 5.Zeer mee eens.
p- -> 1,2
pZERO=3
p+ -> 4,5
H0: p+ = pn= aantal personen (Neutraal niet meetellen)
X+= aantal 4,5
X+ binomiaal verdeeld met n en p=0,5
Normale benadering (als n≥10):
X+ - 0,5n
Z=
0,5√n
Voor mediaan.
H0: Mediaan= M0 (=getal)
n= aantal personen (scores precies M0 niet meetellen)
X+= aantal personen hoger dan mediaan
X+ binomiaal verdeeld met n en p=0,5
Normale benadering (als n≥10):
X+ - 0,5n
Z=
0,5√n
Download