Formuleblad Statistiek

advertisement
Formuleblad Statistiek
Populatie en steekproef
Gegeven een populatie met scores X1 , . . . , XN en gemiddelde µ, zijn variantie
σ 2 en standaardafwijking σ van de populatie gedefinieerd als
PN
√
(Xi − µ)2
2
σ = i=1
σ = σ2 .
N
Gegeven een steekproef met scores X1 , . . . , Xn en gemiddelde X zijn variantie
s2 en standaardafwijking s van de steekproef gedefinieerd als
Pn
√
(Xi − X)2
2
s = i=1
s = s2 .
n−1
Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan is de
standaardafwijking van de verdeling van het steekproefgemiddelde:
σ
σX = √ ,
n
waarbij n de grootte van de steekproef is. Als de standaardafwijking van de
populatie onbekend is, dan wordt voor de standaardafwijking van de verdeling
van het steekproefgemiddelde genomen:
s
sX = √ .
n
Twee populaties en twee steekproeven
Bij twee steekproeven X1 en X2 , waarbij X11 , . . . , X1n1 de scores van X1 en
X21 , . . . , X2n2 de scores van steekproef X2 zijn, dan geldt voor de verdeling
van het verschil tussen de twee steekproefgemiddeldes het volgende. Als de
standaardafwijkingen van de bijbehorende populaties bekend en gelijk aan σ
zijn, dan is de standaardafwijking van de verdeling van het verschil van de twee
steekproefgemiddeldes:
r
1
1
σX 1 −X 2 = σ 2 (
+
),
n1
n2
waarbij n1 de grootte van steekproef X1 en n2 die van X2 is. Als de standaardafwijkingen van de populaties gelijk maar onbekend zijn en s1 is de standaardafwijking van steekproef X1 en s2 die van X2 , dan wordt voor de standaardafwijking van de verdeling van het verschil tussen de twee steekproefgemiddeldes genomen:
r
1
1
sX 1 −X 2 = s2 (
+
),
n1
n2
waarbij s2 is:
Pn1
Pn2
2
2
s2 (n1 − 1) + s22 (n2 − 1)
i=1 (X1i − X 1 ) +
j=1 (X2j − X 2 )
2
s =
= 1
.
n1 + n2 − 2
n1 + n2 − 2
1
Power
Bij significantieniveau α, grootte van het effect ES en variantie σ 2 , is voor een
toets met power (1 − β) een steekproefgrootte
n=
σ 2 (zβ − zα )2
(ES)2
nodig. Hierbij is zα de standaard kritische waarde bij significantieniveau α, en
zβ de corresponderende standaard kritische waarde in de verdeling van Ha bij
de gegeven grootte van het effect.
Indien de variantie van de populatie onbekend is wordt die van de steekproef
gebruikt:
s2 (zβ − zα )2
n=
(ES)2
Correlatie en regressie
Gegeven twee stochasten X en Y , waarbij (Xi , Yi ) de score van element i is in
een steekproef ter grootte n, is de Pearson correlatiecoëfficiënt:
Pn
P
zX zY
zX zY
r=
= i=1 i i .
n−1
n−1
Waarbij zXi , zYi de standaarscores van Xi , Yi t.o.v. de steekproef zijn:
zXi =
Xi − X
sX
zYi =
Yi − Y
.
sY
Gebruikmakend van de notatie x = X − X:
Pn
P
xi yi
xy
r = pP P
= pPn i=12 Pn
.
2
2
2
x
y
i=1 xi
i=1 yi
Ook geldt
P P
XY − X Y
r= p P
.
P
P
P
(n X 2 − ( X)2 )(n Y 2 − ( Y )2 )
n
P
In de regressielijn Ŷ = bX + a is de regressiecoëfficiënt b is gedefiniëerd als:
b=r
sY
.
sX
waarbij sX en sY de standaardafwijking van respectievelijk X en Y zijn. De
regressieconstante a is gedefiniëerd als:
a = Y − bX.
Wanneer zŶ de standaardscores van Ŷ en zX van X aanduiden, dan geldt dat
zŶ = rzX .
2
De standaardfout van de schatting, sY ·X , is gedefiniëerd als de standaardafwijking
van de stochast (Y − Ŷ ) bij n − 1 scores. D.w.z., voor Z = (Y − Ŷ ):
s
P
p
p
(Z − Z)2
sY ·X =
= sY 1 − r2 (n − 1)/(n − 2).
n−2
Integreren
In het volgende is c een constante ongelijk 0, n een geheel getal ongelijk 0 en
ongelijk -1, en x een variabele.
functie
c
primitieve
0
xn
xn+1
n+1
c
x
c ln(x)
ecx
ecx
c
Verder geldt dat als F (x) en G(x) de primitieven van respectievelijk f (x) en
g(x) zijn, dan is cF (x) de primitieve van cf (x) en F (x) + G(x) is de primitieve
van f (x) + g(x).
3
Download