Formuleblad Statistiek Populatie en steekproef Gegeven een populatie met scores X1 , . . . , XN en gemiddelde µ, zijn variantie σ 2 en standaardafwijking σ van de populatie gedefinieerd als PN √ (Xi − µ)2 2 σ = i=1 σ = σ2 . N Gegeven een steekproef met scores X1 , . . . , Xn en gemiddelde X zijn variantie s2 en standaardafwijking s van de steekproef gedefinieerd als Pn √ (Xi − X)2 2 s = i=1 s = s2 . n−1 Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan is de standaardafwijking van de verdeling van het steekproefgemiddelde: σ σX = √ , n waarbij n de grootte van de steekproef is. Als de standaardafwijking van de populatie onbekend is, dan wordt voor de standaardafwijking van de verdeling van het steekproefgemiddelde genomen: s sX = √ . n Twee populaties en twee steekproeven Bij twee steekproeven X1 en X2 , waarbij X11 , . . . , X1n1 de scores van X1 en X21 , . . . , X2n2 de scores van steekproef X2 zijn, dan geldt voor de verdeling van het verschil tussen de twee steekproefgemiddeldes het volgende. Als de standaardafwijkingen van de bijbehorende populaties bekend en gelijk aan σ zijn, dan is de standaardafwijking van de verdeling van het verschil van de twee steekproefgemiddeldes: r 1 1 σX 1 −X 2 = σ 2 ( + ), n1 n2 waarbij n1 de grootte van steekproef X1 en n2 die van X2 is. Als de standaardafwijkingen van de populaties gelijk maar onbekend zijn en s1 is de standaardafwijking van steekproef X1 en s2 die van X2 , dan wordt voor de standaardafwijking van de verdeling van het verschil tussen de twee steekproefgemiddeldes genomen: r 1 1 sX 1 −X 2 = s2 ( + ), n1 n2 waarbij s2 is: Pn1 Pn2 2 2 s2 (n1 − 1) + s22 (n2 − 1) i=1 (X1i − X 1 ) + j=1 (X2j − X 2 ) 2 s = = 1 . n1 + n2 − 2 n1 + n2 − 2 1 Power Bij significantieniveau α, grootte van het effect ES en variantie σ 2 , is voor een toets met power (1 − β) een steekproefgrootte n= σ 2 (zβ − zα )2 (ES)2 nodig. Hierbij is zα de standaard kritische waarde bij significantieniveau α, en zβ de corresponderende standaard kritische waarde in de verdeling van Ha bij de gegeven grootte van het effect. Indien de variantie van de populatie onbekend is wordt die van de steekproef gebruikt: s2 (zβ − zα )2 n= (ES)2 Correlatie en regressie Gegeven twee stochasten X en Y , waarbij (Xi , Yi ) de score van element i is in een steekproef ter grootte n, is de Pearson correlatiecoëfficiënt: Pn P zX zY zX zY r= = i=1 i i . n−1 n−1 Waarbij zXi , zYi de standaarscores van Xi , Yi t.o.v. de steekproef zijn: zXi = Xi − X sX zYi = Yi − Y . sY Gebruikmakend van de notatie x = X − X: Pn P xi yi xy r = pP P = pPn i=12 Pn . 2 2 2 x y i=1 xi i=1 yi Ook geldt P P XY − X Y r= p P . P P P (n X 2 − ( X)2 )(n Y 2 − ( Y )2 ) n P In de regressielijn Ŷ = bX + a is de regressiecoëfficiënt b is gedefiniëerd als: b=r sY . sX waarbij sX en sY de standaardafwijking van respectievelijk X en Y zijn. De regressieconstante a is gedefiniëerd als: a = Y − bX. Wanneer zŶ de standaardscores van Ŷ en zX van X aanduiden, dan geldt dat zŶ = rzX . 2 De standaardfout van de schatting, sY ·X , is gedefiniëerd als de standaardafwijking van de stochast (Y − Ŷ ) bij n − 1 scores. D.w.z., voor Z = (Y − Ŷ ): s P p p (Z − Z)2 sY ·X = = sY 1 − r2 (n − 1)/(n − 2). n−2 Integreren In het volgende is c een constante ongelijk 0, n een geheel getal ongelijk 0 en ongelijk -1, en x een variabele. functie c primitieve 0 xn xn+1 n+1 c x c ln(x) ecx ecx c Verder geldt dat als F (x) en G(x) de primitieven van respectievelijk f (x) en g(x) zijn, dan is cF (x) de primitieve van cf (x) en F (x) + G(x) is de primitieve van f (x) + g(x). 3