Statistiek: Vergelijking Deel 1 en Deel 2 Beschrijvende statistiek

advertisement
Statistiek: Vergelijking Deel 1 en Deel 2
functies
Samenvattende
maten
Centrale
tendensmaten
Beschrijvende statistiek
(steekproef, empirie)
Inductieve statistiek
(populatie, theorie)
1 variabele
1 toevalsvariabele
Frequentiefunctie
- Kwalitatieve variabele
- Kwantitatieve variabele
Kansmassa- , dichtheids- , en cumulatieve
verdelingsfunctie
- Discrete toevalsvariabele
- Continue toevalsvariabele
-
centrale tendensmaten
spreidingsmaten
-
centrale tendensmaten
spreidingsmaten
Steekproefmodus
Elke waarde x waarvoor freq(x) max is
Populatiemodus
elke waarde x waarvoor (x) resp. (x) maximaal is
Steekrpoefmediaan:
Mex : Pc50 = D5 = Q2
Populatiemediaan
MeX*: Pc50*= D5*=Q2*
Rekenkundig gemiddelde
(steekproefgemiddelde):
𝑛
1
𝑥̅ =
∑ 𝑥𝑖
𝑛
Populatiegemiddelde/verwachte waarde:
(X of E  X  )
=
𝑖=1
Spreidingsmaten Bereik:
max(X) – min(X)
-
x discreet: 𝜇𝑥 = ∑𝑗 𝑥𝑗 𝜋 (𝑥𝑗 )
-
x continu: 𝜇𝑥 = ∫− ∞ 𝑥𝜑 (x) dx
+∞
Bereik:
max (X) - min (X)
Interkwartielbereik:
Q3 – Q1
Interkwartielbereik:
Q3 – Q1
steekproefvariantie:
s2x =
𝑛
1
∑(𝑥𝑖 − 𝑥̅ )
𝑛
populatievariantie:
  :
2
X
2
2
met E  X   x     ( x j   x ) 2  ( x j )


j
𝑖=1
steekproefstandaarddeviatie:
sx =
𝑛
1
√ ∑(𝑥𝑖 − 𝑥̅ )
𝑛
2
E  X  x  


populatiestandaarddeviatie:
 X  : X2
2
𝑖=1
Transformatie
van variabelen
(heeft iemand van jullie daar toevallig
een goed lijstje van? Ik was toen ziek
en die van studiebegeleiding zei dat er
in de les een lijstje van gemaakt was!)
1) Als Y= aX+b dan E[𝑌] = 𝑎 𝐸 [𝑋] + 𝑏
2) Als Y= aX+ b dan 𝜎𝑦2 = 𝑎2 𝜎𝑥2
2
3) 𝜇 𝜉𝑥 = 0 𝑒𝑛 𝜎𝜉𝑥
=1
functies
2 variabelen
2 toevalsvariabelen
frequentiefuncties
Bivariate kansmassa- , dichtheids- , en cumulatieve
verdelingsfunctie
-
2 Discrete toevalsvariabelen
*marginale kansmassafuncties (zijn univariate
kansmassafuncties!)
  x , y   P  X  x   
X ,Y
j
j'
j
X
(x j )
j'
Enkel j’ varieert, we tellen op over Y waarden
 X ,Y  x j , y j '   P Y  y j '   Y (y j ' )
j
Enkel j varieert, we tellen op over X waarden
*conditionele kansmassafuncties:
Y| X  x (y ) 
j
 X|Y y j ' (x ) 
-
 X ,Y  x j , y 
 X (x j )
 X ,Y  x, y j ' 
Y (y j ' )
2 Continue toevalsvariabelen
*marginale dichtheidsfuncties
x  x  
ymax

 X ,Y  x, y  dy
ymin
y y  
xmax

 X ,Y  x, y  dx
xmin
*conditionele dichtheidsfuncties:
 X ,Y  x j , y 
Y| x j y  
X  x j 
X|y
Samenvattende
maten
-
centrale tendensmaten
spreidingsmaten
-
j'
x 
X ,Y  x, y j ' 
Y y j ' 
centrale tendensmaten
spreidingsmaten
Centrale
tendensmaten
Conditionele
steekproefgemiddelde:
conditionele verwachte waarden of conditionele
populatiegemiddelden :

𝒚|𝑿 = 𝒙𝒋
=
1
𝑓𝑟𝑒𝑞𝑋 (𝑥𝑗 )
of E  X | Y  y j '  ; Y| X  x j of E Y | X  x j 
X|Y y j '
-
𝑚′
(X,Y) discreet
 X|Y y 
∑ 𝑓𝑟𝑒𝑞𝑋,𝑌 (𝑥𝑗 , 𝑦𝑗 ′ ) 𝑦𝑗 ′
j'
𝑗 ′ =1
x
j
 X|Y y (x j )
j'
 Y| X  x (y j ' )
j'
j
Y| X  x 
𝑚′
j
= ∑ 𝑝𝑌|𝑋=𝑥𝑗 (𝑦𝑗′ ) 𝑦𝑗′
y
j
j'
𝑗′=1
-
X,Y) continu
 X|Y y   x  X|Y y (x ) dx
j'
Of analoog
j'
Y| X  x   y Y| X  x (y ) dy
j
̅̅̅̅̅̅̅̅̅̅̅̅̅̅
𝑥 𝑙 𝑌 = 𝑦𝑗′
Spreidings maten
conditionele steekproefvarianties:
=
conditionele populatievarianties:

𝒔𝟐𝒚|𝑿=𝒙𝒋
𝒎′
𝟏
𝒇𝒓𝒆𝒒𝑿 (𝒙𝒋 )
∑ 𝒇𝒓𝒆𝒒𝑿,𝒀 (𝒙𝒋 , 𝒚𝒋′ ) (𝒚𝒋′
j
2
X|Y y j '
-
(X,Y) discreet
j'
j
− 𝒚|𝑿 = 𝒙𝒋 )
j'
𝒇𝒓𝒆𝒒𝑿 (𝒙𝒋 )
j'

j

 X|Y y (x j )

 Y| X  x (y j ' )
2
 Y2| X  x   y j '  Y| X  x
j
=

 X2|Y y   x j   X|Y y
𝒋′=𝟏
𝟐
𝟏

; Y2| X  x j
j'
2
j
𝒎′
∑ 𝒇𝒓𝒆𝒒𝑿,𝒀 (𝒙𝒋 , 𝒚𝒋′ ) 𝒚𝒋′ 𝟐
𝒋′=𝟏
𝟐
− ( 𝒚|𝑿 = 𝒙𝒋 )
-
X,Y) continu
Y2| X  x j
OF
𝒔𝟐𝒚|𝑿=𝒙𝒋
𝒎′
= ∑ 𝒑𝒀|𝑿=𝒙𝒋 (𝒚𝒋′ ) (𝒚𝒋′
𝒋′=𝟏
𝟐
− 𝒚|𝑿 = 𝒙𝒋 )
𝒎′
= ∑ 𝒑𝒀|𝑿=𝒙𝒋 (𝒚𝒋′ ) 𝒚𝒋′ 𝟐
𝒋′=𝟏
𝟐
− ( 𝒚|𝑿 = 𝒙𝒋 )

  y  
 X2|Y y j '   x  X|Y y j '
Y| X  x j


2
 X|Y y j ' (x ) dx
2
Y| X  x j (y ) dy

Samenhangsof
associatiematen
A.Kwalitatieve variabele
Overeenstemmingsproportie
(wat X en Y hetzelfde hebben,
delen door n)
B.Kwantitatieve variabele
B.1 associatiematen
 steekproefcovariantie
𝒔𝒙𝒚
𝑛
Populatiecovariantie:
 XY  E  X  X Y  Y 
1
= ∑ (𝑥𝑖 − 𝑥 )(𝑦𝑖
𝑛
-
als (X,Y) discreet
E  X  X Y  Y     x j  X y j '  Y   X ,Y (x j , y j ' )
𝑖=1
−𝑦)
j, j '
   x j   X  y j '  Y   X ,Y ( x j , y j ' )
j
-
als (X,Y) continu
E  X   X Y  Y  
j'
  x   y    
X
Y
 steekproefcorrelatie
Populatiecorrelatie:
𝒓𝒙𝒚
1
= ∑ 𝑧𝑥 (𝑥𝑖 )𝑧𝑦 (𝑦𝑖 )
𝑛
 XY   
X
Y
𝑖
𝑠𝑥𝑦
=
𝑠𝑥 𝑠𝑦
B.2 Optimale voorspelling
 Algemene optimale
voorspelling
𝑦𝑗𝑒𝑠𝑡 = 𝑓(𝑥𝑗 )
 Optimale lineaire
voorsrpelling
𝑦𝑗𝑒𝑠𝑡 = 𝑏0 + 𝑏1 𝑥𝑗
= (regressievergelijking)
Somvariabelen
1) 𝑥 + 𝑦 = 𝑥 + 𝑦
2
2) 𝑠𝑥+𝑦
= 𝑠𝑥2 + 𝑠𝑦2 + 2𝑠𝑥𝑦
3) 𝑠𝑥+𝑦 𝑧 = 𝑠𝑥𝑧 + 𝑠𝑦𝑧
1)
2)
3)
 X Y   X  Y
 X2 Y   X2  Y2  2 XY
 X Y Z   XZ  YZ


E a0   aj X j   a0   aj E  X j 
j
j

4) 
 a20  aj X j   a2j  X2 j  2  aj aj ' X j X j '

j
j, j '
jj'
5)
a 
0
6)
 aj X j
j
b0 
 bj ' Yj '
j'

a b
j
j, j '
j'
X Y
j
j'
X ,Y
(x , y ) dx dy
Download