Statistiek: Vergelijking Deel 1 en Deel 2 Beschrijvende statistiek

advertisement
Statistiek: Vergelijking Deel 1 en Deel 2
functies
Samenvattende
maten
Centrale
tendensmaten
Beschrijvende statistiek
(steekproef, empirie)
Inductieve statistiek
(populatie, theorie)
1 variabele
1 toevalsvariabele
Frequentiefunctie
- Kwalitatieve variabele
- Kwantitatieve variabele
Kansmassa- , dichtheids- , en cumulatieve
verdelingsfunctie
- Discrete toevalsvariabele
- Continue toevalsvariabele
-
centrale tendensmaten
spreidingsmaten
-
centrale tendensmaten
spreidingsmaten
Steekproefmodus
Elke waarde x waarvoor freq(x) max is
Populatiemodus
elke waarde x waarvoor (x) resp. οͺ(x) maximaal is
Steekrpoefmediaan:
Mex : Pc50 = D5 = Q2
Populatiemediaan
MeX*: Pc50*= D5*=Q2*
Rekenkundig gemiddelde
(steekproefgemiddelde):
𝑛
1
π‘₯Μ… =
∑ π‘₯𝑖
𝑛
Populatiegemiddelde/verwachte waarde:
(X of E  X  )
=
𝑖=1
Spreidingsmaten Bereik:
max(X) – min(X)
-
x discreet: πœ‡π‘₯ = ∑𝑗 π‘₯𝑗 πœ‹ (π‘₯𝑗 )
-
x continu: πœ‡π‘₯ = ∫− ∞ π‘₯πœ‘ (x) dx
+∞
Bereik:
max (X) - min (X)
Interkwartielbereik:
Q3 – Q1
Interkwartielbereik:
Q3 – Q1
steekproefvariantie:
s2x =
𝑛
1
∑(π‘₯𝑖 − π‘₯Μ… )
𝑛
populatievariantie:
  :
2
X
2
2
met E  X ο€­  x  οƒΉ ο€½ οƒ₯ ( x j ο€­  x ) 2  ( x j )


j
𝑖=1
steekproefstandaarddeviatie:
sx =
𝑛
1
√ ∑(π‘₯𝑖 − π‘₯Μ… )
𝑛
2
E  X ο€­ x  οƒΉ


populatiestandaarddeviatie:
 X  : X2
2
𝑖=1
Transformatie
van variabelen
(heeft iemand van jullie daar toevallig
een goed lijstje van? Ik was toen ziek
en die van studiebegeleiding zei dat er
in de les een lijstje van gemaakt was!)
1) Als Y= aX+b dan E[π‘Œ] = π‘Ž 𝐸 [𝑋] + 𝑏
2) Als Y= aX+ b dan πœŽπ‘¦2 = π‘Ž2 𝜎π‘₯2
2
3) πœ‡ πœ‰π‘₯ = 0 𝑒𝑛 πœŽπœ‰π‘₯
=1
functies
2 variabelen
2 toevalsvariabelen
frequentiefuncties
Bivariate kansmassa- , dichtheids- , en cumulatieve
verdelingsfunctie
-
2 Discrete toevalsvariabelen
*marginale kansmassafuncties (zijn univariate
kansmassafuncties!)
οƒ₯  x , y  ο€½ P  X ο€½ x  ο€½ 
X ,Y
j
j'
j
X
(x j )
j'
Enkel j’ varieert, we tellen op over Y waarden
οƒ₯ X ,Y  x j , y j '  ο€½ P Y ο€½ y j '  ο€½ Y (y j ' )
j
Enkel j varieert, we tellen op over X waarden
*conditionele kansmassafuncties:
Y| X ο€½ x (y ) ο€½
j
 X|Y ο€½y j ' (x ) ο€½
-
 X ,Y  x j , y 
 X (x j )
 X ,Y  x, y j ' 
Y (y j ' )
2 Continue toevalsvariabelen
*marginale dichtheidsfuncties
οͺx  x  ο€½
ymax

οͺ X ,Y  x, y  dy
ymin
οͺy y  ο€½
xmax

οͺ X ,Y  x, y  dx
xmin
*conditionele dichtheidsfuncties:
οͺ X ,Y  x j , y 
οͺY| x j y  ο€½
οͺX  x j 
οͺX|y
Samenvattende
maten
-
centrale tendensmaten
spreidingsmaten
-
j'
x ο€½
οͺX ,Y  x, y j ' 
οͺY y j ' 
centrale tendensmaten
spreidingsmaten
Centrale
tendensmaten
Conditionele
steekproefgemiddelde:
conditionele verwachte waarden of conditionele
populatiegemiddelden :

π’š|𝑿 = 𝒙𝒋
=
1
π‘“π‘Ÿπ‘’π‘žπ‘‹ (π‘₯𝑗 )
of E  X | Y ο€½ y j '  ; Y| X ο€½ x j of E Y | X ο€½ x j 
X|Y ο€½y j '
-
π‘š′
(X,Y) discreet
 X|Y ο€½y ο€½
∑ π‘“π‘Ÿπ‘’π‘žπ‘‹,π‘Œ (π‘₯𝑗 , 𝑦𝑗 ′ ) 𝑦𝑗 ′
j'
𝑗 ′ =1
οƒ₯x
j
 X|Y ο€½y (x j )
j'
 Y| X ο€½ x (y j ' )
j'
j
Y| X ο€½ x ο€½
π‘š′
j
= ∑ π‘π‘Œ|𝑋=π‘₯𝑗 (𝑦𝑗′ ) 𝑦𝑗′
οƒ₯y
j
j'
𝑗′=1
-
X,Y) continu
 X|Y ο€½y ο€½  x οͺ X|Y ο€½y (x ) dx
j'
Of analoog
j'
Y| X ο€½ x ο€½  y οͺY| X ο€½ x (y ) dy
j
Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…Μ…
π‘₯ 𝑙 π‘Œ = 𝑦𝑗′
Spreidings maten
conditionele steekproefvarianties:
=
conditionele populatievarianties:

π’”πŸπ’š|𝑿=𝒙𝒋
π’Ž′
𝟏
𝒇𝒓𝒆𝒒𝑿 (𝒙𝒋 )
∑ 𝒇𝒓𝒆𝒒𝑿,𝒀 (𝒙𝒋 , π’šπ’‹′ ) (π’šπ’‹′
j
2
X|Y ο€½y j '
-
(X,Y) discreet
j'
j
− π’š|𝑿 = 𝒙𝒋 )
j'
𝒇𝒓𝒆𝒒𝑿 (𝒙𝒋 )
j'

j

 X|Y ο€½y (x j )

 Y| X ο€½ x (y j ' )
2
 Y2| X ο€½ x ο€½ οƒ₯ y j ' ο€­ Y| X ο€½ x
j
=

 X2|Y ο€½y ο€½ οƒ₯ x j ο€­  X|Y ο€½y
𝒋′=𝟏
𝟐
𝟏

; Y2| X ο€½ x j
j'
2
j
π’Ž′
∑ 𝒇𝒓𝒆𝒒𝑿,𝒀 (𝒙𝒋 , π’šπ’‹′ ) π’šπ’‹′ 𝟐
𝒋′=𝟏
𝟐
− ( π’š|𝑿 = 𝒙𝒋 )
-
X,Y) continu
Y2| X ο€½ x j
OF
π’”πŸπ’š|𝑿=𝒙𝒋
π’Ž′
= ∑ 𝒑𝒀|𝑿=𝒙𝒋 (π’šπ’‹′ ) (π’šπ’‹′
𝒋′=𝟏
𝟐
− π’š|𝑿 = 𝒙𝒋 )
π’Ž′
= ∑ 𝒑𝒀|𝑿=𝒙𝒋 (π’šπ’‹′ ) π’šπ’‹′ 𝟐
𝒋′=𝟏
𝟐
− ( π’š|𝑿 = 𝒙𝒋 )

ο€½  y ο€­ 
 X2|Y ο€½y j ' ο€½  x ο€­ X|Y ο€½y j '
Y| X ο€½ x j


2
οͺ X|Y ο€½y j ' (x ) dx
2
οͺY| X ο€½ x j (y ) dy

Samenhangsof
associatiematen
A.Kwalitatieve variabele
Overeenstemmingsproportie
(wat X en Y hetzelfde hebben,
delen door n)
B.Kwantitatieve variabele
B.1 associatiematen
 steekproefcovariantie
π’”π’™π’š
𝑛
Populatiecovariantie:
 XY ο€½ E  X ο€­ X Y ο€­ Y 
1
= ∑ (π‘₯𝑖 − π‘₯ )(𝑦𝑖
𝑛
-
als (X,Y) discreet
E  X ο€­ X Y ο€­ Y  ο€½ οƒ₯  x j ο€­ X y j ' ο€­ Y   X ,Y (x j , y j ' )
𝑖=1
−𝑦)
j, j '
ο€½ οƒ₯οƒ₯  x j ο€­  X  y j ' ο€­ Y   X ,Y ( x j , y j ' )
j
-
als (X,Y) continu
E  X ο€­  X Y ο€­ Y  ο€½
j'
  x ο€­  y ο€­   οͺ
X
Y
 steekproefcorrelatie
Populatiecorrelatie:
π’“π’™π’š
1
= ∑ 𝑧π‘₯ (π‘₯𝑖 )𝑧𝑦 (𝑦𝑖 )
𝑛
 XY ο€½  
X
Y
𝑖
𝑠π‘₯𝑦
=
𝑠π‘₯ 𝑠𝑦
B.2 Optimale voorspelling
 Algemene optimale
voorspelling
𝑦𝑗𝑒𝑠𝑑 = 𝑓(π‘₯𝑗 )
 Optimale lineaire
voorsrpelling
𝑦𝑗𝑒𝑠𝑑 = 𝑏0 + 𝑏1 π‘₯𝑗
= (regressievergelijking)
Somvariabelen
1) π‘₯ + 𝑦 = π‘₯ + 𝑦
2
2) 𝑠π‘₯+𝑦
= 𝑠π‘₯2 + 𝑠𝑦2 + 2𝑠π‘₯𝑦
3) 𝑠π‘₯+𝑦 𝑧 = 𝑠π‘₯𝑧 + 𝑠𝑦𝑧
1)
2)
3)
 X Y ο€½  X  Y
 X2 Y ο€½  X2  Y2  2 XY
 X Y Z ο€½  XZ  YZ

οƒΉ
E οƒͺa0  οƒ₯ aj X j οƒΊ ο€½ a0  οƒ₯ aj E  X j 
j
j

4) 
 a20  aj X j ο€½ οƒ₯ a2j  X2 j  2 οƒ₯ aj aj ' X j X j '
οƒ₯
j
j, j '
jο€Όj'
5)
a 
0
6)
οƒ₯ aj X j
j
b0 
οƒ₯ bj ' Yj '
j'
ο€½
οƒ₯a b
j
j, j '
j'
X Y
j
j'
X ,Y
(x , y ) dx dy
Download