Statistiek: Vergelijking Deel 1 en Deel 2 functies Samenvattende maten Centrale tendensmaten Beschrijvende statistiek (steekproef, empirie) Inductieve statistiek (populatie, theorie) 1 variabele 1 toevalsvariabele Frequentiefunctie - Kwalitatieve variabele - Kwantitatieve variabele Kansmassa- , dichtheids- , en cumulatieve verdelingsfunctie - Discrete toevalsvariabele - Continue toevalsvariabele - centrale tendensmaten spreidingsmaten - centrale tendensmaten spreidingsmaten Steekproefmodus Elke waarde x waarvoor freq(x) max is Populatiemodus elke waarde x waarvoor ď°(x) resp. ďŞ(x) maximaal is Steekrpoefmediaan: Mex : Pc50 = D5 = Q2 Populatiemediaan MeX*: Pc50*= D5*=Q2* Rekenkundig gemiddelde (steekproefgemiddelde): đ 1 đĽĚ = ∑ đĽđ đ Populatiegemiddelde/verwachte waarde: (ďX of E ď X ď ) = đ=1 Spreidingsmaten Bereik: max(X) – min(X) - x discreet: đđĽ = ∑đ đĽđ đ (đĽđ ) - x continu: đđĽ = ∫− ∞ đĽđ (x) dx +∞ Bereik: max (X) - min (X) Interkwartielbereik: Q3 – Q1 Interkwartielbereik: Q3 – Q1 steekproefvariantie: s2x = đ 1 ∑(đĽđ − đĽĚ ) đ populatievariantie: ď¨ďł ďŠ : 2 X 2 2 met E ďŠď¨ X ď ď x ďŠ ďš ď˝ ďĽ ( x j ď ď x ) 2 ď° ( x j ) ďŤ ďť j đ=1 steekproefstandaarddeviatie: sx = đ 1 √ ∑(đĽđ − đĽĚ ) đ 2 E ďŠď¨ X ď ďx ďŠ ďš ďŤ ďť populatiestandaarddeviatie: ď¨ďł X ďŠ : ďłX2 2 đ=1 Transformatie van variabelen (heeft iemand van jullie daar toevallig een goed lijstje van? Ik was toen ziek en die van studiebegeleiding zei dat er in de les een lijstje van gemaakt was!) 1) Als Y= aX+b dan E[đ] = đ đ¸ [đ] + đ 2) Als Y= aX+ b dan đđŚ2 = đ2 đđĽ2 2 3) đ đđĽ = 0 đđ đđđĽ =1 functies 2 variabelen 2 toevalsvariabelen frequentiefuncties Bivariate kansmassa- , dichtheids- , en cumulatieve verdelingsfunctie - 2 Discrete toevalsvariabelen *marginale kansmassafuncties (zijn univariate kansmassafuncties!) ďĽď° ď¨ x , y ďŠ ď˝ P ď¨ X ď˝ x ďŠ ď˝ ď° X ,Y j j' j X (x j ) j' Enkel j’ varieert, we tellen op over Y waarden ďĽď° X ,Y ď¨ x j , y j ' ďŠ ď˝ P ď¨Y ď˝ y j ' ďŠ ď˝ ď°Y (y j ' ) j Enkel j varieert, we tellen op over X waarden *conditionele kansmassafuncties: ď°Y| X ď˝ x (y ) ď˝ j ď° X|Y ď˝y j ' (x ) ď˝ - ď° X ,Y ď¨ x j , y ďŠ ď° X (x j ) ď° X ,Y ď¨ x, y j ' ďŠ ď°Y (y j ' ) 2 Continue toevalsvariabelen *marginale dichtheidsfuncties ďŞx ď¨ x ďŠ ď˝ ymax ď˛ ďŞ X ,Y ď¨ x, y ďŠ dy ymin ďŞy ď¨y ďŠ ď˝ xmax ď˛ ďŞ X ,Y ď¨ x, y ďŠ dx xmin *conditionele dichtheidsfuncties: ďŞ X ,Y ď¨ x j , y ďŠ ďŞY| x j ď¨y ďŠ ď˝ ďŞX ď¨ x j ďŠ ďŞX|y Samenvattende maten - centrale tendensmaten spreidingsmaten - j' ď¨xďŠ ď˝ ďŞX ,Y ď¨ x, y j ' ďŠ ďŞY ď¨y j ' ďŠ centrale tendensmaten spreidingsmaten Centrale tendensmaten Conditionele steekproefgemiddelde: conditionele verwachte waarden of conditionele populatiegemiddelden : ď¨ď đ|đż = đđ = 1 đđđđđ (đĽđ ) of E ďŠďŤ X | Y ď˝ y j ' ďšďť ; ďY| X ď˝ x j of E ďŠďŤY | X ď˝ x j ďšďť X|Y ď˝y j ' - đ′ (X,Y) discreet ď X|Y ď˝y ď˝ ∑ đđđđđ,đ (đĽđ , đŚđ ′ ) đŚđ ′ j' đ ′ =1 ďĽx j ď° X|Y ď˝y (x j ) j' ď° Y| X ď˝ x (y j ' ) j' j ďY| X ď˝ x ď˝ đ′ j = ∑ đđ|đ=đĽđ (đŚđ′ ) đŚđ′ ďĽy j j' đ′=1 - X,Y) continu ď X|Y ď˝y ď˝ ď˛ x ďŞ X|Y ď˝y (x ) dx j' Of analoog j' ďY| X ď˝ x ď˝ ď˛ y ďŞY| X ď˝ x (y ) dy j Ě Ě Ě Ě Ě Ě Ě Ě Ě Ě Ě Ě Ě Ě đĽ đ đ = đŚđ′ Spreidings maten conditionele steekproefvarianties: = conditionele populatievarianties: ď¨ďł đđđ|đż=đđ đ′ đ đđđđđż (đđ ) ∑ đđđđđż,đ (đđ , đđ′ ) (đđ′ j 2 X|Y ď˝y j ' - (X,Y) discreet j' j − đ|đż = đđ ) j' đđđđđż (đđ ) j' ď¨ j ďŠ ď° X|Y ď˝y (x j ) ďŠ ď° Y| X ď˝ x (y j ' ) 2 ďł Y2| X ď˝ x ď˝ ďĽ y j ' ď ďY| X ď˝ x j = ď¨ ďł X2|Y ď˝y ď˝ ďĽ x j ď ď X|Y ď˝y đ′=đ đ đ ďŠ ; ďłY2| X ď˝ x j j' 2 j đ′ ∑ đđđđđż,đ (đđ , đđ′ ) đđ′ đ đ′=đ đ − ( đ|đż = đđ ) - X,Y) continu ďłY2| X ď˝ x j OF đđđ|đż=đđ đ′ = ∑ đđ|đż=đđ (đđ′ ) (đđ′ đ′=đ đ − đ|đż = đđ ) đ′ = ∑ đđ|đż=đđ (đđ′ ) đđ′ đ đ′=đ đ − ( đ|đż = đđ ) ď¨ ď˝ ď˛ ď¨y ď ď ďł X2|Y ď˝y j ' ď˝ ď˛ x ď ďX|Y ď˝y j ' Y| X ď˝ x j ďŠ ďŠ 2 ďŞ X|Y ď˝y j ' (x ) dx 2 ďŞY| X ď˝ x j (y ) dy ďŠ Samenhangsof associatiematen A.Kwalitatieve variabele Overeenstemmingsproportie (wat X en Y hetzelfde hebben, delen door n) B.Kwantitatieve variabele B.1 associatiematen ďś steekproefcovariantie đđđ đ Populatiecovariantie: ďł XY ď˝ E ďŠďŤď¨ X ď ďX ďŠď¨Y ď ďY ďŠďšďť 1 = ∑ (đĽđ − đĽ )(đŚđ đ - als (X,Y) discreet E ďŠďŤď¨ X ď ďX ďŠď¨Y ď ďY ďŠďšďť ď˝ ďĽ ď¨ x j ď ďX ďŠď¨y j ' ď ďY ďŠ ď° X ,Y (x j , y j ' ) đ=1 −đŚ) j, j ' ď˝ ďĽďĽ ď¨ x j ď ď X ďŠď¨ y j ' ď ďY ďŠ ď° X ,Y ( x j , y j ' ) j - als (X,Y) continu E ďŤďŠď¨ X ď ď X ďŠď¨Y ď ďY ďŠďťďš ď˝ j' ď˛ď˛ ď¨ x ď ď ďŠď¨y ď ď ďŠ ďŞ X Y ďś steekproefcorrelatie Populatiecorrelatie: đđđ 1 = ∑ đ§đĽ (đĽđ )đ§đŚ (đŚđ ) đ ď˛ XY ď˝ ďł ďş X ďşY đ đ đĽđŚ = đ đĽ đ đŚ B.2 Optimale voorspelling ďś Algemene optimale voorspelling đŚđđđ đĄ = đ(đĽđ ) ďś Optimale lineaire voorsrpelling đŚđđđ đĄ = đ0 + đ1 đĽđ = (regressievergelijking) Somvariabelen 1) đĽ + đŚ = đĽ + đŚ 2 2) đ đĽ+đŚ = đ đĽ2 + đ đŚ2 + 2đ đĽđŚ 3) đ đĽ+đŚ đ§ = đ đĽđ§ + đ đŚđ§ 1) 2) 3) ď X ďŤY ď˝ ď X ďŤ ďY ďł X2 ďŤY ď˝ ďł X2 ďŤ ďłY2 ďŤ 2ďł XY ďł X ďŤY Z ď˝ ďł XZ ďŤ ďłYZ ďŠ ďš E ďŞa0 ďŤ ďĽ aj X j ďş ď˝ a0 ďŤ ďĽ aj E ďŠďŤ X j ďšďť j j ďť 4) ďŤ ďł a20 ďŤ aj X j ď˝ ďĽ a2j ďł X2 j ďŤ 2 ďĽ aj aj 'ďł X j X j ' ďĽ j j, j ' jďźj' 5) ďła ďŤ 0 6) ďĽ aj X j j b0 ďŤ ďĽ bj ' Yj ' j' ď˝ ďĽa b j j, j ' j' ďłX Y j j' X ,Y (x , y ) dx dy