Sheets hoorcollege 5: H4.4 en 4.5 Discrete s.v. X heeft eindig aantal waarden x1 t/m xn met kansen pi, dus pi = P( X= xi) De verwachting , of X of E(X) van een discrete s.v. X is het gewogen gemiddelde van alle x-waarden: = xi pi , waarin pi = P( X=xi ) de wegingsfactor van de waarde xi is. Verschil en verband tussen en x : De verwachting(swaarde) , ook wel populatiegemiddelde genoemd, is een maat voor het centrum van een kansverdeling. Het steekproefgemiddelde x geeft een schatting voor de (vaak onbekende) . De (experimentele) wet van de grote aantallen: indien x het gemiddelde van de waargenomen waarden van s.v. X is bij herhaling van het experiment, dan zal x bij veel herhalingen dicht bij liggen. 1 Rekenregels voor verwachting = E(X): 1. E(a+bX) = a + bE(X) 2. E(X+Y) = E(X) + E(Y) (Notatie boek: a+bX=a+bX en X+Y=X+Y ) De variantie 2 of X2 of var(X) is een maat voor de spreiding van een s.v. X: 2 = (xi - )2 pi Rekenregels voor variantie 2 = var(X): 1. var(a+bX)= b2 var(X) (boek: 2a+bX= b22X) 2.Als X en Y onafhankelijk zijn (d.w.z: gebeurtenissen m.b.t. X resp. Y zijn onafhankelijk), dan geldt: var(X+Y) = var(X) + var(Y) en var(X -Y) = var(X) + var(Y) De standaardafwijking of X of sd(X) wordt afgeleid uit de variantie: 2 σX σX X2 0 en X 0. 2 Let op de eenheid: als de s.v. X in meters (m), dan is X2 in m2 en X weer in m. X2 en X zijn de variantie en standaardafwijking van de populatie. s2 en s schatten de (veelal onbekende) waarden van X2 en X. Rekenregels standaardafwijking X = sd(X): 1. sd(a+bX) = bsd(X) (als b 0) 2. sd(X Y) σ2x σ2Y (= σX+Y ) Een populatie heeft een kansverdeling met bepaalde parameters, zoals µ, σ en p. Met een aselecte steekproef kunnen we deze parameters en kansen schatten: Steekproef uit populatie x is het steekproefgemiddelde: een schatting van µ s2 schat σ2 De relatieve frequentie van gebeurtenis A in de (=de relatieve frequentie steekproef schat P(A) Populatie µ is het populatiegemiddelde: meestal onbekend σ2: spreidingsmaat P(A) is de kans op een gebeurtenis A van A in de populatie) 3 Toepassen van rekenregels voor µ en σ bij de normale verdeling: 1. Als X is N(µ, σ), dan geldt: Y = a + bX is N(a + bµ, bσ) (als b > 0) 2.Als X en Y onafhankelijk zijn en normaal verdeeld, dus X is N(µX, σX) en Y N(µY, σY) dan geldt: X + Y is N(µX + µY, σ2X σ2Y ) Let op: 1. σX+Y ≠ σX + σY, maar wel µX+Y = µX + µY 2. Als X en Y niet onafhankelijk zijn, kunnen we σX+Y en de verdeling van X+Y niet bepalen. 4 Voorwaardelijke kans op A, gegeven (het optreden van) B, is P(A en B) P(B | A) P(A) De algemene productregel: P(A en B) = P(B|A) P(A) ofwel: P(A en B) = P(A|B) P(B) Voor 3 gebeurtenissen: P(A en B en C)= P(A) P(B|A) P(C|A en B) Toepassing voorwaardelijke kans: De omkeerregel van Bayes. Gegeven (zie figuur): een populatie in 2 delen: A en AC. P(A), P(B|A) en P(B| AC) AC A S A en B AC en B B Dan kun je berekenen: 5 P(AC)= 1 - P(A), P(B) = P(A en B) + P(AC en B) = P(A)×P(B|A) + P(AC)×P(B| AC) En (de omkeerregel van Bayes): P(A en B) P(A | B) P(B) P(B | A)P(A) P(B | A)P(A) P(B | A C )P(AC ) Opdeling populatie in 3 delen: A1 A2 A3 A1 en B A en B 2 A3 en B S B Omkeerregel van Bayes voor 3 delen: P(A1 en B) P(A1 | B) P(B) P(B | A1 )P(A1 ) P(B | A1 )P(A1 ) P(B | A 2 )P(A 2 ) P(B | A 3 )P(A3 ) 6