Operations Research Hoorcollege week 4 Deel 1 o.a. Poisson-verdeling en Negatief-exponentiële verdeling R.B.J. Pijlgroms Instituut Informatica en Elektrotechniek Hogeschool van Amsterdam Discrete kansverdelingen discrete uniforme verdeling (N-aselector) Bernoulli-verdeling binomiale verdeling meetkundige of geometrische verdeling logaritmische verdeling (Benford-verdeling) Poisson-verdeling 2 Verdelingen en typische voorbeelden N-aselector (zuivere munt, dobbelsteen) Bernoulli-experiment of alternatief (Bernoulli-trial): 2 uitkomsten; 2 kansen. binomiale verdeling: geeft de kans op k successen in een rij van n Bernoulli-trials. Er geldt: 0 < k < n geometrische verdeling of meetkunige verdeling: geeft de kans op succes na pas n Bernoulli-trials, (n=1,2,3,...) Samenvatting van het voorafgaande N-aselector Bernoulli-experiment binomiale verdeling meetkundige of geometrische verdeling … … discrete uniforme verdeling (N-aselector) Stochast X; uitkomstenverzameling:{1, 2, 3, ..., N} P(X=x) = 1/N; E(X) = m =(N+1)/2; s2 = (N2 - 1)/12 Bernoulli-verdeling Stochast I; uitkomstenverzameling: {0, 1} P(I=0) = q = 1- p; P(I=1) = p; E(I)= m= p; s2 = pq binomiale verdeling: Bin(n, p) Stochast B; uitkomstenverz.: k = {0, 1, 2, ..., n} P(B=k)= (n boven k)pkqn-k; E(B) = m= n p; s2 = n pq meetkundige of geometrische verd.: Geom(p) Stochast N; uitkomstenverz.: n = {1, 2, 3, ...} P(N=n)= pqn-1; E(N) = m= 1/p; s2 = q/p2 Het verjaardagprobleem Hoe groot is de kans pm dat in een gezelschap van m personen, er tenminste twee op dezelfde dag jarig zijn? Complementaire kans Hoe groot is de kans dat er geen van de m op dezelfde jarig zijn, of: hoe groot is de kans dat ze alle m op verschillende dagen jarig zijn? 1- pm Samen zijn deze kansen gelijk aan één! 6 De Poisson-verdeling Poisson-verdeling Genoemd naar één van de pioniers op het gebied van de theorie van de kansrekening Siméon Dénis Poisson (1781-1840) Definitie: Beschouw U={0, 1, 2, 3, ... oneindig }; laat m een vast getal >0 zijn. De onderstaande waarden voor p(n) zijn de kansen van de Poissonverdeling met parameter m pn e m m n n! ( n 0 , 1, 2 ,...) 8 Poisson-verdeling p(0) = e-m = exp(-m) p(1) = e-m (m/1!) = exp(-m).m1/1!= m.exp(-m) p(2) = exp(-m). m2 /2! p(3) = exp(-m). m3 /3! p(4) = exp(-m). m4 /4! ... m p ( n ) pn e (n 0, 1, 2,...) n! m n 9 Poisson-verdeling Wat is de betekenis van de parameter m in verband met de grootheid die Poisson(m)verdeeld is, in samenhang dus met de stochast of kansvariabele ? We bekijken eerst wat voorbeelden van Poisson-verdeelde kansvariabelen. 10 Poisson-verdeling (vervolg) Voorbeelden het aantal moleculen van de soort X in een bepaald volumedeel van met X verontreinigde vloeistof. het aantal vaste deeltjes in een vast gekozen volumedeel van de atmosfeer. het aantal registraties in een Geiger-Muller-teller (radio activiteit) gedurende een vast gekozen tijdsinterval. het aantal windhozen in Nederland dat vergezeld gaat met aanzienlijke schade per tijdvak van bijvoorbeeld 20 jaar. Poisson-verdeling (vervolg) Voorbeelden (vervolg) het aantal zetfouten per pagina van een boek. het aantal klanten per tijdseenheid aan een loket. het aantal weeffouten per oppervlakte-eenheid van een rol textiel. het aantal schepen dat per uur de Rotterdamse haven binnenvaart. het aantal passerende auto's per minuut op een bepaald punt van een autosnelweg. het aantal universeelmeters dat per maand defect raakt op een bepaald practicum. Poisson-verdeling (vervolg) Globaal: De Poisson-verdeling is een model voor het optreden van ‘zeldzame’ verschijnselen. Toelichting op het begrip ‘zelden’. Als het bijvoorbeeld gaat om verschijnselen in de tijd, dan wordt met ‘zelden’ bedoeld: de tijdsduur van het verschijnsel is klein t.o.v. de tijdsduur tussen twee opeenvolgende verschijnselen. 13 Poisson-verdeling (vervolg) Toelichting op het begrip ‘zelden’. Als het bijvoorbeeld gaat om exemplaren in een volume, dan wordt met ‘zelden’ bedoeld: dat het exemplaar zelf een klein volume inneemt ten opzichte van het gemiddelde volume dat aan elk exemplaar ter beschikking staat. Het aantal exemplaren behoeft beslist niet klein te zijn. 14 Poisson-verdeling (vervolg) De parameter is gelijk aan het gemiddelde aantal exemplaren per eenheid van volume of tijd. Gemiddeld over een zeer groot volume of gemiddeld over een zeer lange tijdsperiode. 15 Klassiek voorbeeld (Bortkiewicz, 1898) Uit 200 jaarverslagen van 10 Pruisische cavaleriekorpsen over een periode van 20 jaar volgen de onderstaande aantallen ongelukken per jaar met dodelijke afloop tengevolge van de trap van een paard. k 0 1 2 3 4 aantal rel.freq. theorie #trappen 109 0.545 0.544 0 65 0.325 0.331 65 22 0.110 0.101 44 3 0.015 0.021 9 1+ 0.005 + 0.003 + 4+ 200 1 1 122 gemiddeld aantal trappen per jaar = 122/200 = 0.61 Klassiek voorbeeld (Bortkiewicz, 1898) p(k) 0,6 0,5 Observed 0,4 Theory l=0.61 k=0, 1, 2, 3, 4,... 0,3 0,2 p(k)=exp(-0.61).(0.61)k 0,1 0 0 1 2 3 4 k! k 17 Het verjaardagsprobleem P(1 of meer) = 1 - P(0) P(1 of meer) = 1 - Bin((1/2)*m*(m-1);1/365) P(1 of meer) = 1 - Poisson(0; (1/2)*m*(m-1)) n Bin(n; p) Poisson(m) 10 20 22 23 24 25 50 100 200 400 Bin 0,11614 0,406229 0,469399 0,500477 0,531023 0,560908 0,965291 0,999999 1 1 Poisson 0,115991 0,405805 0,468938 0,500002 0,530536 0,560412 0,965131 0,999999 1 1 18 Binomiaal vergeleken met Poissonbenadering n De benadering werkt als n groot is en p klein. n*p = m De kansen op k successen zijn praktisch gelijk. 10 20 22 23 24 25 50 100 200 400 Bin 0,11614 0,406229 0,469399 0,500477 0,531023 0,560908 0,965291 0,999999 1 1 Poisson 0,115991 0,405805 0,468938 0,500002 0,530536 0,560412 0,965131 0,999999 1 1 19 De logarithische-verdeling of wet van Benford De logaritmische verdeling of de wet van Benford Frank Benford (1883 - 1948) De wet van Benford: In veel getallenverzamelingen (die random zijn ontstaan) bezitten de eerste cijfers van de getallen een aflopende verdeling die begint met ongeveer 30% voor het cijfer 1, ca. 18% voor het cijfer 2, en zo verder tot ongeveer 5% voor het cijfer 9. 21 twee vragen dringen zich op Wat is een getallenverzameling die ‘random’ is ontstaan ? Hoe groot zijn die kansen voor het optreden van de eerste cijfers 1, 2, 3, 4, 5, 6, 7, 8 en 9 dan wel precies? NB: Het gaat om het eerste cijfer (van links naar rechts gaande) dat ongelijk is aan nul; d.w.z. het meest significante cijfer. 22 de antwoorden verzameling van fundamentele natuurconstanten getallen in kranteartikelen oppervlakten van meren en rivieren lengten van telefoongesprekken helderheidsverdelingen van sterren tegoeden op bankrekeningen grootten in bytes van printbestanden de logaritmische verdeling De logaritmische verdeling In het tientallige stelsel is de uitkomstenverzameling: {1,2,3,4,5,6,7,8,9} Kansen zijn: i 1 pi log ; i = 1,2,...,8,9 i 10 Opgave: Toon zelf aan dat de som van deze negen kansen gelijk is aan 1. 24 Paginagrote advertentie van ah in de dagbladen van 12 juli 1989 Geteld cijfer 1 cijfer 2 cijfer 3 cijfer 4 cijfer 5 cijfer 6 cijfer 7 cijfer 8 cijfer 9 Theoretisch verwacht 42.2 % 16.5 % 9.1 % 5.5 % 7.3 % 8.3 % 3.7 % 3.7 % 3.7 % cijfer 1 cijfer 2 cijfer 3 cijfer 4 cijfer 5 cijfer 6 cijfer 7 cijfer 8 cijfer 9 30.0 % 17.6 % 12.5 % 9.7 % 7.9 % 6.7 % 5.8 % 5.1 % 4.58% Kunnen we de verschillen verklaren ?? 25 De meetkundige of geometrische kansverdeling De logaritmische verdeling vergeleken met de meetkundige of geometrische verdeling 0,3 logaritmisch geometrisch 0,25 0,2 0,15 0,1 0,05 0 1 2 3 4 5 6 7 8 9 10 27 De meetkundige of geometrische verdeling p qp qqp qqqp qqqqp … + 1 p qp qqp qqqp p (1 q q 2 q 3 q 4 ) 1 p p 1 1 q p … 1 q qq qqq qqqq... S q qq qqq qqqq ... qS af 1 S qS 1 S (1 q ) S 1 /(1 q) 28 De negatief-exponentiële kansverdeling 1 0.8 0.6 0.4 0.2 2 4 6 8 10 29 De negatief-exponentiële verdeling l 1 f(x)=l e 0.5 lx l =1 0.8 f(x) f(x) = l e –lx = l exp(-lx) 0.5 l 0.5 l = 0.5 0.4 0.3 0.6 0.2 0.4 0.1 1 0.2 2 3 4 5 6 7 8 9 10 1/l 2 0.5 1.5 2.5 1/l 3.5 4.5 5.5 6.5 7.5 8.5 9.5 x 30 De negatief-exponentiële verdeling De stochast Y met U = {y | y>0} heet (negatief-) exponentieel verdeeld als: f ( x) le l x l x F ( x) 1 e E (X) = 1/l Var(X) = 1/l x 0 ( l 0) 2 31 De negatief-exponentiële verdeling Voorbeelden De tussentijden bij radioactieve desintegratie De levensduur van sommige artikelen (gloeilampen) Tijdstippen tussen twee opeenvolgende telefoongesprekken of bezoeken aan een loket (giromaat,...) 32 De negatief-exponentiële verdeling rij van neg.-exp. verd. intervallen rij van Bernoulliexperimenten 0 .5 0 .4 0 .3 0 .2 0 .1 1 2 3 4 5 6 7 8 9 t binomiale verdeling geometrische verdeling Poisson-verdeling 0 .2 0 .1 5 0 .1 0 .0 5 0 1 2 3 4 5 6 7 8 aantal per tijdseenheid t 33 10 De negatief-exponentiële verdeling Hieronder staat het resultaat van het tellen van ‘het aantal begintijdstippen per 5 seconden’ van een rij van 1000 Exp(l=0,5 sec)-verdeelde aaneengesloten tijdsintervallen. 0.25 experimenteel gevonden fracties theoretische kansen, berekend met de Poisson(2.5)-verdeling 0.2 0.15 0.1 2 sec 0.05 0 1 2 3 4 5 6 7 8 aantal per 5 sec 5 seconden Twee kanten van één medaille Poissonverdeling (aantallen aankomsten per vaste tijdseenheid) Negatief-exponetiële verdeling (verdeling van tussenaankomsttijden) 35