Statistiek en kansrekening Een profielspecifieke invulling voor wiskunde D Een voorstel, opgetekend en bij elkaar gezocht door Lia van Asselt, juni 2007 1 Waarom statistiek in wiskunde D? Wiskunde B12 tot 2007 Wiskunde B vanaf 2007 760 uur 600 uur Vaardigheden. Vaardigheden. informatievaardigheden onderzoeksvaardigheden oriëntatie op studie en beroep technisch instrumentele vaardigheden informatievaardigheden onderzoeksvaardigheden technisch instrumentele vaardigheden oriëntatie op studie en beroep Algebraïsche vaardigheden Functies en grafieken 100 Functies en grafieken Discrete Analyse 40 Discrete Analyse Meetkunde 40 Combinatoriek en kansrekening 100 Differentiaal en integraalrekening 120 Continue dynamische modellen 40 Goniometrische functies 40 Normale verdeling en toetsen van hypothesen 40 Keuzeonderwerpen 40 Keuzeonderwerpen Voortgezette meetkunde 120 Voortgezette meetkunde Voortgezette analyse 80 Differentiaal en integraalrekening Goniometrische functies Omdat dit onderwerp noodgedwongen vanwege de urenreductie uit WB verdwenen is. Het is een stuk wiskunde dat veel toepassingen kent. Een leerling met wiskB én wisk D in het pakket moet op de hoogte zijn van deze toepassingen.. 2 Waarom extra onderwerpen statistiek in wiskunde D? Statistiek en kansrekening 120 + 40 Meetkunde 80 Complexe getallen 40 Dynamische modellen 80 Vervolg dynamische modellen 40 of Wiskunde in de wetenschap Keuzeonderwerp 40 Het is het grootste onderdeel van wiskunde D Daarin is ruimte gereserveerd voor een profielspecifieke invulling Eigen gezicht aan wiskunde D Mogelijkheden van de populatie benutten. Ze hebben allemaal wiskunde B en niemand hoeft tegen zijn zin wiskunde B te kiezen. Maatschappelijk relevante en/of moderne onderwerpen. Waaraan moet een goed onderzoek voldoen? Correlatie en regressie Wachttijdentheorie Financiële wiskunde Subdomein B6: de kandidaat kan de stof van wiskunde B gebruiken voor een profielspecifieke verdieping. Wachttijdentheorie: een prachtig stukje wiskunde B Hoe zou een leerlijn voor dit onderwerp eruit kunnen zien? En is dat volgens u te behappen voor de leerlingen. 3 Wachttijdentheorie Geometrische verdeling Wachten totdat een gebeurtenis( met kans p op succes) zich voor het eerst voordoet. Voorbeeld: Casino inzetten op even en je winst nemen zodra het balletje op even komt Mens erger je niet: wie het eerst een zes gooit met een dobbelsteen mag beginnen. X is het nummer van de eerste keer succes. De kansverdeling van X k 1 2 P(X)=k p qp 3 q2p Merk op dat q k p p 1 q k 0 4 q3p 5 q4p … p 1 p De verwachtingswaarde van X Definieer X k 1 als de ke proef gedaan wordt en E ( X ) E ( X1 ) E ( X 2 ) E ( X 3 ) ..... 1 q q 2 .... Xk 0 als dat niet hoeft 1 1 1 q p 4 De Poissonverdeling Geeft antwoorden op vragen als: Hoe groot is de kans dat er tussen twee aankomsten minstens een half uur zit? Hoe groot is de kans dat ik een parkeerplek vind bij een winkelcentrum Hoe groot is de kans dat ik meer dan tien minuten in de rij sta in het postkantoor. Hoe groot is de kans dat er tussen 23.00 uur en 24.00 uur meer dan 6 vliegtuigen aankomen. Stel er komen gemiddeld klanten per tijdseenheid t. Noem X het werkelijk aantal klanten per tijdseenheid. Om P( X k ) te berekenen verdelen we het tijdsinterval in n gelijke stukjes. We kiezen n zo klein dat er maximaal één klant in die tijd kan binnenkomen. We kunnen het totaal aantal klanten in het hele interval schrijven als X X1 X 2 X 3 ...... X n , waarbij X k 1 als er in het ke interval een klant binnen komt, anders X k 0 E ( X ) E ( X1 ) E ( X 2 ) E ( X 3 ) ..... E ( X n ) np p n Dan geldt dus: n k n n P( X k ) p k q n k 1 k k n n n k n 1 1 n n n(n 1)(n 2)...(n k 1) k n k k k ! k nk k n 1 1 n n k Nemen we nu de limiet voor n naar oneindig dan : k P( X k ) e k! Voorbeeld Gemiddeld komen er 30 klanten per uur een postkantoor binnen. Bereken de kans dat er minstens 2 minuten tussen de aankomst van twee klanten zit. Deze kans is gelijk aan de kans dat er 0 klanten in 2 minuten verschijnen. 30 klanten per uur komt overeen met 1 klant per 2 minuten, dus =1 P( X 0) 0 0! e e1 De som van al deze kansen is 1 k 2 3 k ! e e 1 2! 3! .... e e e0 1 k 0 x 2 x3 x 4 .... e x * 2! 3! 4! Op wisk-B niveau is * aan te tonen als volgt: Hierbij gebruik je 1 x 5 x 2 x3 x 4 .... f ( x) Noem 1 x 2! 3! 4! Dan f ( x) f ( x) met f (0) 1 . Hieruit volgt f ( x) e x De verwachtingswaarde k 2 3 k e e 1 .... e e e0 k! 2! 3! k 1 Algemeen: Stel er komen gemiddeld klanten per tijdseenheid en Xt is het aantal klanten dat per t tijdseenheden binnenkomt Dan ( t ) k t P( X t k ) e met E(X)=t k! Wachten op de volgende klant Definieer de stochast T als de tijd t tussen twee opeenvolgende klanten. P(T t ) P( X t 0) et en dus P(T t ) 1 et F (t ) 1 et noemen we de verdelingsfunctie en de afgeleide f (t ) et de bijbehorende kansdichtheidsfunctie De tussentijden bij een Poisson aankomstproces zijn exponentieel verdeeld. Met integraalrekening kun je aantonen dat de functie f inderdaad aan de voorwaarden van een kansdichtheidsfunctie voldoet. Immers e t 0 dt et 1 0 Met integraalrekening kun je de verwachtingswaarde E(T)uitrekenen. E (T ) te t 0 1 1 dt tet et dt et . 0 0 0 Een resultaat dat ons niet verbaast! Een van de voorwaarden voor het gebruiken van een Poissonverdeling is de zogenaamde geheugenloosheid van het systeem.(Wanneer een volgende klant aankomt is onafhankelijk van de aankomst van de vorige klant) Voorbeeld: In een metrostation komt gemiddeld om het kwartier een metro maar er is geen dienstregeling. Je kunt nu de kans dat je tussen de 5 en 10 minuten moet wachten uitrekenen met de exponentiele verdeling als volgt 10 P(5 T 10) 5 1 e 15 t dt 15 1 e 1 t 10 15 5 e 13 e 23 0, 20 6 Wachttijden Welke soort problemen kun je nu oplossen? De lengte van een wachtrij voor een tolbrug Berekenen of die wachtrij oplost door meer loketten te openen. De gemiddelde verblijftijd in een systeem berekenen Kostenaspecten doorrekenen Het M/M/1 systeem Dit is een systeem met één bewerkingsfase en één loket. Er gelden nog de volgende voorwaarden Klanten worden geholpen volgens het FIFO-systeem. First In First Out. Iedere klant wacht tot hij geholpen is. Het aankomstgedrag van iedere klant is onafhankelijk van dat van andere klanten, maar gemiddeld is het aantal klanten dat per tijdseenheid binnenkomt constant Er zijn oneindig veel klanten (Poissonproces) Behandelduren verschillen van klant tot klant en zijn onafhankelijk van elkaar, maar gemiddeld is het aantal klanten μ dat per tijdseenheid geholpen kan worden constant. Behandeltijden zijn volgens een negatief exponentiele kansverdeling verdeeld μ> Aankomsttijden en behandeltijden werken op elkaar in Om erin te komen eerst een voorbeeld. Op een printer zijn een aantal stations aangesloten. De volgende printopdrachten, die met A t/m E genummerd zijn, komen bij de printer aan. Het aankomsttijdstip bij de printer en de bewerkingstijd van elke printopdracht zijn gegeven. Opdracht Aankomsttijdstip Bewerkingstijd A 1 3 B 3 5 C 5 3 D 7 1 E 11 2 De situatie kan als volgt overzichtelijk weergegeven worden 7 . Je ziet dat B totaal 6 minuten in het systeem is en dat C 4 minuten moet wachten voordat hij aan de beurt is. Het maken van een dergelijke figuur is tijdrovend , zelfs onmogelijk in bepaalde situaties. Maar door gebruik te maken van: Elke toestand waarin het systeem zich bevindt heeft te maken met de daaraan voorafgaande toestand en de daaropvolgende toestand kunnen we een model ontwikkelen dat in steeds complexere situaties toepasbaar is. Weer terug naar de algemene situatie Het aantal klanten in het systeem geeft aan de toestand waarin het systeem zich bevindt. Hieronder weergegeven is het toestanden diagram. Omdat < μ geldt ook noemen we de verkeersintensiteit. 1 . Het getal Aangetoond kan worden dat in deze situatie altijd een stationaire toestand ontstaat. Stel Pn is de kans dat er n klanten in het systeem zijn. 8 Een willekeurige toestand met n klanten kan alleen bereikt worden vanuit toestand n-1 omdat de klanten één voor één arriveren of vanuit toestand n+1 omdat de klanten één voor één geholpen worden. De verwachtingswaarde van het gemiddeld aantal malen dat toestand n wordt bereikt is Pn1 Pn1 De verwachtingswaarde van het aantal malen dat toestand n wordt verlaten is Pn Pn Er is evenwicht als Pn1 Pn1 Pn Pn voor n 1 en P0 P1 In de evenwichtsituatie kun je hieruit het volgende stelsel van evenwichtsvergelijkingen afleiden. P0 P1 P0 P1 P1 P2 P2 P3 P3 P4 . P1 P2 P2 P3 en omdat is dit weer P3 P4 . . . Pn1 Pn Pn 1 Pn en dit geeft n P0 Pn Omdat we ook nog weten dat de som van alle kansen 1 is krijgen we de relatie P0 P0 2 P0 3 P0 4 P0 .... 1 1 P0 1 P0 1 1 Pn n (1 ) Het verwachte aantal klanten E (n) in het systeem is dan n0 n0 n0 E (n) n Pn n n (1 ) (1 ) n n (1 ) 2 1 (1 ) (gebruik de somformule van een rekenmeetkundige rij) Nog een belangrijkere grootheid is het gemiddeld aantal klanten E (nq ) dat in de wachtrij staat: E (nq ) (n 1) Pn (met algbraische manipulaties te herleiden tot) n1 2 1 Andere factoren waar je rekening mee moet houden bij het inrichten van een systeem zijn de verwachte waarde van de totale verblijftijd en de verwachte waarde van de wachttijd. Omdat E (n) E (v) 1 kunnen we afleiden E (v) (1 ) 1 1 (1 ) 9 en omdat E (nq ) E ( w) 2 2 kunnen we afleiden dat E ( w) 1 (1 ) (1 ) ( ) We hebben nu een aantal formules afgeleid waarmee bijvoorbeeld het volgende systeem door te rekenen is. Een postkantoor heeft slechts één loket. Er arriveren gemiddeld 5 klanten per kwartier en er kunnen 6 klanten per kwartier geholpen worden. - De kans dat er geen klanten zijn is P0 1 1 56 16 . Dat betekent dat de lokettist - gemiddeld 1/6edeel van de tijd niets te doen heeft. De kans dat er gedurende zes minuten niemand bij komt is e-2=0,135 - De kans op precies twee klanten is P2 2 (1 ) =5/216=0,023 - Het gemiddeld aantal aanwezige klanten is - De gemiddelde wachttijd is: 12½ minuut 1 5 6 1 56 5 M/M/k systeem. Het vervolg is duidelijk: wat gebeurt er als er een tweede loket bij geopend wordt met dezelfde capaciteit. Enzovoort. De formules worden dan snel ingewikkelder. In de dagelijkse praktijk bestaan er spreadsheets waarmee je snel kunt (laten) doorrekenen wat de effecten van maatregelen zijn. Deze zijn ook voor de leerlingen beschikbaar en heel illustratief. Tips Na bestudering van het theoretische deel van de stof kan dan een echte case worden doorgerekend. - Bijvoorbeeld de situatie bij een laadperron. Meerdere bedieningspunten openen kost geld, maar als een vrachtwagen in de rij moet staan kost ook geld. Door meerdere systemen door te laten rekenen met de daaraan verbonden kosten kan de directeur beslissen hoe hij zijn geld het beste kan besteden. - Of je laat de leerlingen echte tellingen verrichten en de uitkomsten vergelijken met die volgens de theorie - Of je laat een van de aannames van het M/M/k model weg en laat de leerlingen zelf het bijbehorende model opstellen. 10 Vragen: Is dit geschikte stof voor de 40 uur profielspecifieke invulling? Om te voorkomen dat docenten ieder voor zich tijdrovende dictaten moeten gaan schrijven: is er behoefte aan het ontwikkelen van deze module? Bronnen Wachttijden: Profimateriaal ontwikkeld door Freudenthal Instituut.Geschreven voor middelbare scholieren. Na wat bewerkingen zeer bruikbaar als lesmateriaal in de klas. Huisman en de Witt: Beter beslissen 1, Kwantitatieve methoden in de praktijk. Wolters Noordhof. ISBN90-01-40879-4 Zeer bruikbaar als je wat meer met spreadsheets wil werken in de klas. Ook tal van casestudies achter in het boek. Een halve module besliskunde 2 uit de 1e graads wiskundeopleiding aan de Fontys Hogeschool Tilburg. Erg theoretisch, wiskunde op hoog niveau. Geschikt studiemateriaal voor de docent. Redeneren, argumenteren en modelleren, dr. ir. P Terlouw, Universiteit Twente. Een dictaat dat studenten bestuurskunde en bedrijfskunde(met dus mogelijk alleen maar WA1in hun pakket!) in het eerste jaar van hun studie moeten bestuderen. 11