Kansrekening en dynamica als basis voor breed wiskundeonderwijs Joost Hulshof en Ronald Meester c Reproductie alleen in overleg met de auteurs. Alle rechten voorbehouden. 1 Voorwoord We zullen in de cursus een aantal basisbegrippen uit de wiskunde in een wat ander daglicht zetten dan op school gebruikelijk. We proberen daarbij een fundamentele invalshoek te combineren met een realistische. Beide invalshoeken funderen we op de common ground die voortkomt uit vertrouwdheid met getallen en getalrepresentaties. Nadrukkelijk aan de orde komen breuken, wortels en het getal e. Nog niet aan de orde in deze cursus komt π. Kansrekening en dynamica bieden een extra perspectief, maar al schrijvende wordt duidelijk hoe met getallen en eenvoudige algebra een fundament voor goede wiskunde en goed wiskundeonderwijs gelegd kan worden. Bij dit alles is Newton alom aanwezig, maar zijn differentiequotiënten laten we achterwege. Nog geen Newton dynamica, geen differentiaalvergelijkingen, geen (co)sinussen. Wel, rechtstreeks vanuit de algebra van rente op rente, de exponentiële functie. In de kantlijn staan diverse thema’s aangegeven die tot projecten voor in de les zouden kunnen worden uitgewerkt. We hopen dat tijdens de cursus hier initiatieven toe ontstaan tussen de deelnemers onderling. Joost Hulshof Ronald Meester VU Amsterdam, 9-11-2010 2 Inhoud • §1 Voorkennis en inleiding. • §2 Rationale en niet-rationale getallen. • §3 Toevallige decimale ontwikkelingen. – §3.1 Normale getallen. – §3.2 Hoeveel toeval kunnen we verdragen? • §4 Newton’s methode als dynamisch systeem. – §4.1 Raaklijnen zonder differentiëren. – §4.2 Newton’s methode. • §5 Rente op rente en het getal e. – §5.1 Rente op rente. – §5.2 De definitie van exp en e. – §5.3 Newton’s binomium en Pascal’s driehoek. – §5.4 Gauss’ strafwerk som. – §5.5 Bestaat de som met oneindig veel termen? – §5.6 Sommen met negatieve termen, renteafschrijving? – §5.7 Samenvattende conclusies. – §5.8 Monotonie, een bewijs! • §6 Kansrekening en het getal e. – §6.1 Sinterklaaslootjes en e. – §6.2 Onafhankelijke experimenten en e. De samenhang tussen de secties is 1 3 ↑ → 2 ↓ 4 → 5 → 6 §5.4, §5.5, §5.8 en §6.2 zijn lastiger dan de rest. 3 1 Voorkennis en inleiding De aangenomen voorkennis omvat onder andere het intuı̈tieve getalbegrip van de reële getallen. Punten op de met 0 en 1 gemarkeerde getallenlijn identificeren we zonder scrupules met reële getallen, waaronder in het bijzonder 0, 1 en de andere andere gehele getallen, −1, 2, −2, 3, −3, . . . , en ook de rationale getallen: de breuken met teller geheel en noemer geheel en ongelijk 0, met de afspraak 6 dat 43 = −3 −4 = 8 , etc. Met deze reële getallen kunnen we optellen, aftrekken, vermenigvuldigen, delen. Notaties: +, −, ·, /, soms × i.p.v. · voor keer, en vaak liever een horizontaal deelstreepje. Een beetje flexibel moet je daarbij wel zijn. De gelijkheid 3/4 = 3 4 is zowel een deling met uitkomst is als twee verschillende schrijfwijzen voor drie vierde. Ook kunnen we twee verschillende reële getallen vergelijken door naar het teken van hun verschil te kijken. Elke x 6= 0 is ofwel positief (x > 0) of negatief (x < 0) en we hebben voor elke x de absolute waarde |x| van x, gedefinieerd door |x| = −x als x < 0 en |x| = x als x > 0 of x = 0. Intuı̈tiever hebben we ook al de noties veel groter en veel kleiner, denk aan het vergelijken van 1 en 10 versus het vergelijken van 1 en 1.000.000 (een miljoen). We zeggen dat x dicht bij y ligt als de absolute waarde |x − y| van het verschil klein is. Met de algebraische operaties maken we functies1 , bijvoorbeeld de functie f : x → f (x) = x2 = x · x, een functie van één variabele. Deze functie f maakt bij iedere x een nieuwe waarde f (x) met behulp van het formulevoorschrift f (x) = x2 . Ander taalgebruik: f stuurt x naar f (x). Met functies heb je ook meteen vergelijkingen, bijvoorbeeld f (x) = 0 of, algemener, f (x) = c voor een gegeven c. Het oplossen van dit soort vergelijkingen is voor sommigen leuk, voor van alles en nog wat nuttig, en meestal lastig. Het praten over functies zonder bijbehorend formulevoorschrift zullen we nog zo veel mogelijk vermijden. Bij voorkeur zien we f als een soort knop op een denkbeeldige rekenmachine. Toets als input een x-waarde in, druk op de knop2 f , en lees af wat de output f (x) = x2 is. Als de knop het niet doet, dan zeggen we dat x niet in het definitiegebied van f zit. De letter x wordt hier gebruikt omdat veel mensen het gewend zijn om de inputvariabele x te noemen √ en de outputvariabele y. Van de knoppen ex , log x en ook x blijven we nog af. We bekijken eerst alleen de rationale functies, functies die we maken met optellen, aftrekken, vermenigvuldigen, delen, zoals F (x) = 1 2 x 1 + = (x + ), 2 x 2 x die x = 0 niet in zijn definitiegebied heeft. De grafiek van een functie f is de verzameling van punten (x, y) in het xy-vlak waarvoor geldt dat y = f (x). Wat slordig praten we zowel over de 1 Van 2 De het Latijnse werkwoord fungor, ik voer een taak uit. knop met daarop het symbool x2 of de formule y = x2 . 4 grafiek y = f (x) als over de functie y = f (x). De grafiek van de f gegeven door f (x) = x2 is een parabool. Bekend verondersteld wordt welke functies als grafiek een recht lijn hebben, hoe de formulevoorschriften van die functies eruit zien, en hoe (makkelijk) de bijbehorende lineaire vergelijkingen worden opgelost. Deze bijzondere functies3 noemen we lineaire functies. Differentiaalrekening voor functies wordt op school meestal gedefinieerd met limieten van differentiequotiënten. We zullen daar geen gebruik van maken, hoewel we soms even kunnen valsspelen om snel te zien wat de formules zijn in Newton’s methode. Voor makkelijke functies laten we wel zien hoe je in de buurt van een gegeven punt steeds betere benaderende functies maakt, i.h.b. lineaire benaderende functies. Eigenlijk is dat een hele elegante manier om het begrip afgeleide functie te introduceren. We gebruiken daartoe variaties op het merkwaardig product a2 − b2 = (a − b)(a + b), zoals a5 − b5 = (a − b)(a4 + a3 b + a2 b2 + ab3 + b4 ). (1.1) Een formule die door uitvermenigvuldigen en haakjes verdrijven geverifieerd kan worden, maar ook afgeleid kan worden met een staartdeling voor Thema: merkwaardige producten a 5 − b5 . a−b Het eerste stukje van die staartdeling4 staat hieronder uitgeschreven: a−b / a 5 − b5 a5 − a4 b a4 b − b5 a4 b − a3 b2 a3 b2 − b5 \ a4 + a3 b+ Opgave 1. Maak deze staartdeling af. De rol van 10 in de gewone staartdeling is hierbij overgenomen door a. We zullen in deze cursus zien hoe je hiermee voor een rationale functie x → f (x) snel de richtingscoëfficiënt f 0 (p) van de raaklijn aan de grafiek in (p, f (p)) kunt vinden, en dat je daar niet eerst voor hoeft te worden lastig gevallen met alle finesses van het lastige begrip limiet. Ook het binomium van Newton is daarvoor niet nodig. Dat binomium van Newton, bijvoorbeeld (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 , (1.2) gebruiken we pas als we het getal e en de functie t → exp(t) = et gaan maken middels steeds hogere n-de machten van a + b met de speciale keuze b = 1, en a = nt voor a en b. Merk overigens op hoe eenvoudig de coëfficiënten in (1.1) zijn vergeleken met de toch wat lastige coëfficiënten in (1.2), die echter snel zijn te vinden met de driehoek van Pascal. Op deze binomiaalcoëfficiënten komen we nog uitgebreid terug. De driehoek van Pascal voeren we hier nu in als een 3 Met 4 Ook als grafiek een rechte lijn, al of niet door de oorsprong. wel hapjesmethode genoemd. 5 Thema: binomium van Newton schema van getallen, waarin elke volgende rij steeds een getal meer heeft, het meest linker- en meest rechter getal steeds 1 zijn, en in de driehoek elk getal steeds de som is van de twee getallen er direct boven. Begrensd door 1-en geeft dit 1 1 1 1 1 1 6 1 2 3 1 4 5 10 15 1 3 6 20 1 4 1 10 5 15 1 6 1 5 Je kunt deze driehoek naar beneden door laten lopen zover je wilt. De getallen 1, 3, 3, 1 op de 4-de rij zijn de coëfficiënten in (a + b)3 = a3 + 3a2 b + 3a2 b + b3 , Elke volgende rij volgt uit de vorige rij. Bijvoorbeeld via uitwerken van (a + b)5 = (a + b)(a + b)4 = (a + b)(a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 ) (1.3) om van de 5-de op de 6-de rij komen. Opgave 2. Ga na dat als je (1.3) uitwerkt, dat je 10a3 b2 krijgt als de som van a keer 6a2 b2 en b keer 4a3 b, en geef aan welke drie getallen in de Pascal-driehoek hierbij betrokken zijn. Hier ligt een verband met combinatoriek en ook met kansrekening. In de kansrekening speelt het getal 1 een grote rol. Met a + b = 1 en a herdoopt als p zien we het verband met de binomiale verdeling. Een andere keuze, b = 1 en a = a5 , is belangrijk in de al aangekondigde weg naar e. Dat is goed uit te leggen in een rente op rente context. Met bijvoorbeeld 5 rentebijschrijvingen per renteperiode, bij rentefractie6 a, heb je na een periode niet één factor 1 + a waarmee je spaargeld is vermenigvuldigd, maar vijf factoren 1 + a5 , kortom a (1 + )5 . 5 Wat gebeurt er als je in deze factor beide 5-en door een ander, groot getal vervangt? Kun je de limiet nemen als je dat grote getal naar oneindig stuurt? En kun je a vervangen door een t, waarbij je aan tijd denkt? Of een x, waarbij je aan positie of plaats denkt? Dit is misschien ook een moment om even stil te staan bij naamgeving en notatie. De letters x en y zijn vaak de namen voor de in- en outputvariabele van een functie f . De afspraak dat we bij het tekenen van de grafiek van f de x horizontaal en de y verticaal uitzetten, en in (x, y) eerst x en dan y schrijven, is maar een afspraak. Het is belangrijk dat je van elkaar weet aan welke afspraken 5 Die al lang voor Pascal in China bekend was, zie wikipedia. de percentages de wereld uit, om te beginnen uit de wiskunde. 6 Help 6 je je houdt. Niet per ongeluk7 de rol van x en y omdraaien trouwens. Ook voor functies gebruiken we letters. De functie in het voorbeeld heet hier toevallig even f . Er zijn meer functies dan Chinezen, een naam is maar een naam, er zijn nooit genoeg namen, en een naam kan veranderd worden. De meeste Chinezen heten Li of Wang, functies noemen we vaak f of g of F . Als we het over een functie met naam f hebben, dan is bij voorkeur een formulevoorschrift van f nodig om te weten over welke f we het hebben. Wat we in deze cursus zullen zien is hoe Newton’s methode bij iedere f een nieuwe F maakt die gebruikt wordt voor het numeriek oplossen van de vergelijking f (x) = 0, hetgeen na het maken van F simpelweg neerkomt op het herhaald drukken op de F -knop. In de praktijk is een paar keer drukken voldoende. 2 Rationale en niet-rationale getallen Rationale getallen zijn de getallen die we uitgaande van vingertellen via optellen, aftrekken, vermenigvuldigen en delen onvermijdelijk tegenkomen als we rekenen met discrete grootheden. Het bestaan van deze rationale getallen √ zullen we als 2 bestaat is van vanzelfsprekend aannemen, maar de vraag of en in welke zin √ een andere orde. De aanwijzing voor het bestaan van 2 is sinds Pythagoras de rechthoekige gelijkbenige driehoek. Als we de rechthoekszijde van zo’n bijzondere driehoek gebruiken om op een getallenlijn 0 en 1 te markeren,√dan is de schuine zijde te gebruiken om het punt op die 2 cor√ getallenlijn waarmee 8 respondeert te vinden. Deze beschrijving van 2 als verhouding tussen twee √ lengten in een meetkundig object is nog concreter dan die van 2 als de zijde van een vierkant met oppervlakte √ 2, waarbij ook over eenheden nagedacht moet worden. Dat het bestaan van 2 als getal zo reëel is lijkt evident en dat trekken we nu niet in twijfel. De hogeremachtswortels9 uit 2, en uit de andere rationale positieve getallen, nemen we meteen ook maar voor lief. √ Maar 2 is wel een nieuw soort getal, niet rationaal, want niet te schrijven als een breuk waarvan teller en noemer gehele getallen zijn. Het is nog niet eens zo triviaal om dat netjes te bewijzen trouwens. Je kunt het inzien als je weet dat elk positief geheel getal even of oneven is: √ Opgave 3. Bewijs dat 2 geen breuk is. Een directe consequentie van dit inzicht is dat in een rechthoekige gelijkbenige driehoek de verhouding tussen schuine en rechte zijde geen breuk kan zijn, een conclusie zo onheilspellend voor de Griekse filosofen van weleer dat geheimhouding verstandig geacht werd. √ We zullen zien dat we 2 wel willekeurig goed kunnen benaderen met breuken. Voordat we dat gaan doen moeten we weten wat willekeurig goed benaderen inhoudt. Gelukkig zijn we al een beetje vertrouwd met dit begrip. 7 Bezuidenhout Den Haag, 3-3-1945, zie de Nederlandse wikipedia. ook π een verhouding is: tussen diameter en omtrek van een cirkel. 9 Maar alleen de derdemachtswortel via kubussen lijkt zo echt reëel... 8 Zoals 7 We weten immers dat, in de gebruikelijke decimale notatie van tienvingerigen, 1 6= 0,3 , 3 1 6= 0,33 , 3 1 6= 0,333 , 3 ... omdat 1 = 0,3333 . . . , (2.1) 3 of we dat nu leuk vinden of niet. Niet iedereen vindt representaties als (2.1) even vanzelfsprekend10 , ook omdat (2.1) ons nogal dwingend verzoekt te accepteren dat dan ook 1 1 = 3 · = 3 · 0,3333 · · · = 0,9999 . . . . (2.2) 3 Opgave 4. Denk even na over dit verzoek. Of je accepteert zowel (2.1) als (2.2), of je verwerpt ze allebei. Omdat de rij breuken 0,9 = 9 , 10 0,99 = 9 9 + , 10 100 0,999 = 9 9 9 + + , 10 100 1000 ... 1 net zo goed benadert als we maar kunnen willen, wordt (2.2) in brede kring geaccepteerd. Zonder deze stap is wiskunde ook leuk, zelfs nuttig (!), maar een stuk lastiger. We trekken immers meteen profijt uit deze stap. Eigenlijk staat er in (2.2) niets anders dan 1= 9 9 9 9 + + + + ··· , 10 100 1000 10000 een som met oneindig veel termen, waar we stilzwijgend niet moeilijk over doen: een doorlopende som11 waar gewoon wat uitkomt. Evenzo leest (2.1) als 1 3 3 3 3 = + + + + ··· , 3 10 100 1000 10000 en is het onvermijdelijk dat 1 1 1 1 1 1 1 1 1 = 0,1111 . . . = + + + +··· = + + + +··· . 9 10 100 1000 10000 10 102 103 104 Opgave 5. Als je vingers hebt om op te tellen kun je veel leren: leg uit waarom met enige afstand van ons tienvingerig perpectief ook moet volgen dat 1 1 1 1 1 = + 2 + 3 + 4 + ··· n−1 n n n n (2.3) voor elke gehele n groter dan 1. Met n = 10 hebben we dit al gezien, dankzij onze tien vingers. Waren we in het Land van Oct geboren, op het speelplein opgevoed met een, twee, drie, vier, vijf, zes, zeven, acht, wie niet weg is, staat op wacht, 10 De 11 Tot CDrom met de nieuwe kennisbasis rekenen voor de PABO vermeldt groot verdriet van sommigen ook wel reeks genoemd. 8 2 3 = 0,66. Thema: getalrepresentaties en in de klas met de cijfers 1, 2, 3, 4, 5, 6, 7 en het getal acht12 , dan was dit verhaaltje begonnen met n = 8 in (2.3). Acceptatie van (2.2) heeft nogal wat gevolgen. Accepteer je n = 10 in (2.3), dan accepteer je elke gehele positieve n. Behalve n = 1 natuurlijk, je moet wel kunnen tellen! Natuurlijk is (2.3) ook wel zonder vingers af te leiden, als je eenmaal zeker bent dat de som als getal bestaat. Opgave 6. Als, voor n > 1, 1 1 1 1 + 3 + 4 + · · · = A, + n n2 n n dan is n n n n + 2 + 3 + 4 + · · · = nA. n n n n Bereken A door de gelijkheden van elkaar af te trekken. Er is nog een mooie realistische context voor (2.3). Als je niet weet13 hoe je een ronde pizza moet opsnijden in gelijke stukken voor drie kinderen, maar wel weet hoe je moeten vierendelen, dan snij je de pizza eerst in vier stukken, deelt drie stukken uit, laat ze lekker eten. Je deelt vervolgens het overgebleven stuk weer in vieren, en herhaalt14 deze eerlijke procedure net zolang als ze honger hebben of de grootte van de pizza toestaat. Voor het inzicht dat 1 1 1 1 1 = + 2 + 3 + 4 + ··· 3 4 4 4 4 is ook deze hapmethode in de praktijk overtuigend genoeg. Met 3 kinderen zie je zo dat (2.3) waar is voor n = 4. Opgave 7. Eet een pizza in je eentje op. Hint: kies n = 2 in (2.3). Wiskundigen zeggen in dit verband dat de rij breuken 0,9, 0,99, 0,999, 0,999, . . . stijgend is en begrensd. De kleinste bovengrens, in dit geval 1, wordt de limiet van de rij genoemd. We zeggen dat de rij convergent is met limiet 1: de rij convergeert naar zijn limiet. Als je 1 = 0,9999999 . . . als vanzelfsprekend accepteert dan gaat het hier alleen maar om nieuwe naamgeving. Iedere decimale ontwikkeling met een eindig aantal cijfers voor de decimale komma15 en een doorlopende rij cijfers daarachter, hoe je daar ook verder aankomt, is te zien als reëel getal, en wel door het getal steeds verder in zijn decimale ontwikkeling af te kappen, en dan de limiet te nemen van de zo gevormde stijgende begrensde rij getallen. Een reëel getal is zo altijd als limiet van een niet-dalende begrensde rij rationale getallen te maken. Zonder erbij stil te staan werkten we altijd al zo met reële getallen. Dat onze gewoonte om breuken soms ook decimaal te schrijven tot veel inzicht leidt is duidelijk16 . Dat je hetzelfde getal op verschillende manieren kunt maken is niet vreemd als je bedenkt dat via 1 1 1 1 9 9 9 9 + + + + ··· = 1 = + + + + ··· 2 4 8 16 10 100 1000 10000 12 En, na invoering van het cijfer 0, met 10 als 1 keer acht plus nul keer 1. reden waarom Streefland’s pizzamodel niet in eerder genoemde kennisbasis voorkomt. 14 Ook herhaaldelijk vierendelen heeft een lange traditie: google Archimedes. 15 In het Engels een (decimal) point. 16 Dat veel inzicht verloren gaat als we breuken alleen maar decimaal schrijven ook. 13 De 9 tweevingerigen en tienvingerigen in hun praktische wiskunde uiteindelijk één zijn. En ze kunnen allebei meteen ook heel veel getallen maken! De tienvingerigen hebben bijvoorbeeld 0,1001000010000001 . . . = 1 1 1 1 + 4 + 9 + 16 + · · · , 10 10 10 10 niet minder reëel dan 0,1111 . . . , maar wel een getal waarbij in de decimale ontwikkeling geen periodieke herhaling zit, geen breuk dus. De bijbehorende stijgende rij van (cumulatieve) breuken is 1 1001 100100001 1001000010000001 , , , ,..., 10 10000 1000000000 10000000000000000 √ Dit voorbeeldgetal is net als 2 niet rationaal. Het heeft de opmerkelijke eigenschap dat van de rij benaderende breuken de derde al 9 √ cijfers van de decimale ontwikkeling goed heeft, de 4-de 16, enzovoorts. Kun je 2 ook zo snel en goed benaderen vinden met breuken? Het antwoord blijkt ja te zijn. We zullen een soortgelijke kwadratische progressie terugzien bij de methode van Newton. Een √ andere vraag is in hoeverre de getallen 2 en 0,1001000010000001 . . . even normaal of abnormaal zijn. Die laatste vraag komt nu eerst aan de orde, als we de reële getallen als verzameling gaan bekijken. 3 Toevallige decimale ontwikkelingen We hebben het tot nu toe alleen over individuele reële getallen gehad. Kunnen we17 die reële getallen ook echt als verzameling zien, waaruit je bijvoorbeeld een element kunt trekken, net zoals uit een vaas met blauwe en rode ballen, al of niet met teruglegging? Een simpele vraag die tot verwarrende antwoorden kan leiden18 . Want wat zijn toevalsgetallen eigenlijk? En wat is het verband tussen deze twee soorten getallen? Ik vulde vroeger bij lottorijtjes steevast 1,2,3,4,5,6 in, tot ongenoegen van mijn vader die vond dat die combinatie toch nooit zou optreden. Vaak heb ik geprobeerd uit te leggen dat elk ander rijtje van zes getallen net zo’n kleine kans heeft, maar hij wilde dat nooit geloven19 . In mijn optiek als kansrekenaar zijn er geen bijzondere rijtjes lottogetallen. Maar wat als je de rijtjes door laat lopen, zoals bijvoorbeeld in doorlopende decimale ontwikkelingen? Is 0,123456 . . . meer bijzonder dan 0,397284 . . . vanwege het bijzondere karakter van de eerste zes opeenlopende decimalen? Of doen de eerste zes decimalen er helemaal niets toe? Waartoe eigenlijk? Uit deze vragen over reële getallen valt het een en ander te leren. 3.1 Normale getallen Wat is een “typisch” getal tussen 0 en 1? We analyseren deze vraag aan de hand van de vertrouwde decimale ontwikkeling van getallen: elk reëel getal x tussen 0 en 1 kunnen we schrijven als x = 0,d1 d2 d3 . . . , 17 Of willen we? voor de auteur(s). 19 Met als argument dat “1,2,3,4,5,6 nog nooit gebeurd was”. 18 Ook 10 waarbij dk de k-de decimaal voorstelt, een cijfer dat 0, 1, 2, 3, 4, 5, 6, 7, 8 of 9 kan zijn. We nemen voor lief aan dat elke keuze van decimalen d1 , d2 , d3 , . . . zo een getal definieert. De schrijfwijze is niet helemaal uniek bepaald, maar als je afspreekt dat uiteindelijk alleen maar nullen verboden is, dan is dat probleem opgelost20 . Zou je nu aan de decimale ontwikkeling kunnen zien of 0,111222333 . . . meer “bijzonder” is dan 0,1945629 . . .? Zolang we niet weten wat de puntjes betekenen kunnen we hier maar weinig over zeggen, een getal is pas een getal als je alle decimalen kent, dus als je wilt zeggen of een getal al dan niet “typisch” of “bijzonder” is, dan zul je een manier moeten vinden waarbij alle decimalen een rol spelen, en dat is wel lastig. Als je bijvoorbeeld vraagt hoe vaak een 7, of willekeurig welk ander cijfer, in de decimale ontwikkeling voorkomt, omdat je verwacht dat het bij de “meeste” x wel zo zal zijn dat elk cijfer, of elk blokje cijfers van een bepaalde lengte, “even vaak” voorkomt in de decimale ontwikkeling, dan heb je meteen het probleem dat niet op voorhand duidelijk is wat “even vaak” betekent. Die onduidelijkheid is er al als je kijkt naar de gewone gehele getallen: komen even getallen “even vaak” voor als dat veelvouden van 5 voorkomen? Dat is maar hoe je het bekijkt. Er zijn oneindig veel even getallen, maar ook oneindig veel veelvouden van 5, dus vanuit dat perspectief bezien komen ze even vaak voor. Maar tegelijkertijd is elke tweede getal even, en slechts elke vijfde getal een veelvoud van 5, dus vanuit dat gezichtspunt komen even getallen vaker voor. Om toch onderscheid te maken doen we het volgende: bekijk alle getallen van 1 tot en met 1000, tel hoeveel even getallen daarbij zitten (500) en hoeveel 500 = 12 , en de vijfvouden (200). De relatieve frequentie even getallen is dan 1000 200 1 relatieve frequentie vijfvouden is dan 1000 = 5 . Als we nu i.p.v. 1000 een getal nemen dat steeds groter wordt, dan noemen de limietwaarde die we krijgen de frequentie of dichtheid van de even getallen respectievelijk de vijfvouden. Opgave 8. Wat is de frequentie van veelvouden van 3? Wat is de frequentie van getallen die zowel even zijn als een veelvoud van 3? Opgave 9. Wat is de frequentie van de kwadraten? Zou de collectie priemgetallen een frequentie hebben? Bij decimale ontwikkelingen, met weliswaar oneindig veel keuzemogelijkheden, maar slechts eindig veel cijfers om uit te kiezen, doen we net zoiets als we weer kijken naar decimale ontwikkelingen van getallen tussen 0 en 1. Het ligt voor de hand te verwachten dat wanneer we naar de ontwikkeling van een 1 getal x kijken, de frequentie van bijvoorbeeld 7 “meestal” gelijk is 10 , en dat 1 de frequentie van het “blok” 68 meestal gelijk is aan 100 . Een getal x noemen we daarom normaal als elk blok in de decimale ontwikkeling van x de juiste fre1 quentie heeft21 . Dus een getal is normaal als bijvoorbeeld 9 frequentie 10 heeft, 1 het blok 346 frequentie 1000 , en alle andere blokken ook allemaal de frequentie die je met je boerenverstand zou verwachten. Opgave 10. Laat zien dat breuken niet normaal kunnen zijn. Opgave 11. Construeer een getal dat geen breuk is en ook niet normaal. 20 Ten 21 Dit koste van de conventie dat 12 = 0,499999 . . . en niet 0,5000000 . . . heeft niets, maar dan ook helemaal niets, met de normale verdeling te maken. 11 Breuken zijn dus niet normaal. Dat is toch niet normaal? Bestaan er eigenlijk wel normale getallen? En zo ja, hoe vinden we er dan een? We zullen zien dat de overgrote meerderheid van de getallen normaal is, zoals je misschien al had verwacht, maar vreemd genoeg is het niet eenvoudig om er ook maar één op te schrijven. Laat staan eentje die je dagelijks tegenkomt, want de enige voorbeelden die we kennen zijn getallen zoals dit rare en zeer bijzondere Champernowne’s getal, gedefiniëerd als 0, 123456789101112131415161718192021 . . . . Een fraai maar onwaarschijnlijk getal, waarvan het nog niets eens zo duidelijk is dat het normaal is. Een echt bewijs gaat hier te ver, hoewel je er wel gevoel voor kunt krijgen door eerst maar eens te gaan onderzoeken wat de frequentie van 1 is. Opgave 12. Probeer te begrijpen waarom de frequentie van 1 gelijk is aan in Champernowne’s getal. 1 10 Nu is de frase “de overgrote meerderheid” hierboven ook nog niet eens zo’n heel precies wiskundig concept, dus we moeten uitleggen wat we daar mee bedoelen, en dat doen we met een kanstheoretische benadering. Stel we kiezen een willekeurig getal tussen 0 en 1, waarbij we geen enkel getal boven een ander prefereren. Wat is dan de kans dat we een normaal getal treffen? Als die kans voldoende groot is dan is er wellicht reden om inderdaad te concluderen dat de meerderheid van de getallen normaal is. Welnu, het blijkt dat de kans op een normaal getal gelijk is aan . . . 1! Wat ik precies bedoel met “willekeurig” kiezen, en met “kans 1” zullen we nu uitleggen. Een willekeurig getal kiezen tussen 0 en 1 kan op vele manieren. De volgende manier ligt voor de hand. We kiezen de decimalen, één voor één, gewoon willekeurig, waarbij steeds elk cijfer uit de verzameling {0, 1, , . . . , 9} dezelfde 1 kans 10 heeft om gekozen te worden. Voor de eerste decimaal komt dit neer 1 1 2 9 op het volgende: we kiezen in welk van de intervallen [0, 10 ), [ 10 , 10 ), . . . , [ 10 , 1] 1 ons getal komt te liggen op zo’n manier dat elk van de intervallen kans 10 heeft. Dit interval verdelen we ook weer in 10 gelijke stukken, em de tweede decimaal kiezen we door een van die intervallen aan te wijzen, enzovoort. Ik denk dat iedereen het erover eens zal zijn dat je niet veel willekeuriger kunt kiezen dan op deze manier. Maar: Opgave 13. Overtuig jezelf ervan dat de kans dat we op deze manier een van tevoren gekozen getal y kiezen gelijk is aan 0, voor alle y. Deze conclusie is al opmerkelijk. We kiezen een getal, zoveel is duidelijk, maar voor elk vantevoren gekozen getal y is de kans dat we juist die y kiezen gelijk aan 0. Vreemd, of juist niet? Wel, als de keuze echt willekeurig is, dan is elk getal even waarschijnlijk, en heeft elk getal dus dezelfde kans om gekozen te 1 worden. Maar dan kan die kans niet positief zijn. Stel namelijk dat die kans 10 is (ik noem maar wat) dan zou de totale kans van bijvoorbeeld 20 verschillende punten gelijk zijn aan 2 en dat is onmogelijk. Meer kans dan 1 hebben we niet22 . Bij onze willekeurige keuze uit het interval [0, 1] is er nog iets vreemds aan de hand: een enkel willekeurig getal tussen 0 en 1 kiezen, is kennelijk hetzelfde 22 Waarom eigenlijk? 12 Thema: toevallige getallen als een oneindige rij van onafhankelijke decimalen kiezen!! Alle “toevalligheid” die er is in één willekeurig getal tussen 0 en 1, is niets minder of meer dan de toevalligheid in een oneindige rij cijfers. In de kansrekening hebben we het vaak over een oneindige rij toevallige trekkingen uit een bepaalde verzameling. De specifieke manier waarop we een willekeurig getal uit [0, 1] trokken laat zien dat voor zo’n willekeurig getal geldt dat de decimalen beschouwd kunnen worden als onafhankelijke toevallige trekkingen uit {0, 1, . . . , 9}. Dit hangt samen met De wet van de grote aantallen, waar bijna iedereen wel eens over gehoord heeft. Anders dan bijvoorbeeld Murphy’s Law, is dit een echte wet die verifieerbare uitspraken doet. Wat hebben onze toevalsgetallen en deze wet te maken met de normale getallen die we zoeken? Het blijkt dat de wet van de grote getallen (die we zometeen formuleren) impliceert dat wanneer we één voor één de decimalen onafhankelijk en toevallig kiezen, het getal dat we krijgen met kans gelijk aan 1 een normaal getal is. We weten al dat er getallen bestaan die niet normaal zijn, dus niet elk getal is normaal. Maar de kans dat we zo’n niet-normaal getal trekken is 0. Dat volgt uit deze formulering van de grote aantallen wet: Wet van de grote aantallen: Stel we voeren n onafhankelijke experimenten uit met succeskans p. Het aantal successen23 na n experimenten noemen we X(n). Dan geldt met kans 1 dat X(n) n naar p convergeert als n groter wordt24 . Deze wet passsen we toe op de keuze van decimalen zoals hiervoor beschreven. We zeggen bijvoorbeeld dat het n-de experiment succesvol is als we als n-de decimaal een 9 kiezen. Het aantal successen (hier dus het aantal negens) bij de 1 , eerste n decimalen convergeert volgens de wet van de grote aantallen naar 10 1 de succeskans. De frequentie van een 9 is dus 10 , en evenzo voor elk ander getal tussen 0 en 9. De toepassing van de wet van de grote aantallen bij een blok ter lengte 2 is net iets ingewikkelder. Dat komt omdat twee verschillende blokken van lengte 2 niet altijd onafhankelijk zijn - er kan overlap bestaan. Als de eerste twee decimalen bijvoorbeeld 68 zijn, dan kan het tweede blok alleen maar met een 8 beginnen. Opgave 14. Deze complicatie kan op verschillende manieren opgelost worden. We kunnen een andere wet van de grote aantallen formuleren die wel toepasbaar is, maar we kunnen in dit geval ook met een truc de problemen oplossen, en wel door de blokken ter lengte 2 in twee series op te schrijven. De eerste serie bestaat uit de blokken d1 d2 , d3 d4 , . . . en de tweede uit d2 d3 , d4 d5 , . . . Op beide series kunnen we gewoon onze wet van de grote aantallen toepassen, en gezamenlijk geeft dat precies wat we nodig hebben. Kun je dit precies maken? Nu we weten dat de kans op een niet normaal getal gelijk is aan 0, moeten er waarachtig wel heel veel normale getallen bestaan! Vreemd dat het √ dan toch zoveel moeite kost om er eentje te vinden. En vraag maar niet of 2 normaal is25 . 23 Met de binomiale verdeling van X(n) kunnen we dit echt bewijzen. is een versie van de sterke wet van de grote aantallen. 25 Eerst maar eens gewoon uitrekenen trouwens. 24 Dit 13 Thema: wet van de grote aantallen 3.2 Hoeveel toeval kunnen we verdragen? We zagen zojuist al dat de keuze van één willekeurig toevallig getal uit het interval [0, 1] eigenlijk hetzelfde is als een oneindige rij toevallige keuzes uit {0, 1, . . . , 9}. In deze sectie gaan we het nog gekker maken: we beweren dat de keuze van één toevallig getal uit het interval [0, 1] eigenlijk ook hetzelfde is als de keuze van oneindig veel onafhankelijke toevallige getallen in [0, 1]. Als je 1 getal trekt, trek je er tegelijkertijd, en zonder daar extra werk voor te verrichten oneindig veel.26 Dat klinkt spectaculair. Als we snappen hoe dit werkt, dan hebben we absoluut meer inzicht gekregen in de natuur van wat we de reële getallen noemen. Laten we, om te beginnen, uit 1 toevallig getal er 2 maken. Stel het toevallige getal dat we gekozen hebben heeft als (begin van zijn) decimale ontwikkeling x = 0,175449230722916 . . . We kunnen hier twee getallen uit maken door de decimalen op de even posities en de decimalen op de oneven posities apart te nemen. Als we de oneven decimalen eerst apart nemen dan krijgen we xo = 0,15420296 . . . en met alleen de even decimalen geeft dit xe = 0,7493721 . . . Aangezien alle decimalen willekeurig gekozen zijn uit {0, 1, . . . , 9} zijn zowel xo als xe ook weer willekeurig gekozen getallen in [0, 1], en nog onafhankelijk van elkaar ook. Opgave 15. Laat nu zien hoe je uit 1 toevallig gekozen getal elk eindig27 aantal toevallige gekozen getallen kunt halen. De vorige opgave vertelt al iets verrassends, namelijk dat het kiezen van 1 toevallig getal in [0, 1] zonder extra werk al leidt tot de keuze van elk gewenst eindig aantal toevallig gekozen getallen in [0, 1]. We zijn hiermee echter nog niet tevreden, want we willen oneindig veel toevallige getallen maken uit eentje! Dat gaat als volgt. Voor het eerste getal - we noemen dat even x1 - gebruiken we de decimalen op de plaatsen 1, 3, 6, 10, 15, . . . van x. De crux is dat we er elke keer eentje meer over slaan. Voor x2 gebruiken we de decimalen op plaats 2, 4, 7, 11, 16, . . . van x. Voor x3 gebruiken we 5, 8, 12, 17, . . . enzovoort. Hopelijk zie je wat er aan de hand is. Doordat we de “gaten” tussen de gebruikte cijfers steeds groter laten worden, lukt het om elke keer weer een nieuw getal te beginnen. Op deze manier kunnen we getallen x1 , x2 , x3 , . . . maken die allemaal onafhankelijk zijn van elkaar, en allemaal een willekeurige keuze uit [0, 1] voorstellen. De “toevalligheid” die we nodig hebben om 1 getal te maken, is voldoende om er dan ook maar gelijk oneindig veel te maken. Opgave 16. Kun je uit 1 willekeurig gekozen getal in [0, 1] ook twee willekeurig gekozen getallen uit [0, 10] maken? 26 Een wiskundig equivalent van de wonderbaarlijke broodvermenigvuldiging. 372. 27 Bijvoorbeeld 14 Thema: tellen, nummeren Opgave 17. Kun je uit 1 toevallig gekozen getal in [0, 1] ook twee willekeurig gekozen reële getallen maken?28 Als een verzameling oneindig veel elementen bevat dan gebeuren er dingen die tegen je gevoel in gaan. Kennelijk is het zo dat wanneer ik één willekeurig getal trek uit [0, 1], ik er automatisch ook twee heb getrokken, het lijkt wel of 1 zo gelijk is aan 2. Misschien helpt het bij het reflecteren hierop om te bedenken dat we in de praktijk nooit een precies getal hoeven en kunnen kiezen29 . We werken bij reële getallen noodzakelijkerwijs met benaderingen, en als je je dat realiseert dan is het allemaal minder schokkend. Immers, als ik een getal benader door bijvoorbeeld de eerste 10 decimalen na de komma te geven, en ik noem dat getal x, dan hebben de xe en xo die we boven construeerden allebei slechts 5 decimalen na de komma. Je krijgt er dus twee getallen voor terug, maar wel met een kleinere nauwkeurigheid. Het aardige is natuurlijk dat dit verschil niet bestaat zodra je oneindig veel decimalen vastlegt, want de helft van oneindig is nog steeds oneindig. De paradox die we nu beschreven hebben (twee getallen “is hetzelfde” als 1 getal) heeft van alles te maken met oneindig, en de problemen die je hebt bij het werken met oneindig. Daar zouden we een hele nieuwe cursus over kunnen praten30 . 4 Newton’s methode als dynamisch systeem √ Newton’s methode om 2 te benaderen met breuken gaat uit van de grafiek van de functie f : x → x2 − 2 in het xy-vlak. Dat is de kromme met vergelijking y = x2 − 2. Je begint met een punt op de grafiek, bijvoorbeeld (x, y) = (1, −1), neemt een slim gekozen lijn door dat punt, en snijdt die met de x-as. Als je lineaire vergelijkingen kunt oplossen dan lukt dat mits je de lijn niet horizontaal neemt. Vervolgens neem je bij de x-waarde van het snijpunt het bijbehorende punt op de grafiek, daardoor weer een slim gekozen lijn, en die snij je weer met de x-as. Zo ga je door. Newton’s slimme keuze voor de lijn die je in elke stap nodig hebt bestaat eruit dat je steeds de raaklijn door het punt aan de grafiek neemt. Newton heeft zelf bedacht hoe je die raaklijn moet opstellen. √ Met deze dynamische keuze blijkt dat je in een paar stappen zo dicht bij 2 zit dat de fout in de benadering bijna verwaarloosbaar is. Er zijn meer keuzen waarmee dat laatste lukt, maar die vergen veel meer stappen. Je kunt bijvoorbeeld de lijn steeds van de vorm y = 2x + b nemen, met b zo gekozen dat de lijn door het punt op de grafiek gaat. Dat werkt ook, maar veel minder snel dan met Newton’s dynamischere keuze, die gebruikt hoe de grafiek er lokaal uitziet in het punt waardoor je steeds de lijn moet kiezen, en in principe werkt voor alle nette functies. In het speciale geval van f : x → x2 −2 zullen we zien dat Newton’s methode neerkomt op het itereren van de Newton functie voor f , F (x) = x 1 1 2 + = (x + ), 2 x 2 x 28 Pas op: strikvraag. we bijvoorbeeld alleen maar met gehele getallen werken. 30 Maar dat gaan we niet doen, Ronald. 29 Tenzij 15 (4.1) waarbij je dus de facto steeds het gemiddelde neemt van x en x2 . Zonder te denken in termen van grafieken en raaklijnen kun je natuurlijk ook op dit idee komen, want je zoekt immers een getal x waarvoor en x en x2 gelijk zijn. Is x te groot dan is x2 te klein, dus ergens tussen x en x2 moet je zoeken, en het gemiddelde van de twee ligt als eerste gok voor de hand, getuige een duizen√ den jaren oud Babylonisch kleitablet31 met sexagecimale benaderingen van 2. Proefondervindelijk blijkt deze eerste gok een meer dan gelukkige keuze, zoals zal blijken uit een analyse van de methode, die voor de 5-de machtswortel uit 3 blijkt te leiden tot 4 3 , (4.2) F (x) = + 5x 5x4 niet het gewone maar een gewogen gemiddelde van x en 4.1 3 x4 . Raaklijnen zonder differentiëren Welke lijn door het punt (x, y) = (1, −1) verdient/heeft de naam raaklijn aan y = x2 − 2 in het punt (x, y) = (1, −1)? Het Engels woord voor raaklijn is tangent (van tangere, Latijn voor aanraken), volgens the Oxford Advanced Learner’s Dictionary, the dictionary you can trust als we de cover moeten geloven, a straight line that touches the outside of a curve but does not cross it (geometry). Deze beschrijving is misschien intuı̈tief duidelijk maar wiskundig precies noch correct, en biedt weinig perspectief voor lastigere zaken. Wat is een raakvlak aan een torus bijvoorbeeld, om maar wat te noemen. Zuiver of toegepast, goede wiskunde onderscheidt zich van slechte wiskunde met name ook door precies proberen te maken waar we het over hebben. Daarom de vraag: welke lijn door het punt (x, y) = (1, −1) is in dat punt bijzonder met betrekking tot de grafiek y = x2 − 2 van de functie f : x → x2 − 2, en wel in die zin dat de lijn en de grafiek in (x, y) = (1, −1) het meest op elkaar lijken? Alle lijnen door (x, y) = (1, −1) worden gegeven door vergelijkingen van de vorm y = −1 + a(x − 1), (4.3) met a een vrij te kiezen reëel getal, behalve de lijn met vergelijking x = 1, de enige lijn die niet de grafiek is van een functie. Deze lijn is wel wat bijzonder natuurlijk omdat het de enige verticale lijn is door (x, y) = (1, −1). Die bijzonderheid heeft niets met de grafiek van f te maken en daarom laten we deze lijn verder buiten beschouwing. Voor elke gegeven reële a is de lijn met vergelijking (4.3) wel de grafiek van een functie, namelijk van La : x → −1 + a(x − 1). Als naam voor de functie gebruiken we hier La . Elke La heeft de eigenschap dat hij met x = 1 hetzelfde doet als f , de output is immers hetzelfde: La (1) = f (1) = −1. 31 Onmiskenbaar is wiskunde na het torenfiasco de enige echte overgebleven universele taal. 16 Thema: experiment, fout-analyse De vraag voor welke a de lijn (4.3) bijzonder is in (x, y) = (1, −1) met betrekking tot de grafiek van f zoals boven geformuleerd vertaalt zich als: welke La lijkt in zijn werking als functie het meest op f als we hem loslaten op xwaarden in de buurt van x = 1? Als we de gemeenschappelijke (output)waarde La (1) = f (1) = −1 aftrekken van La (x) en van f (x) dan zien we hun beider werking als, respectievelijk, La (x) − La (1) = a(x − 1), 2 f (x) − f (1) = x − 1 = (x + 1)(x − 1). (4.4) (4.5) De gemeenschappelijke factor in de rechterleden van (4.4) en (4.5) is x − 1. Deze factor is klein voor x-waarden in de buurt van x = 1. In (4.5) is de voorfactor x + 1 ongeveer gelijk aan 2 als x ongeveer 1 is. De overeenkomst tussen de rechterleden (4.4) en (4.5) is in de buurt van x = 1 dus maximaal als we a = 2 nemen in (4.4). Het verschil tussen de voorfactoren is dan klein, en het verschil tussen de rechterleden van (4.4) en (4.5) is nog veel kleiner, vanwege de, voor x-waarden in de buurt van x = 1, kleine gemeenschappelijke factor x − 1. Dit maken we zo nog wat duidelijker. De grafiek van L2 is wat in de wiskundige volksmond de raaklijn32 aan de grafiek van f in (x, y) = (1, −1) genoemd wordt. De waarde a = 2 heet de richtingscoëfficiënt33 van de (raak)lijn. In dit geval is de raaklijn intuı̈tief de lijn die je van onderen net rakend tegen de grafiek aan legt. Oxford Advanced Learners Dictionary heeft het dus niet altijd fout. Hoe het ook zij, de lijn die iedereen de raaklijn noemt aan onze voorbeeldgrafiek in het punt met x = 1, is de grafiek van de lineaire functie L gegeven door L(x) = −1 + 2(x − 1) (we laten de subscript nu maar weg). Om te kijken hoe goed L(x) de functiewaarden f (x) benadert kijken we naar het verschil van beide functies. Met (4.4) en (4.5) vinden we f (x) − L(x) = (x − 1)2 als de fout in de benadering. Deze restterm noemen we R(x). Met links alleen f (x) en rechts de lineaire benadering L(x) en de restterm R(x) hebben we dat f (x) = −1 + 2(x − 1) + (x − 1)2 . {z } | {z } | L(x) R(x) De restterm R(x) is klein in de buurt van x = 1. Hoe klein? Relatief klein in verhouding tot beide twee termen in L(x). Hoe dichter x bij 1 hoe beter. 1 staat er Met x = 1 + 10 f (1 + 1 2 1 ) = −1 + + , 10 10 100 | {z } 1 ) L(1+ 10 32 In het Engels ook tangent line. rico. Engels: slope. 33 Kort: 17 en met x = 1 − 1 100 f (1 − 1 2 1 ) = −1 − + . 100 | {z 100} 10000 1 L(1− 100 ) Een x die dicht bij 1 zit wordt vaak geschreven als x = 1 + h. De rol van h wordt hopelijk inzichtelijker met af en toe een expliciete keuze voor h.34 Opgave 18. Herhaal het argument hierboven voor (de grafiek van) de functie f : x → x2 . Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek in (x, y) = (1, 1)? Opgave 19. Herhaal het argument hierboven voor (de grafiek van) de functie f : x → x3 . Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek in (x, y) = (1, 1)? Hint: factoriseer x3 − 1 in twee factoren35 . Opgave 20. Herhaal het argument hierboven voor (de grafiek van) de functie f : x → x4 . Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek in (x, y) = (1, 1)? Hint: factoriseer x4 − 1 in (maar) twee factoren36 . Opgave 21. Herhaal het argument hierboven voor (de grafiek van) de functie f : x → x5 . Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek in (x, y) = (1, 1)? Hint: factoriseer x5 − 1 in twee factoren37 . Opgave 22. Hiermee is de regelmaat wel duidelijk. Nu dezelfde vragen voor de raaklijnen aan de grafieken in de punten met x = p. Hint: factoriseer x2 − p2 , x3 − p3 , etc. Opgave 23. Vergeet de merkwaardige producten nu echt nooit meer. Opgave 24. Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek van f : x → x5 − 2x3 + x + 1 in het punt met x = p? Probeer het ook eens met een staartdeling, eerst met p = 2 bijvoorbeeld. Opgave 25. Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek van f : x → x1 in het punt met x = 1? En in het punt met x = p (p 6= 0)? Opgave 26. Wat is de richtingscoëfficiënt van de raaklijn aan de grafiek van f : x → x12 in het punt met x = 1? En in het punt met x = p (p 6= 0)? Opgave 27. Idem voor f : x → 1 x3 , etc. Samenvattend: we kunnen in punten op grafieken van eenvoudige functies f , functies die we maken met rationale formulevoorschriften38 , de raaklijn aan de grafiek bepalen in elk punt (x, y) = (p, f (p)), als f (p) tenminste maar gedefinieerd is39 . De rico van de raaklijn, hierboven steeds a genoemd, hangt 34 Een x die dicht bij 0 zit blijven we natuurlijk x noemen. Heen en weer switchend tussen x 1 en bijvoorbeeld 10 valt er veel te leren. In de volgende cursus zullen we hier nog meer gebruik van maken. 35 Gebruik (1.1) met 3 in plaats van 5, zeg maar 5 = 3. 36 Gebruik (1.1) met 5 = 4. 37 Gebruik (1.1) met 5 = 5. 38 Waarin we alleen +, −, ·, / gebruiken. 39 Lees: als we niet door nul gedeeld hebben voor de inputwaarde x = p. 18 Thema: staartdeling van p en van f (p) af, en wordt genoteerd met f 0 (p) en uitgesproken als f accent van p. De definitie van de afgeleide functie f 0 via f 0 (p) = lim x→p f (x) − f (p) x−p (4.6) bij differentiaalrekening, die meestal pas komt nadat limieten veel uitgebreider40 zijn behandeld voor veel algemenere functies, is hiermee consistent. We noemen de rico f 0 (p) daarom vanaf nu ook de afgeleide van f in p. Wat we nog niet kunnen is het vinden van raaklijnen (inclusief een goede definitie) in punten op krommen in het vlak die op een andere manier gegeven zijn (door andere functies, of als vergelijking, bijvoorbeeld x3 + y 3 = xy). Maar wat we gedaan hebben wijst wel in de juiste richting: je moet de lijn nemen die in de buurt van het punt zoveel mogelijk op de kromme lijkt. Een intuı̈tieve manier om dit te formuleren is dat bij inzoomen op het punt de kromme steeds recht wordt en in de limiet een rechte lijn verschijnt41 . Als dit lukt heet de kromme differentieerbaar, anders niet. En natuurlijk moet de definitie ook niet afhangen van de hoe we het assenstelsel op ons papier tekenen. Dit alles is nu van latere zorg. Voorlopig kunnen wel al erg blij zijn met de definitie van eerst f 0 (1) en daarna f 0 (p) (als rico van de raaklijn aan de grafiek in het punt met x = p) voor willekeurige p als f gegeven wordt door f (x) = xn met n geheel, en simpele combinaties daarvan. In het bijzonder weten we nu dat f (x) = xn f 0 (x) = nxn−1 , ⇒ (4.7) zonder dat we het binomium van Newton hebben gebruikt. 4.2 Newton’s methode Newton’s methode om nulpunten van een functie f te vinden gebruikt de formule y = f (p) + f 0 (p) · (x − p) (4.8) voor de raaklijn aan de grafiek in het punt met x-coordinaat p. De vermenigvuldigingspunt benadrukt dat de tweede term van het rechterlid het product is van de nog te bepalen richtingscoëfficiënt f 0 (p) en x − p. Het snijpunt met de x-as vinden we door y = 0 te nemen in (4.8). Als f 0 (p) 6= 0 volgt dat f (p) (4.9) x=p− 0 . f (p) Omdat de p in de methode van Newton variabel wordt gekozen, ligt het voor de hand om het rechterlid van (4.9) te gebruiken als formulevoorschrift voor een nieuwe functie, met een mogelijk beperkter definitiegebied. We noemen deze nieuwe functie F , dus42 f (p) (4.10) F : p→p− 0 . f (p) 40 Maar ook niet precies. moet recht maken wat krom is. 42 p of x in de definitie van F : what’s in a name? 41 Inzoomen 19 Newton’s methode kiest (soms met enig verstand) een startwaarde p, zeg p = p0 , gebruikt (4.9) om x uit te rekenen, en stopt het resultaat voor x als een nieuwe p = p1 weer in het rechterlid van (4.9) om de volgende x uit te rekenen, die als p = p2 weer in het rechterlid van (4.9) gaat. Dit kan herhaald worden zo vaak als mogelijk of gewenst. In termen van F is Newton’s methode niets anders dan het uitrekenen van p1 = F (p0 ), p2 = F (p1 ) = F (F (p0 )), p3 = F (p2 ) = F (F (p1 )) = F (F (F (p0 ))), enzovoorts. Dit noemen we het itereren van F , kort opgeschreven als pn+1 = F (pn ), n = 0, 1, 2, 3, . . . , (4.11) met startwaarde p0 . We noemen (4.11) een (deterministisch) dynamisch systeem met discrete tijd. Opgave 28. Laat, al of niet met behulp van de moderne kennis van de differentiaalrekening, zien dat Newton’s methode voor f (x) = x5 − 3 leidt tot het itereren van de functie F met formulevoorschrift F (x) = 3 4x + 4, 5 5x (4.12) voor het benaderen van de vijfdemachtswortel uit 3. Opgave 29. Welke F gebruik je voor de elfdemachtswortel uit 42? Opgave 30. Bij een gegeven functie F (eventueel met gaten in zijn definitiegebied) en een rij punten gedefinieerd door (4.11) kunnen we in het xy-vlak de diagonaal y = x en de grafiek y = F (x) tekenen, alsmede de punten P0 = (p0 , p0 ), P1 = (p1 , p1 ), P2 = (p2 , p2 ), P3 = (p3 , p3 ), . . . op de diagonaal. Geef een beschrijving van hoe elk volgend punt Pn+1 bepaald wordt in termen van de diagonaal, de grafiek en het punt Pn , en wel zo dat de beschrijving niet verandert als we grafiek van F transleren evenwijdig langs de diagonaal. Opgave 31. Als in Opgave 30 de functie F een dekpunt B heeft, dat wil zeggen, een punt B met F (B) = B, dan schuiven we de grafiek evenwijdig aan de diagonaal zo op dat het punt (B, B) in de oorsprong terecht komt. Deze verschoven grafiek is weer de grafiek van een functie. Van welke functie? Elke functieknop op de rekenmachine, de kwadraatknop bijvoorbeeld, maar ook de cosinusknop (wat de cosinus ook moge zijn als functie) definieert een (weliswaar numerieke benadering van) een dynamische systeem. Het dynamisch systeem gegeven door de functie F bestuderen we door, in principe voor elke keuze van de startwaarde p0 , te kijken naar het gedrag van de door (4.11) bepaalde rij p0 , p1 , p2 , p3 , . . . . Dit gedrag kan zeer uiteenlopend zijn. De door F (x) = λx(1 − x) 20 (4.13) Thema: chaos en toevalsgetallen gedefinieerde Verhulst afbeelding, met λ een parameter waarmee je kunt spelen, illustreert dat i.h.a. zowel regelmatig als chaotisch gedrag mogelijk is, maar wat we in de context van Newton’s methode met F verwachten is dat de p-tjes steeds dichter bij het gezochte nulpunt van de f komen te liggen. Newton’s functie F is middels (4.10) immers niet zomaar gemaakt. In het bijzonder heeft Newton’s F de eigenschap dat F (p) = p equivalent is met f (p) = 0, althans voor p met f 0 (p) 6= 0. Er zijn natuurlijk bij f veel meer F -en te maken die de nulpunten van f als dekpunten hebben, zet maar een coëfficiënt voor het quotiënt in (4.10) bijvoorbeeld, of neem een andere deler dan f 0 (p), een constante of zo, maar die andere F -en doen het niet zo goed. Bij elke functie F , al of niet verkregen uit een f waarvan we nulpunten zoeken, ligt, als onderdeel van de analyse van het dynamisch systeem dat bij F hoort, de vraag wat de dekpunten van F zijn als eerste voor de hand. Dat zijn namelijk de evenwichtstoestanden. Gegeven zo’n evenwicht is de natuurlijke volgende vraag wat er gebeurt al je het evenwicht een klein beetje (of heftig) verstoort. Zulke stabiliteitsvragen geven aanleiding tot diverse definities van lokale en globale stabiliteit van evenwichten. De precieze definities van de diverse begrippen laten we achterwege, maar hopelijk is in de voorbeelden wel duidelijk wat wat moet zijn en dat is voorlopig genoeg. Goede precieze definities volgen sowieso meestal pas uit inspectie van voorbeelden en wat je daarbij waarneemt, en de vraag wat Newton’s F nu zo bijzonder maakt kan aan de hand van voorbeelden goed aan de orde komen. Hiertoe kijken we eerst naar voorbeelden van functies F waarvoor x = 0 een dekpunt is. Op grond van Opgaven 30 en 31 is immers elke functie met een dekpunt x = B te veranderen in een functie met dekpunt x = 0, waarvoor de stabiliteitseigenschappen moeilijk anders kunnen zijn dan die van x = B voor de oorspronkelijke functie F . Opgave 32. Laat F (x) = ax. Onderzoek voor a = 21 , a = 1, a = −1, a = 2, a = − 13 de stabiliteit van het evenwicht x = 0. Geef steeds aan voor welke startwaarden de iteraties naar 0 convergeren. Opgave 33. Dezelfde vraag voor F (x) = x2 , F (x) = 2x2 en F (x) = −2x2 . Opgave 34. Dezelfde vragen voor F (x) = ax2 met a 6= 0. Opgave 35. In de vorige opgaven is de snelheid waarmee iteraties convergeren naar het evenwicht nog niet aan de orde geweest. Bestudeer in dit verband de rol van de positieve gehele exponent n als F (x) = axn met n = 1 en n = 2. Laten we vervolgens nu eens kijken naar Newton’s methode voor het trekken van de 5-demachtswortel uit het getal 3. De f waarmee we F maken heeft maar één nulpunt: het positieve getal dat tot de 5-de macht verheven het getal 3 geeft. We noemen dit getal hieronder B, de unieke positieve oplossing43 van de vergelijking B 5 = 3. Uit Opgaven 28 en 29 is makkelijk te raden welke F gebruikt moet worden voor de n-demachtswortel uit b > 0. Hoe het dan zit met de relevante bijzondere eigenschappen van F is dan ook wel af te leiden uit de eigenschappen die we hieronder zien voor de F uit Opgave 28. 43 Dat B bestaat nemen we aan, is het duidelijk dat er dan maar één zo’n B is? 21 Opgave 36. Laat F gegeven zijn door (4.12) en B > 0 de unieke oplossing zijn van B 5 = 3. Laat m.b.v. (1.1) zien dat F (x) − B = x − B − 2B 2 B3 x5 − B 5 3B 2 4 = (x − B) + + ). ( + 4x4 5x 5x2 5x3 5x4 Het rechterlid vertelt ons meteen al dat F (x) een minimum heeft in x = B ter grootte F (B) = B. In het bijzonder zien we dat de tweede factor in het rechterlid in Opgave 36 ongelijk nul is voor x dicht bij B, terwijl de eerst factor dan (kwadratisch) klein is. We concluderen hieruit dat de beste kwadratische benadering van F rond x = B gegeven wordt door F (x) = B + 4+3+2+1 (x − B)2 . 5B Deze benadering is bijzonder omdat de lineaire factor x − B er niet in voorkomt en met de opgaven hierboven kunnen we de consequenties daarvan zien. Als we de grafiek van F oppakken en zo naar de oorsprong schuiven dat (B, B) in de oorsprong uitkomt, zie Opgaven 30 en 31, dan krijgen we de grafiek van een functie die zijn minimum nul in x = 0 aanneemt, met als kwadratische benadering rond x = 0 de nu puur kwadratische term 2 4+3+2+1 2 x = x2 . 5B B Zodra je bij het itereren in de buurt van x = 0 zit pluk je in elke stap de vruchten het kwadraat. Dit is de reden dat Newton’s methode het zo goed doet: er zit geen lineaire term in de benadering van F rond zijn dekpunt. 5 Rente op rente en het getal e Banken keren rente uit op het geld dat je bij ze wegzet. Bij sommige spaarrekeningen gebeurt dat op jaarbasis middels een van te voren vastgestelde rentefractie. Banken gebruiken liever het woord percentage, een woord dat ik zal vermijden vanwege de ruis die het veroorzaakt in het reken- en wiskundeonderwijs. Je krijgt de fractie door het percentage door 100 te delen. Dus 30% van 3 iets betekent een fractie 0,3 = 10 van dat iets, 50% van alle gevallen betekent de helft van alle gevallen. In 100% van alle gevallen waarin het woord percentage gebruikt wordt is het gebruik van dat woord overbodig44 . 5.1 Rente op rente Als de rentefractie op jaarbasis a is dan wordt je tegoed elk jaar met een factor 1+a vermenigvuldigd. Dat oogt al veel beter als start voor het verhaal hieronder A dan een factor 1 + 100 met rentepercentage A. Met rentefactor a = 1 wordt je geld jaarlijks verdubbeld. Banken werken vaak met maandelijks bijschrijvingen. Stel de bank zegt, ja 1 , maar we keren wel elke maand onze rentefractie is wel a, bijvoorbeeld45 a = 15 44 Met deze zin als unieke uitzondering op de regel. de rentefractie die IceSave beloofde. 45 Ongeveer 22 uit. Als ze je niet besodemieteren betekenent dat: aan het eind van elke maand wordt je tegoed met een factor a 1+ 12 vermenigvuldigd. De rentefractie op maandbasis is daarbij natuurlijk wel 12 keer zo klein als op jaarbasis, maar elke volgende maand krijg je rente op het nieuwe steeds grotere bedrag, dus er telt uiteindelijk alleen maar meer mee. Dat kan na 12 maanden alleen maar gunstiger zijn, want als de elke maand bijgeschreven rente niet meegeteld wordt bij elke volgende renteberekening, dan kom je aan het eind van het jaar op precies hetzelfde uit. Je krijgt dus in 12 maanden in a op het startbedrag46 . Bij rente ieder geval meer dan 12 keer de rentefractie 12 a op maandbasis is na 1 jaar je tegoed 12 keer met 1 + 12 vermenigvuldigd. De eenvoudige observatie is dat, voor a > 0, 1+ a 12 groter is dan 1 + a, 12 (5.1) Nogal wiedes en verder uitschrijven kan dit inzicht voorlopig alleen maar vertroebelen, zeker met een expliciete keuze voor a. De vraag die we wel meteen ook stellen is of het nog (veel) meer kan worden als we de rente 52 keer per jaar bijgeschreven krijgen, of 365 keer, enzovoorts. Voor de berekeningen die nu volgen is het essentieel dat we met een abstracte rentefactor a werken en de keuze van a niet meteen specificeren. Zonder deze abstractie verdwijnt alle structuur waaraan we iets kunnen zien, als we het aantal rentebijschrijvingen per jaar veranderen van maandelijks naar wekelijks naar dagelijks etc. Met a krijgen de formules een natuurlijke ordening die ze transparant maakt, en die we ook pas uitschrijven47 als dat nodig is. Rente op rente op maandbasis en niet op jaarbasis betekent dat het eind van het jaar je tegoed een factor a 12 1+ 12 groter is, in plaats van de factor 1 + a op jaarbasis. Dat is zo evident meer dat we dat niet hoeven uit te rekenen, maar we doen het zometeen toch. Dat de 12 in de formule het aantal bijschrijvingen per jaar is snappen we inmiddels. Met twee bijschrijvingen per maand krijg je zo op jaarbasis een factor 1+ a 24 , 24 dezelfde formule, maar met 24 in plaats van 12, hetgeen goed te herkennen is door het gebruik van de abstracte notatie met a. Dat de factor met 24 (nog) meer is dan met 12 is wel duidelijk, want wat op maandbasis al beter is, twee keer bijschrijven per maand in plaats van één keer, is zeker ook op jaarbasis beter. Het ophakken van de renteperiode in kleinere periodes maakt je dus rijker. In de formules zien we inmiddels waar wat staat. De oorspronkelijke rentefractie op jaarbasis is a, en het aantal renteperiode per jaar is de in de laatste formule twee keer voorkomende 24. 46 In 1 het geval a = 15 is dit inzicht dus gebaseerd op de rekensom 12 × het binomium van Newton. 47 Met 23 1 12×15 = 1 . 15 Opgave 37. Laat in detail zien waarom voor elke a > 0 geldt dat a 24 a 12 1+ > 1+ . 24 12 Rentetermijnen verder ophakken is dus ook alleen maar gunstiger. Maar is het nu duidelijk dat rente op weekbasis, met 52 bijschrijvingen per jaar en een factor a 52 1+ 52 op jaarbasis, nog gunstiger is? Intuı̈tief wel, maar rekenen via maanden gaat niet want 52 is niet deelbaar door 12. Wel door 13 trouwens, dus de vraag zou eerst kunnen zijn of de factor a 12 a 13 groter is dan 1 + . 1+ 13 12 De stap van 12 naar 13 schreeuwt nu als het ware om de volgende abstractie: zet een n in plaats van 12 en n + 1 in plaats van 13. We willen immers nagaan dat de bijschrijffactor a n en (a) = 1 + (5.2) n groter wordt als n groter wordt gekozen. Dat kunnen we stap voor stap doen, bijvoorbeeld van n = 12 naar n = 13, of van n = 123456789 naar n = 123456790. Met de introductie van n lukt het hopelijk om in één keer al deze stappen tegelijk48 te zetten, middels een bewijs dat n+1 a a n en+1 (a) = 1 + groter is dan 1 + = en (a), (5.3) n+1 n niet alleen voor n = 12, maar voor elke n vanaf n = 1. De a is voorlopig positief, want we praten over rentebijschrijvingen. We verwachten dan intuı̈tief dat (5.3) waar is: en (a) zal groter zijn naarmate n groter is. Natuurlijk blijft de hamvraag of en (a) willekeurig groot wordt als we steeds vaker rente bijgeschreven krijgen, maar dat klinkt te aantrekkelijk om waar te zijn. Er zal dus wel een bovengrens zijn voor en (a), een bovengrens die afhangt van a, maar niet van n. 5.2 De definitie van exp en e Vooruitlopend op het inderdaad stijgend en begrensd zijn van de rij getallen en (a) die je krijgt als je, voor een vaste a ≥ 0, in (5.2) voor n achtereenvolgens 1, 2, 3, . . . invult, kunnen we een limietwaarde introduceren voor n naar oneindig49 . Voor gegeven a ≥ 0 is het resultaat een positief getal dat we exp(a) noemen. Voorlopig is exp alleen maar een naam en (nog) niet de knop op de rekenmachine. We zeggen: a n en (a) = 1 + stijgt naar exp(a) als n → ∞ voor elke a ≥ 0. (5.4) n 48 Bijna net als het in één keer omgooien van alle steentjes in dominospel. n → ∞, het pijltje niet verwarren met het functiepijltje. 49 Notatie: 24 Deze exp(a) kun je interpreteren als de maximale bijschrijffactor op jaarbasis bij rentefractie a. In de bankpraktijk misschien zelf niet realiseerbaar, maar je kunt er willekeurig dichtbij komen, volledig vergelijkbaar met 0,999999999999999999999999999999999999999999999 . . . = 1. Voor elke a ≥ 0, is de limietwaarde exp(a) van 1+ a 1 a 2 a 3 a 4 a 5 < 1+ < 1+ < 1+ < 1+ < ··· 1 2 3 4 5 zo even reëel als het getal 1 als limietwaarde van 0,9 < 0,99 < 0,999 < 0,9999 < 0,99999 < · · · Voordat we in details duiken50 is het goed om stil te staan bij wat we hier op de rails gezet hebben. Uitgaande van de rente op rente context zijn we gekomen tot het idee dat dit de definitie is waar we niet om heen kunnen: Definitie 1. a n 1+ . n→∞ n exp(a) = lim Geen wortels, geen logaritmen, alleen +, ·, / en een limiet. Strict genomen is Definitie 1 nog geen definitie maar we hebben wel al intuı̈tie opgebouwd dat, tenminste voor a > 0, dit inderdaad een definitie zou kunnen zijn. Is de definitie ook goed? Voorzichtigheid blijft geboden want er staat uiteindelijk toch zoiets als 1∞ , en daar kun je vingers (!) stevig aan branden. Laten we nu eerst aannemen dat alles goed komt en dat wat er staat inderdaad een goede definitie51 is. Wat zijn dan de eigenschappen van exp(a) als we a als variabele zien? Een a die ook t of x mag heten trouwens. Wat voor nieuw type functie x → exp(x) hebben we hier zo gemaakt? Merk op dat voor elke a en b (1 + a b a+b ab )(1 + ) = 1 + + 2. n n n n We zien in dit product zowel de som als het product van a en b. Als we links en rechts de n-de macht nemen, n n a n b a+b ab 1+ 1+ = 1+ + 2 , n n n n dan zien we in de limiet aan de linkerkant exp(a) en exp(b) verschijnen. Rechts heeft de term met ab in de teller en n2 in de noemer voor n → ∞ steeds minder invloed op het gedrag van de n-de macht dan de term met a + b in de teller 50 Of die overslaan. goed definitie is per definitie een definitie. 51 Een 25 Thema: limieten en n in de noemer, simpelweg omdat n12 veel kleiner is dan n1 . Als die invloed helemaal verdwijnt, dan krijgen we rechts ook een exp, en wel exp(a + b). Er moet dan dus wel volgen dat exp(a) exp(b) = exp(a + b), (5.5) althans voor alle a en b waarvoor een (5.5) een welgedefinieerde uitspraak is. Het zal blijken dat er geen enkele restrictie is: Stelling 1. Voor alle reële a en b is Definitie 1 goed en geldt exp(a) exp(b) = exp(a + b), met het rechterlid weer welgedefinieerd door Definitie 1. Voor dat we laten zien waarom deze stelling waar is, trekken we eerst wat conclusies. Opgave 38. Wat is exp(0)? Laat met Stelling 1 zien dat exp(a) > 1 is voor alle positieve a en dat 0 < exp(a) < 1 is voor alle negatieve a. Definitie 2. Het getal e is per definitie n 1 . e = lim 1 + n→∞ n Opgave 39. Laat met Stelling 1 zien dat exp(2) = e2 , exp(3) = e3 , exp(4) = e4 , etc. Opgave 40. Laat met Stelling 1 zien n 1 1 = lim 1 − = exp(−1). e n→∞ n Opgave 41. Wat is exp( 12 )? En exp(− 21 )? Opgave 42. Wat is exp(− 15 )? En exp( 32 )? Wat we zojuist besproken en gezien hebben mag wel een wiskundige stelling worden genoemd: Stelling 2. Voor alle p geheel en q ≥ 1 geheel geldt √ p p exp( ) = q ep = e q . q Kortom, voor rationale getallen x is exp(x) = ex . En voor niet rationale x? Tja. Dat is mijns inziens geen goed geformuleerde vraag, aangezien een definitie van ex niet eerder is gegeven52 . Als we ex ook voor niet-rationale x invoeren, dan is er maar één zinnige keuze53 : x n De enige echte e-macht is ex = exp(x) = lim 1 + . n→∞ n 52 Nog afgezien van de mystiek (tot nu toe) rond e zelf. 53 Trompetgeschal. 26 Thema: e-machten Opgave 43. Wat kun je zeggen over exp(x) als x → +∞? En als x → −∞? Opgave 44. Toch even kijken hoe zou zitten met de afgeleide van exp(x): exp(x) wordt gemaakt als limiet van x n en (x) = 1 + . n Kun je met de methoden uit Sectie 4.1 de afgeleide e0n (x) bepalen en e0n (x) en (x) uitrekenen? Wat valt je op als n → ∞? Nu we de e-macht voor het eerst in zijn ware gedaante zien, is het extra zaak om zeker te weten dat Definitie 1 een goede definitie is. Daartoe moeten we het voorafgaande helaas weer even uit ons hoofd zetten. We weten nog niets, en we kijken naar de bijschrijffactor in(5.2), a n . en (a) = 1 + n Dit is de factor op jaarbasis bij een rentefractie a die, in plaats van één keer per jaar, n keer per jaar bijgeschreven wordt, wel gedeeld door n natuurlijk. Heeft deze en (a) inderdaad een limiet als n → ∞ waarmee we exp(a) kunnen definiëren? Natuurlijk geldt dat exp(0) = 1 goed is gedefinieerd omdat en (0) = 1 voor alle n. Voor a > 0 hebben we inmiddels enig gevoel over monotonie in n, maar voor a < 0? De vraag hoe het zit met het gedrag van de factor en (a) voor a < 0 is zonder meer interessant te noemen, zelfs zonder economische context, ook omdat het geval a < 0 heeft juist binnen de kansrekening aardige toepassingen heeft. Opgave 45. Beantwoord op intuı̈tie: voor negatieve a is de rij (5.2) monotoon54 . Waar of niet waar? Zoja, dalend of stijgend? Opgave 46. ICT is leuk als je er wat interessants mee kunt doen. Even kijken dus wat er gebeurt als we de grafieken van de functies a → en (a) plotten, in één diagram, zodat we kunnen zien hoe het zit met de ordening. Vaker rente (af)schrijven is zo te zien55 ook bij negatieve rente gunstiger. Wie had dat meteen gedacht? Voor a < 0 is vraag of een bovengrens bestaat triviaal: we kunnen sowieso nooit boven de 1 uitkomen. Wel in de buurt van 1? Die vraag stellen we weer uit. Nu eerst de vraag hoe het zit met de begrenzing voor a > 0, waar het ons in eerste instantie om begonnen was, maar ook omdat met alleen positieve getallen de kans op verwarring nu eenmaal kleiner is. Wat we hiervoor nodig hebben is een combinaties van algebra en analyse. Analyse is een soort schattend rekenen met letters en dat is moeilijker dan gewone letter algebra, net zoals goed schattend rekenen ook moeilijker is dan gewoon rekenen. Maar eerst nog wat algebra, algebra waarbij geteld moet worden, ook lastig. 54 Zodra 55 Is n groter is dan −a. seeing believing? We komen erop terug. 27 Thema: differentiaalvergelijkingen 5.3 Newton’s binomium en Pascal’s driehoek Tot nu toe hebben we het binomium van Newton niet gebruikt56 . We weten strict genomen ook nog niet dat de getallen in de driehoek van Pascal binomiaalcoëffiënten zijn, laat staan dat ze iets met kansrekening of combinatoriek te maken hebben. Nu hebben we ze echt nodig, want we gaan de bijschrijffactor en (a) uitwerken en bekijken voor grote n. Opgave 47. Kun je jezelf door tellen zonder dubbeltellen overtuigen van het feit dat (1 + a)14 = (1 + a)(1 + a)(1 + a)(1 + a)(1 + a) · · · (1 + a)(1 + a) = | {z } 14 factoren 1 + 14a + 14 · 13 2 14 · 13 · 12 · 11 · 10 5 a + ··· + a + · · · + a14 , 2 5·4·3·2 zodat (1 + 13 a2 13 · 12 · 11 · 10 a6 a 14 ) =1+a+ + ··· + + ··· , 14 14 2! 14 · 14 · 14 · 14 6! met nog steeds slechts 15 termen, de laatste qua typesetting te groot om op te schrijven? Zo ja, wat is de coëfficiënt van a3 ? Zo nee dan even een andere opgave tussendoor. Opgave 48. Voor het geval de vorige niet lukt, werk uit, sorteer en groepeer: (a+b)3 = (a+b)(a+b)(a+b) = aaa+aab+aba+baa+abb+bab+bba+bbb = · · · . Doe hetzelfde met (a + b)14 , maar alleen de termen met precies drie a-tjes. Hoeveel mogelijkheden heb je om die drie a-tjes te kiezen? De driehoek van Pascal, die we al gezien hebben in de inleiding, bevat deze coëffiënten natuurlijk ook, maar we hebben voor het vervolg echt de formules met factoren nodig, de binomiaalcoëffiënten uit de kansrekening en combinatoriek. Mooi wel dat we nu zien dat het ook hetzelfde is. De 20 is inderdaad57 6 keer 5 keer 4 gedeeld door 3 gedeeld door 2. Als we nu deze binomiaalformule gebruiken met a gedeeld door de exponent, dan zien we een nieuw patroon verschijnen: Opgave 49. Laat zien dat (1 + a 99 98 a2 98 · 97 · 96 · 95 a5 ) =1+a+ + ··· + + ··· , 99 99 2! 99 · 99 · 99 · 99 5! een som met 100 termen. Wat is de coëfficiënt van a3 ? Opgave 50. Overtuig jezelf van en (a) = 1 + a + · · · + (1 − 56 Is 1 2 3 4 a5 )(1 − )(1 − )(1 − ) + · · · , n n n n 5! voor de monotonie in n ook niet goed bruikbaar trouwens. de kansrekening komen we hier nog op terug. 57 Bij 28 (5.6) nu met n + 1 termen. Wat is de laatste term? Schrijf ook de coëfficiënten van de weggelaten termen met a2 , a3 en a4 op. De coëfficiënt van a5 wordt groter als n groter wordt. Leg uit dat acceptatie van de uitspraak 1 daalt naar 0 n ertoe leidt dat elke van de 4 voorfactoren in de term met a5 stijgt naar 1, en 5 dat de term met a5 zelf stijgt naar a5! . Hoe zit dat met de coëfficiënten van de andere machten van a? Opgave 51. Overtuig jezelf er opnieuw van dat, voor elke a ≥ 0, en (a) stijgend is in n, dat bovendien en (a) ≤ 1 + a + a2 a3 a4 a5 an + + + + ··· + , 2! 3! 4! 5! n! (5.7) en dat elke term in het rechterlid van (5.7) stijgt naar de overeenkomstige term in het rechterlid van (5.7) als n → ∞. Opgave 50 en 51 suggereren zo de conclusie dat, nog steeds voor a > 0, onze rente op rente uitdrukking en (a) stijgt naar het rechterlid van van (5.7), dat we nu een naam geven: En (a) = 1 + a + a3 a4 a5 an a2 + + + + ··· + . 2! 3! 4! 5! n! (5.8) Maar deze uitdrukking hangt zelf ook van n af! Beide uitdrukkingen krijgen steeds meer termen. Algebra wordt nu analyse als we middels schattend letter rekenen de sommen uit de buurt van oneindig proberen te houden, indachtig ook alles wat we in Sectie 2 besproken hebben is, en de vraag stellen, bestaat EXP(a) = 1 + a + a3 a4 a5 a2 + + + + · · ·? 2! 3! 4! 5! (5.9) En natuurlijk willen we ook het verschil tussen en (a) en En (a) klein maken. Zodat het uiteindelijk niet uitmaakt of we de limiet met en (a) of met En (a) nemen. We kijken nu eerst naar dit verschil. 5.4 Gauss’ strafwerk som Wat het verschil tussen en (a) in (5.6) en En (a) in (5.8) betreft, vergelijken we 1 + a + (1 − 1 2 a3 1 2 3 a4 1 a2 ) + (1 − )(1 − ) + (1 − )(1 − )(1 − ) + · · · , n 2! n n 3! n n n 4! een eindige som met n + 1 termen58 , met 1+a+ a2 an + ··· + , 2! n! dan zien we een verschil waarin, om te beginnen, a2 2n 58 Wat is de laatste? 29 (5.10) als verschil van de derde termen voorkomt. De n in de noemer van (5.10) helpt in ieder geval mee om het totale verschil naar nul te trekken. Beter dan (5.10) als foutafschatting59 voor Fn (a) = 1 + a + a2 an + ··· + − en (a) 2! n! kunnen we moeilijk krijgen, maar wel (bijna) net zo goed, zo blijkt hieronder uit een stukje voorbereidende algebra, waarin we de termen zover uitschrijven als nodig is om de structuur in de formules te herkennen en ze vervolgens schattend te behandelen, wat behoorlijk lastig is, maar wel mooi uitkomt. Opgave 52. Er staan hierboven twee mogelijke benaderingen voor exp(a) = ea , zie ook (5.4) en (5.8). Beantwoord op intuitie: welke van de twee zit dichter bij exp(a) = ea ? Welke benadering zou de rekenmachine gebruiken voor exp(a) = ea ? Zie §5.5. De twee uitdrukkingen van Fn (a) = 1 − (1 − | {z B2 + 1 − (1 − | elkaar aftrekkend vinden we 2 3 a 1 2 a 1 ) + 1 − (1 − )(1 − ) n 2! n n 3! } | {z } B3 4 2 3 1 a )(1 − )(1 − ) + ··· , n n n 4! {z } B4 nog steeds een eindige som, nu met met n − 1 termen. De coëfficiënten hebben een index maar hangen ook van n af60 . We nummeren van 2 tot en met n. Goed kijkend zien we dat B4 = 1 + (1 − 3 3 3 )(B3 − 1) = (1 − )B3 + n n n de regelmaat al duidelijk maakt. Beginnend met B2 = 1 , n 2 2 1+2 )B2 + < , n n n 3 3 3 1+2+3 0 < B4 = 1 + (1 − )(B3 − 1) = (1 − )B3 + < , n n n n zien we hoe groot de coëfficiënten kunnen zijn. Toevallig61 komt de strafsom die Gauss op school kreeg hier ook nog langs: 0 < B3 = (1 − Opgave 53. Wat is 1 + 2 + · · · + 1000? Wat is, voor k positief en geheel, de som van de eerste k positieve gehele getallen? Laat zien hoe het antwoord voor k + 1 volgt uit het antwoord voor k, welke k ≥ 1 je ook neemt in deze implicatie62 . 59 Berekeningen moeten precies, foutafschattingen niet, maar wel correct. beter: Bk,n , met k = 2, . . . , n en n = 2, 3, . . . , twee indices dus. 61 Nou ja, wat is toeval Oom Ronald? 62 Dominoprincipe: de k=1 uitspraak impliceert dan de uitspraak voor elke k > 1. 60 Eigenlijk 30 Opgave 54. Laat voor k = 2, . . . , n zien dat 0 < Bk < k(k − 1) Bk 1 ofwel 0 < < 2n k! 2n(k − 2)! Opgave 55. Voor het verschil geldt, als a > 0, a2 an 1 0 < Fn (a) = B2 + · · · + Bn ≤ 2! n! 2n an a + ··· + (n − 2)! 2 . Laat dit zien door een factor a2 naar voren te halen. Opgave 56. Laat zien, nu voor a willekeurig, dat a2 an 1 |a|n a2 2 |Fn (a)| = |B2 +· · ·+Bn | ≤ |a| + · · · + ≤ EXP(|a|) → 0 2! n! 2n (n − 2)! 2n als n → ∞, dankzij de n in de noemer63 . Het verschil Fn (a) gaat dus naar nul, als we tenminste weten dat de functie EXP gedefinieerd is. 5.5 Bestaat de som met oneindig veel termen? De onvermijdelijke hamvraag, indachtig ook alles wat we in Sectie 2 besproken hebben, blijft dus: bestaat EXP(a) = 1 + a + a3 a4 a5 a2 + + + + · · ·? 2! 3! 4! 5! Zoja, dan volgt exp(a) = EXP(a), de linker als limiet van en (a), de rechter als limiet van En (a). In (2.3) hebben we gezien dat er niets engs is aan sommen met oneindig veel termen. We hebben bijvoorbeeld gezien dat 1 1 1 1 1 + + 3 + 4 + ··· = m m2 m m m−1 als m een geheel64 getal is groter dan 1. Je telt wel oneindig veel termen bij elkaar op, maar die worden zo snel kleiner dat alles bij elkaar op te tellen is zonder dat de som willekeurig groot wordt65 . In de voorbeeldsom zien we dat elke term precies een factor m kleiner is dan de vorige. Dat helpt natuurlijk om er voor te zorgen dat er iets uit de som komt. Hoe sneller de termen klein worden hoe beter. Hoe zit het met de verhouding tussen opeenvolgende termen in het rechterlid van (5.9) waarmee we EXP(a) proberen te maken? De factoren die er steeds bijkomen zijn achtereenvolgens, beginnend bij de stap van 1 naar a, a a a a a a, , , , , , . . . 2 3 4 5 6 63 Dit is (5.10) met de extra factor exp(|a|). dat eigenlijk echt nodig? 65 Zoals Zeno’s schildpad ook niet oneindig lang op Achilles voorblijft. 64 Is 31 Hoe groot de positieve a in de tellers ook is, de rij noemers 1, 2, 3, 4, 5, 6, . . . haalt a altijd in. Wil je dat in elke stap de volgende term hoogstens twee keer zo groot is (minstens een factor twee kleiner wordt) dan moet je de somindex66 groter kiezen dan 2a. Is dat eenmaal gelukt dan is het daarna alleen maar beter. Voor elke vast a is oneindig voor (5.9) buiten bereik67 via een bovengrens in de vorm van een eindige som 1+a+ a2 ak−1 ak 1 1 1 + ··· + + (1 + + + + · · · ), 2! k − 1! k! | 2 4{z 8 } =2 als je k zo kiest dat k > 2a. Gegeven a > 0 kan dat, klaar. We concluderen dat voor a ≥ 0 de definitie van EXP(a) als in (5.9) inderdaad betekenis heeft. Bijgevolg is EXP(a) met Opgave 50 nu een bovengrens: e1 (a) < e2 (a) < e3 (a) < · · · < EXP(a). De limietwaarde exp(a) van en (a) voor n → ∞ kan dus alleen maar kleiner zijn of gelijk, is exp(a) ≤ EXP(a), en we verwachten inmiddels gelijkheid omdat het verschil tussen en (a) en En (a) nu ook onder controle is. Opgave 57. We kunnen en (a) afkappen bij zijn kwadratisch term, dan krijgen we 1 a2 1 + a + (1 − ) < en (a). n 2! Overtuig jezelf ervan dat bijgevolg 1+a+ a2 ≤ exp(a), 2! en dat met eenzelfde redenatie 1+a+ a3 a2 + ≤ exp(a), 2! 3! enzovoorts voor elke eindige som. Concludeer dat EXP(a) voldoet aan EXP(a) ≤ exp(a) . Samenvattend, als n → ∞, dan geeft rente op rente bij rentefractie a > 0 en uiteindelijk continue rentebijschrijving dat 1+ a n a2 a3 a4 a5 → exp(a) = EXP(a) = 1 + a + + + + + ··· n 2! 3! 4! 5! (5.11) We zijn nu dus zover dat exp(a) voor alle a gedefinieerd via de stijgende rij en (a) en voor a > 0 gelijk is aan EXP(a). 66 Die 67 The we nu even k noemen omdat n al in gebruik is. sky is not the limit! 32 5.6 Sommen met negatieve termen, renteafschrijving Tot nu toe hebben we ons niet willen branden aan benaderingen die niet monotoon zijn en daarom weten we nu nog niet goed wat we aanmoeten met EXP(a) voor a < 0. We hebben immers ons begrip en intuı̈tie volledig gebaseerd op onze vertrouwdheid met doorlopende decimale ontwikkelingen die, vanwege onze keuze voor het werken met de positieve cijfers 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, ons nu beperkt68 . Maar we weten na Opgave 56 ook voor a < 0 inmiddels wel hoe het zit met Fn (a). Dat was het verschil tussen a n en (a) = 1 + n en En (a) = 1 + a + a2 an + ··· + . 2! n! Ook al weten we nog niet goed hoe we bij de tweede uitdrukking met de overgang n → ∞ moeten omgaan, als het verschil tussen beide uitdrukkingen naar nul gaat, dan zal het met deze tweede uitdrukking ook wel goed gaan. Een trucje om weg te komen met de van teken wisselende termen is steeds twee termen bij elkaar nemen, bijvoorbeeld a21 a20 a a20 + = 1+ >0 20! 21! 20! 21 als a > −21. De overzichtelijkheid van alleen positieve termen, afgezien van de eerste paar termen, keert zo snel terug. Opgave 58. Wat komt er, als m > 1, uit 1 1 1 1 − + 3 − 4 + · · ·? m m2 m m Hint: factoriseer steeds twee opeenvolgende termen. Opgave 59. Overtuig jezelf van het feit dat de som in (5.9) voor a < 0 ook een echte uitkomst heeft. 5.7 Samenvattende conclusies We concluderen dat (5.11) voor alle a geldt en zijn klaar voor de slotronde. De exp(a) = EXP(a) die we nu gemaakt hebben heeft een eigenschap die we al hebben geraden: exp(a + b) = exp(a) exp(b). Hieronder werken we deze slotconclusie nog wat uit. Eerst maar voor a + b = 0, want die vraag brandde na de vorige opgave misschien al op de lippen. Nu we weten hoe het zit met en (a) en en (−a) kunnen we kijken naar hun product n a2 N (a) = en (a)en (−a) = 1 − 2 , (5.12) n dat stijgt69 met n. 68 Men had ons natuurlijk ook kunnen opvoeden met −4, −3, −2, −1, 0, 1, 2, 3, 4, 5. 69 Waarom? 33 Opgave 60. Laat zien dat N (a)n stijgt naar exp(−a2 ), dat groter is dan 0 en op zijn hoogst 1, en combineer dit met het stijgen van N (a) om de conclusie te trekken dat N (a) naar 1 stijgt, gebruikmakend van het feit dat voor elke √ 0 < y < 1 , de n-de machtswortel n y naar 1 stijgt70 als n → ∞. Overtuig jezelf ervan dat bijgevolg 1 = exp(0) = exp(−a) exp(a). Opgave 61. Leg uit dat met de definitie e = exp(1) volgt dat e=1+1+ 1 1 1 1 + + + + ··· ; 2! 3! 4! 5! 1 e = exp(−1) en 1 1 1 1 1 = − + − + ··· . e 2! 3! 4! 5! Opgave 62. Merk op dat de n2 in (5.12) er voor zorgt dat het grondtal relatief hard naar 1 gaat in vergelijking met het grondtal in de rente op rente formule en (a), waarin binnen de haken een breuk staat met n in de noemer in plaats van n2 . Reflecteer op en bepaal het gedrag van 1 1+ n 2 ; 1 1+ n 1 1+ n 2n n ; ; 1 1+ n 1 1− n n2 ; n ; 1 1+ 2 n 2 ; n2 1 1− , n als n → ∞, allemaal voorbeelden van 1∞ . Thema: 1∞ Opgave 63. We zien in Opgave 60 een voorbeeld van de uitspraak dat exp(a + b) = exp(a) exp(b), (5.13) namelijk het speciale geval a + b = 0. Voor algemene a en b geldt dat (1 + a b a+b ab )(1 + ) = (1 + + 2) n n n n We zien in het product zowel de som als het product van a en b. De vorige opgaven geven inzicht in de rol van de kwadratische term in het grondtal als we alles tot de n-de macht verheffen. Overtuig jezelf er nu van dat (5.13) waar is voor alle a en b, en dat nu ook voor elke gehele n geldt dat exp(n) = en . Reflecteer op de geldigheid van de formule exp(x) = ex . 5.8 Monotonie, een bewijs! Hoe zit het nu echt met de monotonie van en (a) voor a > 0, waarop onze intuı̈tie volledig was gebaseerd? Deze vraag is lastiger dan misschien op voorhand gedacht, want als we het verschil ∆n (a) = en+1 (a) − en (a) = 1 + 70 Evident? a n+1 n+1 a n − 1+ n Zo nee, bestudeer de grafiek y = xn met 0 < x < 1 en n steeds groter. 34 bekijken en ons afvragen of ∆n (a) positief is, zien we dat de n op twee plaatsen in elke term voorkomt en dat maakt vergelijken moeilijk. De standaardtechniek om hier mee om te gaan is het invoegen van een missing link, en wel twee keer, met een plus en met een min, zodat er netto niets verandert71 . Zo kunnen we het verschil splitsen in twee verschillen die elk op zich makkelijker zijn, omdat ze elk op maar één plek verschillen. Beide stukken leiden vervolgens hun eigen leven tot dat het moment daar is om de boel weer bij elkaar te harken. Klinkt simpel, maar is echt lastig, dus goed opletten hieronder, want je moet onderweg wel iets herkennen waarmee je uit de voeten kunt, en je weet nog niet wat72 . De redenatie duurt73 twee pagina’s. Met de missing links erbij gaat het om de vraag of n+1 a n+1 a n+1 a n a − 1+ + 1+ − 1+ ∆n (a) = 1 + n+1 n n n | {z } missing links positief is. Splitsen met in elke term een missing link geeft twee termen. In elk van de twee zien we iets: n+1 a a n a n+1 a n+1 ∆n (a) = 1+ − 1+ − 1+ + 1+ . n+1 n n n } | {z | {z } dit factoriseert van de vorm (1.1) met n + 1 i.p.v. 5 We zien dus dat ∆n (a) = n a a a n a n a a ( − ) 1+ 1+ −1 . + ··· + 1 + + 1+ n+1 n n+1 n n {z n } | {z } | gefactoriseerd hier is (1.1) gebruikt met n + 1 i.p.v. 5 De mengtermen op de puntjes vullen we later wel in, indien nodig. In de linker term brengen we de voorfactor onder één noemer74 In de tweede factor in de rechter term vallen de 1-en fijn weg. Daarmee wordt n −a a a n a a n ∆n (a) = . 1+ + ··· + 1 + + 1+ n(n + 1) n+1 n n {z n } | {z } | {z } | versimpeld was a − a ongewijzigd n+1 n Nu kunnen de a in de tellers en de n in de noemers naar voren, en we halen ook75 de n + 1 in de eerste term naar buiten. De versimpelde uitdrukking rechts schrijven we nu binnen de haken als eerste op, met een factor n + 1, want we hebben voor de haken een n + 1 in de noemer gezet. Dit geeft n a a n a a n , ∆n (a) = (n + 1) 1 + − 1+ − ··· − 1 + n(n + 1) n n + 1 n | {z }| {z } n + 1 termen n + 1 negatieve termen 71 Een welhaast universele truc. ik niet. 73 Zo bleek later. 74 Breuken blijven belangrijk. 75 De wedstrijd is nu echt begonnen. 72 Ook 35 waarin de eerste uitdrukking tussen de haken geschreven kan worden76 als som van n + 1 identieke positieve termen. Het moment77 waarop alles weer samen genomen kan worden. De eerste positieve term en de eerste negatieve term binnen de grote haken geven een combinatie die78 factoriseert met het verschil van de grondtallen als eerste factor: n a n a = 1+ − 1+ n n+1 n−1 ! a a n−1 a a 1+ −1− 1+ + ··· + 1 + n n+1 n n+1 | {z } ook al eerder gezien n−1 ! a n−1 a a 1+ + ··· + 1 + . = n(n + 1) n n+1 a We zien79 voor deze twee termen dus nog een keer dezelfde factor n(n+1) naar buiten komen. Goed kijkend zien we dat bij de andere paren ook gebeuren. Bij de tweede positieve term en de tweede negatieve term (de eerste op de puntjes) binnen de grote haken kan eerst een factor naar buiten (naar achteren hieronder) en daarna gaat het weer hetzelfde80 : n−1 a n a a = − 1+ 1+ 1+ n n+1 n n−1 ! a n−1 a a 1+ − 1+ 1+ n n+1 n n−2 ! a n−2 a a a 1+ , = + ··· + 1 + 1+ n(n + 1) n n+1 n enzovoorts, tot (en niet tot en met) de laatste twee termen toe, die gewoon wegvallen. Het was even werk, maar de slotconclusie is81 dat a a ∆n (a) = keer een hoop troep, n(n + 1) n(n + 1) maar in die troep staan alleen maar producten van machten van 1 + 1 + na . De troep is dus positief82 . a n+1 en Opgave 64. Lees nog een keer terug om te zien dat inderdaad ∆n (a) > 0, niet alleen voor a > 0 maar ook voor −n ≤ a < 0. Enigszins tot onze verbazing is de aanvankelijk uitgestelde vraag over a < 0 nu ook beantwoord83 . 76 Combinaties op het middenveld. 77 Aanval. 78 Eerder gezien. 79 Overzicht. 80 Voorzet. 81 Intikken. 82 Goal! 83 In de les zag het publiek het zelf sneller terwijl ik bezig was. 36 6 Kansrekening en e Op verschillende manieren blijkt het getal e relevant te zijn voor het werken met kansen. We zullen hiervan enkele voorbeelden geven. 6.1 Sinterklaaslootjes en e Ons beginpunt is de uitdrukking 1− 1 n n (6.1) die we inmiddels kennen als benadering voor 1e , ongeveer 0,368. Deze uitdrukking heeft een zeer voor de hand liggende interpretatie in de kansrekening. Stel we hebben een groep van n personen, en dat we n briefjes in een hoge hoed doen met de namen van alle mensen in de groep. Als de eerste persoon, laten we hem Joostje noemen, een briefje trekt, dan is de kans 1 − n1 dat hij niet zichzelf trekt. Zometeen gaan we kijken wat er gebeurt als Joostje het briefje niet terugdoet in de hoed, maar we houden het eerst nog even eenvoudig, en nemen aan dat Joostje, na op het briefje gekeken te hebben, het briefje weer terug doet in de hoge. Nu trekt de volgende persoon, laten we zeggen Oom Ronald, een briefje. Natuurlijk is wederom de kans dat Oom Ronald zichzelf niet trekt gelijk aan 1 − n1 . De kans dat Joostje en Oom Ronald allebei zichzelf niet getrokken hebben, is nu gelijk aan (1 − n1 )2 , als we er tenminste vanuit gaan dat de trekking van Joostje die van Oom Ronald niet heeft beı̈nvloed. Opgave 65. Laat zien dat wanneer we op deze manier alle personen in de groep langsgaan, de kans dat niemand zichzelf trekt gelijk is (1 − n1 )n . Opgave 66. Die eis van onafhankelijkheid tusssen de trekkingen moet er wel bij! Als bijvoorbeeld iedereen hetzelfde briefje trekt (dat is ver van onafhankelijk dus), wat is dan de kans dat niemand in de groep zichzelf trekt? De kans dat niemand zichzelf trekt voor grote groepen convergeert dus kennelijk naar 1e = e−1 , ofwel naar ongeveer 0,368. Het is opmerkelijk dat deze kans een limietwaarde heeft die niet 0 of 1 is. De procedure van het trekken van de briefjes uit de hoge hoed doet natuurlijk denken aan de oh zo Nederlandse Sinterklaasloting. De procedure bij Sinterklaaslootjes is anders, want een briefje dat getrokken wordt, gaat niet meer terug in de hoge hoed. Dit heet dan ook trekken zonder teruglegging. Iedereen die dit vaker geprobeerd heeft weet dat het regelmatig gebeurt dat de hele trekking opnieuw moet omdat iemand zichzelf heeft getrokken.84 Maar wat is nu eigenlijk de kans dat er iemand in het gezelschap is die zichzelf trekt? Met ander woorden, hoe vaak (gemiddeld gesproken) moet de trekking overnieuw? Het antwoord op deze vraag hangt natuurlijk af van de grootte van de groep, maar gemotiveerd door het eerste voorbeeld waarbij we met teruglegging werkten, zijn we ook benieuwd naar de kans dat niemand zichzelf trekt bij Sinterklaas wanneer de groepsgrootte n almaar toeneemt. 84 Mijn oudere zus trok vele jaren geleden zichzelf, zei niets, en gaf zichzelf een buitengewoon duur cadeau, tot verbijstering van de rest van het gezelschap. De grap kwam natuurlijk snel uit, maar ze had ons wel mooi te pakken. 37 Thema: trekken zonder terugleggen Opgave 67. Stel je viert met 2 mensen Sinterklaas. Wat is de kans dan niemand zichzelf trekt? En bij 4 personen? Nu de grote verrassing85 : het blijkt dat het gedrag voor steeds grotere n bij trekken zonder teruglegging hetzelfde is als het gedrag bij trekken met teruglegging. Als de groep waaruit we trekken erg groot wordt, is er maar weinig verschil tussen trekken met of zonder teruglegging. Opgave 68. Reflecteer op deze laatste opmerking. Waarom kunnen we ondanks dit bij de Sinterklaaslootjes niet met teruglegging werken? Om te laten zien dat dit echt waar is, moeten we wel wat meer moeite doen dan bij trekken met teruglegging. Trekken zonder teruglegging is altijd moeilijker, omdat de uitkomst van de eerste trekking gevolgen heeft voor de tweede. We kunnen dus niet zomaar doen wat we bij het trekken met terugleging deden, en we zullen iets creatiever moeten zijn. We gaan het principe van inclusie-exclusie gebruiken, een mooie telmethode die we eerst zullen introduceren. Stel ik heb gebeurtenissen A en B. Wat is de kans dat A of B optreedt?86 Je kunt eerst de kans op A bepalen, daarbij tel je de kans op B op, maar dan heb je alles wat in A en B zit dubbel geteld. Dat moet je er dus nog een keer vanaf trekken, en dat geeft dat de kans op A of B gelijk is aan P (A) + P (B) − P (A en B), waarbij de P staat voor “de kans op”, afgeleid van het Engelse “probability”. Opgave 69. Bereken met deze formule87 de kans dat je bij het werpen met een dobbelsteen een even getal gooit groter dan 3. De formule die we net hebben bekeken heeft een versie voor drie gebeurtenissen: Opgave 70. Overtuig jezelf van het feit dat bij drie gebeurtenissen A, B en C, de kans op A of B of C gelijk is aan P (A)+P (B)+P (C)−P (A en B)−P (A en C)−P (B en C)+P (A en B en C). Opgave 71. Pas bovenstaande regel toe op de situatie bij het gooien met een dobbelsteen: A is de gebeurtenis van een even uitkomst, B is de gebeurtenis van een uitkomst minstens 3, en C is de gebeurtenis dat je precies 2 gooit. Opgave 72. Als je begrijpt hoe het principe nu werkt, kun je een formule opschrijven voor de kans dat minstens een van de gebeurtenissen A1 , A2 , . . . , An optreedt. Probeer dat te doen. Deze formule wordt het principe van inclusieexclusie genoemd. Laten we nu een groep van 4 personen beschouwen. We gaan het principe van inclusie-exclusie toepassen op de gebeurtenissen A, B, C en D, waarbij A de gebeurtenis is dat de eerste persoon zichzelf trekt, B de gebeurtenis dat de tweede persoon zichzelf trekt, enzovoort. Bij 4 mensen zijn er 4 4·3 =6 = 2 2 85 Of juist niet? bedoel ik de kans dat tenminste een van beide gebeurtenissen optreedt. 87 Dat kan natuurlijk makkelijker maar daar gaat het nu even niet om. 86 Hiermee 38 paren te maken, en 4 drietallen. Het principe van inclusie-exclusie voor 4 gebeurtenissen leidt tot een kans van 4 1 4 1 1 4 1 1 1 4 1 1 1 · − · · + · · · − · · · ·1 1 4 2 4 3 3 4 3 2 4 4 3 2 dat er iemand is die wel zichzelf trekt. Als je laatste uitdrukking vereenvoudigt staat er gewoon 1 1 1 1 1 2 1− + − =1− + − . 2 6 4 2! 3! 4! Dit komt ons natuurlijk bekend voor: het is 1 minus het beginstuk van de doorlopende som voor e−1 = 1e . Opgave 73. Laat zien dat deze regelmaat inderdaad doorzet: de kans dat er minstens 1 persoon is die zichzelf trek bij een groep van n personen gelijk is aan 1− 1 1 1 1 + − + ··· ± . 2! 3! 4! n! Of de laatste term een plus of een min heeft hangt af van of n even of oneven is. Enigszins verrassend misschien: hoe groot de groep ook is, de kans dat je overnieuw moet trekken is altijd ongeveer 0,368. Opgave 74. Een moeilijke opgave: wat is de kans, als de groep heel groot wordt, dat precies k mensen zichzelf trekken. Het blijkt dat hier de Poisson verdeling om de hoek komt kijken. Voor grote groepen is deze kans gelijk aan 1 ek! , en dat is precies een Poisson verdeling met parameter 1. Het maakt dus voor grote n niet uit of we met of zonder teruglegging werken. In het eerste geval gebruiken we het feit dat (1 − n1 )n naar 1e convergeert, in het tweede geval gebruiken we de ontwikkeling van 1e uit het vorige hoofdstuk. De methodes zijn verschillend, maar het antwoord is hetzelfde. 6.2 Onafhankelijke experimenten en e Ons beginpunt hier is opnieuw het binomium van Newton dat we al eerder tegengekomen zijn. Het blijkt (daar hintten88 we al op) dat er een mooie link is tussen het binomium en kansrekening. Hoe zit dat precies? We hadden al eerder gekeken naar uitdrukkingen als (a + b)n . Als we dat uitwerken krijgen een combinatie van termen van de vorm ak bn−k , voor k = 0, 1, . . . , n.89 Als n = 3 bijvoorbeeld, krijgen we (a + b)3 = a3 + 3a2 b + 3ab2 + b3 , per term tellen de exponenten altijd op tot 3. De term a3 komt maar 1 keer voor, terwijl de term a2 b drie keer voorkomt. Dit komt natuurlijk omdat om a3 88 Is dit een toegestaan woord? nooit het plezier iets te horen dat je in een andere context al hebt gezien. 89 Onderschat 39 te krijgen je drie maal a moet kiezen en dat kan maar op 1 manier. Voor a2 b kunnen we de b op drie manieren kiezen, vandaar het verschil. De coefficienten vinden we natuurlijk ook in de al eerder genoemde driehoek van Pascal. Die coefficienten kunnen we ook puur combinatorisch90 beschouwen. Hoe vaak komt de term ak bn−k eigenlijk voor wanneer we (a + b)n uitwerken? We moeten dan uit n termen k keer de a kiezen en n − k keer de b. Als je daar een tijdje over nadenkt91 zie je dat het aantal manieren om dat te doen gelijk is aan n(n − 1) · · · (n − k + 1) . k! Deze uitdrukking wordt vaak genoteerd als nk en uitgesproken92 als n boven k. Dit levert dan op dat n n n n n n n−1 (a + b) = a + a b + ··· + b . n n−1 0 Opgave 75. Reken k3 uit voor k = 0, 1, 2 en 3, en vergelijk dat met de uitdrukking die we eerder opschreven voor (a + b)3 . n Opgave 76. Waarom geldt nk = n−k ? Je kunt deze gelijkheid op vele manieren inzien: gewoon door te rekenen, door te denken aan de combinatorische interpretatie, of door a en b te verwisselen. Nu is de kansrekening heel dichtbij. Als we in deze uitdrukking voor a een getal p ∈ [0, 1] kiezen en b = 1 − p dan vinden we n n n n n n−1 n−1 p + p (1 − p) + · · · + p(1 − p) + (1 − p)n = 1. n n−1 1 0 Wanneer een som van positieve getallen optelt tot 1 dan is het zaak om eens te zien of er misschien een kanstheoretische interpretatie mogelijk is. In dit geval is dat niet zo moeilijk. Wanneer we n experimenten uitvoeren, onafhankelijk van elkaar93 , wat is dan de kans dat we precies k keer succes hebben? Een voorbeeld maakt veel duidelijk. Als je bijvoorbeeld 4 experimenten doet, en we schrijven 0 voor geen succes en 1 voor wel succes, dan is de kans op de reeks 0, 0, 1, 0 gelijk aan (1 − p) × (1 − p) × p × (1 − p) = (1 − p)3 p. Nogal logisch: elk succes heeft kans p en geen succes heeft kans 1 − p. Er zijn natuurlijk nog meer series van lengte 4 te maken met precies 1 succes, bijvoorbeeld 0, 1, 0, 0. Elke serie die je zo maakt heeft dezelfde kans (1 − p)3 p en de totale kans op precies 1 succes is dan ook (1 − p)3 p keer het aantal mogelijkheden. In dit geval zijn er precies 4 mogelijkheden, dus de kans op exact 1 succes wordt 4(1 − p)3 p. Dit kunnen we natuurlijk ook algemener doen: elke serie van n experimenten die k successen bevat heeft kans94 pk (1 − p)n−k . 90 “Combinatoriek” gaat over slim tellen. even terugbladert, of goed oplet bij de cursus. 92 De Engelsen zeggen “n choose k”. Waarom is dat beter? 93 Herhaald gooien met een munt of dobbelsteen of iets exotischers. 94 Zorg dat je dit snapt! 91 Of 40 Op hoeveel manieren kunnen vervolgens die ksuccessen “verdeeld” worden over alle n experimenten? Dat is precies de nk die we net al zagen, en dus is bijvoorbeeld 5 3 p (1 − p)2 3 de kans om bij 5 experimenten drie maal succes te hebben. De kansverdeling die hier bescheven wordt heet de binomiale verdeling, en bepaalt de kans op k successen bij n onafhankelijke experimenten. De binomiale verdeling, en verdelingen die er sterk mee samen hangen, hebben alles met e te maken. Dat is natuurlijk niet op voorhand duidelijk, maar dat gaan we nu zien door p af te laten hangen van n, helemaal geen gekke gedachte want bij het trekken van de lootjes hadden we al gezien dat p = n1 een hele natuurlijke keuze is wanneer we n experimenten uitvoeren. We kunnen het direct ietsjes algemener maken, en niet p = n1 kiezen maar p = nλ , met λ een positief getal.95 Als we p = nλ kiezen, dan kunnen we de kans uitrekenen op geen enkel succes. Deze kans is natuurlijk96 n λ 1− , n en als n groter wordt, convergeert dit naar e−λ , zoals we al eerder hadden gezien. Kennelijk is het zo dat bij p van de orde n1 het aantal experimenten dat hier ”natuurlijk” bij past, van de orde n is. Een andere manier om dat in te zien is de volgende: Als we n experimenten doen met een kans p op succes, dan is het redelijk te verwachten dat je ongeveer np successen zult hebben. We verwachten dan in totaal ongeveer nλ × n = λ successen, en dat getal hangt niet van n af! Maar we kunnen ook de kans op precies k successen opschrijven met behulp van de binomiale verdeling. Deze kans noemen we even pn (k) en is gelijk aan (gebruik de binomiale verdeling!) k n−k λ n λ pn (k) = 1− k n n k n −k λ λ λ n! 1− 1− = k!(n − k)! n n n n −k k λ λ n! λ = 1− 1− . k k! n n (n − k)! n Opgave 77. Laat met behulp van je kennis van e zien dat deze uitdrukking, als n groter wordt, convergeert naar λk −λ e . k! (6.2) Hierbij kan Opgave 47 misschien wel van pas komen. Dit is een ander resultaat dat de samenhang van de binomiale verdeling met e illustreert. Alles blijkt nu met alles samen te hangen. Niet alleen hebben we 95 Alleen 96 Het zinvol als λ ≤ n, maar n wordt willekeurig groot, we nemen dus aan dat n ≥ λ. is gewoon dezelfde vraag als bij de Sinterklaaslootjes met teruglegging. 41 Thema: discrete benaderingen gebruik gemaakt van het feit dat (1 + n1 )n → e, maar ook komt de al eerder besproken doorlopende som exp(1) van e nu nog eens om de hoek te komen kijken: Opgave 78. Noteer de uitdrukking in (6.2) met p(k). Laat zien dat p(0) + p(1) + p(2) + · · · = 1. De kansverdeling die hier beschreven is, wordt de Poisson verdeling genoemd met parameter λ. Door p op de ”juiste” manier van n te laten afhangen hebben we een zg. limietstelling ontdekt: als p van de orde n1 is, dan convergeert de kans op precies k successen naar een prachtig antwoord als n groter wordt. Gewapend met deze kennis kunnen we nu ook begrijpen hoe we als kansrekenaar naar zg. continue processen, dat zijn processen waar de tijdsparameter t continu varieert, kunnen kijken. Bij het wiskundig modelleren van bepaalde processen wordt vaak aangenomen dat de wachttijd tot een bepaalde gebeurtenis (bijvoorbeeld de wachttijd tot een lamp kapot gaat, of de lengte van een bediening in het postkantoor) zodanig verdeeld is dat de kans dat je langer dan t tijdseenheden moet wachten, gelijk is aan e−λt , voor een zekere λ > 0. Met behulp van wat we nu gezien hebben kunnen we wel begrijpen waarom deze keuze gemaakt wordt. Dat gaat ongeveer als volgt. Laten we concreet kijken naar een lamp die na verloop van tijd stuk zal gaan. We willen dat proces graag fatsoenlijk modelleren. Laten we eerst kijken naar het tijdsinterval van 0 tot t. We kunnen dat tijdsinterval van 0 tot t opdelen in kleine intervalletjes97 ter lengte n1 , en poneren dat de kans dat wanneer de lamp aan het begin van zo’n klein interval nog niet stuk is, de kans dat hij in dat gegeven intervalletje wel stuk gaat98 gelijk is aan p = nλ . We gaan er van uit dat de verschillende intervalletjes geen invloed op elkaar uitoefenen. Tot aan tijdstip t hebben we nt intervallen, dus de kans dat de lamp voor die tijd niet stuk gaat is (1 − nλ )nt . We hebben in feite een benadering gemaakt voor het continue proces van de levensduur van een lamp,en door n groter en groter te nemen is het de bedoeling dat de benadering beter wordt. Welnu, als n groter en groter wordt, dan gaat onze kans naar e−λt als n groot wordt. Het is dus helemaal niet zo gek om deze uitdrukking voor de wachttijd te nemen tot het stukgaan van de lamp in het continue proces. De verdeling die hier bij hoort heet de exponentiële verdeling. Opgave 79. Hoe groot is - denk je - de gemiddelde lengte van een wachttijd die een exponentiële verdeling heeft? Opgave 80. Er is dus veel samenhang tussen binomiale, exponentiële en Poisson verdeling. Reflecteer hierop, i.h.b. op de rol van de parameters λ en p. 97 We doen net of dat past. kans is proportioneel met de intervallengte, met proportionaliteitsconstante λ. 98 Deze 42