Technische Universiteit Delft Faculteit Elektrotechniek, Wiskunde en Informatica Delft Institute of Applied Mathematics Eulers productformule voor de sinus (Engelse titel: Euler’s sine product formula) Verslag ten behoeve van het Delft Institute of Applied Mathematics als onderdeel ter verkrijging van de graad van BACHELOR OF SCIENCE in TECHNISCHE WISKUNDE door EMIEL LORIST Delft, Nederland Juli 2013 c 2013 door Emiel Lorist. Alle rechten voorbehouden. Copyright BSc verslag TECHNISCHE WISKUNDE “Eulers productformule voor de sinus” (Engelse titel: “Euler’s sine product formula”) EMIEL LORIST Technische Universiteit Delft Begeleiders Dr. K. P. Hart Dr. E. Coplakova Overige commissieleden Dr. ing. D. Jeltsema Dr. J.G. Spandaw Juli, 2013 Delft Samenvatting In dit onderzoek is Eulers productformule voor de sinus bestudeerd. De productformule voor de sinus heeft de volgende vorm: sin(z) = z ∞ Y n=1 1− z2 π 2 n2 In Eulers tijd was deze formule van groot belang, aangezien hiermee het al lang openstaande Basel-probleem opgelost kon worden. In dit verslag worden vier bewijzen van de productformule voor de sinus gegeven. Allereerst wordt de theorie over convergentie van oneindige producten ontwikkeld. Deze is namelijk nodig voor de eerste twee bewijzen. Daarna wordt het eerste bewijs behandeld, het hedendaagse standaardbewijs van Weierstrass met complexe analyse. Hierin wordt een formule geconstrueerd voor een analytische functie met voorgeschreven nulpunten. Deze formule wordt vervolgens toegepast op de nulpunten van de sinus. Hierna wordt een ander bewijs uit de complexe analyse gegeven, het bewijs met behulp van de Γ-functie. Dit bewijs gebruikt hele andere technieken uit de complexe analyse dan het bewijs van Weierstrass. Daarna wordt het bewijs van Euler zelf gegeven. Dit bewijs maakt vrijelijk gebruik van oneindig grote en oneindig kleine getallen en is tegenwoordig geen sluitend bewijs meer. Ook in Eulers tijd werden er al vraagtekens gezet bij dit bewijs. Het laatste bewijs dat behandeld wordt is het bewijs van Luxemburg. Dit is een bewijs dat met behulp van niet-standaard analyse het bewijs van Euler probeert te rechtvaardigen. Tot slot worden de verschillende bewijzen met elkaar vergeleken. Tussen de bewijzen in de complexe analyse zijn niet zo heel veel overeenkomsten. Tussen het bewijs van Euler en Luxemburg natuurlijk wel. Bij die twee bewijzen is het meer de vraag in hoeverre Luxemburg de stappen van Euler weet te rechtvaardigen. De conclusie is dat Luxemburg dit vrij goed heeft gedaan. Hij hoeft op slechts één plaats af te wijken van de stappen van Euler. Wel heeft hij twee keer in zijn bewijs een stelling uit de complexe analyse nodig. iii Voorwoord Dit verslag is het resultaat van mijn bachelorproject als onderdeel van de bachelor Technische Wiskunde aan de Technische Universiteit Delft. Dankzij de verschillende analysevakken die in de bachelor zitten, is mijn interesse gewekt voor deze tak van de wiskunde. In het vak Logica ben ik vorig jaar in aanraking gekomen met niet-standaard analyse, wat mij ook zeer aansprak. Zodoende ben ik op een bachelorproject uitgekomen die complexe analyse met niet-standaard analyse combineert. Het onderwerp van mijn Bachelorproject is: “Eulers productformule voor de sinus”. Ik wil mijn begeleiders Dr. K.P. Hart en Dr. E. Coplakova bedanken voor de begeleiding en ondersteuning bij het bestuderen van dit onderwerp en tevens de verslaglegging ervan. iv Inhoudsopgave 1 Inleiding 1 2 Oneindige producten 2.1 Definitie van een oneindig product . . . . . . . . . . . . . . . . . 2.2 Convergentie van een oneindig product . . . . . . . . . . . . . . . 2.3 Convergentie van een oneindig product van analytische functies . 3 3 3 4 3 Het bewijs van Weierstrass 3.1 Existentie van een analytische functie met voorgeschreven nulpunten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Constructie van een analytische functie met voorgeschreven nulpunten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 De productformule voor de sinus . . . . . . . . . . . . . . . . . . 6 8 11 4 Het 4.1 4.2 4.3 4.4 bewijs met de Γ-functie De Γ-functie . . . . . . . . . . . . Eigenschappen van de Γ-functie . De Γ-functie als oneindig product De productformule van de sinus . 13 13 14 15 17 5 Het 5.1 5.2 5.3 bewijs van Euler 20 Benodigde stellingen . . . . . . . . . . . . . . . . . . . . . . . . . 20 Polynomen ontbinden in lineaire factoren . . . . . . . . . . . . . 20 Reeksen ontbinden in lineaire factoren . . . . . . . . . . . . . . . 23 6 Niet-standaard analyse 6.1 Tweede-orde taal . . . . . . . . 6.2 De superstructuur R̂ . . . . . . 6.3 Ultramacht van R̂ . . . . . . . 6.4 De niet-standaard reële getallen 6.5 Limieten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Het bewijs van Luxemburg 6 25 25 25 26 29 31 34 8 Vergelijking tussen de bewijzen 37 8.1 Vergelijking tussen de twee bewijzen uit de complexe analyse . . 37 8.2 Vergelijking tussen de bewijzen van Euler en Luxemburg . . . . . 38 8.3 In hoeverre rechtvaardigt Luxemburg de stappen in het bewijs van Euler? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 A Aanvullende bewijzen van stellingen uit de complexe analyse 40 B Bibliografie 44 C Collectie van symbolen en afkortingen 45 v 1 Inleiding In dit project is Eulers productformule voor de sinus bestudeerd. Deze formule heeft de volgende vorm: sin(z) = z ∞ Y n=1 1− z2 π 2 n2 In 1735 wist Euler voor het eerst een bewijs te geven voor deze formule. In Eulers tijd was dit een zeer belangrijke formule, aangezien hiermee voor het eerst de reeks ∞ X 1 π2 = 2 n 6 n=1 uitgerekend kon worden. In de tijd voor Euler hadden Leibniz en Bernoulli in de zeventiende eeuw al gepoogd deze reeks uit te rekenen. Bernoulli had in zijn poging met het majorantenkenmerk al wel laten zien dat de reeks convergeerde naar een getal kleiner dan 2, maar helaas waren de pogingen van deze twee heren voor de rest vruchteloos. In 1935 wist Euler dit probleem, dat bekend was komen te staan als het Basel-probleem, op te lossen met behulp van de productformule voor de sinus. De productformule voor de sinus was voor Euler dus eigenlijk vooral een middel om het Basel-probleem op te lossen. In zijn bewijs van de productformule voor de sinus maakt Euler vrijelijk gebruik van oneindig grote en oneindig kleine getallen. Hoewel de uitkomst algemeen geaccepteerd werd, werden in Eulers tijd al van verschillende kanten vraagtekens gezet bij het bewijs. Tegenwoordig zet elke wiskundige die het bewijs leest deze vraagtekens. Gelukkig zijn er in de complexe analyse meerdere bewijzen bekend die de productformule voor de sinus wel netjes bewijzen. Onder andere heeft Weierstrass in 1876 een bewijs gegeven en is er met de Γ-functie een sluitend bewijs in de complexe analyse te geven. Dit toont aan dat de formule die Euler afleidde dus wel correct was. Sinds de jaren ’60 van de vorige eeuw is het gebruik van oneindig grote en oneindig kleine getallen binnen een bepaalde theorie wel weer geaccepteerd, namelijk binnen de niet-standaard analyse. Binnen deze theorie moet wel voorzichtig omgegaan worden met deze getallen. In 1973 heeft W.A.J. Luxemburg het bewijs van Euler in een niet-standaard analyse jasje gegoten, om zo tot een hedendaags sluitend bewijs te komen. Hierbij heeft hij het bewijs van Euler wel iets moeten veranderen, aangezien niet alle stappen van Euler te rechtvaardigen zijn in de niet-standaard analyse. Het doel van dit onderzoek is het vergelijken van de verschillende bewijzen van de productformule voor de sinus. Daarom zullen allereerst de volgende vier bewijzen van de productformule voor de sinus op volgorde aan bod komen: 1. Het bewijs van Weierstrass uit 1876 2. Het bewijs met behulp van de Γ-functie1 3. Het bewijs van Euler uit 1735 4. Het bewijs van Luxemburg uit 1973 1 Dit bewijs is niet aan één persoon en jaartal te koppelen, zoals uitgelegd op pagina 13. 1 Daarna zullen deze vier bewijzen met elkaar vergeleken worden met de volgende vragen in het achterhoofd: • Op welke punten komen deze bewijzen overeen? • Op welke punten verschillen deze bewijzen juist? • In hoeverre heeft Luxemburg het bewijs van Euler gerechtvaardigd? Deze laatste vraag is de hoofdvraag van dit onderzoek. 2 2 Oneindige producten Alvorens we in het volgende hoofdstuk het bewijs met complexe analyse van de sinus productformule kunnen bestuderen, moeten we eerst wat voorkennis over oneindige producten ontwikkelen. Om een functie te kunnen schrijven als een oneindig product, zullen we namelijk eerst moeten definiëren wat we precies bedoelen met een oneindig product en daarnaast hoe we de convergentie van een oneindig product van functies definiëren. 2.1 Definitie van een oneindig product We willen een oneindig product graag definiëren aan de hand van een oneindige som, oftewel een reeks, om op die manier alle theorie over reeksen te kunnen overbrengen naar oneindige producten. Hiervoor zou het handig zijn om een oneindig product te definiëren als: ∞ Y P∞ an = e n=1 Log(an ) (2.1.1) n=1 Waarbij Log de hoofdtak van de complexe logaritme aanduidt, dus Log(z) = log|z| + iArg(z) (2.1.2) met Arg(z) de hoofdwaarde van het argument van z. Helaas gedraagt de hoofdtak van de complexe logaritme zich niet analytisch op het gehele complexe vlak, maar slechts op de verzameling C− = C \ (−∞, 0]. Om dit probleem te omzeilen nemen we aan dat de rij (an )∞ n=1 naar 1 convergeert. Dit in analogie met een convergente reeks, waarbij de termen naar 0 moeten convergeren. Als we nu een ∞ rij (bn )∞ n=1 definieren door bi = ai − 1 voor alle i ∈ N, dan convergeert (bn )n=1 naar 0, wat betekent dat er een N ∈ N bestaat met |bn | < 1 voor alle n ≥ N . Nu kunnen we het oneindige product definiëren door: ∞ Y n=1 an := N −1 Y n=1 an · e P∞ n=N Log(1+bn ) (2.1.3) aangezien 1 + bn ∈ C− voor alle n ≥ N . De waarde van het oneindige product is onafhankelijk van de keuze van N . 2.2 Convergentie van een oneindig product We zullen een oneindig productPmet termen (an )∞ n=1 absoluut convergent noe∞ men als de bijbehorende reeks n=1 Log(1 + bn ) absoluut convergent is. Voor |z| < 1 wordt Log(1 + z) gegeven door de volgende machtreeks: Log(1 + z) = − Voor z ∈ C met |z| ≤ 1 2 ∞ X (−1)n n=1 zn n (2.2.1) betekent dit: ∞ ∞ X n z X z n n ||Log(1 + z)| − |z|| ≤ |Log(1 + z) − z| = (−1) ≤ n n=2 n n=2 2 ∞ |z| |z| X n 2 |z| ≤ |z| ≤ ≤ 2 n=0 2 3 (2.2.2) Hieruit volgt met de omgekeerde driehoeksongelijkheid dat: 1 3 |z| ≤ |Log(1 + z)| ≤ |z| (2.2.3) 2 2 P∞ P∞ Als nu de reeks n=1 |bn | of n=1 |Log(1 + bn )| convergeert, dan is er een N ∈ N zó, dat voor alle n ≥ N geldt dat |bn | < 21 . Uit Formule (2.2.3) volgt dan dat: 1 3 |bn | ≤ |Log(1 + bn )| ≤ |bn | 2 2 (2.2.4) P∞ Dit betekent met het MajorantenkenmerkP dat de reeks n=1 |Log(1 + bn )| con∞ vergeert Q dan en slechts dan als de reeks n=1 |bn | convergeert. Het oneindige ∞ product n=1 an is dus absoluut convergent dan en slechts dan als de reeks P∞ b absoluut convergent is. n n=1 2.3 Convergentie van een oneindig product van analytische functies In het geval van reeksen kunnen we in plaats van een reeks met termen uit R ∞ of C ook een reeks van analytische functies beschouwen. Laat P∞(fn )n=1 een rij analytische functies zijn met fn : D → C, D ⊂ C. De reeks n=1 fn heet dan normaal convergent op D als er voor elk punt a ∈ D een omgeving Ua is en een rij (Mn )∞ n=1 in R met Mn > 0 zó, dat: |fn (z)| ≤ Mn voor alle z ∈ Ua ∩ D en alle n ∈ N P∞ en er verder geldt dat n=1 Mn convergeert. Met de Weierstrass M-test volgt dat een normaal convergente reeks ook lokaal uniform convergent is. Lokale uniforme convergentie betekent dat er voor elke a ∈ D een omgeving U is P∞ zodanig dat n=1 fn beperkt tot U ∩ D uniform convergent is. Een belangrijke resultaat in de complexe analyse zegt dat als een rij analytische functies (fn )∞ n=1 lokaal uniform convergent is, dat dan de limietfunctie f ook analytisch is en dat de rij van afgeleides ook lokaal uniform P∞ convergent is, met als limietfunctie f 0 . Hieruit volgt eenvoudig dat als n=1 fn normaal convergent is, dat dan de limietfunctie f ook analytisch is en dat de reeks van afgeleides ook normaal convergent is, met als limietfunctie f 0 . De bewijzen van deze stellingen staan in Theorem III.1.3 en Theorem III.1.6 van [Freitag and Busam, 2009]. Eenzelfde resultaat zouden we graag willen hebben voor oneindige producten. Neem dat (fn )∞ n=1 een rij analytische functies met fn : D → C, D ⊂ C Paan ∞ is, zodat n=1 fn normaal convergent is. Laat D0 ⊆ D compact zijn. Voor alle a ∈ D0 bestaan er open omgevingen Ua enSrijen (Mna )∞ n=1 zoals in de definitie 0 van normale convergentie. Dan geldt dat a Ua een open overdekking Spvan D is. Aangezien D0 compact is, is er een eindige deeloverdekking, zeg i=1 Uai . ai Als we dan de rij (MnP )∞ n=1 definiëren door Mn = max1≤i≤p Mn , dan is het ∞ duidelijk dat de reeks n=1 Mn convergent is en geldt: |fn (z)| ≤ Mn voor alle z ∈ D0 en alle n ∈ N Er is dan dus een N ∈ N zo dat voor alle n ≥ N geldt dat Mn ≤ 21 . Dan volgt met Vergelijking (2.2.3): |Log(1 + fn (z)| ≤ |fn (z)| ≤ Mn voor alle z ∈ D0 en alle n ≥ N 4 P∞ 0 wat betekent dat de reeks n=N Log(1 + fn ) uniform convergent is op D . Aangezien D0 compact is, volgt hieruit dat ook dat de rij analytische functies (gk )∞ k=N gegeven door: Pk gk (z) = e n=N Log(1+fn (z)) (2.3.1) uniform convergent is op D0 . Definiëer nu Fk : D → C door: Fk (z) = k Y (1 + fn (z)) (2.3.2) n=1 Op D0 geldt dat voor k ≥ N : Fk (z) = N −1 Y n=1 Pk (1 + fn (z)) · e n=N Log(1+fn (z)) = N −1 Y n=1 (1 + fn (z)) · gk (z) (2.3.3) 0 Dus (Fk )∞ k=1 is uniform convergent op D . Aangezien C lokaal compact is, is er voor elke a ∈ D een compacte omgeving Ua , waaruit volgt dat (Fk )∞ k=1 lokaal uniform convergent is op D. Dus F : D → C gegeven door F (z) = ∞ Y (1 + fn (z)) (2.3.4) n=1 is een analytische functie. Vanwege dit resultaat zullen we eenP oneindig product Q∞ ∞ (1 + f (z)) normaal convergent noemen als de reeks n n=1 n=1 fn normaal convergent is. We hebben ook nog een resultaat voor de afgeleide van een oneindig product F . Uit de lokale uniforme convergentie volgt dat de afgeleide van F gelijk is aan de limiet van de afgeleides van de partiële producten Fk . Deze limiet is lokaal uniform. Er geldt voor alle z ∈ D \ N (F ), waarbij N (F ) = {z ∈ D : F (z) = 0}, en alle k ∈ N: Pk Qk k fn0 (z) · i=1 (1 + fi (z)) X 0 n=1 fn0 (z) Fk (z) i6=n = = (2.3.5) Qk Fk (z) 1 + fn (z) n=1 i=1 (1 + fi (z)) Hierbij noemen we Fk0 /Fk de logaritmische afgeleide van Fk , aangezien deze uitdrukking voor alle z ∈ D met F (z) ∈ C− gelijk is aan Log(F )0 . De logaritmische afgeleide van F is dus voor alle z ∈ D \ N (F ): ∞ k X X F 0 (z) fn0 (z) fn0 (z) = lim = k→∞ F (z) 1 + fn (z) n=1 1 + fn (z) n=1 De convergentie is hierbij lokaal uniform. 5 (2.3.6) 3 Het bewijs van Weierstrass Met deze achtergrondkennis over de convergentie van oneindige producten kunnen we nu de constructie van de productformule voor de sinus in de complexe analyse beschouwen. Alvorens we het probleem toespitsen op het vinden van een productformule voor de sinus, leiden we eerst een stelling af, waarmee een analytische functie kan worden geconstrueerd als de nulpunten voorgeschreven worden. Deze stelling stamt uit 1876 en is door K. Weierstrass bewezen. 3.1 Existentie van een analytische functie met voorgeschreven nulpunten. Om te beginnen nemen we een discrete deelverzameling S ⊂ D, met voor elke s ∈ S een getal ms ∈ N en we vragen ons af of er een analytische functie f : C → C bestaat met: • f (z) = 0 ⇔ z ∈ S • De orde van het nulpunt s ∈ S is precies ms Aangezien een discrete verzameling in C aftelbaar is, kunnen we de elementen van S nummeren en sorteren, zodat geldt: S = {s1 , s2 , . . .} |s1 | ≤ |s2 | ≤ . . . Definieer mn := msn . Als S eindig is, is een oplossing eenvoudig in te zien, namelijk: |S| Y (z − s)mn n=1 Helaas zal dit met het oog op de ontwikkelde theorie over oneindige producten niet convergeren voor oneindige verzamelingen S. Om tot een convergent product te komen nemen we aan dat 0 ∈ / S. Achteraf kunnen we namelijk altijd nog met z m0 vermenigvuldigen, mocht S toch 0 bevatten. Dankzij deze aanname kunnen we het oneindige product mn ∞ Y z 1− sn n=1 beschouwen. Dit oneindige product heeft nog steeds een nulpunt in z ∈ C precies dan als z = sn ∈ S met orde mn en zoals we gezien hebben is dit product normaal convergent als de reeks ∞ X n=1 z· mn sn normaal convergent is. Bijvoorbeeld voor de nulpuntenverzameling S = Z is dit echter niet het geval. Om voor elke discrete deelverzameling S met bijbehorende ordes een convergent product te construeren zullen we dus convergentie moeten forceren. Hiervoor vermenigvuldigen we met een e-macht, dus we beschouwen: mn ∞ Y z f (z) := 1− ePn (z) (3.1.1) s n n=1 6 waarbij Pn een nog nader te bepalen polynoom is voor elke n ∈ N. Neem n ∈ N vast en definiëer gn : B|sn | (0) → C, met Br (a) de open schijf rond a met straal r, als: mn 1 sn m n = gn := (3.1.2) sn − z 1 − szn Dan geldt dat gn analytisch is aangezien de nulpunten van de noemer buiten het domein liggen. Ook heeft gn geen nulpunten, dit betekent dat er een analytische functie An : B|sn | (0) → C bestaat met gn (z) = eAn (z) (3.1.3) Het bewijs hiervoor wordt gegeven in Stelling A.1 in de appendix. Merk op dat voor deze functie geldt dat: m n mn mn 1 − szn z z m n = 1 (3.1.4) eAn (z) = 1 − gn (z) = 1− sn sn 1− z sn De functie An is volgens Theorem II.2.2 uit [Freitag and Busam, 2009] op de open schijf B|sn | (0) voor te stellen als machtreeks. Laat Pnk : B|sn | (0) → C de partiële sommen van deze machtreeks zijn, oftewel: Pnk (z) = k X ai z i (3.1.5) i=1 met ai ∈ C en Pnk → An voor k → ∞. Op een compacte deelverzameling van B|sn | (0) is deze convergentie zelfs uniform. Aangezien het beeld van een compacte verzameling onder een continue afbeelding ook compact is, volgt dat k ook ePn → eAn uniform voor k → ∞. Neem nu K = B 12 |sn | [0] en zij mn z M = max 1 − :z∈K (3.1.6) sn Dit is goed gedefiniëerd aangezien K compact is. Kies kn ∈ N zodanig dat: k 1 Pn n (z) − eAn (z) < (3.1.7) e M n2 voor alle z ∈ B 12 |sn | [0] en definiëer Pn := Pnkn . Er volgt nu dat: mn mn Pn (z) An (z) Pn (z) 1 − 1 − z 1− z e = e − e sn sn M 1 < = 2 2 Mn n (3.1.8) voor alle z ∈ B 21 |sn | [0]. Neem nu a ∈ C willekeurig, dan is de gesloten schijf U = BR [0] met R > |a| een omgeving van a. Er geldt: mn 1 Pn (z) 1 − 1 − z e (3.1.9) < n2 sn 7 voor alle z ∈ U en alle n ∈ N met 21 |sn | ≥ R. Merk op dit voor slechts eindig veel nP niet het geval is, aangezien U compact is en S discreet. Aangezien de ∞ reeks n=1 n12 convergeert, volgt dat de reeks: ∞ X n=1 1− z sn mn ePn (z) − 1 (3.1.10) normaal convergent is. Met de theorie over oneindige producten volgt hieruit dat ook mn ∞ Y z 1− ePn (z) (3.1.11) s n n=1 normaal convergent is. Dus volgt dat f analytisch is en bij constructie de vooraf gedefiniëerde eigenschappen bezit. Merk op dat deze functie niet uniek is. Als h : C → C analytisch is, dan voldoet bijvoorbeeld F : C → C met: F (z) = eh(z) f (z) (3.1.12) ook aan de voorwaarden. 3.2 Constructie van een analytische functie met voorgeschreven nulpunten. Nu bewezen is dat bij elke discrete verzameling nulpunten met voorgeschreven orde een analytische functie bestaat, willen we deze natuurlijk ook construeren. Uit het existentiebewijs volgen echter vaak polynomen Pn van hoge orde, waardoor de op deze wijze verkregen functies erg ingewikkeld worden. Door onze redenering te verfijnen kunnen we deze orde drastisch omlaag brengen. Herinner dat voor n ∈ N de functie An : B|sn | (0) → C zó gekozen was, dat: eAn (z) = Oftewel, aangezien z sn 1 1− z sn mn (3.2.1) < 1: z An (z) = −mn Log 1 − sn (3.2.2) Hieruit volgt dat An op B|sn | (0) gegeven wordt door: j ∞ X 1 z An (z) = mn · j s n j=1 (3.2.3) Het polynoom Pn wordt hieruit bepaald door deze reeks af te kappen op een geschikte kn ∈ N: j kn X z 1 Pn (z) = mn · (3.2.4) j sn j=1 Deze kn willen we zo klein mogelijk hebben om een zo eenvoudig mogelijk oneindig product te verkrijgen. 8 We introduceren hiervoor allereerst de zogenaamde Weierstrass elementaire factoren Ek met k ∈ N0 : E0 (z) = 1 − z Ek (z) = (1 − z)e Pk i=1 zi i voor k ∈ N (3.2.5) Het oneindige product is dan als volgt te schrijven: ∞ Y Ekn n=1 z sn mn (3.2.6) Kies nu de rij (kn )∞ n=1 in N zó, dat de reeks ∞ X kn +1 z mn sn n=1 (3.2.7) convergeert voor alle z ∈ C. We zullen aantonen dat voor zo’n rij het oneindige product normaal convergent is. Eerst moeten we echter aantonen dat keuze van zo’n rij (kn )∞ n=1 mogelijk is. Dit volgt niet direct uit het existentiebewijs, aangezien deze reeks in dat bewijs niet gebruikt wordt. Neem kn = mn + n voor alle n ∈ N en kies z ∈ C vast. Aangezien de rij (sn )∞ n=1 naar oneindig gaat, kunnen we een N ∈ N vinden zó, dat voor alle n ≥ N geldt dat szn ≤ 12 , waardoor we voor alle n ≥ N vinden dat: kn +1 mn +n+1 n z 1 1 ≤ mn mn < (3.2.8) sn 2 2 Met het Majorantenkenmerk voor reeksen volgt nu de convergentie. We kunnen dus inderdaad (kn )∞ n=1 zó kiezen, dat de reeks convergent wordt. Het enige wat nu nog over is om te bewijzen is dat als we (kn )∞ n=1 inderdaad zo kiezen, dat het oneindige product dan normaal convergent is. Uit de ontwikkelde theorie voor oneindige producten volgt dat het equivalent is te bewijzen dat mn ∞ X z Ekn −1 sn n=1 normaal convergent is. Neem hiervoor R > 0 willekeurig en N ∈ N zó, dat voor alle n ≥ N de volgende twee ongelijkheden gelden: R |sn | 2mn R |sn | ≤ 1 2 ≤ 1 2 kn +1 (3.2.9) Dit kan aangezien de rij (sn )∞ n=1 naar oneindig gaat en de termen van een convergente reeks naar 0 gaan. Voor alle z ∈ C met |z| ≤ R en voor alle n ≥ N volgt nu: kn +1 mn kn +1 (∗) z z R Ek − 1 ≤ 4mn ≤ 4mn n sn sn |sn | 9 (3.2.10) k+1 ≤ 21 De ongelijkheid (∗) geldt, aangezien we voor m, k > 0, |z| ≤ 12 en 2m|z| hebben dat: P∞ Pk zn zn |Ek (z)m − 1| = (1 − z)m em n=1 n − 1 = e−m n=k+1 n − 1 !i ! X ∞ ∞ ∞ n i n X X ∞ X z |z| ≤ −m = m (3.2.11) n i=1 n i=1 n=k+1 ≤ ∞ X k+1 2m|z| i=1 i n=k+1 k+1 ≤ 4m|z| Aangezien R willekeurig was, volgt dat we voor alle a ∈ C een omgeving kunnen vinden waarop dit geldt en vanwege de convergentie van kn +1 ∞ X R mn sn n=1 voor alle R > 0, vinden we dat ∞ X n=1 Ekn z sn mn −1 normaal convergent is op C. Dus geldt dat mn ∞ Y z Ekn s n n=1 normaal convergent is. We hebben dus de volgende stelling bewezen: Stelling 3.1 (Weierstrass). Als we (kn )∞ n=1 in N zó kiezen, dat de reeks ∞ X z kn +1 mn sn n=1 convergeert voor alle z ∈ C, dan is het oneindige product mn ∞ Y z Ekn sn n=1 normaal convergent op C, waardoor de functie F : C → C met mn ∞ Y z F (z) = Ekn s n n=1 analytisch is met nulpunten precies op s1 , s2 , · · · met ordes m1 , m2 , · · · . De logaritmische afgeleide van deze functie volgt uit Formule (2.3.6) en wordt voor z ∈ D0 \ N (F ) gegeven door: ∞ Ek0 n ( szn ) F 0 (z) X = mn · F (z) Ekn ( szn ) n=1 De analytische functie F0 : C → C met: F0 (z) = z m0 F (z) heeft een extra nulpunt van orde m0 in 0, voor het geval dat 0 ∈ S. 10 3.3 De productformule voor de sinus Met deze constructieve stelling over oneindige producten kunnen we nu een functie construeren die dezelfde nulpunten heeft als de sinus. We nemen dus S = πZ. Deze verzameling ordenen we als volgt: s0 = 0, s2 = −π, s1 = π, s3 = 2π, ... Aangezien alle nulpunten van de sinus enkelvoudig zijn nemen we we mn = 1 voor alle n ∈ N. Aangezien de reeks 2 ∞ 2 ∞ X z 2|z| X 1 (3.3.1) mn = sn π n=1 n2 n=1 convergeert voor alle z ∈ C, kunnen we kn = 1 nemen voor alle n ∈ N. Stelling 3.1 geeft ons dan de volgende analytische functie F : C → C: ∞ Y z z e sn sn n=1 2N Y z z 1− = z lim e sn N →∞ sn n=1 F (z) = z 1− N Y z z z −z e πn e πn 1+ N →∞ πn πn n=1 N Y z2 = z lim 1− 2 2 N →∞ π n n=1 ∞ Y z2 =z 1− 2 2 π n n=1 = z lim 1− (3.3.2) en de normaal convergente reeks analytische functies (fn )∞ n=1 die bij F hoort, wordt gegeven door: z2 fn = − 2 2 (3.3.3) π n voor n ∈ N. Doordat F ook een nulpunt in 0 heeft, hebben we daarnaast nog f0 = z − 1. Hoewel F dezelfde nulpunten heeft als de sinus, weten we natuurlijk niet of F gelijk is aan de sinus. Wel weten voor dat voor de logaritmische afgeleide van F voor alle z ∈ C \ πZ geldt: ∞ ∞ ∞ −2z X 1 X F 0 (z) X fn0 (z) 1 2z π 2 n2 = = = + + 2 − π 2 n2 −z 2 F (z) 1 + f (z) 1 + z − 1 z z 1 + n π 2 n2 n=0 n=1 n=1 (3.3.4) Voor de logaritmische afgeleide van de sinus weten we dat voor alle z ∈ C \ πZ: ∞ cos(z) 1 X 2z sin(z)0 = = cot(z) = + sin(z) sin(z) z n=1 z 2 − π 2 n2 11 (3.3.5) Het bewijs hiervoor wordt gegeven in Stelling A.2 in de appendix. Dus de logaritmische afgeleide van F is gelijk aan die van de sinus, wat betekent dat sin(z) = c · z ∞ Y n=1 z2 1− 2 2 π n (3.3.6) voor een c ∈ C. Door beide kanten te delen door z en gebruik te maken van de standaardlimiet sin(z) lim =1 (3.3.7) z→0 z vinden we dat c = 1. Dus is de constructie van de productformule voor de sinus rond: ∞ Y z2 (3.3.8) sin(z) = z 1− 2 2 π n n=1 12 4 Het bewijs met de Γ-functie Naast het voorgaande bewijs in de complexe analyse dat op een directe manier de productformule voor de sinus construeert, is de formule ook de bewijzen met behulp van de Γ-functie. Dit bewijs is veel indirecter, aangezien de productformule voor de sinus volgt uit een aantal eigenschappen van de Γ-functie. Deze eigenschappen zijn door verschillende wiskundigen bewezen, onder andere door Euler, Gauss en Wielandt. Dit bewijs is dan ook niet direct toe te kennen aan één wiskundige. 4.1 De Γ-functie We zullen de sinus productformule dus bewijzen met behulp van de Γ-functie. De functie Γ : C+ → C met C+ = {z ∈ C : Re(z) > 0} wordt gegeven door: Z ∞ tz−1 e−t dt (4.1.1) Γ(z) = 0 Om aan te tonen dat dit goed gedefiniëerd is, moeten we aantonen dat deze integraal convergeert voor alle z ∈ C+ . Hiervoor splitsen we de integraal in twee delen: Z Z ∞ 1 tz−1 e−t dt + Γ(z) = tz−1 e−t dt 0 (4.1.2) 1 Definiëer x = Re(z). We zien met |tz−1 e−t | < tx−1 voor t > 0 en voor alle z ∈ C+ dat uit de absolute convergentie van Z 0 1 1 dt ts (s < 1) (4.1.3) volgt dat de eerste integraal absoluut convergent is voor alle z ∈ C+ . Voor een willekeurige x0 > 0 bestaat er verder een C > 0 zodanig, dat t tx−1 ≤ Ce 2 (4.1.4) voor 0 < x < x0 en t > 0. Hieruit volgt dat t |tz−1 e−t | = tx−1 e−t ≤ Ce− 2 (4.1.5) voor 0 < x < x0 en t > 0. Aangezien dit voor alle x0 > 0 geldt, volgt dat de tweede integraal ook absoluut convergent is voor alle z ∈ C+ , wat betekent dat de Γ-functie goed-gedefiniëerd is. Deze afschattingen tonen ook aan dat de functierij (fn )∞ n=1 met fn : C+ → C gedefiniëerd door: Z n tz−1 e−t dt fn (z) = (4.1.6) 1 n lokaal uniform convergent is. Aangezien fn analytisch op C+ is voor alle n ∈ N, volgt dus dat de Γ-functie analytisch is. 13 4.2 Eigenschappen van de Γ-functie Nu we de Γ-functie gedefiniëerd hebben kunnen we gaan kijken naar wat eigenschappen van de Γ-functie. Zoals we al gezien hebben is de Γ-functie dus analytisch. Ook hebben we natuurlijk: Z ∞ e−t dt = 1 (4.2.1) Γ(1) = 0 Door partiëel te integreren met u(t) = tz en v 0 (t) = e−t verkrijgen we de vergelijking: Γ(z + 1) = zΓ(z) (4.2.2) voor alle z ∈ C+ . Deze twee eigenschappen gecombineerd geven voor alle n ∈ N0 : Γ(n + 1) = n! (4.2.3) De Γ-functie “interpoleert” dus analytisch de faculteiten. Als we Vergelijking (4.2.2) herhaald toepassen, vinden we: Γ(z) = Γ(z + n + 1) z · (z + 1) · · · (z + n) (4.2.4) voor willekeurige n ∈ N. We zien dat de rechterkant een analytische functie is voor alle z ∈ C met Re(z) > −(n + 1) en z 6= 0, −1, · · · , −n. Dit is een groter definitiegebied dan het domein C+ waarop de Γ-functie is gedefiniëerd. We vinden dus voor elke n een analytische voortzetting van de Γ-functie. Aangezien we met Gevolg A.4 in de appendix weten dat de analytische voortzetting van een functie uniek is, volgt dat deze voortzettingen voor elke n ∈ N precies aan elkaar passen en samen een analytische functie definiëren op C \ S, waarbij S = {0, −1, −2, · · · }. Uit de manier waarop we de Γ-functie hebben voortgezet, volgt dat Vergelijking (4.2.2) ook voor alle C \ S geldt. Vanaf nu zullen we deze voortzetting de Γ-functie noemen. Deze functie heeft enkelvoudige polen voor alle s ∈ S en de residuen zijn te berekenen met Vergelijking (4.2.4). Er volgt dat: (−1)n (4.2.5) Res(Γ; −n) = n! voor n ∈ N0 . Zij z ∈ C+ en noem x = Re(z). We weten uit de definitie van de Γ-functie dat |Γ(z)| ≤ Γ(x). De Γ-functie beperkt tot een gesloten interval in de positieve reële getallen is natuurlijk begrensd, vanwege de compactheid van zo’n interval. Dus volgt dat de Γ-functie ook begrensd is op een gesloten verticale strook in C, oftewel op: {z = x + iy : x, y ∈ R en a ≤ x ≤ b} met 0 < a ≤ b. Het blijkt dat deze eigenschappen de Γ-functie volledig karakteriseren. In 1939 heeft H. Wielandt bewezen dat de Γ-functie de enige functie is met deze eigenschappen. Dit bewijs staat in onderstaande stelling. Stelling 4.1 (Wielandt). Laat D ⊂ C een domein zijn die de verticale strook V = {z = x + iy : x, y ∈ R en 1 ≤ x < 2} bevat. Laat f : D → C een analytische functie zijn met de volgende eigenschappen: 14 1. f is begrensd op V 2. f voldoet aan de vergelijking f (z + 1) = zf (z) voor alle z ∈ D met ook z + 1 ∈ D. Dan geldt f (z) = f (1)Γ(z) voor alle z ∈ D. Bewijs. Aangezien V ⊂ D kunnen we net als bij de Γ-functie f aan de hand van de vergelijking f (z + 1) = zf (z) voor alle z ∈ D met ook z + 1 ∈ D uitbreiden naar C\S. Noteer deze functie weer met f . De vergelijking f (z+1) = zf (z) blijft weer gelden voor alle z ∈ C\S en f heeft enkelvoudige polen voor alle s ∈ S. De residuen zijn op dezelfde manier te berekenen als de residuen van de Γ-functie. De waarden van deze residuen zijn voor n ∈ N0 : Res(f ; −n) = (−1)n f (1) n! (4.2.6) Aangezien de functies f en f (1) · Γ dezelfde polen hebben met gelijke residuen, zijn deze singulariteiten ophefbaar voor de functie h : C → C gegeven door h(z) = f (z) − f (1)Γ(z). Er geldt dus dat h analytisch is op heel C. Met de eigenschappen van f en de Γ-functie zien we dat h begrensd is op V . Deze eigenschap is uit te breiden naar stroken van de vorm {z = x + iy : x, y ∈ R en a ≤ x ≤ b} met a ≤ b < 2. Dit kan eerst met de aanvullende conditie dat |Im(z)| ≥ 1 om de polen te ontwijken, maar de verzameling {z ∈ C : |Im(z)| ≤ 1 en a ≤ Re(z) ≤ b} is compact, dus deze extra conditie kan weggelaten worden. Definiëer nu de functie H : C → C door H(z) = h(z)h(1 − z). De functie H is analytisch aangezien h analytisch is. Een analytische functie gedefiniëerd op heel C heet ook wel geheel. Aangezien h ook voldoet aan h(z + 1) = zh(z) voor alle z ∈ C zien we voor H: H(z + 1) = h(z + 1)h(−z) = zh(z) h(1 − z) = −H(z) −z (4.2.7) Dus H is periodiek op het teken na. Ook is de functie H begrensd op de strook {z = x + iy : x, y ∈ R en 0 ≤ x ≤ 1} aangezien de functie h hier begrensd is en de strook invariant is onder de afbeelding z 7→ 1 − z. Hieruit volgt met de periodiciteit van H dat H begrensd is op heel C, maar dan volgt met Stelling A.5 in de appendix dat H constant is. Vanwege h(1) = 0 volgt dat H ≡ 0. Uit de definitie van H volgt dan dat h ≡ 0, oftewel dat f (z) = f (1)Γ(z) voor alle z ∈ D. 4.3 De Γ-functie als oneindig product Dankzij Stelling 4.1 hoef je dus maar twee eisen na te gaan om te bepalen of een gegeven functie op een constante na gelijk is aan de Γ-functie. Als er dan ook nog geldt dat de gegeven functie de waarde 1 heeft in 1, volgt dus dat de functie gelijk aan de Γ-functie is. Dit zullen we gebruiken om een representatie als oneindig product van de Γ-functie te construeren. Hier hebben we het volgende lemma voor nodig: 15 Lemma 4.2. Het oneindige product H(z) = ∞ Y 1+ n=1 z −z e n n is een analytische functie op heel C en er geldt dat H(z) = 0 dan en slechts dan als −z ∈ N. Bewijs. Dat de nulpunten van H precies liggen op alle negatieve natuurlijke getallen, is direct in te zien. We tonen aan dat H normaal convergent is op heel C. We hebben al gezien dat we daarvoor moeten aantonen dat ∞ h X i z −z e n −1 n 1+ n=1 (4.3.1) normaal convergent is op heel C. Laat a ∈ C willekeurig zijn en zij K = B|a|+1 [0] een compacte schijf rond 0 die a bevat. Beschouw de Taylorontwikkeling (1 + w)e−w − 1 = − w2 + O(w3 ) 2 Aangezien K compact is, kunnen we een C ∈ R vinden zodanig, dat (1 + w)e−w − 1 ≤ C|w|2 (4.3.2) (4.3.3) voor alle w ∈ K. Maar dan geldt dus ook voor alle z ∈ K en alle n ∈ N dat: z 2 z z (|a| + 1)2 (1 + )e− n − 1 ≤ C ≤ C · n n n2 (4.3.4) aangezien nz ∈ K P voor alle n ∈ N als z ∈ K. De reeks wordt op K dus ∞ gedomineerd door n=1 n12 . Aangezien a ∈ C willekeurig was, kunnen we dit voor alle a ∈ C doen, dus de reeks is normaal convergent op heel C. Er volgt dat het product normaal convergent is op heel C en dus een gehele functie definiëert. Definiëer nu Gn : C → C voor alle n ∈ N door: n Y Gn (z) = ze−z log n 1+ ν=1 z ν Door gebruik te maken van de Euler-Mascheroni constante 1 1 γ = lim 1 + + · · · + − log n ≈ 0, 57721566 . . . n→∞ 2 n (4.3.5) (4.3.6) zien we met het voorgaande lemma dat Gn voor n → ∞ convergeert naar de gehele functie G : C → C met: G(z) = lim Gn (z) = lim ze−z log n n→∞ = lim ze n→∞ n→∞ z( 1 1+ 12 +···+ n −log n n Y ν=1 ) n Y ν=1 16 1+ z ν z −z 1+ e ν = zeγz H(z) ν (4.3.7) De nulpuntenverzameling van G is precies S, de polenverzameling van de Γfunctie. Dit is geen toeval, zoals onderstaande stelling aantoont. Deze stelling komt van Gauss uit 1811. Het bewijs is veel eenvoudiger dan het originele bewijs van Gauss dankzij Stelling 4.1 van Wielandt. Stelling 4.3 (Gauss). Voor alle z ∈ C geldt: 1 n−z = G(z) = lim z(z + 1) · · · (z + n) n→∞ n! Γ(z) Bewijs. De tweede gelijkheid zegt precies G = limn→∞ Gn . We zullen de eerste gelijkheid bewijzen door de karakteristieke eigenschappen van de Γ-functie uit 1 1 . Merk allereerst op dat de functie G Stelling 4.1 na te gaan voor de functie G analytisch is op het domein D = {z = x + iy : x, y ∈ R en 0 < x < 2} omdat er geen nulpunten van G op D liggen. Dit domein bevat de strook V = {z = x + iy : x, y ∈ R en 1 ≤ x < 2} Voor alle z ∈ V en n ∈ N hebben we dat n−z = n−x en |z + n| ≥ x + n met x = Re(z). Dus geldt dat G(z) ≤ G(x) voor alle z ∈ V . Omdat [1, 2] 1 compact is, weten we dat G begrensd op [1, 2] en dus ook op V . Verder zien we voor alle n ∈ N en alle z ∈ D met z + 1 ∈ D dat: n−(z+1) (z + 1)(z + 2) · · · (z + n + 1) n! z + n + 1 n−z z+n+1 = · z(z + 1) · · · (z + n) = Gn (z) n n! n zGn (z + 1) = z (4.3.8) Voor n → ∞ volgt hieruit zG(z + 1) = G(z) ⇒ 1 1 =z· G(z + 1) G(z) (4.3.9) voor alle z ∈ D met z + 1 ∈ D. Tot slot merken we op dat voor alle n ∈ N geldt dat: n−1 n+1 Gn (1) = (n + 1)! = (4.3.10) n! n 1 Voor n → ∞ volgt hier dus uit dat G(1) = 1, dus ook G(1) = 1. Stelling 4.1 zegt 1 dan dus dat G(z) = Γ(z) voor alle z ∈ D. Omdat de Γ-functie geen nulpunten 1 heeft op D volgt ook Γ(z) = G(z) voor alle z ∈ D. Vanwege de uniciteitsstelling 1 voor analytische functies, zie Gevolg A.4 in de appendix, volgt dat Γ(z) = G(z) voor alle z ∈ C. 4.4 De productformule van de sinus Tot nu toe lijkt het alsof de eigenschappen van de Γ-functie weinig te maken hebben met de sinus. Uit alle eigenschappen die we tot nu toe bewezen hebben, volgt de productformule voor de sinus echter al bijna. 17 Definiëer de functie f : C \ Z → C door f (z) = Γ(z)Γ(1 − z). Deze functie heeft polen van orde 1 voor z ∈ S door de factor Γ(z) en polen van orde 1 voor z ∈ N door de factor Γ(1 − z). Bij elkaar geeft dit dus polen van orde 1 voor alle z ∈ Z. De residuen hebben de waarde Res(f ; n) = lim (z − n)Γ(z)Γ(1 − z) = (−1)n z→n (4.4.1) voor n ∈ Z. Ook geldt voor alle z ∈ C \ Z: f (z + 1) = Γ(z + 1)Γ(−z) = zΓ(z) Γ(1 − z) = −f (z) −z (4.4.2) dus f is periodiek op het teken na. Dat beide eigenschappen gelden ook voor de functie sinππz is niet toevallig. In 1749 wist Euler al dat deze twee functies gelijk aan elkaar zijn. Stelling 4.4 (Euler). Voor alle z ∈ C \ Z geldt: Γ(z)Γ(1 − z) = π sin πz Bewijs. Aangezien deze functies dezelfde polen hebben met gelijke residuen, zijn deze singulariteiten ophefbaar voor de functie h : C → C met h(z) = Γ(z)Γ(1 − z) − π sin πz (4.4.3) en dus is h analytisch op heel C. Op de verzameling A = {z = x + iy : x, y ∈ R met 0 ≤ x ≤ 1 en |y| ≥ 1} is h begrensd, aangezien we al eerder gezien hebben dat Γ(z) en Γ(1−z) begrensd zijn op A en er geldt dat π 2π 2π ≤ 2 ≤ 4π ≤ (4.4.4) = iπz 1 π|y| sin πz e − e−iπz |e−πy | − |eπy | eπ 2e voor alle x + iy = z ∈ A. De rechthoek B = {z = x + iy : x, y ∈ R met 0 ≤ x ≤ 1 en |y| ≤ 1} is compact en aangezien h analytisch is, geldt dus dat h ook begrensd op B. Met de periodiciteit van h volgt dat h begrensd is op heel C en dus is h volgens Stelling A.5 in de appendix constant. Aangezien h(z) = −h(−z) moet deze constante nul zijn. Er volgt dus dat Γ(z)Γ(1 − z) = Voor alle z ∈ C \ Z. 18 π sin πz (4.4.5) Door nu Stelling 4.3 en 4.4 te combineren, vinden we: sin πz = π Γ(z)Γ(1 − z) n−z n−(1−z) z(z + 1) · · · (z + n) · lim (1 − z) · · · (n + 1 − z)) n→∞ n! n→∞ n! n−z n−(1−z) = π lim z · · · (z + n) (1 − z) · · · (n + 1 − z)) n→∞ n! n! n 1 Y 2 z(n + 1 + z) · ν − z2 = π lim 2 n→∞ n (n!) ν=1 n 2 Y n+1+z ν − z2 = π lim z · · lim n→∞ n→∞ n ν2 ν=1 ∞ Y z2 = πz · 1− 2 n n=1 (4.4.6) voor alle z ∈ C \ Z. Deze formule is equivalent met = π lim sin z = z · ∞ Y n=1 1− z2 π 2 n2 voor alle z ∈ C \ πZ. Dit is de productformule voor de sinus. 19 (4.4.7) 5 Het bewijs van Euler De productformule voor de sinus wordt ook wel Eulers productformule voor de sinus genoemd. Hoewel de complexe analyse pas ontwikkeld is in de negentiende eeuw, heeft Euler in 1735 de productformule voor de sinus al geconstrueerd. Dit bewijs is gepubliceerd in zijn boek Introductio in analysin infinitorum I uit 1748. Hij gebruikte in dit bewijs een hele andere aanpak dan de bewijzen uit de complexe analyse. Hedendaags is het bewijs van Euler niet meer sluitend te noemen, aangezien hij in zijn constructie vrijelijk gebruik maakt van oneindig kleine en oneindig grote getallen. Zelfs in Eulers tijd werden er al vraagtekens bij het bewijs gezet door tijdgenoten. Met het oog op het hiervoor gegeven bewijs met behulp van de complexe analyse, weten we echter wel dat de formule waar Euler uiteindelijk op uit komt, correct is. Waarschijnlijk had Euler dus een goede intuı̈tie hoe er met zulke getallen omgegaan kan worden. Hieronder volgt het bewijs zoals Euler dit in zijn boek uit 1748 gaf, voorafgegaan door een aantal andere stellingen uit zijn boek die nodig zijn in dit bewijs. Zonder onderbouwing zal in het bewijs dus gebruik gemaakt worden van oneindig grote en oneindig kleine getallen. 5.1 Benodigde stellingen Allereerst een aantal stellingen die nodig zijn voor Eulers constructie. De bewijzen van deze stellingen zijn te vinden in [Euler, 1988]. Ook in deze bewijzen wordt vrijelijk gebruik gemaakt van oneindige grote en oneindig kleine getallen. Stelling 5.1. Voor alle hoeken φ en natuurlijke getallen n geldt: n (cos φ ± sin φ) = cos nφ ± sin nφ Stelling 5.2. De e-macht is als volgt als reeks te ontwikkelen: ex = 1 + x2 x3 x + + + ... 1 1·2 1·2·3 Stelling 5.3. Voor j oneindig groot geldt: x e = x 1+ j j Stelling 5.4. De cosinus is als volgt als reeks te ontwikkelen: cos x = 1 − 5.2 x2 x4 x6 + − + ... 1·2 1·2·3·4 1·2·3·4·5·6 Polynomen ontbinden in lineaire factoren Euler komt tot de productformule voor de sinus door de machtreeks te ontbinden in lineaire factoren. We bekijken daarom eerst het ontbinden van polynomen in lineaire factoren. De lineaire factoren van een polynoom a0 + a1 z + a2 z 2 + a3 z 3 + a4 z 4 . . . 20 kunnen gevonden kunnen door gebruik te maken van de nulpunten van het polynoom. Als p een nulpunt is, is z − p namelijk een lineaire factor. Het is echter niet altijd even eenvoudig om alle lineaire factoren op deze wijze te vinden, zeker als het om complexe lineaire factoren gaat. We ontwikkelen daarom een alternatieve manier om deze factoren te vinden. Aangezien de lineaire factoren van een polynoom volgen uit de nulpunten van het polynoom, weten we dat de complexe lineaire factoren van een polynoom met reële coëfficiënten paarsgewijs gecombineerd kunnen worden tot reële kwadratische factoren. We kunnen de complexe lineaire factoren van zo’n polynoom dus vinden als we de kwadratische factoren van de vorm p−qz+rz 2 die reëel zijn, maar waarvan de lineaire factoren complex zijn, bestuderen. Zo’n reëele kwadratische factor p − qz + rz 2 heeft complexe lineaire factoren precies als 4pr > q 2 , oftewel als: q −1< √ <1 2 pr (5.2.1) Aangezien de cosinus alle waardes tussen −1 en 1 aanneemt, heeft een reëele kwadratische factor complexe lineaire factoren als q √ = cos φ 2 pr (5.2.2) √ voor een zekere φ. Als we q = 2 pr cos φ invullen in de kwadratische term, dan krijgen we √ p − 2 prz cos φ + rz 2 (5.2.3) In deze kwadratische factor substitueren we p door p2 en r door q 2 . Dit kan aangezien p en r hetzelfde teken moeten hebben en dus, eventueel na de kwadratische term met −1 vermenigvuldigd te hebben, positief zijn. We krijgen dan de drieterm p2 − 2pqz cos φ + q 2 z 2 (5.2.4) met complexe lineaire factoren qz − p(cos φ + i sin φ) qz − p(cos φ − i sin φ) (5.2.5) Als cos φ = ±1 dan geldt dat sin φ = 0 en dan zullen beide factoren gelijk en reëel zijn. We hebben het vinden van complexe lineaire factoren van het reële polynoom α + βz + γz 2 + δz 3 + z 4 . . . (5.2.6) dus gereduceerd tot het vinden van waarden voor p, q en φ zodanig dat de drieterm p2 − 2pqz cos φ + q 2 z 2 een factor van het polynoom is, oftewel dat r2 − 2rz cos φ + z 2 met r = p q (5.2.7) een factor van het polynoom is. Dit geldt als z − r(cos φ + i sin φ) z − r(cos φ − i sin φ) 21 (5.2.8) lineaire factoren van het polynoom zijn. Om de drietermen te bepalen substitueren we r(cos φ + i sin φ) (5.2.9) r(cos φ − i sin φ) voor z in het polynoom en kijken we voor welke waarden voor r en φ het polynoom nul wordt. Dit levert ons de volgende twee vergelijkingen op: 2 a0 + a1 r(cos φ + i sin φ) + a2 r2 (cos φ + i sin φ) + · · · = 0 2 a0 + a1 r(cos φ − i sin φ) + a2 r2 (cos φ − i sin φ) + · · · = 0 (5.2.10) Hoewel het op het eerste gezicht lijkt dat deze substitutie alleen maar moeilijkheden oplevert, valt dit heel erg mee. Met Stelling 5.1 kunnen de twee vergelijkingen namelijk omgeschreven worden tot: a0 + a1 r(cos φ + i sin φ) + a2 r2 (cos 2φ + i sin 2φ) + · · · = 0 a0 + a1 r(cos φ − i sin φ) + a2 r2 (cos 2φ − i sin 2φ) + · · · = 0 (5.2.11) Door deze twee vergelijkingen bij elkaar op te tellen en van elkaar af te trekken en in het tweede geval nog te delen door 2i, verkrijgen we: a0 + a1 r cos φ + a2 r2 cos 2φ + · · · = 0 a1 r sin φ + a2 r2 sin 2φ + · · · = 0 (5.2.12) Hieruit zijn r en φ te bepalen. Beschouw nu het polynoom an − z n . Dit is een polynoom van de vorm a0 + a1 z + a3 z 2 + a4 + a5 z 4 + · · · (5.2.13) met a0 = an , an = −1 en an = 0 voor alle andere coëfficiënten. Uit de vergelijkingen in (5.2.12) volgt dan dat de kwadratische factoren te vinden zijn door an − rn cos nφ = 0 (5.2.14) rn sin nφ = 0 op te lossen. De tweede vergelijking geeft sin nφ = 0, wat betekent dat nφ = 2kπ of nφ = (2k + 1)π. In dit geval moeten we φ = 2kπ n kiezen. Dan volgt cos nφ = 1 en dus krijgen we dat an = rn , oftewel r = a. Dus a2 − 2az cos 2kπ + z2 n (5.2.15) zijn factoren van an − z n , waarbij 2k door alle natuurlijke getallen kleiner dan n loopt. Voor k = 0 verkrijgen we a2 − 2az + z 2 . Dit betekent echter niet dat (a − z)2 een factor is van het polynoom, aangezien voor dit geval er slechts één vergelijking uit (5.2.12) over blijft. Wel geldt dat a − z een factor van het polynoom is. Voor n even geldt hetzelfde als 2k = n, dan verkrijgen we de drieterm a2 − 2az + z 2 en dus is dan a + z een lineaire factor van het polynoom. 22 5.3 Reeksen ontbinden in lineaire factoren De factorisatie van polynomen kunnen we uitbreiden naar reeksen. We weten uit Stelling 5.2 namelijk dat: 1+ en uit Stelling 5.3 dat: x x2 x3 + + + · · · = ex 1 1·2 1·2·3 (5.3.1) j x (5.3.2) e = 1+ j waarbij j oneindig groot is. We zien dus dat de reeks van de e-macht oneindig veel lineaire factoren heeft, allemaal gelijk aan 1 + xj . Als we de eerste term van deze reeks verwijderen, verkrijgen we j x2 x3 x x −1 (5.3.3) + + + ··· = 1 + 1 1·2 1·2·3 j x Nemen we a = 1 + xj , n = j en z = 1, dan is dit van de vorm an − z n , dus de factoren zijn zoals in (5.2.15): 2 x 2kπ x −2 1+ cos +1 (5.3.4) 1+ j j j Door voor k alle natuurlijke getallen in te vullen verkrijgen we alle factoren. 2 k = 0 geeft xj 2 en net als eerder levert dit enkel de factor xj op. We zien dus dat x een factor van ex − 1 is. Met Stelling 5.4 weten we dat: cos 2kπ k2 π2 1 k4 π4 = 1 − 2 · 2 + · 4 + ... j j 3 j (5.3.5) Alle termen van de reeks behalve de eerste twee kunnen we verwaarlozen, aangezien j oneindig groot is. We krijgen dan dus cos k2 π2 2kπ =1−2· 2 j j (5.3.6) Als we dit invullen in Vergelijking (5.3.3) vinden we dat alle factoren van de vorm x2 4k 2 π 2 4k 2 π 2 + + x (5.3.7) j2 j2 j3 zijn. Hieruit volgt dat naast x de factoren van ex − 1 gegeven worden door 1+ x x2 + 2 2 j 4k π (5.3.8) waarbij k door alle natuurlijke getallen vanaf 1 loopt. We kunnen ex − 1 schrijven als product van alle factoren, vermenigvuldigd met een passende constante. Alle factoren van ex − 1 behalve x bevatten echter de oneindig kleine term xj . Deze kan niet verwaarloosd worden, aangezien door de vermenigvuldiging van alle termen, in totaal 2j , een niet te verwaarlozen bijdrage wordt gevormd. Om dit te voorkomen beschouwen we de de uitdrukking j j x x x −x e −e = 1+ − 1− (5.3.9) j j 23 Als we nu a = 1 + xj , n = j en z = 1 − xj nemen, is dit weer van de vorm an − z n , dus alle factoren zijn zoals in (5.2.15): 1+ x j 2 2 x x 2kπ x −2 1+ 1− cos + 1− j j n j 2 2 x 2kπ x = 2 1 + 2 − 2 1 − 2 cos j j j 2 2 2 2 2 2 4k π 4k π x 4x − = 2 + j j2 j4 2 (5.3.10) 2 k π waarbij we wederom cos 2kπ j = 1 − 2 · j 2 gebruiken. Voor k = 0 vinden we weer de factor x. De andere factoren worden 1+ x2 π 2 x2 − 2 2 k j (5.3.11) waarbij k door alle natuurlijke getallen vanaf 1 loopt. Ditmaal kunnen we de 2 oneindig kleine factor xj 2 wel weglaten, aangezien dit vermenigvuldigd met j oneindig klein blijft. We vinden dus x2 x2 ex − e−x = 2x 1 + 2 1 + 2 ... (5.3.12) π 4π hierbij is met 2 vermenigvuldigd, zodat als de termen met elkaar vermenigvuldigd worden, de eerste term 2x oplevert, net zoals in ex − e−x = 2x 2x3 + + ... 1 1·2·3 Als we nu voor x het imaginaire getal iz invullen, dan krijgen we: z2 z2 eiz − e−iz = 2iz 1 − 2 1 − 2 ... π 4π en dus volgt de productformule voor de sinus: eiz − e−iz z2 z2 sin z = =z 1− 2 1 − 2 ... 2i π 4π 24 (5.3.13) (5.3.14) (5.3.15) 6 Niet-standaard analyse Hoewel het bewijs van Euler met oneindig grote en oneindig kleine getallen tegenwoordig niet meer wordt geaccepteerd als sluitend bewijs, is er wel een theorie waarbinnen oneindig grote en oneindig kleine getallen wel correct gebruikt kunnen worden, namelijk de niet-standaard analyse. Deze theorie is in de jaren ’60 van de vorige eeuw ontwikkeld door A. Robinson en breidt de reële getallen uit tot de hyperreële getallen. Zoals we zullen zien moet het gebruik van oneindig grote en oneindig kleine getallen in de niet-standaard analyse wel gepaard gaan met enige voorzichtigheid. W.A.J Luxemburg heeft in 1973 het bewijs van Euler om weten te zetten naar de niet-standaard analyse. In dit hoofdstuk zal eerst de niet-standaard analyse worden opgebouwd, waarna in het volgende hoofdstuk het bewijs van Luxemburg zal worden gegeven. Slechts de hoofdlijn van de niet-standaard analyse die nodig is voor het bewijs van de productformule voor de sinus zal worden behandeld. Voor een gedetailleerdere en uitgebreidere opbouw verwijs ik graag naar [Luxemburg, 1973] en [Mendelson, 2010]. 6.1 Tweede-orde taal Een van de eerdere versies van niet-standaard-analyse was gebaseerd op het formuleren van eigenschappen van R die in een eerste-orde taal kunnen worden geformuleerd. Je hebt echter al vrij snel een tweede-orde taal nodig, waarin uitspraken als “Er bestaat een continue functie die . . . ” kunnen worden geformuleerd. Dit vereist een stukje axiomatische verzamelingenleer, waarbinnen de theorie van de reële getallen kan worden ontwikkeld. 6.2 De superstructuur R̂ We hebben de superstructuur van R, welke we met R̂ zullen Sn aanduiden, nodig. Deze is inductief gedefiniëerd. Laat R0 = R en Rn+1 = P( k=0 Rk ) voor n ∈ N. S∞ Hierbij is P(X) de machtsverzamling van X. Dan geldt R̂ = n=0 Rn . De elementen van Rn \ Rn−1 noemen we van rang n in R̂. Geordende paren definiëren we als (a, b) = {{a}, {a, b}} en n-tupels inductief door (a) = a, en (a1 , . . . , an ) = ((a1 , . . . , an−1 ), an ). Dan zien we dat alle ntupels in R̂ zitten, wat dus betekent dat alle algebraı̈sche operaties van R ook allemaal elementen van R̂ zijn, aangezien deze kunnen worden gedefiniëerd als verzamelingen van 3-tupels. De product- en somoperatie P en S kunnen als volgt worden gedefiniëerd: ab = c dan en slechts dan als (a, b, c) ∈ P ∈ R̂ en a + b = c dan en slechts dan als (a, b, c) ∈ S ∈ R̂. De ordening op R kan als verzameling geordende paren worden uitgedrukt en dus volgt dat alle axioma’s en eigenschappen van R elementen van R̂ zijn. Laten we nu de formele taal L introduceren. De atomaire symbolen van L zijn: • De connectieven ∧, ∨, ⇐, ⇒ en ¬. • Aftelbaar oneindig veel variabelen. • De kwantoren ∃ en ∀. 25 • De haakjes (). • Het binaire predicaat ∈ • Genoeg constanten voor een bijectie met alle elementen van de structuur die beschouwd wordt. Dit is over het algemeen een oneindig grote verzameling, maar de grootte ligt wel vast. Aangezien we de structuur R̂ beschouwen, nemen we dus evenveel constanten in L als elementen in R̂. Als deze constanten geı̈dentificeerd zijn met de elementen van R̂, noemen we R̂ een L-structuur. De interpretatie van het predicaat ∈ zal de “element van” relatie uit de axiomatische verzamelingenleer zijn. Hier kan op gebruikelijke wijze het predicaat = uit worden geconstrueerd. De atomaire formules zijn van de vorm α ∈ β, waarbij α en β constanten of variabelen kunnen zijn. De goedgevormde formules (wf) worden hieruit geconstrueerd door connectieven, kwantoren en haakjes toe te voegen. Dat wil zeggen, als V een atomaire formule is, dan is [V ] een wf en als V, W wfs zijn, dan zijn [V ∧ W ], [V ∨ W ], [¬V ], [V ⇒ W ] en [V ↔ W ] wfs. Verder geldt als V een wf is en x een willekeurige variabele die nog niet achter een kwantor in V staat, dat (∀x)V en (∃x)V wfs zijn. Als V een wf is, dan noemen we V het bereik van de kwantor in de wfs [(∀x)V ] en [(∃x)V ]. Een variabele x heet vrij in een wf V als deze niet in ∀x, ∃x of het bereik van een kwantor ∀x of ∃x staat. Een wf zonder vrije variabelen heet een gesloten wf, een wf met vrije variabelen een open wf. Voor de ontwikkeling van de niet-standaard analyse zullen we enkel kijken naar de toelaatbare wfs van L, dit zijn wfs waarbij alle kwantoren de vorm hebben (∀x)[[x ∈ A] ⇒ · · · ] of (∃x)[[x ∈ A] ∧ · · · ] met A ∈ R̂. De verzameling van alle toelaatbare wfs noteren we met K(L). Dit zijn dus de wfs waarin alle kwantoren een domein hebben. De verzameling toelaatbare wfs die gelden in R̂ noteren we met K0 (L). Merk op dat alle uitspraken in de analyse die over getallen, verzamelingen getallen, relaties tussen getallen, relaties tussen verzamelingen etc. gaan en gelden in R, uitgedrukt kunnen worden als elementen van K0 (L). Bijvoorbeeld de uitspraak dat vermenigvuldiging in R commutatief is, kan als volgt worden uitgedrukt: (∀a)(∀b)(∀c) [a, b, c ∈ R] ⇒ [(a, b, c) ∈ P ⇒ (b, a, c) ∈ P ] 6.3 Ultramacht van R̂ We zullen de taal L uit gaan breiden naar een taal ∗ L, waarin we de de L∗ structuur R̂ uit gaan breiden naar een ∗ L-structuur R̂. Hierin zullen alle toelaatbare wfs van R̂ die gelden met een geschikte interpretatie van de symbolen ∗ ∗ in R̂ ook gelden in R̂. Hiertoe zullen we met behulp van een vrij ultrafilter een ultramacht van R̂ construeren. Allereerst herhalen we kort wat een ultrafilter is. Laat I een niet-lege verzameling zijn. Een filter op I is een niet-lege verzameling F van deelverzamelingen van I zodanig, dat ∅ ∈ / F, dat F gesloten is onder eindige doorsnedes en dat als F ⊂ G ⊂ I en F ∈ F, dan G ∈ F. In het bijzonder geldt I ∈ F. Een ultrafilter op I is een filter F op I, zodanig dat er geen filter G op I bestaat met F ⊂ G en F 6= G. Een belangrijke stelling over ultrafilters zegt dat een filter F een ultrafilter op I is dan en slechts dan als voor alle F ⊂ I geldt 26 dat F ∈ F of I \ F ∈ F. Er is nog een equivalente karakterisering te geven, welke in onderstaande stelling bewezen wordt. Sn Stelling 6.1. Een filter F is een ultrafilter precies dan als uit i=1 Fi ∈ F met Fi ⊂ I voor i = 1, . . . , n volgt dat Fi ∈ F voor tenminste één i. Sn Bewijs. Stel dat F een ultrafilter is. Laat Fi ∈ I met i=1 Fi ∈ F en stel dat F / F zijn voor i = 1, . . . , n. Dan geldt I \ Fi ∈ F voor i = 1, . . . , n. Dus Tin∈ ook i=1 (I \ Fi ) ∈ F. Maar dan volgt: ∅= n \ (I \ Fi ) ∩ i=1 n [ i=1 Fi ∈ F Een tegenspraak met het feit dan F een ultrafilter is, dus geldt Fi ∈ F voor tenminste één i. Nu andersom. Laat F een filter op I zijn en neem F ⊂ I willekeurig. Als F ∈ / I, dan geldt vanwege F ∪ (I \ F ) = I ∈ F dat I \ F ∈ F. Een filter T F heet δ-incompleet als erTeen rij Fn ∈ F bestaat met n = 1, 2, . . . ∞ zodanig, dat n=1 Fn ∈ / F en vrij als {F : F ∈ F } = ∅. Om een ultramacht van R̂ te construeren waar we meer mee kunnen dan met R̂ zelf, hebben we een δ-incompleet ultrafilter nodig. Hier is het onderstaande lemma belangrijk voor. Lemma 6.2. Een ultrafilter F op I is δ-incompleet dan en slechts dan als er een aftelbare partitie {In : n ∈ N} van de verzameling I bestaat zodanig, dat In ∈ /F voor alle n ∈ N. Bewijs. Laat F een δ-incompleet ultrafilter op I zijn en neem een rijTFn ∈ F T∞ n met n ∈ N zó, dat n=1 Fn ∈ / F. Zij GT1 = I \ F1 en Gn+1 = (I \ Fn ) \ k=1 Gk ∞ voor n = 1, 2, . . .. Neem verder G0 = n=1 Fn . Er geldt dat alle Gn ’s disjunct zijn, Gn ∈ / F voor alle n ∈ N en: ! ∞ ∞ ∞ ∞ ∞ [ \ [ \ \ Gn = Fn ∪ (I − Fn ) = Fn ∪ I \ Fn = I n=0 n=1 n=1 n=1 n=1 We vinden dus dat {Gn : n ∈ N0 } een aftelbare partitie is van I met Gn ∈ /F voor alle n ∈ N0 . Nu andersom. Laat F op I een ultrafilter zijn en {In : n ∈ N} een partitie van I zó, dat In ∈ / F voor alle n ∈ N. Neem Fn = I \ In voor alle n ∈ N. Dan geldt: ∞ ∞ \ [ Fn = I \ In = ∅ ∈ /F n=1 n=1 Dus de rij Fn voldoet. Uit dit lemma volgt direct dat er alleen δ-incomplete ultrafilters bestaan op oneindige verzamelingen. Ook volgt uit het slechts dan gedeelte van het bewijs dat een δ-incompleet ultrafilter vrij is. Met deze opmerkingen volgt de volgende stelling. Stelling 6.3. Op elke oneindige verzameling bestaat er een δ-incompleet, vrij ultrafilter. 27 Bewijs. Zij {In : n ∈ N} een partitie van I met In 6= ∅ voor alle n ∈ N. Dit is mogelijk aangezien I een oneindige verzameling is. Laat het filter F op I voortgebracht worden door I \ In voor alle n ∈ N. Dit is goed gedefiniëerd, want voor geen enkele eindige doorsnede van I \In ’s krijg je de lege verzameling. Definiëer P = {G : F ⊂ G}, de verzameling van alle filters die F bevatten. Dan is P een partieel geordende verzameling ten opzichte van “⊂” en elke volledig geordende deelverzameling heeft een bovengrens, namelijk de vereniging van alle filters in die deelverzameling. Met Zorn’s Lemma volgt dan dat P een maximaal element heeft, oftewel dat P een ultrafilter H bevat. Aangezien voor dit ultrafilter geldt dat F ⊂ H, volgt dat I \ In ∈ H, oftewel In ∈ / H voor alle n ∈ N. Met Lemma 6.2 volgt dan dat H δ-incompleet is, waaruit direct volgt dat H een vrij ultrafilter is. Nu kunnen we gaan kijken naar een ultramacht van R̂. Laat I een oneindige verzameling zijn en F een δ-incompleet ultrafilter op I. We noteren alle afbeeldingen I → R̂ als R̂I . Er bestaat een natuurlijke imbedding R̂ → R̂I gegeven door a 7→ ∗ a met ∗ a(i) = a voor alle i ∈ I. De predicaten ∈ en = kunnen worden uitgebreid naar R̂I met de volgende definities. Definitie 6.4. Als a, b ∈ R̂I , dan a ∈F b dan en slechts dan als {i : a(i) ∈ b(i)} ∈ F en a =F b dan en slechts dan als {i : a(i) = b(i)} ∈ F Aangezien I ∈ F zien we direct dat voor a, b ∈ R̂ geldt dat a ∈ b precies dan als ∗ a ∈ ∗ b en a = b precies dan als ∗ a = ∗ b. De predicaten ∈F en =F op R̂I zijn dus uitbreidingen van ∈ en = op R̂. Met ∈ / en 6= op de voor de hand liggende manier gedefiniëerd zien we ook voor alle a, b ∈ R̂I dat ofwel a ∈F b, ofwel a∈ / F b en ofwel a =F b ofwel a 6=F b, door op te merken dat voor alle F ⊂ I geldt ofwel F ∈ F ofwel I \ F ∈ F. De predicaten ∈F en =F gedragen zich op R̂I zoals ∈ en = op R̂. Daarom zullen we het subscript vanaf nu weglaten. Om aan te tonen dat alle gesloten wfs in R̂ ook in R̂I gelden met de zojuist gedefiniëerde interpretatie van de basis predicaten, nemen we aan dat de elementen van R̂I één op één in relatie staan met de constanten van een taal ∗ L. Verder heeft deze taal twee basis predicaten, die worden geı̈dentificeerd met ∈ en = van R̂I . Zo krijgen we een ∗ L-structuur R̂I , waarvan verzameling van de geldige gesloten wfs afhangt van F. De verzameling R̂I heet de ultramacht van R̂ ten opzichte van het ultrafilter F. We zullen een substructuur van de ∗ L-structuur R̂I nemen, waarvan we zullen aantonen dat deze op een bepaalde manier samenhangt met de gesloten wfs van K0 (L). Definitie 6.5. Een entiteit a ∈ R̂I heet een interne entiteit als er een n ∈ N0 bestaat zodanig, dat a ∈ ∗ Rn . Een interne entiteit heet een standaard entiteit als er een b ∈ R̂ bestaat met a = ∗ b. Niet-interne entiteiten heten extern. Voor het bewijs van de productformule voor de sinus hebben we slechts een substructuur van de ultramacht R̂SI nodig, namelijk de verzameling van ∞ alle interne entiteiten van R̂I , oftewel n=0 ∗ Rn . Deze verzameling zullen we ∗ noteren met R̂ ∗ De definitie van rang is direct over te zetten naar R̂ en voor standaard elementen vallen deze definities samen. We zien dat elementen van interne entiteiten wederom intern zijn. Omgekeerd geldt dit niet: Niet elke verzameling van interne entiteiten is intern. 28 ∗ De afbeelding a 7→ ∗ a is een inbedding van R̂ in de substructuur R̂ van R̂I . ∗ De vraag is natuurlijk of deze inbedding proper is, oftewel of R̂ ook ook nietstandaard entiteiten bevat. De volgende stelling geeft hier antwoord op. Stelling 6.6. Er bestaan niet-standaard interne entiteiten. In het bijzonder bestaat voor elke a ∈ R̂ met oneindig veel elementen een niet-standaard b ∈ ∗ a. Bewijs. Aangezien a een oneindige verzameling is, bestaat er een rij (bn )∞ n=1 van elementen van a met bn 6= bm voor alle n, m ∈ N met n 6= m. Laat {In : n ∈ N} een partitie van I zijn met In ∈ / F voor alle n ∈ N. Laat b : I → R̂ gegeven zijn door b(i) = bn voor alle i ∈ In met n ∈ N. Dan geldt b ∈ ∗ a, maar voor alle c ∈ R̂ geldt b 6= ∗ c. Dus b is niet-standaard. Net zoals bij de L-structuur R̂, noemen we een wf van ∗ L toelaatbaar als alle kwantoren van de vorm (∀x)[[x ∈ A] ⇒ · · · ] of (∃x)[[x ∈ A] ∧ · · · ] met A ∈ R̂I . Zo’n toelaatbare wf noemen we intern als alle constanten in de wf intern zijn en standaard als alle constanten in de wf standaard zijn. De verzameling van alle interne gesloten wfs van ∗ L noteren we met ∗ K(∗ L) en de deelverzameling hiervan die geldig is met ∗ K0 (∗ L). Tot slot definiëren we de ∗ -transformatie ∗ V van een toelaatbare wf V door alle constanten, zeg a1 , . . . , an te vervangen door ∗ a1 , . . . , ∗ an . Voordat we nu de niet-standaard analyse kunnen gaan ontwikke∗ len, hebben we nog één zeer belangrijke stelling over R̂ nodig. Het bewijs is terug te vinden in Theorem 3.8 van [Luxemburg, 1973]. Stelling 6.7. V ∈ K(L) ⇔ ∗ V ∈ ∗ K(∗ L) Deze stelling wordt ook wel de Fundamental Theorem genoemd en zal vanaf nu naar verwezen worden als F.T.. Deze stelling zegt dat een toelaatbare ge∗ sloten wf V geldig is in R̂ dan en slechts dan als ∗ V geldig is in R̂ en zal ∗ veelvuldig gebruikt worden om uitspraken te transformeren van R̂ naar R̂ en terug. De volgende stelling over interne wfs is ook erg handig in bewijzen waarin de F.T. wordt toegepast. Het bewijs is terug te vinden in Theorem 3.10 van [Luxemburg, 1973]. Stelling 6.8. Laat V = V (x1 , · · · , xn ) een interne wf zijn met vrije variabe∗ len x1 , · · · , xn en laat a ∈ R̂ een interne entiteit zijn. Dan is de verzameling {(x1 , · · · , xn ) : (x1 , · · · , xn ) ∈ a en V (x1 , · · · , xn )} intern. 6.4 De niet-standaard reële getallen Uit de vorige sectie blijkt dat de verzameling ∗ R dezelfde eigenschappen heeft als R, voor zo ver deze eigenschappen uitgedrukt kunnen worden door gesloten wfs in K0 (L). We kunnen nu bijvoorbeeld eenvoudig aantonen dat ∗ R een geordend lichaam is. De volgende gesloten wf is namelijk een wf uit K0 (L): (∀x)(∀y) [x ∈ R ∧ y ∈ R] ⇒ [x < y] ∨ [x = y] ∨ [x > y] Om de notatie enigszins te versimpelen zullen we de uitbreiding van de algebraı̈sche operaties van R naar ∗ R met dezelfde symbolen aanduiden. Dus bijvoorbeeld met a + b = c in ∗ R wordt bedoeld dat {i : a(i) + b(i) = c(i)} ∈ F. Hetzelfde geldt voor aftrekken, vermenigvuldigen, de ordeningsrelatie, de absolute waarde, het maximum, het minimum, etc.. Daarnaast zullen we vanaf nu, 29 aangezien R ingebed wordt in ∗ R door de afbeelding a → ∗ a, R identificeren met de standaard entiteiten van ∗ R. Hierdoor kunnen we dus ook R ⊂ ∗ R schrijven. Ditzelfde voor een deelverzameling S van R en zijn inbedding ∗ S, in het bijzonder N ⊂ ∗ N. Merk op dat we aangezien we met de superstructuur R̂ begonnen zijn, we eigenschappen kunnen overdragen, waarin er niet alleen gekwantificeerd wordt over getallen. Voorbeeld 6.9. Twee voorbeelden van eigenschappen waarin niet alleen gekwantificeerd wordt over getallen zijn: i. Elke niet-lege interne deelverzameling van ∗ R met een bovengrens heeft een supremum. ii. Elke niet-lege interne deelverzameling van ∗ N heeft een kleinste element. Deze eigenschappen zullen later erg handig blijken. Ook volgt uit Stelling 6.6 dat ∗ N \ N 6= ∅. We zullen nu laten zien dat er een ω ∈ ∗ N bestaat met |r| < ω voor alle r ∈ R. Laat ω(i) = n voor i ∈ In met n ∈ N. Hierbij is {In : n ∈ N} wederom een partitie van I met In ∈ / F voor alle n ∈ N. Dan is ω een afbeelding van I naar N, dus ω ∈ ∗ N. Ook geldt voor alle 0 ≤ r ∈ R dat {i : ω(i) < r} ∈ / F. We zien dus dat |r| < ω voor alle r ∈ R, wat betekent dat ω oneindig groot genoemd zou kunnen worden. Dit geeft aanleiding tot de volgende definitie: Definitie 6.10. Een reëel getal a ∈ ∗ R noemen we eindig, als er een standaard reëel getal 0 ≤ r ∈ R bestaat met |a| < r. Een reëel getal a ∈ ∗ R dat niet eindig is noemen we oneindig. De verzameling eindige reële getallen noteren we met M0 . Een reëel getal a ∈ ∗ R noemen we infinitesimaal, als voor alle standaard reële getallen 0 < r ∈ R geldt dat |a| < r. De verzameling infinitesimale reële getallen noteren we met M1 . Merk op dat R ⊂ M0 , M1 ⊂ M0 en R ∩ M1 = {0}. Ook zien we dat 0 6= a ∈ M1 dan en slechts dan als a1 oneindig groot is. Voor de natuurlijke getallen geldt verder dat ∗ N ∩ M0 = N. Dit volgt direct uit F.T. en de volgende gesloten wf in K0 (L): (∀x) [x ∈ N] ⇒ [x ≤ r] ⇔ [x = 1] ∧ · · · ∧ [x = p] waarbij r ∈ R en p ∈ N constantes zijn met p het grootste natuurlijke getal kleiner dan r. Aan de hand van de infinitesimalen kunnen we definiëren wanneer twee getallen in ∗ R oneindig dicht bij elkaar liggen. Voor a, b ∈ ∗ R zeggen we namelijk dat ze oneindig dicht bij elkaar liggen, notatie a =1 b, als a − b ∈ M1 . Verder definiëren we het standaard deel van a ∈ M0 als st(a) = sup{u ∈ R : u < a}. Merk op dat dit goed gedefiniëerd is, aangezien de verzameling {u ∈ R : u < a} naar boven begrensd en niet leeg is. Ook is eenvoudig in te zien dat dit een equivalentierelatie is. De volgende eigenschappen voor x, y ∈ M0 volgen uit de definitie van het standaard deel: • Als x ∈ R, dan st(x) = x • st(x) is uniek • st(x) = 0 ⇔ x ∈ M1 30 • st(x + y) = st(x) + st(y) • st(x · y) = st(x) · st(y) • Als x ≤ y, dan st(x) ≤ st(y) • x =1 y dan en slechts dan als st(x) = st(y) Nu we de verzamelingen ∗ N \ N, M0 en M1 hebben geı̈ntroduceerd, kunnen we ons afvragen of dit interne of externe entiteiten zijn. Zoals we al eerder hebben opgemerkt, hoeft het namelijk niet zo te zijn dat de verzameling van interne entiteiten intern is. We zullen bewijzen deze verzamelingen allemaal extern zijn, door met de F.T. een tegenspraak over de eigenschappen van deze verzamelingen af te leiden. Stelling 6.11. De niet-lege verzamelingen ∗ N \ N, M0 en M1 zijn extern. Bewijs. Neem allereerst aan dat ∗ N \ N intern is, dan geldt vanwege ∗ N \ N 6= ∅ en Voorbeeld 6.9.ii dat ∗ N \ N een eerste element heeft. Noem dit element ω0 . Aangezien ω0 > k voor alle k ∈ N, geldt ook ω0 − 1 > k voor alle k ∈ N. Dus ω0 − 1 ∈ ∗ N \ N en uit ω0 − 1 < ω0 volgt dan dat ∗ N \ N geen eerste element heeft, een tegenspraak. Dus ∗ N \ N is extern. Neem nu aan dat M1 intern is. Aangezien er geldt dat M1 6= ∅ en |a| < 1 voor alle a ∈ M1 weten we met Voorbeeld 6.9.i dat M1 een supremum heeft. Noem dit supremum a0 . We weten dat a0 > 0, aangezien M1 ook elementen ongelijk aan nul bevat. We zien eenvoudig dat a0 ∈ / M1 , aangezien we anders via het standaarddeel ook direct hebben dat 2a0 ∈ M1 . Maar dan volgt dat a20 ook een bovengrens voor M1 is, dus M1 heeft geen supremum, een tegenspraak. Dus M1 is extern. Neem nu aan dat M0 intern is. Aangezien er geldt dat M0 6= ∅ en |a| < ω voor alle a ∈ M0 en een willekeurige ω ∈ ∗ N \ N, weten we met Voorbeeld 6.9.i dat M0 een supremum heeft, noem dit supremum a0 . We zien dat a0 ∈ / M0 , aangezien we anders ook direct hebben dat 2a0 ∈ M1 . Maar dan volgt dat a20 ook een bovengrens voor M0 is, dus M0 heeft geen supremum, een tegenspraak. Dus M0 is extern. 6.5 Limieten Met deze theorie over ∗ R kunnen we nu een aantal begrippen uit de analyse ∗ overzetten naar R̂. Allereerst bekijken we de limiet van een rij. Aangezien een rij s beschouwd kan worden als functie N → R, en dus een deelverzameling ∗ van N × R is, volgt dat s ∈ R̂. In R̂ wordt s uitgebreid naar ∗ s, wat volgens de F.T een afbeelding van ∗ N naar ∗ R is. De rij ∗ s heeft uiteraard weer dezelfde eigenschappen als s voor zo ver deze eigenschappen uit te drukken zijn als wf in K0 (L). In de niet-standaard analyse krijgt de eigenschap convergentie de volgende vorm: Stelling 6.12. Laat (sn )∞ n=1 een rij in R zijn en zij s ∈ R. Dan geldt dat limn→∞ sn = s dan en slechts dan als ∗ sω =1 s voor alle ω ∈ ∗ N \ N. Bewijs. Neem aan dat limn→∞ sn = s. Dit is als volgt als gesloten wf in K0 (L) uit te drukken: h i (∀) 0 < ∈ R ⇒ (∃x) x ∈ N ∧ (∀y)[y ∈ N ∧ x ≤ y ⇒ |sy − s| < ] 31 Neem nu een 0 < ∈ R willekeurig en n0 zodanig, dat de volgende gesloten wf in K0 (L) zit: (∀x)[x ∈ N ∧ n0 ≤ x ⇒ |sx − s| < ] In deze wf zijn en n0 dus constanten. Met de F.T. zien we dat de volgende wf in ∗ K0 (∗ L) zit: (∀x)[x ∈ ∗ N ∧ n0 ≤ x ⇒ |∗ sx − s| < ] In het bijzonder geldt dus voor alle ω ∈ ∗ N \ N dat |∗ sx − s| < . Dit geldt voor alle > 0, wat betekent dat |∗ sx − s| ∈ M1 . Dit is equivalent met ∗ sω =1 s voor alle ω ∈ ∗ N \ N. Neem nu aan dat ∗ sω =1 s voor alle ω ∈ ∗ N\N. Laat 0 < ∈ R een positieve ∗ constante zijn. Dan is de volgende gesloten, toelaatbare wf geldig in R̂ (∃y) y ∈ ∗ N ∧ (∀x)[x ∈ ∗ N ∧ n0 ≤ x ⇒ |∗ sx − s| < ] aangezien we y ∈ ∗ N \ N kunnen nemen. Deze wf is de ∗ -transformatie van: (∃y) y ∈ N ∧ (∀x)[x ∈ N ∧ n0 ≤ x ⇒ |sx − s| < ] Met de F.T. geldt deze laatste wf dus in R̂. Dit betekent dat er een n0 ∈ N is met |sn − s| < voor alle n ≥ n0 . Aangezien willekeurig was, geldt dit voor alle > 0, dus limn→∞ sn = s. Ook Cauchy-rijen zijn naar de niet-standaard analyse over te zetten en hiermee kunnen we dus een andere karakterisering van convergentie in de nietstandaard analyse geven. Stelling 6.13. Een rij {sn : n ∈ N} in R is convergent dan en slechts dan als geldt dat ∗ sω1 =1 ∗ sω2 voor alle ω1 , ω2 ∈ ∗ N \ N. Bewijs. Dat de conditie ∗ sω1 =1 ∗ sω2 voor alle ω1 , ω2 ∈ ∗ N \ N noodzakelijk is voor convergentie volgt uit Stelling 6.12. We bewijzen dat de conditie voldoende is. Hiervoor is het toereikend om te laten zien dat ∗ sω eindig is voor alle ω ∈ ∗ N \ N, aangezien dan de convergentie volgt uit Stelling 6.12 met s = st(∗ sω ) voor een willekeurige ω ∈ ∗ N \ N en de transitiviteit van “=1 ”. Neem aan dat er een ω0 ∈ ∗ N \ N bestaat zodanig dat ∗ sω0 niet eindig is. Definiëer dan de verzameling A = {n ∈ ∗ N en |∗ sω0 − ∗ sn | < 1}. Uit Stelling 6.8 volgt dat A intern is. Ook zien we uit de voorwaarde ∗ sω1 =1 ∗ sω2 voor alle ω1 , ω2 ∈ ∗ N\N dat ∗ N\N ⊂ A. Voor eindige n ∈ N zien we aangezien ∗ sn ∈ M0 , dat |∗ sω0 | − |∗ sn | oneindig is. Hieruit volgt met |∗ sω0 − ∗ sn | ≥ |∗ sω0 | − |∗ sn | dat n ∈ / A. Dus we zien A = ∗ N \ N, maar A is intern en ∗ N \ N is extern, een tegenspraak. Dus ∗ sω is eindig voor alle ω ∈ ∗ N \ N. Hiernaast zullen we ook de volgende eigenschap van interne rijen nodig hebben in het bewijs van de productformule voor de sinus. Stelling 6.14. Laat {an : n ∈ ∗ N} een interne rij reële getallen zijn zodanig dat an =1 0 voor alle n ∈ N. Dan bestaat er een oneindig groot getal ω ∈ ∗ N \ N waarvoor geldt dat an =1 0 voor alle n ≤ ω. 32 Bewijs. Beschouw de interne rij {nan : n ∈ ∗ N} en definiëer A = {n : n ∈ ∗ N en (∀k)[[k ∈ ∗ N ∧ k ≤ n] ⇒ k|ak | ≤ 1]} Dan volgt uit Stelling 6.8 dat A intern is. Aangezien an =1 0 voor alle eindige n ∈ N, volgt dat nan =1 0 voor alle n ∈ N, oftewel N ⊂ A. Stel dat A geen oneindig grote getallen bevat, dus dat A ∩ (∗ N \ N) = ∅. Dan is A naar boven begrensd door een willekeurige ω ∈ ∗ N \ N en volgt met de F.T. dat A een maximum heeft. Het maximum kan echter geen element van N zijn, aangezien N ⊂ A. Maar aangezien we hebben aangenomen dat A ∩ (∗ N \ N) = ∅ kan het maximum ook geen element van ∗ N \ N zijn, een tegenspraak. Dus zien we dat A ∩ (∗ N \ N) 6= ∅ en er is dus een ω0 ∈ ∗ N \ N zodanig, dat voor alle oneindig grote n ≤ ω0 geldt dat n|an | ≤ 1, oftewel 0 ≤ |an | ≤ n1 =1 0. ∗ Tot slot zullen we ook nog wat eigenschappen van functies in R̂ nodig hebben. Een functie f die gedefiniëerd is op een open interval (a, b) ⊂ R, wordt uitgebreid tot een functie ∗ f op het open interval (a, b) ⊂ ∗ R. Wederom blijven alle eigenschappen van f die in wfs van K0 (L) uit te drukken zijn behouden. Onder andere hebben we bijvoorbeeld als limx→x0 f (x) = l geldt voor een x0 ∈ (a, b) en l ∈ R, dat de volgende gesloten wf in K0 (L) zit: h (∀) 0 < ∈ R ⇒ (∃δ) 0 < δ ∈ R ∧ (∀x)[[x ∈ R ∧ 0 < |x − x0 | < δ] (6.5.1) i ⇒ [|f (x) − l| < ]] Analoog aan het bewijs van Stelling 6.12 kan met deze wf de volgende stelling bewezen worden: Stelling 6.15. Laat f een reëelwaardige functie op het open interval (a, b) zijn en zij x0 ∈ (a, b). Dan geldt dat limx→x0 f (x) = l dan en slechts dan als voor alle 0 6= h ∈ M1 geldt dat ∗ f (x0 + h) =1 l. In het bijzonder geldt dat f continu is in x0 dan en slechts dan als ∗ f (x0 + h) =1 ∗ f (x0 ) voor alle h ∈ M1 . Ook zullen we de volgende stelling over de tangens nodig hebben: Stelling 6.16. Voor alle ω ∈ ∗ N \ N en a ∈ R geldt dat ω tan ωa =1 a Bewijs. Neem 0 < ∈ R willekeurig. Vanwege de Taylorontwikkeling van de tangens bestaat er een n0 ∈ N zodanig, dat de gesloten wf (∀x)[x ∈ N ∧ x ≥ n0 ⇒ |x tan a − a| < ] x in K0 (L) zit. Met de F.T. volgt hieruit dat (∀x)[x ∈ ∗ N ∧ x ≥ n0 ⇒ |x tan a − a| < ] x In het bijzonder geldt dus voor alle ω ∈ ∗ N \ N dat |x tan xa − a| < , aangezien ω > n0 . Dit geldt voor alle 0 < ∈ R, oftewel |x tan xa − a| ∈ M1 , waaruit volgt dat ω tan ωa =1 a 33 7 Het bewijs van Luxemburg In 1973 heeft W.A.J. Luxemburg in zijn publicatie What is Nonstandard Analysis het bewijs van Euler omgezet naar de niet-standaard analyse. Hierbij heeft hij het bewijs van Euler aangepast op de punten waar Euler oneindig grote en oneindig kleine getallen gebruikt op een manier die in de niet-standaard analyse niet toegestaan is. Het uitgangspunt is de door Euler afgeleide ontbinding van an − z n zoals deze in Formule (5.2.15) staat. Nemen we hier a = 1 + nx en z = 1 − nx dan hebben we de kwadratische factoren x2 2kπ x2 2kπ 2kπ x2 1 + 2 − 1 − 2 cos = 1 − cos + 1 + cos n n n n n n2 voor 1 ≤ k < n2 . Met de dubbele-hoekformule voor de cosinus kunnen deze factoren omgeschreven worden tot ! 2 kπ x 4 sin2 · 1+ 2 n n tan2 kπ n Naast deze factoren hebben we natuurlijk ook nog de factor 2x n van k = 0 en de factor 2 als n even is van 2k = n, precies zoals in Eulers constructie. Nemen we het product van alle factoren dan krijgen we voor alle x ∈ R en n ∈ N dat: n x n x n x 1+ − 1− = 42 · n n n b(n−1)/2c Y k=1 kπ sin2 · n x2 1+ 2 n tan2 ! kπ n (7.1.1) met b(n − 1)/2c het grootste natuurlijke getal kleiner gelijk aan (n − 1)/2. Aangezien deze formule als gesloten wf is uit te drukken, vinden we met Stelling 6.7 dat dit ook geldt voor alle x ∈ ∗ R en n ∈ ∗ N. In de standaard analyse hebben we voor alle n ∈ N dat: n n 1 + nx − 1 − nx lim =2 (7.1.2) x→0 x waaruit met Stelling 6.15 volgt dat voor alle n ∈ N en h ∈ M1 \ {0} geldt dat: n n 1 + nh − 1 − nh =1 2 (7.1.3) h Door in Formule (7.1.1) te delen door x 6= 0 en vervolgens x ∈ M1 \{0} te kiezen volgt dan dat: [(n−1)/2] n 1 Y kπ 42 · sin2 =1 2 (7.1.4) n n k=1 voor alle n ∈ N en met Stelling 6.7 dus ook voor alle n ∈ ∗ N, aangezien deze formule als gesloten wf is uit te drukken. Met Stelling 6.12 weten we verder voor alle ω ∈ ∗ N \ N en x ∈ R dat: x ω x ω 2 sinh x =1 1 + − 1− (7.1.5) ω ω 34 Door nu Formules (7.1.1), (7.1.4) en (7.1.5) te combineren, vinden we uiteindelijk voor alle x ∈ R en ω ∈ ∗ N \ N dat: ! b(ω−1)/2c Y x2 2 sinh(x) =1 2x 1+ 2 (7.1.6) ω tan2 kπ ω k=1 Met behulp van Lemma 7.1 zien we vervolgens door aan beide kanten het standaard deel te nemen dat: ∞ Y x2 (7.1.7) sinh(x) = x 1+ 2 2 k π k=1 voor alle x ∈ R en dus volgt met de uniciteit van de analytische voortzetting van een analytische functie, zoals bewezen in Gevolg A.4 in de appendix, dat: ∞ Y z2 (7.1.8) sin(z) = z 1− 2 2 k π k=1 voor alle z ∈ C. Lemma 7.1. Voor x ∈ R en voor alle ω ∈ ∗ N \ N hebben we: ! b(ω−1)/2c ∞ 2 Y Y x x2 st 1+ 2 = 1+ 2 2 k π ω tan2 kπ ω k=1 k=1 (7.1.9) Bewijs. Kies ω ∈ ∗ N \ N willekeurig. Aangezien we uit Sectie 2.3 weten dat Q∞ 2 voor alle x ∈ R het oneindige product k=1 1 + kx2 π2 convergent is, volgt uit Stelling 6.12 dat b(ω−1)/2c ∞ Y Y x2 x2 1+ 2 2 = 1+ 2 2 k π k π k=1 (7.1.10) k=1 voor alle x ∈ R. Aangezien we voor alle n ∈ N en alle 1 ≤ k ≤ [(n − 1)/2] 2 2 hebben dat n2 tan2 kπ ≥ k π , volgt dit met Stelling 6.7 ook voor ω, omdat n deze formule als gesloten wf is uit te drukken. Er geldt dus: !! b(ω−1)/2c X x2 x2 log 1 + 2 2 − log 1 + 2 ≥0 (7.1.11) k π ω tan2 kπ ω k=1 voor alle x ∈ R. Definiëer de rij (ηn )n∈∗ N als volgt: ηn = n X k=1 x2 log 1 + 2 2 k π x2 − log 1 + 2 ω tan2 !! kπ ω (7.1.12) met x ∈ R. We hebben dus ηn ≥ 0 voor alle n ∈ ∗ N. Uit Stelling 6.8 volgt dat deze rij intern is. Als n ∈ ∗ N eindig is, dan volgt uit Stelling 6.16 dat: x2 x2 =1 2 2 2 k π ω tan2 35 kπ ω (7.1.13) voor alle 1 ≤ k ≤ n . Hieruit volgt met Stelling 6.15 en de continuı̈teit van de log dat: ! x2 x2 (7.1.14) log 1 + 2 2 =1 log 1 + 2 k π ω tan2 kπ ω voor 1 ≤ k ≤ n en x ∈ R, waaruit volgt dat ηn =1 0. Met Stelling 6.14 vinden we vervolgens een ν ∈ ∗ N \ N zodanig, dat ηn =1 0 voor alle n ≤ ν. Aangezien ! x2 ≥0 (7.1.15) log 1 + 2 ω tan2 kπ ω voor alle 1 ≤ k ≤ [(ω − 1)/2] zien we nu: b(ω−1)/2c 0 ≤ ηb(ω−1)/2c ≤ ην + X k=ν+1 x2 log 1 + 2 2 =1 k π b(ω−1)/2c X k=ν+1 x2 log 1 + 2 2 k π (7.1.16) Met het criterium voor een Cauchy-rijuit Stelling 6.13 volgt, aangezien voor Q∞ 2 alle x ∈ R het oneindige product k=1 1 + kx2 π2 convergent is, dat: b(ω−1)/2c X k=ν+1 x2 log 1 + 2 2 k π = ηb(ω−1)/2c − ην =1 0 (7.1.17) oftewel ηb(ω−1)/2c =1 0 voor alle x ∈ R. Dit betekent dat b(ω−1)/2c X k=1 x2 log 1 + 2 2 k π b(ω−1)/2c =1 X k=1 x2 log 1 + 2 ω tan2 ! kπ ω (7.1.18) voor alle x ∈ R. Met de continuı̈teit van de logaritme volgt tot slot het lemma. 36 8 Vergelijking tussen de bewijzen Nu de vier bewijzen van de productformule voor de sinus behandeld zijn, kunnen we deze bewijzen gaan vergelijken. Het ligt voor de hand om enerzijds de twee bewijzen uit de complexe analyse met elkaar te vergelijken en anderzijds het bewijs van Euler met dat van Luxemburg. Tot slot zullen we de hoofdvraag van dit onderzoek beantwoorden: “In hoeverre rechtvaardigt Luxemburg met behulp van niet-standaard analyse de stappen in het bewijs van Euler?” 8.1 Vergelijking tussen de twee bewijzen uit de complexe analyse We hebben twee bewijzen uit de complexe analyse bekeken, namelijk het bewijs van Weierstrass en het bewijs met behulp van de Γ-functie. Hoewel beide bewijzen gebruik maken van technieken uit complexe analyse, zijn ze toch heel verschillend van aard. Het eerste dat opvalt als je het bewijs van Weierstrass naast het bewijs met behulp van de Γ-functie legt, is dat het bewijs van Weierstrass constructief is en het bewijs met behulp van de Γ-functie niet. Het bewijs van Weierstrass construeert een algemene formule voor een analytische functie met vooraf vastgelegde nulpunten heeft. Hieruit volgt dan met de nulpunten van de sinus de productformule voor de sinus. Het bewijs met behulp van de Γ-functie daarentegen werkt enkel voor de sinus en is een gevolg van een aantal eigenschappen van de Γ-functie. Er wordt bewezen dat de productformule voor de sinus geldig is zonder echte constructie van deze formule. Wat beide bewijzen wel gemeen hebben is dat de sinus pas heel laat in het bewijs voorkomt. Weierstrass bewijst eerst een stelling over analytische functies met voorgeschreven nulpunten en in het bewijs met behulp van de Γ-functie wordt eerst een hele reeks eigenschappen van de Γ-functie bewezen. Pas helemaal aan het einde van de bewijzen worden de stellingen toegepast op de sinus. Ook hebben beide bewijzen de theorie over de convergentie van oneindige producten nodig. In het bewijs van Weierstrass neemt deze theorie een zeer centrale rol. Eigenlijk draait het hele bewijs om een zo eenvoudig mogelijk normaal convergent oneindig product van een verzameling nulpunten te construeren. Hierin wordt constant gebruik gemaakt van de karakterisering van een normaal convergent oneindig product. In het bewijs met behulp van de Γ-functie is deze theorie uiteraard ook nodig, maar slechts één maal in het hele bewijs. De rest van het bewijs loopt eigenlijk vrijwel volledig via Stelling A.5 van Liouville en Stelling A.3, de uniciteitsstelling voor analytische functies. De laatste stap van beide bewijzen is het daadwerkelijk aantonen van de gelijkheid tussen het oneindige product en de sinus zelf. Hier worden verschillende oplossingen voor gebruikt. Weierstrass maakt gebruik van de logaritmische afgeleide en de breuksplitsing van de cotangens uit Stelling A.2. Het bewijs met behulp van de Γ-functie gebruikt hiervoor de Stelling A.5 van Liouville. Uit dit bewijs zou je de breuksplitsing van de cotangens juist kunnen afleiden door in de productformule voor de sinus aan beide kanten de logaritmische afgeleide te nemen. Persoonlijk vind ik het grote verschil tussen de twee bewijzen dat je in het bewijs van Weierstrass precies ziet waar je naar toe werkt, terwijl het resultaat 37 in het bewijs met de Γ-functie een beetje uit de lucht komt vallen. Aan de andere kant heeft het bewijs van Weierstrass wel veel afschattingen en vervelend rekenwerk, terwijl het bewijs met behulp van de Γ-functie wat eleganter en eenvoudiger qua rekenwerk is. Dit is mogelijk doordat er in dit bewijs wat krachtigere stellingen uit de complexe analyse worden gebruikt. In het bewijs van Weierstrass wordt niet veel meer gebruikt dan de residuen stelling en de theorie over normaal convergente producten. 8.2 Vergelijking tussen de bewijzen van Euler en Luxemburg De bewijzen van Euler en Luxemburg hebben veel meer overlap dan de bewijzen uit de complexe analyse. Dit is natuurlijk ook niet verrassend, aangezien het bewijs van Luxemburg op het bewijs van Euler gebaseerd is. Het begin van het bewijs van Luxemburg is identiek aan het bewijs van Euler. Dit deel wordt door Luxemburg dan ook niet uitgeschreven. Hij begint bij Formule (5.2.15), de ontbinding van het polynoom an − z n in kwadratische factoren. Euler probeert met deze ontbinding eerst de e-macht te schrijven als oneindig product. Dit lukt echter niet aangezien de oneindig kleine termen die in het product voorkomen niet te verwaarlozen blijken. Dit gedeelte van Eulers bewijs slaat Luxemburg daarom ook over. Na zijn poging voor de e-macht, probeert Euler de sinus hyperbolicus te ontwikkelen als oneindig product. Hier springt Luxemburg weer in. Hij vult net als Euler in Formule (5.2.15) de waardes a = 1 + nx en z = 1 − nx in. Euler neemt voor n direct een oneindig groot getal en substitueert voor de cosinus in alle kwadratische factoren de eerste twee termen van de Taylorreeks van de cosinus. De rest van de termen van de Taylorreeks verwaarloost hij, zodat hij de factoren uit Formule (5.3.11) overhoudt. Deze factoren bevatten nog een term waarin gedeeld wordt door een oneindig groot getal j. Deze term is evenredig met j12 en deze verwaarloost hij, aangezien er slechts j termen zijn en dit uitvermenigvuldigd dus nooit een bijdrage kan opleveren die niet oneindig klein is. Deze stappen kunnen niet één op één vertaald worden naar de niet-standaard analyse. Vooral deze laatste stap van Euler is niet te verantwoorden in de nietstandaard analyse. Luxemburg moet zich hierdoor op dit punt in wat bochten wringen. Allereerst schrijft Luxemburg het verkregen product om met behulp van de dubbele-hoekformule voor de cosinus. De dubbele-hoekformule wordt door Euler nergens gebruikt en vanaf hier lopen de bewijzen dan ook een klein beetje uit elkaar. Luxemburg houdt een product over waarin zowel een sinus als een tangens voorkomt. De sinus weet hij weg te werken met behulp van een standaardlimiet van de sinus hyperbolicus. Met de definitie van de sinus hyperbolicus verkrijgt hij tenslotte de productformule voor de sinus hyperbolicus zoals in Formule (7.1.6). De tangens die hier nog in staat werkt Luxemburg weg door in Lemma 7.1 te bewijzen dat deze tangens vervangen mag worden door de eerste term van de Taylorreeks van de tangens. Dit is dus eigenlijk dezelfde stap als de stap van Euler waarin Euler de cosinus vervangt door de eerste twee termen van de Taylorreeks van de cosinus. Om dit lemma te bewijzen schrijft Luxemburg het oneindige product met behulp van de logaritme om naar een reeks, net zoals gebeurt in de ontwikkeling van de theorie over oneindige producten in de complexe analyse. Hierbij 38 gebruikt hij dat het oneindige product convergent is, zonder dit aan te tonen. Hij grijpt dus terug op de theorie over oneindige producten uit de complexe analyse. Daarna wordt een flink aantal stellingen uit de niet-standaard analyse in aangeroepen om tot een bewijs te komen. Lemma 7.1 is dus zeker niet triviaal, terwijl Euler een soortgelijk substitutie gebruikt in zijn bewijs zonder enige argumentatie. Uiteindelijk hebben Euler en Luxemburg beiden een productformule voor de sinus hyperbolicus afgeleid voor reële getallen x ∈ R. Euler substitueert hierin simpelweg x = iz in met z ∈ C en concludeert de productformule voor de sinus voor alle complexe getallen. Luxemburg verantwoordt deze stap door gebruik te maken van de uniciteit van analytische voortzetting in het complexe vlak, dus Stelling A.4. Hij grijpt helemaal aan het einde dus nog een keer terug op de complexe analyse om het bewijs rond te krijgen. 8.3 In hoeverre rechtvaardigt Luxemburg de stappen in het bewijs van Euler? In grote lijnen is Luxemburg met het oog op de vorige sectie dus wel geslaagd in het verantwoorden van de stappen in het bewijs van Euler. De enige stap die echt anders is in het bewijs van Luxemburg ten opzichte van het bewijs van Euler is het gebruik van de dubbele-hoekformule voor de cosinus. Deze stap stelt Luxemburg in staat om in plaats van de Taylorreeks van de cosinus de Taylorreeks van de tangens te gebruiken. Het voordeel hiervan is dat hij alleen de eerste term van deze reeks nodig heeft en de oneindig grote getallen in alle kwadratische factoren daardoor direct wegvallen. Hiermee omzeilt hij de redenering van Euler dat in een product van j factoren, met j oneindig groot, een getal evenredig met j12 verwaarloosd mag worden. Luxemburg moet deze redenering omzeilen, aangezien al eerder opgemerkt is dat dit in de nietstandaard analyse niet direct te verantwoorden is. Tot slot vind ik het persoonlijk niet zo elegant dat in het bewijs twee keer gebruik gemaakt wordt van stellingen uit de complexe analyse. Het was naar mijn mening mooier geweest als Luxemburg ook een niet-standaard analyse oplossing had gevonden om de convergentie van het oneindige product en de equivalentie van de productformule voor de sinus hyperbolicus en de productformule voor de sinus aan te tonen. Ik kan me echter ook voorstellen dat dit vrij ingewikkeld is. 39 A Aanvullende bewijzen van stellingen uit de complexe analyse Hieronder worden een aantal stellingen bewezen die nodig zijn in de bewijzen van de productformule voor de sinus met complexe analyse. Stelling A.1. Laat f : D → C een analytische functie op een enkelvoudig samenhangend domein zijn, met f (z) 6= 0 voor alle z ∈ D. Dan bestaat er een functie g : D → C met: f (z) = eg(z) Bewijs. Aangezien f (z) 6= 0 voor alle z ∈ D, is de functie f 0 /f analytisch op D en heeft dus een primitieve op D omdat D een enkelvoudig samenhangend en dus een elementair domein is. Laat F : D → C een primitieve van f 0 /f zijn. Definiëer G : D → C als eF (z) (A.1.1) G(z) = f (z) Dan is G analytisch en er geldt: G0 (z) = f (z)F 0 (z)eF (z) − f 0 (z)eF (z) f 0 (z)eF (z) − f 0 (z)eF (z) = =0 2 f (z) f (z)2 (A.1.2) voor alle z ∈ D. Dus G(z) = C voor een C ∈ C. We weten dat C 6= 0, aangezien eF (z) > 0 voor alle z ∈ C. We kunnen C dus schrijven als C = ec voor een bepaalde c ∈ C, aangezien de e-macht surjectief is op C \ {0}. Als we nu g : D → C definiëren als g(z) = F (z) − c (A.1.3) dan volgt dat eg(z) = eF (z)−c = eF (z) f (z)G(z) = = f (z) C C (A.1.4) dus voldoet g aan de voorwaarden. Stelling A.2. Voor alle z ∈ C \ πZ geldt: ∞ cot(z) = 1 X 2z + 2 z n=1 z − π 2 n2 Bewijs. Door het substitueren van πz voor z zien we dat we bewering equivalent is met: ∞ 1 X 2z π cot(πz) = + (A.1.5) z n=1 z 2 − n2 voor z ∈ C \ Z. Dit zullen we bewijzen met behulp van de residuenstelling. Introduceer voor z ∈ C \ Z vast de functie f (w) = z π cot(πw) w(z − w) 40 (A.1.6) De singulariteiten van f zijn w = z en w = n ∈ Z. Alle singulariteiten zijn enkelvoudige polen, behalve w = 0, wat een pool van orde 2 is. De residuen in de enkelvoudige polen zijn: − π cot(πz) z n(z − n) voor w = z voor w = n 6= 0 Voor het residu in w = 0 geldt: Res(f ; 0) = g 0 (0) met g(w) = w2 f (w) (A.1.7) Hieruit volgt dat het residu in w = 0 de waarde z1 heeft. Laat N ∈ N met N > |z|. We integreren nu f over de rand ∂QN van het vierkant QN met hoekpunten ±(N + 21 ) ± (N + 12 )i. De lengte van deze kromme is 8N + 4. Op het integratiepad liggen geen singulariteiten, dus vinden we met behulp van de residuenstelling dat: I X 1 z 1 f (w)dw = −π cot(πz) + + (A.1.8) 2πi ∂QN z n(z − n) 0<|n|≤N Merk op dat cot(πw) begrensd is op ∂QN . Immers, voor |y| ≥ 1 met Im(w) = y hebben we: 1 + e−2π|y| 1 + e−2π |cot(πw)| ≤ ≤ (A.1.9) −2π|y| 1 − e−2π 1−e en voor |y| ≤ 1 volgt met de periodiciteit van de cotangens: cot ±π N + 1 + iπy = cot π + iπy = |tan(iπy)| 2 2 (A.1.10) −2π 1−e 1 + e−2π ≤ ≤ 1 + e−2π 1 − e−2π De integraal in Formule (A.1.8) kunnen we dus als volgt afschatten: I −2π |z| ≤ (8N + 4) · π · 1 + e f (w)dw · 1 −2π 1−e (N + 2 )(N + 12 − |z|) ∂QN (A.1.11) Er volgt dat voor N → ∞ de integraal naar 0 convergeert. Met Formule (A.1.8) vinden we dus voor z ∈ C \ Z: π cot(πz) = 1 X z + z n(z − n) n∈Z n6=0 ∞ X X ∞ 1 1 1 1 1 + + + − z n=1 z − n n z+n n n=1 ∞ 1 X 1 1 = + + z n=1 z − n z + n = ∞ = 1 X 2z + z n=1 z 2 − n2 Dit is zoals eerder opgemerkt equivalent met de stelling. 41 (A.1.12) Stelling A.3. Laat f, g : D → C twee analytische functies zijn, gedefiniëerd op een domein D 6= ∅. Dan geldt dat f = g dan en slechts dan als de verzameling {z ∈ D : f (z) = g(z)} een verdichtingspunt in D heeft. Bewijs. Als geldt dat f = g, dan geldt {z ∈ D : f (z) = g(z)} = D. Aangezien D open is volgt dan direct dat deze verzameling een verdichtingspunt heeft. Neem nu aan dat {z ∈ D : f (z) = g(z)} een verdichtingspunt heeft in D. Definiëer de functie h = f −g. Dan heeft de verzameling N = {z ∈ D : h(z) = 0} een verdichtingspunt a in D. Beschouw de machtreeks van f rond dit punt a: f (z) = ∞ X n=0 cn (z − a)n (A.1.13) voor alle z ∈ D met |z − a| < r voor geschikt gekozen r > 0. Aangezien a een verdichtingspunt van N is, kunnen we in elke omgeving van a in D een punt z 6= a vinden met f (z) = 0. Aangezien f continu is, volgt c0 = f (a) = 0. Ditzelfde argument kunnen we toepassen op de machtreeks ∞ X f (z) = cn (z − a)n z − a n=1 (A.1.14) waaruit volgt dat c1 = 0. Door dit proces te herhalen vinden we cn = 0 voor alle n ∈ N0 , waaruit volgt dat f (z) = 0 voor alle z in een omgeving van a. Aangezien a een willekeurig verdichtingspunt van U was is de verzameling U = {z ∈ D : z is een verdichtingspunt van N } dus een open verzameling. Maar de verzameling V = {z ∈ D : z is geen verdichtingspunt van N } is ook een open verzameling vanwege de continuı̈teit van h. Er geldt U ∪ V = D en aangezien D samenhangend en U niet-leeg is, volgt dat V = ∅. Dus U = D, oftewel h(z) = 0 voor alle z ∈ D. Dus geldt dat f = g. Gevolg A.4. Laat D ⊂ C een domein en M ⊂ D een deelverzameling met minimaal één verdichtingspunt in D zijn. Zij F : M → C een functie. Als er een analytische functie fˆ : D → C is die f uitbreid, dat wil zeggen fˆ(z) = f (z) voor z ∈ M , dan is fˆ uniek met deze eigenschap. Bewijs. Volgt direct uit Stelling A.3. Stelling A.5 (Liouville). Elke analytische functie f : C → C die begrensd is, is constant. Bewijs. Laat f een begrensde gehele functie zijn. We tonen aan dat f 0 (z) = 0 voor alle z ∈ C. Laat C ∈ R zodanig dat |f (z)| ≤ C voor alle z ∈ C. Met de Cauchy integraalformule, zie Theorem II.3.2 van [Freitag and Busam, 2009], weten we dat: I 1 f (ζ) f 0 (z) = dζ (A.1.15) 2πi |ζ−z|=r (ζ − z)2 42 voor alle z ∈ C en alle r > 0. Met de standaardafschatting voor integralen zien we: C C 1 |f 0 (z)| ≤ · 2πr · 2 = (A.1.16) 2π r r Door de limiet r → ∞ te nemen volgt nu dat f 0 (z) = 0 voor alle z ∈ C. Dus f is constant. 43 B Bibliografie William Dunham. Euler: the master of us all, volume 22 of The Dolciani Mathematical Expositions. Mathematical Association of America, Washington, DC, 1999. ISBN 0-88385-328-0. Leonhard Euler. Introduction to analysis of the infinite. Book I. Springer-Verlag, New York, 1988. ISBN 0-387-96824-5. Translated from the Latin and with an introduction by John D. Blanton. Eberhard Freitag and Rolf Busam. Complex analysis. Universitext. SpringerVerlag, Berlin, second edition, 2009. ISBN 978-3-540-93982-5. W. A. J. Luxemburg. What is nonstandard analysis? American Mathematical Monthly, 80(6, part II):38–67, 1973. ISSN 0002-9890. Papers in the foundations of mathematics. Elliott Mendelson. Introduction to Mathematical Logic. Discrete Mathematics and its Applications (Boca Raton). CRC Press, Boca Raton, FL, fifth edition, 2010. ISBN 978-1-58488-876-5; 1-58488-876-8. 44 C Collectie van symbolen en afkortingen Hieronder staat de lijst met gebruikte symbolen en afkortingen. Deze staan gegroepeerd op onderwerp en zijn gesorteerd op de volgorde waarin ze voor het eerst voorkomen in het verslag. N De natuurlijke getallen {1, 2, 3, · · · } N0 De natuurlijke getallen inclusief nul {0, 1, 2, · · · } Z De gehele getallen R De reële getallen C De complexe getallen C+ De complexe getallen met positief reëel deel {z ∈ C : Re(z) > 0} C− De complexe getallen behalve de negatieve reële as C \ (−∞, 0] Br (a) De open schrijf rond a met straal r {z ∈ C : |z − a| < r} Br [a] De compacte schrijf rond a met straal r {z ∈ C : |z − a| ≤ r} |z| De modulus, absolute waarde van z Arg(z) De hoofdwaarde van het argument van z: −π < Arg(z) ≤ π Re(z) Het reële deel van z Im(z) Het imaginaire deel van z log(x) De logaritme van x: log : (0, ∞) → R Log(z) De hoofdwaarde van de logaritme van z: log|z| + iArg(z) Res(f ; a) Het residu van f in a P(X) De machtsverzameling van X Rn De n-de machtsverzameling van R: P R̂ De superstructuur van R: R̂I De ultramacht van R̂ t.o.v. een ultrafilter op I S∞ De interne entiteiten van R̂I : n=1 ∗ Rn ∗ R̂ S∞ n=1 S n−1 k=1 Rk ∪ R Rn ∗ a De inbedding van a in R̂I : i 7→ a voor alle i ∈ I ∗ V De ∗ -transformatie van een toelaatbare wf V : V (∗ a1 , · · · , ∗ an ) met a1 , · · · , an alle constanten van V wf Een well-formed formula, oftewel een goedgevormde formule 45 wfs Meervoud van wf F.T. De Fundamental Theorem, Stelling (6.7) K(L) De verzameling toelaatbare wfs in L K0 (L) De verzameling geldige toelaatbare wfs in L ∗ K(∗ L) De verzameling toelaatbare wfs in ∗ L ∗ K0 (∗ L) De verzameling geldige toelaatbare wfs in ∗ L M0 De eindige reële getallen: {a ∈ ∗ R : er is een r ∈ R met |a| < r} M1 De infinitesimalen: {a ∈ ∗ R : voor alle 0 < r ∈ R geldt |a| < r} st(a) Het standaarddeel van a: sup{u ∈ R : u < a} =1 Bijna gelijk: a =1 b ⇔ a − b ∈ M1 46