Lineaire Algebra 3 en 4 Wieb Bosma juni 2000/juni 2001 Inhoudsopgave 1 Vectorruimten 1.1 Inleiding . . . . . . . . . . . . . . . . . . . 1.2 Lichamen . . . . . . . . . . . . . . . . . . 1.2.1 Definities . . . . . . . . . . . . . . 1.2.2 Voorbeelden . . . . . . . . . . . . . 1.2.3 Definitie . . . . . . . . . . . . . . . 1.2.4 Opmerkingen en Definities . . . . . 1.2.5 Voorbeelden . . . . . . . . . . . . . 1.2.6 Definitie . . . . . . . . . . . . . . . 1.2.7 Opmerkingen . . . . . . . . . . . . 1.2.8 Definities . . . . . . . . . . . . . . 1.2.9 Stelling . . . . . . . . . . . . . . . 1.2.10 Definities . . . . . . . . . . . . . . 1.2.11 Opmerkingen . . . . . . . . . . . . 1.2.12 Opgaven . . . . . . . . . . . . . . . 1.3 Polynoomringen . . . . . . . . . . . . . . 1.3.1 Definities . . . . . . . . . . . . . . 1.3.2 Stelling . . . . . . . . . . . . . . . 1.3.3 Definities . . . . . . . . . . . . . . 1.3.4 Algoritme van Euclides . . . . . . 1.3.5 Voorbeeld . . . . . . . . . . . . . . 1.3.6 Stelling . . . . . . . . . . . . . . . 1.3.7 Uitgebreid Algoritme van Euclides 1.3.8 Voorbeeld . . . . . . . . . . . . . . 1.3.9 Stelling . . . . . . . . . . . . . . . 1.3.10 Stelling . . . . . . . . . . . . . . . 1.3.11 Definitie . . . . . . . . . . . . . . . 1.3.12 Voorbeelden . . . . . . . . . . . . . 1.3.13 Lemma . . . . . . . . . . . . . . . 1.3.14 Stelling . . . . . . . . . . . . . . . 1.3.15 Opmerkingen . . . . . . . . . . . . 1.3.16 Stelling . . . . . . . . . . . . . . . 1.3.17 Gevolg . . . . . . . . . . . . . . . . 1.3.18 Opmerkingen . . . . . . . . . . . . 1.3.19 Definitie . . . . . . . . . . . . . . . 1.3.20 Stelling . . . . . . . . . . . . . . . 1.3.21 Opmerkingen en Voorbeelden . . . 1.4 Vectorruimten . . . . . . . . . . . . . . . . 1.4.1 Definitie . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 3 4 4 4 5 6 7 7 7 7 8 8 10 10 11 11 12 12 12 13 13 14 15 15 15 16 16 16 17 17 17 18 18 18 20 20 1.5 1.6 1.4.2 Opmerkingen . . . . . . . . . . . . . . . . . . . 1.4.3 Voorbeelden . . . . . . . . . . . . . . . . . . . . 1.4.4 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.4.5 Opmerkingen . . . . . . . . . . . . . . . . . . . 1.4.6 Definities . . . . . . . . . . . . . . . . . . . . . 1.4.7 Opmerkingen . . . . . . . . . . . . . . . . . . . 1.4.8 Stelling [Hoofdstelling van de Lineaire Algebra] 1.4.9 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.4.10 Voorbeelden . . . . . . . . . . . . . . . . . . . . 1.4.11 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.4.12 Lemma . . . . . . . . . . . . . . . . . . . . . . 1.4.13 Gevolgen . . . . . . . . . . . . . . . . . . . . . Lineaire Afbeeldingen . . . . . . . . . . . . . . . . . . 1.5.1 Definities . . . . . . . . . . . . . . . . . . . . . 1.5.2 Opmerkingen . . . . . . . . . . . . . . . . . . . 1.5.3 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.5.4 Matrices . . . . . . . . . . . . . . . . . . . . . . 1.5.5 Voorbeeld . . . . . . . . . . . . . . . . . . . . . 1.5.6 Voorbeeld . . . . . . . . . . . . . . . . . . . . . Enkele Constructies van Vectorruimten . . . . . . . . . 1.6.1 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.3 Gevolg . . . . . . . . . . . . . . . . . . . . . . . 1.6.4 Definities . . . . . . . . . . . . . . . . . . . . . 1.6.5 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.6 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.7 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.6.8 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.9 Definities . . . . . . . . . . . . . . . . . . . . . 1.6.10 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.11 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.6.12 Stelling . . . . . . . . . . . . . . . . . . . . . . 1.6.13 Gevolg . . . . . . . . . . . . . . . . . . . . . . . 1.6.14 Voorbeelden en Opmerkingen . . . . . . . . . . 1.6.15 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.6.16 Opmerkingen . . . . . . . . . . . . . . . . . . . 1.6.17 Definitie . . . . . . . . . . . . . . . . . . . . . . 1.6.18 Stelling . . . . . . . . . . . . . . . . . . . . . . 2 Eigenwaarden en Diagonaliseerbaarheid 2.1 Diagonaliseerbaarheid . . . . . . . . . . 2.1.1 Definities . . . . . . . . . . . . . 2.1.2 Stelling . . . . . . . . . . . . . . 2.1.3 Definitie . . . . . . . . . . . . . . 2.1.4 Stelling . . . . . . . . . . . . . . 2.1.5 Opmerkingen . . . . . . . . . . . 2.1.6 Voorbeeld . . . . . . . . . . . . . 2.2 Eigenruimten . . . . . . . . . . . . . . . 2.2.1 Stelling . . . . . . . . . . . . . . 2.2.2 Gevolg . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 20 21 21 21 22 22 22 22 23 23 23 24 24 24 24 25 26 26 29 29 29 29 29 30 30 30 30 31 31 31 31 32 32 33 33 33 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 35 35 35 35 36 36 36 37 37 37 2.3 2.4 2.2.3 Definitie . . . . . . . . . . 2.2.4 Lemma . . . . . . . . . . 2.2.5 Opmerkingen . . . . . . . 2.2.6 Voorbeeld . . . . . . . . . 2.2.7 Definitie . . . . . . . . . . 2.2.8 Stelling . . . . . . . . . . 2.2.9 Gevolg . . . . . . . . . . . 2.2.10 Stelling . . . . . . . . . . 2.2.11 Voorbeeld . . . . . . . . . 2.2.12 Stelling . . . . . . . . . . 2.2.13 Lemma . . . . . . . . . . 2.2.14 Stelling . . . . . . . . . . Cayley-Hamilton . . . . . . . . . 2.3.1 Lemma . . . . . . . . . . 2.3.2 Opmerkingen . . . . . . . 2.3.3 Stelling [Cayley-Hamilton] 2.3.4 Voorbeeld . . . . . . . . . 2.3.5 Toepassingen . . . . . . . 2.3.6 Voorbeeld . . . . . . . . . Jordan normaalvorm . . . . . . . 2.4.1 Voorbeeld . . . . . . . . . 2.4.2 Definities . . . . . . . . . 2.4.3 Voorbeeld . . . . . . . . . 2.4.4 Definitie . . . . . . . . . . 2.4.5 Lemma . . . . . . . . . . 2.4.6 Stelling . . . . . . . . . . 2.4.7 Stelling . . . . . . . . . . 2.4.8 Gevolg . . . . . . . . . . . 2.4.9 Lemma . . . . . . . . . . 2.4.10 Gevolg . . . . . . . . . . . 2.4.11 Stelling . . . . . . . . . . 2.4.12 Gevolg . . . . . . . . . . . 3 Inproductruimten 3.1 Bilineaire Vormen . 3.1.1 Definitie . . . 3.1.2 Voorbeelden . 3.1.3 Stelling . . . 3.1.4 Definitie . . . 3.1.5 Stelling . . . 3.1.6 Opmerking . 3.1.7 Stelling . . . 3.1.8 Gevolg . . . . 3.1.9 Voorbeeld . . 3.1.10 Stelling . . . 3.1.11 Definitie . . . 3.1.12 Voorbeeld . . 3.1.13 Stelling . . . 3.1.14 Definitie . . . 3.1.15 Opmerkingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 37 38 39 39 39 39 40 40 41 41 42 42 42 43 44 44 45 45 46 46 47 47 47 47 48 48 48 49 49 49 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 50 50 50 51 51 51 51 51 52 52 52 53 53 53 54 54 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 55 55 55 55 55 56 57 57 57 58 58 58 59 59 59 60 60 60 60 61 61 4 Transformaties van Inproductruimten 4.1 Inleiding . . . . . . . . . . . . . . . . . . . . 4.2 Orthogonale en Unitaire Transformaties . . 4.2.1 Definitie . . . . . . . . . . . . . . . . 4.2.2 Stelling . . . . . . . . . . . . . . . . 4.2.3 Definities . . . . . . . . . . . . . . . 4.2.4 Stelling . . . . . . . . . . . . . . . . 4.2.5 Definitie . . . . . . . . . . . . . . . . 4.2.6 Stelling . . . . . . . . . . . . . . . . 4.2.7 Definitie . . . . . . . . . . . . . . . . 4.2.8 Stelling . . . . . . . . . . . . . . . . 4.2.9 Definitie . . . . . . . . . . . . . . . . 4.2.10 Stelling . . . . . . . . . . . . . . . . 4.2.11 Stelling . . . . . . . . . . . . . . . . 4.3 Symmetrische en Hermitese Transformaties 4.3.1 Definitie . . . . . . . . . . . . . . . . 4.3.2 Stelling . . . . . . . . . . . . . . . . 4.3.3 Definitie . . . . . . . . . . . . . . . . 4.3.4 Stelling . . . . . . . . . . . . . . . . 4.3.5 Definitie . . . . . . . . . . . . . . . . 4.3.6 Stelling . . . . . . . . . . . . . . . . 4.3.7 Stelling . . . . . . . . . . . . . . . . 4.3.8 Gevolg . . . . . . . . . . . . . . . . . 4.4 Geadjungeerde en Normaliteit . . . . . . . . 4.4.1 Lemma . . . . . . . . . . . . . . . . 4.4.2 Stelling . . . . . . . . . . . . . . . . 4.4.3 Stelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 62 62 62 62 63 63 63 63 64 64 64 64 65 65 65 65 66 66 66 66 66 67 67 67 68 68 3.2 3.3 3.1.16 Stelling . . . . . . . . . . . . . 3.1.17 Gevolg . . . . . . . . . . . . . . 3.1.18 Voorbeeld . . . . . . . . . . . . Reëel-symmetrische bilineaire vormen 3.2.1 Definitie . . . . . . . . . . . . . 3.2.2 Stelling . . . . . . . . . . . . . 3.2.3 Gevolg . . . . . . . . . . . . . . 3.2.4 Gevolg . . . . . . . . . . . . . . 3.2.5 Voorbeeld . . . . . . . . . . . . 3.2.6 Gevolg . . . . . . . . . . . . . . 3.2.7 Voorbeeld . . . . . . . . . . . . Inproductruimten . . . . . . . . . . . . 3.3.1 Definities . . . . . . . . . . . . 3.3.2 Opmerkingen . . . . . . . . . . 3.3.3 Voorbeelden . . . . . . . . . . . 3.3.4 Stelling . . . . . . . . . . . . . 3.3.5 Definities . . . . . . . . . . . . 3.3.6 Opmerkingen . . . . . . . . . . 3.3.7 Definities . . . . . . . . . . . . 3.3.8 Voorbeelden . . . . . . . . . . . 3.3.9 Stelling . . . . . . . . . . . . . 3.3.10 Opmerkingen . . . . . . . . . . 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 4.4.5 4.4.6 4.4.7 4.4.8 4.4.9 4.4.10 4.4.11 4.4.12 4.4.13 4.4.14 4.4.15 4.4.16 4.4.17 4.4.18 Definitie . Stelling . Stelling . Propositie Propositie Definitie . Gevolg . . Gevolg . . Stelling . Stelling . Stelling . Definitie . Stelling . Stelling . Stelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 69 69 69 70 70 70 70 70 71 72 72 72 73 73 Voorwoord Dit zijn de aantekeningen bij de colleges Lineaire Algebra 3 en 4, zoals gegeven in de voorjaarskwartalen van 2000 en opnieuw in 2001, aan eerstejaars wiskundestudenten van de Universiteit Nijmegen. Nadat in Lineaire Algebra 1 en 2 de basisbegrippen voor vectorruimten en lineaire afbeeldingen daartussen over R zijn gegeven, wordt in Lineaire Algebra 3 begonnen met generalisatie naar willekeurige grondlichamen. Daartoe wordt in het eerste hoofdstuk een korte introductie in abstracte algebra, vooral lichamen en (polynoom)ringen, gegeven waarna in de volgende drie hoofdstukken vooral de vraag van diagonaliseerbaarheid van matrices behorende bij lineaire afbeeldingen tussen eindig-dimensionale vectorruimten centraal staat. Eerst komen, in Hoofdstuk 2, eigenwaarden en eigenruimten aan de orde, daarna de stelling van Cayley-Hamilton. De Jordan normaalvorm van matrices wordt in deze aantekeningen wel kort behandeld, maar is door tijdgebrek op het college nauwelijks aan de orde gekomen. In de Hoofdstukken 3 en 4 komen inproductruimten aan de orde. Na een algemene inleiding over bilineaire vormen, spitst de behandeling zich weer toe op reële en complexe vectorruimten. In Hoofdstuk 4 wordt gekeken naar lineaire afbeeldingen die, op een of andere manier, inproducten behouden: unitaire (orthogonale) en Hermitese (symmetrische) afbeeldingen (en hun matrices), alsmede de diagonaliseerbaarheid daarvan. Tevens is een sectie over geadjungeerden, normaliteit en het verband met unitaire en Hermitese afbeeldingen toegevoegd. Gedurende 15 weken werd wekelijks 2 uur college gegeven aan de hand van dit dictaat, gevolgd door 2 uur ‘tutoruur’ (in 2001 alleen in het derde kwartaal van het academisch jaar). Met het oog op dat tutoruur zijn in de tekst een groot aantal opgaven verwerkt. Bovendien was er wekelijks een werkcollege van 2 uur voor het maken van wat uitgebreidere opgaven (die niet allemaal in dit dictaat zijn opgenomen). Tijdens het college Computergebruik is door middel van Maple worksheets kort het nut van computeralgebrasystemen voor berekeningen in de lineaire algebra aan de orde gekomen. Mijn aantekeningen zijn gebaseerd op het eerder gebruikte dictaat Algebra B, geschreven door Arno van den Essen, en op delen van het boek Lineaire Algebra van Friedberg, Insel en Spence. Mijn dank gaat ook uit naar de tutor, Josephine Buskes, en naar Jan-Willem Bikker, Stefan Maubach, Lucie van der Logt en Ard Willems, die het werkcollege begeleidden. Niet alleen namen zij mij veel begeleidend werk uit handen en bedachten zij goede vragen voor tutoruren en werkcolleges, maar ook gaven ze nuttige kritiek op, en wezen ze op fouten in, mijn aantekeningen. Meron B. en Daan W. worden bedankt voor opmerken van diverse foutjes. Tenslotte dank aan alle studenten die het vak in deze vorm volgden en te kampen kregen met kinderziekten in het dictaat, en het laat ontvangen van delen daarvan. Een schrale troost voor hen: het dictaat is nu af — en volgend jaar moet het vak weer helemaal anders worden. Wieb Bosma, juni 2000, juni 2001 6 Hoofdstuk 1 Vectorruimten 1.1 Inleiding In Lineaire Algebra 1 heb je al kennis gemaakt met het begrip vectorruimte. In dit hoofdstuk gaan we dat begrip generaliseren, en wel door toe te staan dat de scalairen uit andere objecten bestaan dan slechts de reële getallen, waartoe ze tot dusverre beperkt waren. De scalairen moeten aan zekere eisen voldoen om de gegeneraliseerde definitie zinnig te maken; zo moet je scalairen kunnen optellen en met elkaar vermenigvuldigen, en moeten er scalaire elementen 1 en 0 zijn. Het blijkt prettig te zijn om te eisen dat de scalairen een lichaam vormen. Onze eerste taak zal zijn om lichamen te definiëren en er voorbeelden van te geven. Lichamen zijn speciale gevallen van ringen, die op veel plaatsen in de algebra opduiken. We zullen hier in het bijzonder geı̈nteresseerd zijn in ringen van matrices en van polynomen. 1.2 Lichamen Voor een algemenere definitie van vectorruimte zullen we eigenschappen van de reële getallen bestuderen en proberen in een abstracte definitie te vangen. Vervolgens zullen we kijken naar andere objecten die aan diezelfde eigenschappen voldoen. De eigenschappen waar we op doelen zijn niet die van de reële getallen zelf, maar van de operaties die je er op uit kunt voeren: je kunt reële getallen bij elkaar optellen, en je kunt ze met elkaar vermenigvuldigen. Een lichaam zal een verzameling zijn waar we op soortgelijke manier 2 operaties hebben die aan dezelfde eigenschappen moeten voldoen. Die eigenschappen zijn dat het niet uitmaakt in welke volgorde je getallen optelt (of vermenigvuldigt), dat er speciale reële getallen zijn (namelijk 0 en 1) die bij optelling of vermenigvuldiging geen effect hebben, en de manier waarop de vermenigvuldiging zich ‘verdeelt’ over de optelling (we maken dat precies in 1.2.3). Maar eerst definiëren we wat een bewerking is, omdat we meer algemene operaties willen toestaan dan alleen optelling en vermenigvuldiging. Als V een verzameling is, geven we met V × V de verzameling geordende paren (v 1 , v2 ) met v1 , v2 ∈ V , aan. 1.2.1 Definities Een bewerking · op een verzameling V is een afbeelding van V × V naar V . Een bewerking is commutatief als v1 · v2 = v2 · v1 voor elk tweetal v1 , v2 ∈ V , en een bewerking · heet associatief als (v1 · v2 ) · v3 = v1 · (v2 · v3 ), voor elk drietal v1 , v2 , v3 . Met andere woorden: een bewerking voegt aan elk paar elementen van V een derde element toe. Bij een commutatieve bewerking maakt het niet uit in welke volgorde je de bewerking 7 uitvoert en voor een associatieve bewerking maakt het niet uit hoe je de haakjes zet in v 1 ·v2 ·v3 . 1.2.2 Voorbeelden Je kent al heel veel voorbeelden van bewerkingen: we keken al naar de optelling en vermenigvuldiging van reële getallen. Let wel op: bij een bewerking hoort een verzameling. Je kunt niet zeggen dat + een bewerking is, maar wel dat + een bewerking is op de reële getallen (of gehele getallen, enz.). (i) Optellen vormt een bewerking op de natuurlijke getallen N. Evenzo vermenigvuldigen. (ii) Aftrekken is een bewerking op de gehele getallen Z. (iii) Delen is een bewerking op de verzameling rationale getallen Q (maar niet op de gehele getallen) ongelijk aan nul. (iv) Zowel optellen als vermenigvuldigen is een bewerking op M n (R), de n × n matrices met reële coëfficiënten. (v) Als X een verzameling is, dan kun je aan twee afbeeldingen f en g van X naar zichzelf een nieuwe afbeelding g ◦ f toevoegen, door (g ◦ f )(x) = g(f (x)). Deze samenstelling g ◦ f van de afbeeldingen f en g is zelf ook weer een afbeelding X → X. Dus is ◦ een bewerking op de afbeeldingen van X naar zichzelf. Als speciaal geval kun je bijvoorbeeld kijken naar alle functies van R naar R. Opgave 1. Laat zien dat de samenstelling ◦ van functies R → R associatief is. 1.2.3 Definitie Een lichaam is een verzameling V met daarop twee bewerkingen + en ×, die voldoen aan: [L1] de operatie + op V is associatief: (x + y) + z = x + (y + z), voor alle x, y, z ∈ V ; [L2] er is een (nul)element 0 ∈ V zodanig dat 0 + x = x + 0 = x voor alle x ∈ V ; [L3] bij elke x ∈ V is er een tegengestelde −x ∈ V zodanig dat x + (−x) = (−x) + x = 0; [L4] de operatie + op V is commutatief: x + y = y + x voor alle x, y ∈ V ; [L5] de operatie × op V is associatief: (x × y) × z = x × (y × z), voor alle x, y, z ∈ V ; [L6] er is een (eenheids)element 1 ∈ V zodanig dat 1 × x = x × 1 = x voor alle x ∈ V ; [L7] bij elke x ∈ V met x 6= 0 is er een inverse x −1 ∈ V zodanig dat x × x−1 = x−1 × x = 1; [L8] de operatie × op V is commutatief: x × y = y × x voor alle x, y ∈ V ; [L9] de operatie × is distributief over +, dat wil zeggen: x × (y + z) = (x × y) + (x × z) en (x + y) × z = (x × z) + (y × z), voor alle x, y, z ∈ V . 1.2.4 Opmerkingen en Definities Een lichaam bestaat dus uit een drietal (V, +, ×), namelijk een verzameling V met twee bewerkingen daarop. In deze definitie hebben we de bewerkingen met + en × aangegeven, omdat in voorbeelden die we kennen (zoals de reële getallen) dat natuurlijk is. Maar de bewerkingen hoeven helemaal geen optelling of vermenigvuldiging te zijn — daarvan zien we zo voorbeelden. Er zijn heel veel belangrijke algebraı̈sche strukturen die bestaan uit een verzameling V , en één of twee operaties die voldoen aan een deelverzameling van de axioma’s L1–9. Een groep is een verzameling met een bewerking die voldoet aan L1–3, en een abelse groep voldoet bovendien aan L4. Een ring met 1 is een verzameling V met operaties + en × die voldoen aan L1–6 en aan L9; als deze bovendien aan L8 voldoet, is het een commutatieve ring met 1. In een lichaam kun je dus elk tweetal elementen optellen en aftrekken, vermenigvuldigen en delen (mits de deler maar niet nul is). In een ring kun je niet altijd een inverse vinden van een element, en kun je dus niet altijd delen. Een lichaam vormt een abelse groep ten opzichte 8 van de optelling +, en de elementen die niet nul zijn vormen een abelse groep ten opzichte van de vermenigvuldiging ×. Als (V, +, ×) een ring (of lichaam) is en een deelverzameling U ⊂ V vormt met dezelfde bewerkingen ook een ring (of lichaam), dan zeggen we dat (U, +, ×) een deelring (of deellichaam) van V is. We zeggen wel dat U een deelring is van V (en bedoelen dan: met dezelfde bewerkingen). Wanneer wij in het vervolg over een ring spreken, bedoelen we altijd een ring met eenheidselement. Voor een deelring moeten we dan ook eisen dat het eenheidselement 1 ∈ V ook in U zit (en daar het eenheidselement is). Opgave 2. Laat zien dat r × 0 = 0 voor elk element r in een ring R, door 0 = s − s te schrijven. 1.2.5 Voorbeelden (i) (R, +, ×): de reële getallen vormen onder optelling en vermenigvuldiging een lichaam. (ii) (Q, +, ×): de rationale getallen (breuken) vormen onder optelling en vermenigvuldiging een lichaam. Het is duidelijk dat (Q, +, ×) een deellichaam is van (R, +, ×). (iii) (C, +, ×): de complexe getallen vormen onder optelling en vermenigvuldiging een lichaam. Hiervan is (R, +, ×) een deellichaam! (iv) De verzameling V = {0} met de gewone optelling en vermenigvuldiging vormt een ring die uit maar 1 element bestaat; in het bijzonder is 0 = 1 in deze ring! Omdat dit speciale geval soms tot complicaties leidt, zullen we het vanaf nu expliciet uitsluiten, en eisen: de ringen die wij beschouwen hebben ten minste twee verschillende elementen 0 6= 1. (v) De gehele getallen vormen geen lichaam onder optelling en vermenigvuldiging omdat je van 0 6= z ∈ Z geen inverse kunt vinden, tenzij z ∈ {−1, 1}. Maar (Z, +, ×) vormt wel een commutatieve ring met 1. (vi) In het college Rekenkunde heb je gezien hoe je met restklassen van de gehele getallen modulo m > 1 kunt rekenen. Deze restklassen modulo m vormen voor elke m > 1 een commutatieve ring met 1 ten opzichte van optelling en vermenigvuldiging, die we met Z/mZ aangeven. Niet alle elementen (ongelijk 0) hebben een inverse in Z/mZ tenzij m een priemgetal is: dus de ring Z/pZ is een lichaam (p is een priemgetal) onder + en × dat uit precies p verschillende elementen bestaat. Zo’n eindig lichaam Z/pZ wordt ook wel met Fp aangegeven. Later zullen we zien dat voor elke macht m = p k van een priemgetal p er een eindig lichaam van m elementen bestaat (en voor geen enkel ander natuurlijk getal m). Bovendien is er in essentie maar één zo’n lichaam. (vii) Als R een commutatieve ring met 1 is (bijvoorbeeld één van de ringen of lichamen die we hierboven zagen) kun je daaruit een nieuwe ring R[x] van polynomen P met coëfficiënten in R maken: de verzameling bestaat uit de polynomen of veeltermen ni=0 ai xn = a0 + a1 x + a2 x2 + · · · + an xn , waar n ≥ 0 een geheel getal is. De operaties zijn de optelling van polynomen: max(m,n) m n X X X j i bj x = (ai + bi )xi , ai x + j=0 i=0 i=0 en de vermenigvuldiging van polynomen ( n X i=0 i ai x ) × ( m X j bj x ) = j=0 m+n X ( k X k=0 i=0 9 ai × bk−i )xk . Hier nemen we ai = 0 voor alle i > n en bj = 0 voor j > m. Deze polynoomring R[x] is zelf weer een commutatieve ring met 1, maar geen lichaam omdat bijvoorbeeld het polynoom x geen inverse heeft. (viii) In Lineaire Algebra 1 en 2 heb je gezien dat je vierkante matrices van reële getallen kunt optellen en vermenigvuldigen. Veel algemener kunnen we bij elke commutatieve ring met 1 een nieuwe ring van n × n matrices M n (R) met coëfficiënten in R maken: de verzameling bestaat uit vierkante n × n matrices, en de operaties zijn de optelling van matrices, waar de som van a11 a12 · · · a1n b11 b12 · · · b1n a21 a22 · · · a2n b21 b22 · · · b2n . en .. .. .. .. .. .. .. ... . . . . . . an1 an2 ··· ann bn1 bn2 ··· bnn gedefinieerd is door a11 + b11 a21 + b21 .. . an1 + bn1 a12 + b12 a22 + b22 .. . ··· ··· .. . an2 + bn2 ··· a1n + b1n a2n + b2n .. . ann + bnn en vermenigvuldiging van matrices, middels het product Pn Pn Pn a × b 1i i1 i=1 a1i × bi2 · · · Pi=1 a1i × bin Pi=1 P n n n i=1 a2i × bi1 i=1 a2i × bi2 · · · i=1 a2i × bin . . .. . .. .. .. . Pn Pn Pn i=1 ani × bi1 i=1 ani × bi2 · · · i=1 ani × bin Met andere woorden: je telt zulke matrices op en je vermenigvuldigt ze op precies dezelfde manier als waarop je dat eerder hebt gezien in het speciale geval dat alle coëfficiënten reëel waren. Voor elke n krijgen we zo (voor gegeven commutatieve ring R) een nieuwe ring. Als n > 1 is die ring Mn (R) niet commutatief! Opgave 3. Laat zien dat de deelverzameling van Z bestaande uit de even getallen voldoet aan L1–5 en L8–9. Dit is een commutatieve ring zonder eenheidselement, die we niet als deelring van Z beschouwen (omdat 1 er niet in zit). We hebben gezien dat elke ring R (dus in het bijzonder elk lichaam) in ieder geval de elementen 0, 1 bevat. Maar dan moet ook 1+1 in R zitten, een element dat we gewoonlijk met 2 aangeven. Maar let op: het kan best zijn dat 2 gelijk is aan één van de elementen die we al opschreven: 0 of 1. Maar als 1 + 1 = 1 dan moet 1 = 0 (want tel bij beide kanten de tegengestelde −1 op), en dat hebben we juist verboden. Dus 2 is een nieuw element òf gelijk aan 0. Datzelfde argument kun je herhalen: 1 + 1 + 1 ∈ R komt al voor onder {0, 1, 2} òf het is een nieuw element; in het eerste geval moet 1 + 1 + 1 = 0. 1.2.6 Definitie Laat R een ring zijn; als er een natuurlijk getal m bestaat zodanig dat 1 + 1 + · · · + 1 = m · 1 = 0 ∈ R, dan is de karakteristiek van R het kleinste positieve natuurlijke getal met die eigenschap; als zo’n m niet bestaat is de karakteristiek per definitie 0. 10 1.2.7 Opmerkingen Als de karakteristiek van R gelijk aan 0 is, dan zijn alle elementen 1, 2, 3, . . . verschillend: er bestaat dan een injectie van Z → R. Omgekeerd, als er zo’n injectieve afbeelding bestaat moet de karakteristiek wel 0 zijn. Opgave 4. Geef voor elk natuurlijk getal m ≥ 2 een voorbeeld van een ring van karakteristiek m. Vervolgens kijken we naar twee speciale soorten elementen in een ring. 1.2.8 Definities Een element r van een ring R heet een eenheid in R als er een inverse voor r in R bestaat (dus een element s ∈ R met r × s = s × r = 1). De inverse van r geven we meestal met r −1 aan. Een element r ∈ R heet een nuldeler in R als er een element s ∈ R bestaat zodat r × s = 0 of s × r = 0 terwijl s 6= 0. Opgave 5. Laat zien dat in een lichaam elk element dat niet 0 is een eenheid is. Opgave 6. Geef twee elementen r, s van M2 (Z) met de eigenschap dat r × s = 0 maar s × r 6= 0. 1.2.9 Stelling Een eenheid in een ring R kan geen nuldeler zijn. Bewijs. Laat r ∈ R een eenheid zijn, en veronderstel dat r ook een nuldeler is omdat er een t ∈ R is met r × t = 0 ∈ R. (Het geval t × r = 0 gaat net zo.) Omdat r een eenheid is, is er een s met s × r = 1. Dan is t = 1 × t = (s × r) × t = s × (r × t) = s × 0 = 0, (volgens opgave 2) dus t = 0, in tegespraak met de definitie van nuldeler. In de algebra spelen naast objecten met een bepaalde struktuur, zoals groep, ring, lichaam, en vectorruimte, afbeeldingen tussen zulke objecten die de struktuur behouden een belangrijke rol. 1.2.10 Definities Een ringhomomorfisme is een afbeelding f : R → S tussen ringen R en S die voldoet aan de eigenschappen: (i) f (1) = 1; (ii) f (a + b) = f (a) + f (b), voor alle a, b ∈ R; (iii) f (a × b) = f (a) × f (b), voor alle a, b ∈ R. Een ringisomorfisme is een bijectief ringhomomorfisme. Een ringautomorfisme is een ringisomorfisme tussen R en zichzelf. Opgave 7. Laat zien dat de afbeelding f : Z → Q die aan een geheel getal n de breuk n/1 toevoegt een homomorfisme is. Is dit een ringisomorfisme? Opgave 8. Laat zien dat de afbeelding f : Z → Z/nZ die aan een geheel getal n de restklasse n mod m toevoegt een homomorfisme is. Is dit een ringisomorfisme? 11 1.2.11 Opmerkingen De eis dat f (1) = 1 kunnen we stellen omdat we hebben aangenomen dat elke ring een eenheidselement heeft. De identieke afbeelding is altijd een ringisomorfisme. Een ringisomorfisme tussen twee ringen drukt uit dat de twee ringen dezelfde struktuur hebben (als ring); dit maakt het bijvoorbeeld mogelijk om preciezer uit te drukken (vgl. 1.2.5) dat er in essentie maar één lichaam van p elementen bestaat, voor een priemgetal p: elk lichaam van p elementen is isomorf met Z/pZ. 1.2.12 Opgaven Opgave 9. Wat is het eenheidselement, en wat is het nulelement in R[x]? En in Mn (R)? Opgave 10. Zij · een bewerking op een verzameling V . Definieer voor n ≥ 3 het product v 1 · v2 · · · vn inductief (voor vi ∈ V ) door (v1 · v2 · · · vn−1 ) · vn . Laat (met behulp van inductie naar n) zien dat als · associatief is, voor alle n ≥ 3 en alle k met 1 ≤ k ≤ n − 1 geldt: (v1 · v2 · · · vk ) · (vk+1 · · · vn ) = v1 · v2 · · · vn . Opgave 11. Bewijs dat het eenheidselement 1 ∈ R uniek bepaald is. Opgave 12. Laat (R, +, ×) een ring zijn; bewijs dat een deelverzameling S van R een deelring is als: (i) 1R ∈ S; (ii) als a, b ∈ S dan ook a − b ∈ S; (iii) als a, b ∈ S dan ook a × b ∈ S. Opgave 13. Laat zien dat de eenheden van een ring R een groep vormen onder ×. Deze groep geven we aan met R∗ . Opgave 14. Geef een voorbeeld van een ring zonder nuldelers waarin niet elk element (ongelijk aan 0) een eenheid is. Opgave 15. Bewijs dat Mn (R)∗ bestaat uit de n × n reële matrices met determinant ongelijk aan 0. Deze groep geven we ook wel met Gln (R) aan. Waarom is dit geen ring (voor elke n > 0)? Opgave 16. Beschrijf Gln (Z), en algemener, de groep Gln (R) voor een commutatieve ring R. Opgave 17. Laat zien dat complexe conjugatie (de afbeelding die aan een complex getal a + bi het getal a − bi toevoegt) een isomorfisme C → C geeft. Opgave 18. Bewijs dat de ring Z/nZ een lichaam is dan en slechts dan als n een priemgetal is. Opgave 19. Als V een verzameling is, geven we met P (V ) de machtsverzameling van V aan: P (V ) bestaat uit de deelverzamelingen van V . Laat zien dat (P (V ), +, ×) een commutatieve ring (met 1) wordt als we de optelling + en vermenigvuldiging × definiëren door voor deelverzamelingen A, B ⊂ V te nemen: A + B = (A ∪ B) \ (A ∩ B), A × B = A ∩ B. Laat ook zien dat P (V ) zo alleen een lichaam wordt als #V = 1. Opgave 20. De quaternionen van Hamilton H worden gedefinieerd als uitdrukkingen van de vorm a + bi + cj + dk met a, b, c, d ∈ R. Twee zulke uitdrukkingen a1 + b1 i + c1 j + d1 k en a2 + b2 i + c2 j + d2 k zijn hetzelfde dan en slechts dan als a1 = a2 en b1 = b2 en c1 = c2 en d1 = d2 . Optellen geschiedt componentsgewijs, hetgeen som a1 + a2 + (b1 + b2 )i + (c1 + c2 )j + (d1 + d2 )k geeft, en vermenigvuldiging vindt plaats met de regels: i2 = j2 = k2 = −1 i·j = k j · i = −k j·k = i k · j = −i k·i = j i · k = −j. 12 Laat zien dat H met deze bewerkingen een niet-commutatieve ring vormt. (Voor het bewijs van associativiteit van vermenigvuldiging helpt het om a + bi + cj + dk = (a + bi) + (c + di)j te schrijven.) Geef een isomorfisme aan van H met de deelring van M2 (C) bestaande uit matrices A · I + B · J + C · K + D · L, waar A, B, C, D ∈ R en 1 0 i 0 0 1 0 i I= , J= , K= , L= . 0 1 0 −i −1 0 i 0 Laat ook zien dat a + bi + cj + dk een inverse heeft tenzij a = b = c = d = 0, door te kijken naar (a + bi + cj + dk) · (a − bi − cj − dk). De quaternionen vormen een scheeflichaam: een ring die aan alle axioma’s voor een lichaam voldoet behalve de commutativiteit [L8]. 13 1.3 Polynoomringen Eén van de belangrijkste ringen die we tegenkomen is de ring van polynomen (of veeltermen) over R in de variabele (of onbekende) x, die we aangeven met R[x]. In deze paragraaf zijn een aantal belangrijke eigenschappen van deze ringen en hun elementen op een rijtje gezet. We nemen steeds aan dat R een commutatieve ring (met 1) is. 1.3.1 Definities Een polynoom over R is element van R[x], en dat is van de vorm f = a n xn + an−1 xn−1 + · · · + a1 x + a0 , waar ai ∈ R. Zo’n polynoom bestaat dus uit een som van termen a i xi ; een polynoom dat uit één zo’n term bestaat heet ook wel een monoom. De a i zijn de coëfficiënten van het polynoom; gewoonlijk schrijven we alleen termen met a i 6= 0 op (tenzij alle coëfficiënten nul zijn: we schrijven dan gewoon 0). De graad van f 6= 0 (notatie: deg f ) is de hoogste macht van xn die met niet-nul coëfficiënt voorkomt, en de coëfficiënt van deze xn heet de kopcoëfficient. Als de kopcoëfficiënt 1 is noemen we het polynoom monisch. De coëfficiënt a0 heet de constante coëfficiënt. Als ai = 0 voor alle i > 0 dan heet polynoom een constant polynoom. Het nulpolynoom is het constante polynoom 0; de graad hiervan is per definitie −∞. De x in deze uitdrukkingen is de onbepaalde, of variabele. De regels voor optellen en vermenigvuldigen (die R[x] tot een commutatieve ring maken) zagen we al in 1.2.5. Net als bij vermenigvuldiging van reële getallen schrijven we vaak f ·g of f g voor het product f × g van polynomen. Merk op dat het nulelement, resp. het eenheidselement van R[x] de constante polynomen 0, resp. 1 zijn. Waarschijnlijk ben je polynomen al eerder tegengekomen als functies; het is belangrijk op te merken dat we polynomen hier niet in de eerste plaats als functies beschouwen, maar als elementen van een ring. Een polynoom f ∈ R[x] definieert wel een afbeelding f : R → R omdat we f kunnen evalueren: zo is f (r) = a n r n + · · · a1 r + a0 1 ∈ R voor f als boven. We noemen f (r) ook wel de waarde van f in r. Een nulpunt van f in R is een r ∈ R zodanig dat f (r) = 0. Als R een deelring van S is, kunnen we elementen van R via de inbedding ook als elementen van S opvatten; dat betekent dat we in dit geval f ∈ R[x] ook kunnen evalueren in een s ∈ S: f (s) ∈ S. Opgave 21. Laat zien dat als R geen nuldelers heeft voor de graden van polynomen geldt: deg f g = deg f + deg g. [Let op het nulpolynoom!] Sommige eigenschappen van R[x] hangen af van die van R; een heel belangrijk speciaal geval is dat waar R een lichaam is, dat we in deze paragraaf steeds met K zullen aangeven. In heel veel opzichten lijkt K[x] op de ring Z: zoals we zullen zien kun je polynomen over K net als gehele getallen ontbinden in factoren, en kun je een grootste gemene deler van twee zulke polynomen vinden (en wel met hetzelfde algoritme als waarmee dat in Z kan). Opgave 22. Bewijs dat R[x] nuldelers heeft dan en slechts dan als R nuldelers heeft. In het vervolg nemen we steeds polynomen f = a m xm + am−1 xm−1 + · · · a1 x + a0 en g = bn xn + bn−1 xn−1 + · · · b1 x + b0 uit R[x], (met am 6= 0 en bn 6= 0). De eerste stap bestaat uit het imiteren van de gebruikelijke deling met rest. Dat gaat goed als de deler g een inverteerbare kopcoëfficiënt heeft (dus bijvoorbeeld als g monisch is). 14 1.3.2 Stelling Laat f, g ∈ R[x] als boven, en veronderstel dat b n een eenheid in R is. Dan bestaan er polynomen q, r ∈ R[x] zodat: f = q · g + r, deg r < deg g; bovendien zijn deze q en r uniek bepaald. Bewijs. Eerst bewijzen we het bestaan van q en r, met inductie naar de graad m = deg f . Omdat de kopcoëfficiënt van g inverteerbaar is, is deg g ≥ 0; we mogen ook aannemen dat m = deg f ≥ deg g = n, want anders voldoen q = 0 en r = f . Als m = 0 dan is f = a 0 en g = b0 , en omdat bij aanname bn = b0 inverteerbaar is, geldt de gevraagde gelijkheid met −1 m−n g. Als dit polynoom r = 0 en q = a0 b−1 0 . Laat nu m ≥ 1; beschouw h = f − a m bn x −1 m−n 0 is voldoen r = 0 en q = am bn x aan de gestelde eisen. Is dit niet het geval, dan is deg h < degf omdat de kopcoëfficiënten van f en am bn−1 xm−n g precies tegen elkaar wegvallen. We kunnen dan op h en g de inductiehypothese toepassen: er bestaan q 0 en r 0 met h = q 0 g + r 0 en deg r 0 < deg g; maar dan is m−n m−n + q 0 )g + r 0 , g = (am b−1 f = h + am b−1 n x n x m−n + q 0 en r = r 0 aan alle condities. en voldoen q = am b−1 n x Om de uniciteit te bewijzen veronderstellen we dat f = q 0 · g + r 0 = q 00 · g + r 00 , beide aan de eisen voldoen. Dan is (q 0 − q 00 )g = r 00 − r 0 . Stel dat r 0 6= r 00 . Dan is q 0 6= q 00 . Omdat bn ∈ R een eenheid is, is g geen nuldeler, en dus is (zie opgave): deg(r 00 − r 0 ) = deg(q 0 − q 00 )g = deg g + deg(q 0 − q 00 ) ≥ deg g, hetgeen in tegenspraak is met deg r 00 < deg g en deg r 0 < deg g. Dus r 0 = r 00 , maar dan is (q 0 − q 00 )g = 0 en moet q 0 = q 00 . Opgave 23. Geef twee polynomen f, g ∈ Z[x] waarbij je geen q, r ∈ Z[x] kunt vinden met f = q · g + r, deg r < deg g. Opgave 24. Met welke veranderingen geeft bovenstaande stelling deling met rest in Z in plaats van R[x]? 1.3.3 Definities Als d, f ∈ R[x] dan is d een deler van f (notatie d | f ) als er een q ∈ R[x] bestaat met f = qd; we zeggen ook dat d het polynoom f deelt, dat f deelbaar is door d in R[x], en dat f een veelvoud is van d. Merk op dat elk polynoom een deler is van 0. Een gemene deler van f, g ∈ R[x] is een d ∈ R[x] die zowel f als g deelt; een grootste gemene deler van f en g is een gemene deler d ∈ R[x] van f en g met de eigenschap dat elke andere gemene deler d 0 een deler van d is. Zo’n grootste gemene deler geven we aan met ggd(f, g). Opgave 25. Vergelijk deze definities met de overeenkomstige definities voor Z. Bestaat een grootste gemene deler in Z voor elk tweetal elementen, en als deze bestaat, is deze dan uniek bepaald? Je kunt dezelfde definities gebruiken voor een lichaam, zoals Q; heeft elk tweetal uit Q een grootste gemene deler, en in hoeverre is deze uniek? Om te laten zien dat polynomen over een lichaam altijd een grootste gemene deler hebben, geven we algoritme om deze te vinden. Achteraf bewijzen we dan dat het algoritme altijd werkt, en een juist antwoord geeft. 15 1.3.4 Algoritme van Euclides Gegeven: polynomen f, g ∈ K[x]; Levert: de monische grootste gemene deler d ∈ K[x] van f en g. [1] Initialiseer: F = 0, G = f and r = g. [2] Herhaal de volgende stappen zolang r 6= 0: (i) vervang F door G en G door r; (ii) bepaal q, r zodanig dat F = qG + r met deg r < deg G; [3] Lever d = G/Gk af waar Gk de kopcoëfficiënt van G is. Opgave 26. Ga na: als deg g > deg f bij het begin van dit algoritme, dan is na één keer uitvoeren van stap [2] het resultaat dat f en g verwisseld zijn. Opgave 27. Wijzig het algoritme zodanig dat het resultaat grootste gemene delers in Z geeft. 1.3.5 Voorbeeld We bepalen bij wijze van voorbeeld de monische grootste gemene deler van f = x 6 +x4 −x3 −x en g = x5 +2x3 +x2 +x+1 in Q[x]. In stap [2](i) wordt F0 = 0, G0 = f en r = g; elke keer dat in het algoritme F en G vervangen worden verhogen we in dit voorbeeld de index van F i en Gi , en we geven de bijbehorende q en r dezelfde index. In stap [2](i) wordt dan F 1 = G0 = f en G1 = r = g. Deling met rest (bijvoorbeeld door een staartdeling) levert op dat F1 = x · G1 + (−x4 − 2x3 − x2 − 2x), dat wil zeggen: q1 = x en r1 = −x4 −2x3 −x2 −2x. Dus krijgen we F2 = G1 = x5 +2x3 +x2 +x+1 en G2 = −x4 − 2x3 − x2 − 2x; waarna quotiënt q2 = −x + 2 rest r2 = 5x3 + x2 + 5x + 1 geeft: F2 = (−x + 2)G2 + (5x3 + x2 + 5x + 1). Vervolgens, met F3 = G2 = −x4 − 2x3 − x2 − 2x en G3 = 5x3 + x2 + 5x + 1 krijgen we q3 = 1/5x − 9/25 en r3 = 9/25x2 + 9/25: 9 9 9 1 F3 = (− x − )G3 + ( x2 + ). 5 25 25 25 Dus F4 = G3 = 5x3 + x2 + 5x + 1 en G4 = F4 = ( 9 2 25 x + 9 25 , waarmee 9 125 x + )G4 + 0. 9 25 Met q4 = 125/9x + 9/25 krijgen we rest 0 en daarom termineert het algoritme na het afleveren 9 van G4 / 25 = x2 + 1. 1.3.6 Stelling In een polynoomring K[x] over een lichaam K heeft elk tweetal polynomen f, g een grootste gemene deler d; deze is bepaald op vermenigvuldiging met niet-nul elementen uit K na, en daarom uniek als we opleggen dat d monisch is. Het bovenstaande algoritme bepaalt deze unieke monische grootste gemene deler. Bewijs. Als f = 0 dan is g een grootste gemene deler van f en g en omgekeerd; dus we nemen nu aan (zonder beperking der algemeenheid) dat deg f ≥ deg g ≥ 0. 16 De crux van het bewijs is de opmerking dat als d een gemene deler is van f en g, dan ook van elke lineaire combinatie af + bg: immers, als f = ud en g = vd voor zekere u, v ∈ R[x] dan is af + bg = aud + bvd = (au + bv)d. Passen we dit toe op r = f − qg, met q, r bepaald uit deling met rest, dan zien we dat d een gemene deler is van f, g dan en slechts dan als het gemene deler van g, r is: dus is de grootste gemene deler van f, g, gelijk aan de grootste gemene deler van g, r, mits één van beide bestaat. Dit argument gaan we herhalen, als in het algoritme van Euclides. Laat daartoe F1 = f en G1 = g en laat d een gemene deler van f en g zijn. Bepaal q 1 en r1 zodat F1 = q1 G1 + r1 ; dan zijn de gemene delers van F1 , G1 dezelfde als die van G1 , r1 . We vervangen daarom het paar F1 , G1 door F2 = G1 , G2 = r1 , met dezelfde gemene delers, maar met deg G2 = deg r1 < deg G1 . Zo vinden we uit een paar Fi , Gi een nieuw paar Fi+1 , Gi+1 met dezelfde gemene delers, maar met deg G i+1 < deg Gi . Na eindig veel stappen vinden we Gn met deg Gn ≥ 0 en deg Gn+1 = −∞, dat wil zeggen, dat Gn+1 = 0. We zijn terug in de situatie die we allereerst bekeken en nu hebben F n+1 = Gn en Gn+1 = 0 een grootste gemene deler Gn . Dat toont in alle gevallen het bestaan van een grootste gemene deler aan. Uniciteit volgt omdat voor twee verschillende grootste gemene delers d en d 0 enerzijds geldt dat d = qd0 en anderzijds d0 = q 0 d. Tesamen is d = qq 0 d, dus (1 − qq 0 )d = 0. Als d 6= 0 dan moet 1 − qq 0 = 0 (want K[x] heeft geen nuldelers), dus qq 0 = 1. Dan zijn q en q 0 polynomen van graad 0, dus constanten. Dat bewijst dat d en d 0 een constante factor schelen; eisen we dat de grootste gemene deler monisch is, dan is deze dus uniek bepaald. Een kleine toevoeging aan het algoritme van Euclides maakt het mogelijk niet alleen de monische grootste gemene deler d = ggd(f, g) van 2 polynomen te vinden, maar daarbij zogenaamde multiplicatoren s, t ∈ R[x] met de eigenschap dat d = s · f + t · g. 1.3.7 Uitgebreid Algoritme van Euclides Gegeven: polynomen f, g ∈ K[x]; Levert: de monische grootste gemene deler d alsmede s, t ∈ K[x] met d = s · f + t · g. [1] Initialiseer: F = 0, G = f en r = g, en ook. s 00 = 1 en t00 = 0, evenals s0 = 0 en t0 = 1. [2] Herhaal de volgende stappen zolang r 6= 0: (i) vervang F door G en G door r; (ii) bepaal q, r zodanig dat F = qG + r met deg r < deg G; (iii) bewaar s00 in u en t00 in v en vervang s00 door s0 en t00 door t0 ; (iv) vervang s0 door u − qs0 en t0 door v − qt0 ; [3] Lever d = G/Gk , s = s00 /Gk en t = t00 /Gk af, waar Gk de kopcoëfficiënt van G is. 1.3.8 Voorbeeld We herhalen het voorbeeld 1.3.5 maar nu met de extra parameters. In de tabel zijn de waarden van de variabelen weergeven na n keer stap [2] van het algoritme doorlopen te hebben. De waarden van F n en Gn , evenals die van rn en qn zijn precies dezelfde als in voorbeeld 1.3.5. De laatste kolom vertelt ons dat de monische grootste gemene deler 9 9 = x2 + 1 is, maar bovendien dat de multiplicatoren s = s 004 / 25 = de waarde van d = G4 / 25 1 7 9 5 3 1 2 2 5 2 00 x − x − en t = t / = − x + x − x + 1 oplossing geven voor de vergelijking 9 9 9 25 9 9 9 sf + tg = d. Inderdaad, 1 7 5 1 2 5 ( x2 − x − ) · (x6 + x4 − x3 − x) + (− x3 + x2 − x + 1) · (x5 + 2x3 + x2 + x + 1) = x2 + 1. 9 9 9 9 9 9 17 n 1 6 F 4 3 3 2 G x + 2x + x + x + 1 q r x 4 3 2 4 3 2 −x − 2x − x − 2x 3 2 3 −x + 2x + 1 1 −x 4 3 9 2 25 x 1 2 1 5 x − 25 x − 51 x3 + 1 2 25 x − + + 9 25 9 25 7 25 x−2 2 25 x + 2 5x + x + 5x + 1 9 2 25 x 125 9 x 2 − 51 x − 1 −x 2 5x + x + 5x + 1 x−2 2 3 −x − 2x − x − 2x 5x + x + 5x + 1 0 t00 3 4 −x + 2 1 0 1.3.9 2 −x − 2x − x − 2x s00 t 3 x + x − x − x x + 2x + x + x + 1 5 s0 2 5 + + 0 3 − 25 9 x − 9 25 −x2 + 2x + 1 − 51 x3 + 25 25 9 x− 9 1 2 1 7 5 x − 25 x + 25 25 4 25 9 x − 9 x 1 2 2 9 25 x − 25 x + 25 Stelling In K[x] bestaat bij elk tweetal polynomen f, g een tweetal s, t ∈ K[x] zodanig dat s·f +t·g = d waar d de monische grootste gemene deler van f en g is. Het bovenstaande algoritme bepaalt zowel d als zulke s en t. Bewijs. Een eenvoudig algoritmisch bewijs gebruikt Algoritme 1.3.7: omdat dit algoritme net als Algoritme 1.3.4 na eindig veel stappen termineert en dezelfde F n , Gn , rn en qn bepaalt, en dus ook de monisch grootste gemene deler d oplevert, hoeven we slechts te laten zien dat de uiteindelijke waarden van s00 /Gk en t00 /Gk oplossingen geven voor s · f + t · g = d. Daartoe laten we zien dat, met dezelfde notatie als voorheen, steeds na het voltooien van stap [2] van het algoritme geldt dat s0j f + t0j g = rj . Dat is voldoende, omdat dan ook na de voorlaatste stap geldt dat s0n f + t0n g = rn , en de laatste maal dat [2] doorlopen wordt, wordt r n+1 = 0, krijgt s00n+1 de waarde van s0n en t00n+1 die van t0n , terwijl Gn+1 = rn hetgeen op een constante factor na de monische grootste gemene deler is. Het resultaat volgt dan na deling door de kopcoëfficiënt van Gn+1 . Op schematische wijze kan gezien worden dat steeds s 0j f +t0j g = rj wanneer we we rijen voor j = −1 (met, per definitie, r−1 = f ) en voor j = 0 (die correspondeert met de initialisatiestap [1] van het algoritme) toevoegen: 1 0 s01 s02 s0n 0 sn+1 · · · · .. . f f f f · f · f + 0 · f = r−1 + 1 · g = r0 + t01 · g = r1 + t02 · g = r2 .. .. .. .. . . . . + t0n · g = rn + t0n · g = 0 Want hier is de j-de rij gelijk aan de (j − 2)-de rij minus q j maal de (j − 1)-ste rij; immers in stap [2](iii) en (iv) wordt s0j verkregen uit s0j−2 − qj s0j−1 en t0j uit t0j−2 − qj t0j−1 . Bovendien is voor j ≥ 1 rj = Fj − qj Gj = Gj−1 − qj rj−1 = rj−2 − qj rj−1 , vanwege stap [2](ii) en (i). Omdat gelijkheid in de eerste twee rijen geldt, volgt hij voor de volgende rijen dan recursief. Opgave 28. Bewijs dat in het (uitgebreide) algoritme van Euclides met bovenstaande notaties voor j ≥ 0 geldt: Fj+2 = Gj+1 = rj . Laat ook zien dat F, G, r daardoor alle drie voldoen aan de recursieve betrekking yj = yj−2 − qj yj−1 voor j ≥ 1. 18 9 25 25 9 In de rest van de paragraaf bemoeien we ons vooral met de vraag hoe polynomen met coëfficiënten in een lichaam in factoren uiteen vallen. Wederom is de analogie met Z treffend. De volgende eenvoudige stelling drukt uit dat in een commutatieve ring delers van graad 1 van een gegeven polynoom corresponderen met nulpunten van dat polynoom. 1.3.10 Stelling Als a ∈ R en f ∈ R[x] dan geldt: x−a deelt f ⇐⇒ f (a) = 0. Bewijs. Als f deelbaar is door x − a dan is f = q(x − a), voor zekere q ∈ R[x]. Evalueren in a geeft f (a) = q(a) · 0 = 0 ∈ R. Voor de omkering pas je deling met rest toe op f en g = x − a: er is een q ∈ R en een r ∈ R[x] van graad kleiner dan 1 (dus een constante r 0 ∈ R) zodat f = q(x − a) + r0 . Maar dan is 0 = f (a) = q(a) · 0 + r0 , dus r0 = 0 en f = q(x − a) is deelbaar door (x − a). De stelling geeft dus een eenvoudige methode om te controleren of een polynoom deelbaar is door x − a: reken f (a) uit. Als de deling opgaat (dus f (a) = 0) zul je nog wel een berekening (bijvoorbeeld een staartdeling) uit moeten voeren om het quotient te vinden. Opgave 29. Ga van het polynoom f = x6 + x5 − 2x4 + x2 + x − 2 ∈ Z[x] na door welke twee polynomen x − i met i ∈ {−2, −1, 0, 1, 2} het deelbaar is. Voer de deling q = f /((x − i1 )(x − i2 )) voor die waarden ook uit. Opgave 30. Bewijs dat f ∈ R[x] door x deelbaar is dan en slechts dan als a0 = 0. P Opgave 31. Bewijs dat f ∈ R[x] door x − 1 deelbaar is dan en slechts dan als ai = 0. Opgave 32. Laat f ∈ R[x] en z ∈ C; bewijs dat f (z) = 0 impliceert dat f (z̄) = 0 (waar z̄ de complex geconjugeerde van z is). De stelling die we beneden willen bewijzen zal laten zien dat in K[x] we elementen (net als gehele getallen) in factoren kunnen ontbinden. Eerst moeten we de elementen definiëren die de rol van priemgetallen zullen overnemen. 1.3.11 Definitie Een element r ∈ R in een commutatieve ring R zonder nuldelers heet irreducibel in R als geldt: r 6= 0 en r is geen eenheid maar als r = s · t met s, t ∈ R dan is s een eenheid of t is een eenheid in R. Als r wel als zo’n product van niet-eenheden is te schrijven heet hij reducibel. 1.3.12 Voorbeelden In een lichaam is elk element nul of een eenheid en zijn er dus geen irreducibele elementen. In Z zijn de irreducibele elementen precies de priemgetallen en de reducibele elementen de samengestelde getallen. In een polynoomring R[x] over een commutatieve ring R zonder nuldelers heten de irreducibele elementen irreducibele polynomen. Als R = K een lichaam is, dan zijn de irreducibele elementen de polynomen f ∈ R[x] met deg f ≥ 1 waarvoor geen polynomen g, h ∈ R[x] bestaan zodat f = g · h en zowel deg g < deg f als deg h < deg f . Als R geen lichaam is zijn er in het algemeen ook nog irreducibele elementen uit R in R[x] (irreducibele polynomen van graad 0). 19 1.3.13 Lemma Laat p, f, g ∈ K[x] met K een lichaam. Als p irreducibel is en p is een deler van f · g, dan is p een deler van f of g. Bewijs. Veronderstel dat het irreducibele polynoom p geen deler is van f . Dan is de monische grootste gemene deler van p en f dus 1, en bestaan er volgens 1.3.9 dus polynomen s, t ∈ K[x] zodat 1 = s · p + t · f . Omdat p een deler is van f · g is er ook een h ∈ K[x] met p · h = f · g. Maar bij elkaar geeft dat g = g · 1 = g · (s · p + t · f ) = s · p · g + t · f · g = s · p · g + t · p · h = p · (s · g + t · h), dus p deelt g. 1.3.14 Stelling Elk monisch polynoom f ∈ K[x] over een lichaam is te schrijven als product f= k Y pei i , i=1 waar de pi verschillende monische, irreducibele polynomen uit K[x] zijn; deze schrijfwijze is uniek op volgorde van de factoren pei i na. Bewijs. Dat elke monische f een ontbinding als product van monisch irreducibele factoren heeft kan met inductie (naar de graad m van) f bewezen worden. Elke f ∈ K[x] van graad 1 is irreducibel. Is f met deg f = m > 1 zelf irreducibel, dan zijn we klaar, en anders zijn er g, h ∈ K[x] zodat f = g · h, die beide graad kleiner dan m hebben en dus op grond van de inductiehypothese als product van irreducibele polynomen te schrijven zijn. Hun product geeft dan zo’n ontbinding voor f , die na het bij elkaar nemen van gelijke irreducibele factoren een product als in de Stelling geeft.. De eenduidigheid hiervan is als volgt in te zien: veronderstel dat er twee ontbindingen p1 p2 · · · pk = q1 q2 · · · ql voor f zijn, met alle pi , qj monisch en irreducibel. Dan deelt p 1 het product van de qj , en dus op grond van het voorafgaande lemma (herhaald toegepast) tenminste één der qj , zeg q1 . Maar q1 is irreducibel en monisch evenals p 1 , dus p1 = q1 . Nu is p1 (p2 · · · pk − q2 · · · ql ) = 0, dus p2 · · · pk = q2 · · · ql , en we kunnen hetzelfde argument herhalen. Uiteindelijk vinden we dan dat k = l en (eventueel na hernummering van de q j ) dat pi = qi voor 1 ≤ i ≤ k. Hetgeen te bewijzen was. Opgave 33. Wat gaat er fout in de stelling als we ‘monisch’ weglaten? 1.3.15 Opmerkingen De voorgaande stelling geeft het beoogde analogon van priemfactorontbinding in Z. Een commutatieve ring zonder nuldelers waarin elk element (op volgorde van factoren en vermenigvuldiging met eenheden na) uniek als product van irreducibele elementen geschreven kan worden heet een factorontbindingsring. We weten nu dat Z en K[x] (voor elk lichaam K) een factorontbindingsring is. Algemener geldt zelfs dat R[x] een factorontbindingsring is als R het zelf is; dus geldt bijvoorbeeld ook in Z[x] eenduidige priemfactorontbinding. Maar het algemene bewijs is iets lastiger. Om de stelling te gebruiken zouden we nog graag willen kunnen herkennen wat de irreducibele polynomen zijn in K[x]; maar dat hangt sterk af van het lichaam K. De reden dat het 20 lichaam der complexe getallen C zo’n belangrijke rol speelt is gelegen in het feit (zoals uitgedrukt in de volgende stelling) dat het algebraı̈sch afgesloten is: elke algebraı̈sche vergelijking over C heeft een oplossing! Deze stelling, die we hier niet bewijzen, wordt wel de fundamentele stelling van de algebra genoemd. 1.3.16 Stelling Voor elke f ∈ C[x] is er een z ∈ C zodat f (z) = 0. 1.3.17 Gevolg Als f een monisch polynoom is dan geldt: (i) f ∈ C[x] is irreducibel ⇐⇒ deg f = 1; (ii) f ∈ R[x] is irreducibel ⇐⇒ deg f = 1 of f = x 2 + bx + c met b2 − 4c < 0. Bewijs. Als f ∈ C[x] graad groter dan 1 heeft, is er een ontbinding van f van de vorm f = (x − z) · g op grond van 1.3.10 en 1.3.16, en dus is f reducibel. Bovendien is over een willekeurig lichaam elk polynoom van graad 1 is irreducibel. Als f ∈ R[x] en er is een r ∈ R met f (r) = 0, dan is, net als boven, f reducibel tenzij f van graad 1 is. Maar zo’n r bestaat niet altijd; wél is er altijd een z ∈ C met f (z) = 0. Neem nu dus aan dat zo’n z ∈ C bestaat met z ∈ / R; vanwege opgave 32 is dan ook f (z̄) = 0. Dan moet f deelbaar zijn door g = (x − z)(x − z̄) = x 2 − (z + z̄)x + zz̄. Omdat zowel b = −(z + z̄) ∈ R als c = zz̄ ∈ R, is g ∈ R[x]. Maar g | f en f is irreducibel in R[x], dus f = g en g is irreducibel. Bovendien is b2 − 4c = (z + z̄)2 − 4zz̄ = (z − z̄)2 < 0. Opgave 34. Bewijs dat (z − z̄)2 ≤ 0 geldt voor alle z ∈ C, en dat geldt (z − z̄)2 = 0 ⇐⇒ z ∈ R. 1.3.18 Opmerkingen Voor een monisch kwadratisch √ polynoom f = x 2 + bx + c geeft de wortelformule natuurlijk altijd de twee nulpunten −b ± b2 − 4c en ook daaraan zie je dat f reducibel is over R als b2 − 4c ≥ 0. Een ander direkt gevolg van 1.3.16 is dat elk polynoom f ∈ C[x] precies m = deg f nulpunten heeft, mits we een nulpunt z precies k maal tellen als (x − z) k een deler is van f maar (x − z)k+1 niet. We noemen deze k de multipliciteit van het nulpunt z. Over Q bestaan monisch irreducibele polynomen van willekeurige graad m ≥ 1; de polynomen xm − 2 zijn bijvoorbeeld irreducibel in Q[x], voor elke m ≥ 1, maar we hebben nog √ niet de hulpmiddelen om dat hier te bewijzen. Er volgt uit dat de rationale machten 2 k/m = m 2k van 2 voor 1 ≤ k < m irrationaal zijn, dat wil zeggen, niet in Q liggen. Opgave 35. Bewijs dat in K[x], met K een lichaam, voor elk polynoom f geldt dat het aantal nulpunten (geteld met multipliciteiten) ten hoogste deg f is. Opgave 36. Laat aan de hand van een voorbeeld zien dat een polynoom f ∈ R[x], met R een commutatieve ring, het aantal nulpunten groter kan zijn dan de graad van f . Een laatste overeenkomst tussen Z en K[x] ligt in de mogelijkheid tot het vormen van restklassenringen. De ring Z kon voor gegeven n > 1 opgedeeld worden in equivalentieklassen ā = {b ∈ Z: b ≡ a mod n}, waar b ≡ a mod n niets anders betekende dan: n deelt b − a; nog anders gezegd: de deling van b door n heeft dezelfde rest als die van a. Omdat we in K[x] ook deling met rest kunnen toepassen, krijgen we op een zelfde manier de volgende definitie. 21 1.3.19 Definitie De restklassenring K[x]/f , voor een f ∈ K[x] met deg f > 0, bestaat uit de verzameling equivalentieklassen ḡ = {h ∈ K[x] : h ≡ g mod f } = {g + tf : t ∈ K[x]} (waar h ≡ g mod f dan en slechts dan als f een deler is van h − g), voorzien van optelling en vermenigvuldiging, gegeven door: ḡ + h̄ = g + h en ḡ · h̄ = g · h. Opgave 37. Bewijs dat in K[x]/f geldt: h ∈ ḡ dan en slechts dan als bij deling met rest geldt g = qg f + r en h = qh f + r, met dezelfde rest r. Opgave 38. Ga na dat K[x]/f zo een commutatieve ring met 1 vormt. 1.3.20 Stelling K[x]/f is een lichaam dan en slechts dan als f irreducibel is in K[x]. Bewijs. Veronderstel dat f reducibel is, dus f = g · h met deg g < deg f en deg h < deg f . Dan is f geen deler van g of h, maar wel van g · h; dus is g 6= 0 ∈ K[x]/f en h 6= 0 ∈ K[x]/f maar g · h = 0 ∈ K[x]/f , zodat g, h nuldelers zijn, en K[x]/f geen lichaam kan zijn. Dat bewijst de implicatie ⇒. Veronderstel nu dat f irreducibel is, en laat g ∈ K[x] niet deelbaar zijn door f . Dan is de monische grootste gemene deler van f en g gelijk aan 1, dus bestaan er volgens 1.3.9 polynomen s, t ∈ K[x] zodat s · f + t · g = 1, oftewel t · g = 1 + s · f : dat betekent dat t̄ḡ = 1̄ ∈ K[x]/f . Bij het willekeurige element g ∈ K[x] met ḡ 6= 0̄ vonden we dus een t ∈ K[x] zodat t̄ = ḡ −1 . Elk niet-nul element in K[x]/f is kennelijk inverteerbaar: de ring K[x]/f is een lichaam. 1.3.21 Opmerkingen en Voorbeelden De voorgaande stelling geeft aan hoe lichaamsuitbreidingen gemaakt kunnen worden: begin met een lichaam K en vind een irreducibel polynoom f ∈ K[x], dan is L = K[x]/f een lichaam. 2 Bijvoorbeeld met K√= Q en f = x2 − 2 vinden we √ L = K[x]/(x √ − 2), een lichaam dat bestaat uit elementen a + b 2, met a, b ∈ Q, waar a + b 2 en c + d 2 opgeteld worden volgens √ √ √ (a + b 2) + (c + d 2) = (a + c) + (b + d) 2, en vermenigvuldigd via √ √ √ (a + b 2) × (c + d 2) = (ac + 2bd) + (ad + bc) 2, √ √ (werk de haakjes uit en gebruik dat ( 2)2 = 2). Dit lichaam L geven we aan met Q[ 2]. Algemeen geldt, als f een monisch irreducibel polynoom van graad d is over een lichaam K, dat L = K[x]/f isomorf is met K[α], waar α voldoet aan f (α) = 0, en K[α] bestaat uit de elementen van de verzameling {a0 + a1 α + · · · + an−1 αn−1 : ai ∈ K}, die je componentsgewijs optelt en waar je bij vermenigvuldiging gebruikt dat je α n kunt uitdrukken als K-lineaire combinatie van de lagere machten van α omdat f (α) = 0. In het bijzonder, als K het lichaam van p elementen is, kunnen we zo een lichaam met p n elementen construeren door een monisch irreducibel polynoom van graad n over K te vinden. Later zal blijken dat we voor elke p en elke n ≥ 2 zo’n polynoom kunnen vinden. 22 Zoals je uit de ring Z door het nemen van quotiënten het lichaam Q maakt, kun je uit K[x] door het nemen van quotiënten het lichaam K(x) van rationale functies over K maken. De elementen zijn quotiënten f /g van polynomen uit K[x], met natuurlijk g 6= 0. Twee zulke elementen f1 /g1 en f2 /g2 zijn hetzelfde als f1 g2 = f2 g1 , en daarom schrijf je elementen meestal in gereduceerde vorm (net als rationale getallen!) door teller en noemer beide door hun grootste gemeenschappelijke deler te delen. Optelling en vermenigvuldiging van rationale functies gaat zoals je verwacht: f1 f2 f1 g2 + f 2 g1 f1 f2 f1 f2 + = , · = . g1 g2 g1 g2 g1 g2 g1 g2 Opgave 39. Ga na dat K(x) voor elk lichaam K weer een lichaam vormt. Opgave 40. Vind een irreducibel polynoom van graad 2 over F3 , schrijf alle elementen op van een lichaam van 9 elementen, inclusief een tabel die bij elk tweetal hun product geeft. Opgave 41. Laat zien dat de afbeelding φ : C → R[x]/(x2 + 1) die aan a + bi ∈ C de restklasse van a + bx ∈ R[x]/(x2 + 1) toevoegt een ringisomorfisme is. Opgave 42. Bewijs dat als R een ring zonder nuldelers is, de enige eenheden van R[x] de eenheden van R zijn. Opgave 43. Bepaal de monische grootste gemene deler d en multiplicatoren s, t zodanig dat sf +tg = d voor: (i) f = x3 + 1, g = x5 + 1; (ii) f = x5 + 2x4 + 3x3 + 5x2 − 3, g = x4 + x2 − 6. Opgave 44. Ontbind de volgende polynomen in irreducibele factoren in Q[x], in R[x] en in C[x]: (i) x4 − 2; (ii) x8 − 1. Opgave 45. Ontbind de polynomen x3 − 1 en x5 − x in F5 [x] in irreducibele factoren. Opgave 46. Laat K een lichaam zijn en f ∈ K[x] met deg f = 3. Bewijs: f is reducibel dan en slechts dan als f een nulpunt in K heeft. √ Opgave 47. Bewijs dat met α = −1+2 −3 ∈ C de verzameling Z[α] = {a + bα : a, b ∈ Z} een ring vormt (met de gewone optelling en vermenigvuldiging). Teken de deelverzameling Z[α] ⊂ C. Opgave 48. Geef twee elementen f, g in Z[x] met grootste gemene deler 1, waarvoor géén elementen s, t ∈ Z[x] bestaan met sf + tg = 1. √ √ Opgave 49. Laat zien dat de afbeelding ψ : Z[ −5]∗ → Z gedefinieerd door ψ(a + b −5) = a2 + 5b2 √ (voor a, b ∈ Z) een groepshomomorfisme is. Bewijs vervolgens dat als u een deler is van v in Z[ −5], √ dan is ψ(u) een deler van ψ(v) in Z. Laat ook zien dat er geen u ∈ Z[ −5] is met ψ(u) = 2 of ψ(u) = 3, en bepaal alle u met ψ(u) = 6. Schrijf nu 6 op twee verschillende manieren als product van irreducibele √ √ √ elementen in Z[ −5]. Laat ook zien dat 6 en 3 + 3 −5 géén grootste gemene deler in Z[ −5] hebben! 23 1.4 Vectorruimten Nu zijn we in staat definities en stellingen uit Lineaire Algebra 1 en 2 te generaliseren. 1.4.1 Definitie Zij K een lichaam. Een K-vectorruimte is een verzameling V met een bewerking + en een afbeelding die aan elk paar (λ, v) ∈ K × V een element λv ∈ V toevoegt, die voldoen aan: [V1] [V2] [V3] [V4] [V5] [V6] [V7] [V8] de operatie + op V is associatief: (u + v) + w = u + (v + w), voor alle u, v, w ∈ V ; er is een (nul)element 0 ∈ V zodanig dat 0 + v = v + 0 = v voor alle v ∈ V ; bij elke v ∈ V is er een tegengestelde −v ∈ V zodanig dat v + (−v) = (−v) + v = 0; de operatie + op V is commutatief: v + w = w + v voor alle v, w ∈ V ; 1v = v voor alle v ∈ V ; λ(v + w) = λv + λw voor alle λ ∈ K en v, w ∈ V ; (λ + µ)v = λv + µv voor alle λ, µ ∈ K en v ∈ V ; (λµ)v = λ(µv) voor alle λ, µ ∈ K en v ∈ V . 1.4.2 Opmerkingen Vergeet niet dat de eis dat + een bewerking is oplegt dat [V0] v1 + v2 ∈ V voor alle v1 , v2 ∈ V . Een afbeelding K ×V → V , voor een lichaam K en een verzameling V , die aan V [5−8] voldoet wordt een scalaire vermenigvuldiging genoemd. Kort samengevat kunnen we dan zeggen dat een K-vectorruimte niets anders is dan een additieve groep (V, +) met daarop een scalaire vermenigvuldiging gedefinieerd. De elementen van K heten scalairen, die van V vectoren. Merk op dat bij een vectorruimte dus een lichaam hoort waaruit de scalairen komen. In Lineaire Algebra 1 werd onder vectorruimte het speciale geval van R-vectorruimte of reële vectorruimte verstaan. Het is ook mogelijk een struktuur analoog aan een vectorruimte maar dan algemener over een ring te definiëren, een zogenaamd R-moduul. 1.4.3 Voorbeelden (i) Uit Lineaire Algebra 1 ken je de ruimte R n bestaande uit n-tallen reële getallen (geschreven als rijvector of kolomvector) met de coördinaatsgewijze optelling en scalaire vermenigvuldiging. Net zo is de verzameling van alle rijtjes van n elementen uit een lichaam K een K-vectorruimte, die we met K n aangeven (voor n ≥ 1). Per definitie is K 0 = {0}. (ii) De verzameling van oneindige rijtjes elementen x 1 , x2 , . . . van K is een K-vectorruimte onder coördinaatsgewijze optelling en vermenigvuldiging, die we met K ∞ aangeven. (iii) Laat Mm×n (K) voor een lichaam K en positieve gehele getallen m, n de verzameling van m × n matrices met coëfficiënten in K zijn. Dan is Mm×n (K) een K-vectorruimte (onder optelling), als de scalaire vermenigvuldiging λM eruit bestaat elke coëfficiënt met λ te vermenigvuldigen. (iv) De verzameling van elementen van K[x] vormt met optelling en scalaire vermenigvuldiging λ(am xm + · · · + a1 x + a0 ) = (λam )xm + · · · + (λa1 )x + λa0 een K-vectorruimte. (v) Voor een willekeurige verzameling S vormt de verzameling van afbeeldingen φ : S → K naar een lichaam K een vectorruimte als we optelling definiëren door (φ1 + φ2 )(s) = φ1 (s)+φ2 (s) (voor s ∈ S) en scalaire vermenigvuldiging door (λφ)(s) = λ·φ(s) (voor s ∈ S, λ ∈ K). We geven die ruimte wel aan met K S . Merk op dat met S = {1, 2, . . . , n} we 24 K n vinden, dat K N = K ∞ en dat Mm×n (K) hetzelfde is als K S voor S = {1, 2, . . . , m}× {1, 2, . . . , n}. (vi) Met K = R en I een open interval van R is K S = RI de vectorruimte van reëelwaardige functies op I. Leggen we op dat de functies k-maal continu differentieerbaar zijn, dan geven we die ruimte wel met C (k) (I) aan. Zo bestaat C (0) (R) uit de continue functies. Opgave 50. Laat zien dat Rn een Q-vectorruimte is. Is Cn een R-vectorruimte? En is Qn een Rvectorruimte? 1.4.4 Definitie Een K-lineaire deelruimte van een K-vectorruimte V is een deelverzameling U ⊂ V met de eigenschap dat: (i) 0 ∈ U ; (ii) u1 + u2 ∈ U voor alle u1 , u2 ∈ U ; (iii) λu ∈ U voor elke λ ∈ K en u ∈ U . 1.4.5 Opmerkingen Net als in het reële geval geldt hier weer dat de naam K-lineaire deelruimte terecht suggereert dat het een deelverzameling U ⊂ V is die met de van V geërfde optelling en scalaire vermenigvuldiging zelf een K-vectorruimte vormt. In veel van de definities laten we de toevoeging K- wel weg als het onbelangrijk is, of duidelijk uit de context om welk lichaam het gaat. Opgave 51. Laat zien dat de eerste voorwaarde uit 1.4.4 gemist kan worden mits we eisen dat U nietleeg is; laat door twee voorbeelden zien dat geen van beide andere voorwaarden gemist kan worden. Opgave 52. Laat zien dat de convergente rijtjes y1 , y2 , . . . een lineaire deelruimte vormen van R∞ . 1.4.6 Definities Een K-lineaire combinatie van elementen v 1 , . . . , vk uit een K-vectorruimte V is een element λ1 v1 + · · · + λk vk ∈ V , waar λi ∈ K. Het K-opspansel van v1 , . . . , vk is de verzameling van alle K-lineaire combinaties van v1 , . . . , vk : hv1 , . . . , vk i = {λ1 v1 + · · · + λk vk | λ1 , . . . , λk ∈ K}. Een volledig stelsel (of ook wel opspannend stelsel vectoren voor een vectorruimte V is een verzameling {v1 , v2 , . . . , vk } ⊂ V zodat V = hv1 , v2 , . . . , vk i; we zeggen dat de vi de ruimte V opspannen (over K). Een K-basis voor een vectorruimte V is een volledig stelsel dat bovendien onafhankelijk is over K; hier heet v 1 , v2 , . . . , vk een onafhankelijk stelsel over K als voor λ1 , . . . , λk ∈ K geldt: λ1 v1 + · · · + λ k vk = 0 ⇒ λ1 = λ2 = · · · = λk = 0. Een stelsel dat niet onafhankelijk is heet natuurlijk afhankelijk. Op grond van de onderstaande stelling kunnen we voor de dimensie dim V van een vectorruimte V 6= {0} het maximale aantal n van onafhankelijke vectoren in V nemen als zo’n eindig getal n bestaat; als dat niet bestaat is de dimensie oneindig. De nulruimte {0} heeft per definitie dimensie 0. Zodra een basis B = {b1 , . . . , bn } voor een K-vectorruimte is gekozen, kan elk element v ∈ V op unieke manier gerepresenteerd worden door een coördinatenvector v = (v1 , . . . , vn )B ∈ K n , namelijk zo dat v = v 1 b1 + · · · + v n bn . 25 1.4.7 Opmerkingen Eigenlijk is het beter om een basis niet als verzameling te definiëren, want de volgorde doet er wel degelijk toe (voor de coördinatenvector bijvoorbeeld)! (Zie ook de opgave na 1.6.14.) Misschien vraag je je nu af wat Q[x] nu eigenlijk is — in de vorige sectie zagen we dat Q[x] een commutatieve ring was, en nu wordt opgemerkt dat Q[x] een Q-vectorruimte is. Het antwoord is: beide. Voor de vectorruimtestruktuur van Q[x] kijken we naar optelling van elementen van Q[x] en naar vermenigvuldiging van elementen van Q[x] met scalairen, dat wil hier zeggen: elementen van Q. Voor de struktuur van Q[x] als ring moeten we elementen van Q[x] vermenigvuldigen met elementen van Q[x], niet alleen van Q. Met andere woorden: Q[x] is een vectorruimte, die nog meer struktuur heeft omdat je twee elementen ook nog met elkaar kunt vermenigvuldigen. Vatten we Q[x] als vectorruimte op dan vergeten we die multiplicatieve struktuur. 1.4.8 Stelling [Hoofdstelling van de Lineaire Algebra] Als er een K-basis van de K-vectorruimte V is die uit n > 0 elementen bestaat, dan heeft elke K-basis van V precies n elementen. 1.4.9 Stelling Zij V een vectorruimte en n ≥ 1. Als {v 1 , . . . , vn } ⊂ V een volledig stelsel vormen, is elk stelsel {w1 , . . . , wm } ⊂ V met m > n afhankelijk. De bewijzen van deze twee stellingen in Lineaire Algebra 1 voor het geval K = R blijken op een enkel detail na (lees K in plaats van R) ook in het algemene geval te gelden: de laatste stelling bewijs je door te laten zien dat een homogeen stelsel van n vergelijkingen in m onbekenden altijd een oplossing heeft (in K) die niet de nul-oplossing is. Dan bewijs je de Hoofdstelling door te laten zien dat #B 1 ≤ #B2 en #B2 ≤ #B1 als B1 en B2 allebei bases voor V zijn, en dus moet #B1 = #B2 . 1.4.10 Voorbeelden (i) De dimensie van K n is n, en K ∞ heeft oneindige dimensie. De standaardbasis E = {e1 , . . . , en } van K n bestaat uit de vectoren 0 0 1 0 1 0 e1 = . , e 2 = . , · · · , e n = . . . . .. . . 1 0 0 (ii) Mm×n (K) is een vectorruimte van dimensie mn. Opgave 53. Is het over een willekeurig lichaam waar dat een homogeen stelsel van n vergelijkingen in m onbekenden (met m > n) oneindig veel oplossingen heeft? Opgave 54. Bewijs dat een homogeen stelsel van n vergelijkingen in m onbekenden over Z altijd oplossingen in Z heeft. Is het waar dat er altijd oneindig veel oplossingen in Z zijn als m > n? Opgave 55. Laat zien dat Q[x] een oneindig-dimensionale Q-vectorruimte vormt, door voor elke n > 0 een onafhankelijk stelsel van n elementen uit Q[x] aan te geven. 26 1.4.11 Stelling Elke lineaire deelruimte U van een eindig-dimensionale vectorruimte V is eindig-dimensionaal, en er geldt dim U ≤ dim V . Ook het bewijs van deze stelling verloopt precies zo als voor het speciale geval K = R: bewijs eerst een lemma. 1.4.12 Lemma Als {v1 , . . . , vn } een onafhankelijk stelsel vormen in de vectorruimte V , en w ∈ V \hv 1 , . . . , vn i, dan is {v1 , . . . , vn , w} onafhankelijk. Vervolgens laat je zien dat een maximaal onafhankelijk stelsel in U ⊂ V ten hoogste n = dim V elementen kan bevatten. Ook dat gaat over een willekeurig lichaam. Opgave 56. Het bewijs van het lemma over R gebruikte dat met ai , a ∈ R: a1 u1 + · · · + an un + av = 0 ⇒ v = b 1 u1 + · · · + b n un , met bi ∈ R. Laat met een voorbeeld zien dat dit niet waar is als je eist dat ai , a, bi ∈ Z. 1.4.13 Gevolgen In een eindig-dimensionale vectorruimte is elk onafhankelijk stelsel aan te vullen tot een basis, en is elk volledig stelsel uit te dunnen tot een basis. Opgave 57. Bewijs dat (voor elke n ≥ 1 en elk lichaam K) de diagonaalmatrices (met alleen nietnul elementen toegestaan op de diagonaal) een lineaire deelruimte van Mn×n (K) vormen. Bepaal de dimensie van deze ruimte en geef een basis. Opgave 58. Laat zien dat W1 en W2 lineaire deelruimten van Q5 zijn en W3 niet; bepaal ook de dimensie en een basis voor W1 en W2 . Hier is W1 = { (a, b, c, d, e) ∈ Q5 | a + b = c + d }, en W2 = { (a, b, c, d, e) ∈ Q5 | a = b = c en a + d + e = 0 }, en W3 = { (a, b, c, d, e) ∈ Q5 | a2 = b + 1 }. Opgave 59. Bewijs dat de doorsnede van twee lineaire deelruimten van een K-vectorruimte V weer een lineaire deelruimte van V is. Laat zien dat zelfs geldt dat ∩i∈I Wi een lineaire deelruimte van V is als alle Wi dat zijn, voor i ∈ I. Opgave 60. Geef een voorbeeld waaruit blijkt dat de vereniging van twee lineaire deelruimten van een K-vectorruimte V niet weer een lineaire deelruimte van V hoeft te zijn. Bewijs dat zelfs geldt voor lineaire deelruimten W1 , W2 van V dat: W1 ∪ W2 is een lineaire deelruimte van V dan en slechts dan als W1 ⊂ W2 or W2 ⊂ W1 . Opgave 61. Laat zien dat voor elk lichaam K en elk geheel getal n ≥ 0 de deelverzameling { f ∈ K[x] | deg f ≤ n } een lineaire deelruimte is van K[x]; deze ruimte zullen we wel met K[x](n) aangeven. Bepaal de dimensie van K[x](n) en geef een basis. 27 1.5 Lineaire Afbeeldingen Ook voor lineaire afbeeldingen herhalen we de belangrijkste definities en stellingen in de algemenere context van willekeurige vectorruimten in plaats van reële. Steeds is K een lichaam. 1.5.1 Definities Een K-lineaire afbeelding tussen K-vectorruimten V en W is een afbeelding f : V → W die voldoet aan (i) f (v1 + v2 ) = f (v1 ) + f (v2 ) voor alle v1 , v2 ∈ V ; (ii) f (λv) = λf (v) voor alle v ∈ V en λ ∈ K. Als V = W dan heet een K-lineaire afbeelding ook wel een (lineaire) transformatie of een endomorfisme. Als W = K (de K-vectorruimte van dimensie 1) dan heet een K-lineaire afbeelding ook wel een lineaire functionaal. Een isomorfisme (van vectorruimten) is een Klineaire afbeelding die tevens bijectie is; als er een isomorfisme tussen V en W bestaat heten ze isomorf: V ∼ = W (precieser: K-isomorf, notatie V ∼ =K W ). In het speciale geval dat W = V heet zo’n isomorfisme een automorfisme. Opgave 62. Is draaiing over π/4 een Q-lineaire afbeelding op de deelruimte Q2 van R2 ? Opgave 63. Bewijs dat een K-lineaire afbeelding f van V naar W een isomorfisme is dan en slechts dan als er een K-lineaire afbeelding g van W naar V bestaat met g ◦ f = idV en f ◦ g = idW . Deze g heet de inverse van f , en noteren we met g = f −1 , en f heet dan ook wel inverteerbaar. Opgave 64. Laat zien dat R en C niet isomorf zijn (als R-vectorruimte). Geldt Q ∼ =Q R? Opgave 65. Geef een isomorfisme tussen Mm×n (K) en K mn . 1.5.2 Opmerkingen Net als in het reële geval volgt onmiddellijk uit de definitie dat voor K-lineaire afbeelding geldt f (λ1 v1 + · · · + λn vn ) = λ1 f (v1 ) + · · · + λn f (vn ), als vi ∈ V en λi ∈ K, dus f is echt lineair. Onder isomorfismen worden belangrijke lineaire eigenschappen behouden, zoals (on)afhankelijkheid. Als twee K-vectorruimten dezelfde eindige dimensie n hebben, dan zijn ze isomorf: een isomorfisme wordt gegeven door de elementen van de basis van de één naar die van de ander af te beelden. Beide zijn dus isomorf met K n . Bij een lineaire afbeelding f : V → W horen twee lineaire deelruimten, namelijk de kern Ker(f ) ⊂ V en het beeld Im(f ) ⊂ W . Dan is f surjectief dan en slechts dan als Imf = W , en injectief dan en slechts dan als Kerf = {0}. Ook de volgende stelling geldt weer. 1.5.3 Stelling Als f : V → W een K-lineaire afbeelding is, en V is eindig-dimensionaal, dan zijn ook Ker(f ) en Im(f ) dat, en bovendien is dim Kerf + dim Imf = dim V. Opgave 66. Geef een isomorfisme van Q-vectorruimten tussen Q[x] en Q[π]. Zijn R[x] en R[π] ook isomorf? Wat is de dimensie van R als Q-vectorruimte? Opgave 67. Geldt K ∞ ∼ =K K[x]? 28 1.5.4 Matrices Net als in het reële geval kunnen we K-lineaire afbeeldingen tussen eindig-dimensionale Kvectorruimten altijd representeren met behulp van matrices; daarvoor is het nodig dat we een basis B = {b1 , . . . , bn } voor V kiezen en een basis C = {c1 , . . . , cm } voor W . Dan kunnen we f : V → W geven door middel van de matrix m11 m12 · · · m1n m21 m22 · · · m2n Mf = MfB,C = . .. .. ∈ Mm×n (K), . . . . . . . mm1 mm2 · · · mmn die aangeeft wat het beeld w (als coördinatenvector ten opzichte van de basis C) is van een vector v (gegeven als coördinatenvector ten opzichte van de basis B), namelijk w1 v1 m11 m12 · · · m1n m21 m22 · · · m2n v2 w2 Mf v = . .. .. = .. = w. .. .. .. . . . . . mm1 mm2 · · · mmn wm vn De matrix Mf is dus sterk afhankelijk van de keuze van de bases B en C. De kolommen van de matrix MfB,C bestaan uit beelden van de basisvectoren f (b 1 ), . . . , f (bn ), uitgedrukt op de basis C. Het samenstellen van lineaire afbeeldingen h = g ◦ f waar f : V → W en g: W → X, correspondeert met het vermenigvuldigen van de bijbehorende matrices: M h = Mg Mf , waarbij we dan wel moeten zorgen dat f en g gegeven worden ten opzichte van dezelfde basis C voor W: MhB,D = MgC,D MfB,C . Een transformatie f van V is inverteerbaar als er een inverse transformatie f −1 van V bestaat met de eigenschap dat f −1 ◦ f = f ◦ f −1 = idV , de identieke afbeelding op V . Voor eindigdimensionale vectorruimten is dat equivalent met de eis dat M f een inverteerbare matrix is, en dan is Mf −1 = Mf−1 . Laat V nu eindig-dimensionaal met basis B = {b 1 , b2 , . . . , bn } zijn, en f een lineaire transformatie van V die inverteerbaar is. Dan geeft f een automorfisme van V , en vormen de beelden {f (b1 ), . . . , f (bn )} ook weer een basis van V . De matrix M fB,B heeft in de i-de kolom de coördinatenvector van het beeld f (bi ) ten opzichte van de basis B. Nemen we als nieuwe basis C voor V de vectoren ci = f (bi ), dan kunnen we de matrix met in de i-de kolom de coördinaten van f (bi ) = ci op basis B natuurlijk ook interpreteren als de matrix van de afbeelding die ci geschreven op basis C stuurt naar ci geschreven op basis B. Met andere woorden, C,B Mid = MfB,B . Maar dan is de matrix die de bi op basis C schrijft ook gemakkelijk te vinden: B,C C,B Mid = Mid −1 = MfB,B −1 . C,B B,C De matrices Mid en Mid zijn van groot belang; ze geven coordinatentransformaties. Als B,C een vector v gegeven is op basis B, dan is M id (v) dezelfde vector maar dan uitgeschreven op de C,B basis C. Meestal is de matrix Mid gemakkelijk te vinden (omdat de kolommen de coördinaten B,C van de nieuwe basisvectoren op de oorspronkelijke basis B zijn) terwijl je de matrix M id wilt gebruiken om een vector op de nieuwe basis te schrijven. 29 1.5.5 Voorbeeld We doen een eenvoudig voorbeeld in R 3 . Laat B de standaardbasis zijn, ten opzichte waarvan de vector v gegeven is. Gevraagd is om de vector v uit te drukken op een nieuwe basis C, als bijvoorbeeld 1 2 5 −1 v = 2 , C = 0 , 1 , 1 . 1 0 3 0 Omdat de vectoren c1 , c2 , c3 hier een mooie ‘diagonaalvorm’ hebben, kun je het juist antwoord direct aflezen: v = 3c3 − c2 − 4c1 . In het algemeen is dat niet zo eenvoudig, maar volgt het antwoord uit B,C C,B −1 (v), Mid (v) = Mid C,B waar Mid als kolommen c1 , c2 , c3 op basis B heeft. Hier dus: −1 −1 2 1 5 −1 2 −1 5 −4 0 1 1 2 = 0 1 −1 2 = −1 , 0 0 1 3 0 0 1 3 3 hetgeen overeenkomt met wat we al zagen. C,B Laat Φ nu de matrix Mid zijn. Dan zijn we in staat om van een lineaire transformatie g van V gegeven ten opzichte van de basis B, ook de matrix van g ten opzichte van de nieuwe basis C te bepalen. Immers, om g ten opzichte van C te bepalen kunnen we eerst vectoren herschrijven van C naar B, dan de g ten opzichte van B nemen en tenslotte weer teruggaan naar de basis C. Dus: MgC = Φ−1 MgB Φ. Matrices A, B ∈ Mn×n (K) waarvoor een inverteerbare C ∈ M n×n (K) bestaat zodat A = C −1 BC heten geconjugeerd (met elkaar, in M n×n (K)). Het belangrijkste thema van de volgende hoofdstukken zal zijn om een met A geconjugeerde matrix te vinden die prettigere eigenschappen heeft dan A zelf, met andere woorden, om door overgang op een andere basis een mooiere matrix voor een gegeven afbeelding te vinden. Opgave 68. Laat zien dat ‘geconjugeerd zijn’ een equivalentierelatie op Mn×n (K) definieert. 1.5.6 Voorbeeld We geven een toepassing in V = R2 , namelijk om de matrix M` te bepalen, ten opzichte van de standaardbasis, van de lineaire afbeelding ` die een gegeven vector spiegelt in de lijn y = 3x. Laten we een speciale basis B = {b1 , b2 } kiezen voor R2 , en wel zo dat de eerste basisvector b 1 op ` ligt, en de tweede er loodrecht op staat. Dus, bijvoorbeeld, 1 −3 b1 = , b2 = . 3 1 De matrix M`B voor spiegeling in de lijn y = 3x ten opzichte van de basis B voor R 2 is eenvoudig, immers het beeld van b1 (die op ` ligt) is b1 zelf, en van b2 (die loodrecht op ` staat) wordt het spiegelbeeld −b2 ; met andere woorden: 1 0 B . M` = 0 −1 Volgens het bovenstaande is M`E = Φ−1 M`B Φ, 30 E,B waar Φ = Mid aangeeft hoe ei in B uit te drukken. Nu is −3 1 −3 −3 1 1 1 c2 , = + = c1 + e1 = 0 1 10 3 10 10 10 3 1 3 1 0 1 −3 = e2 = + = c1 + c2 , 1 1 10 3 10 10 10 dus Φ= zodat M`E = 1 −3 3 1 1 10 −3 10 3 10 1 10 −1 , Φ 1 0 0 −1 = 1 10 −3 10 3 10 1 10 1 −3 3 1 = , −8 10 6 10 6 10 8 10 . In dit geval was het gemakkelijk om Φ −1 op te schrijven, en moesten we moeite doen om Φ te vinden. Tot slot van deze sectie vatten we eigenschappen van de determinant samen. Deze eigenschappen kunnen voor een willekeurig lichaam K geheel analoog aan het geval K = R afgeleid worden; de determinant wordt dan gedefinieerd als de unieke multilineaire afbeelding op M n×n (K) die waarde 1 heeft op de eenheidsmatrix I n . Er geldt in de eerste plaats (en dit kan zelfs als definitie voor de determinant genomen worden) dat: (1) det(A) = A11 als A ∈ M1×1 (K); (2) det(A) = A11 A22 − A21 A12 als A ∈ M2×2 (K); P (n) det(A) = ni=1 (−1)i+j Aij det A(i,j) als A ∈ Mn×n (K) en 1 ≤ j ≤ n; waar (−1)i+j det A(i,j) de cofactor van Aij is, verkregen door de determinant van de (n − 1) × (n − 1)-matrix A(i,j) bestaande uit A waaruit de i-de rij en de j-de kolom zijn weggelaten met een teken te vermenigvuldigen. Hier kan deze ontwikkeling naar de j-de kolom ook vervangen worden door de ontwikkeling naar de j-de rij: P (n0 ) det(A) = nk=1 (−1)j+k Ajk det A(j,k) met 1 ≤ j ≤ n. In het bijzonder geldt voor een bovendriehoeksmatrix (onder de hoofddiagonaal staanQ allemaal nullen) en voor een benedendriehoeksmatrix (nullen boven de diagonaal) dat det A = ni=1 Aii . Ook geldt voor elke A dat de determinant gelijk is aan de determinant van zijn getransponeerde (verkregen door te speigelen in de hoofddiagonaal), dus det A = det A t . Uit multilineariteit volgt ook dat: • verwisseling van twee rijen (of kolommen) van A tot vermenigvuldiging van det A met −1 leidt; • vermenigvuldiging van een rij (of kolom) van A met een scalar λ tot vermenigvuldiging van det A met λ leidt; • het optellen van een veelvoud van een rij (of kolom) van A bij een andere rij (of kolom) det A ongemoeid laat. Omdat ook geldt: det AB = det A · det B voor elk tweetal A, B ∈ M n×n (K), hebben we dat A inverteerbaar is dan en slechts dan als det A 6= 0, en dan is det A −1 = (det A)−1 ; bovendien is, als A inverteerbaar is A−1 = (det A)−1 adjA, waar de geadjungeerde adjA van A ∈ Mn×n (K) gedefinieerd is als de matrix in M n×n (K) met op plaats i, j de cofactor (−1)j+i det A(j,i) . Let op dat dit de i, j-de cofactor van de getransponeerde van A is! 31 Opgave 69. Laat zien dat als R een commutatieve ring met 1 is, een element A ∈ Mn×n (R) inverteerbaar is als det R inverteerbaar is in R. Opgave 70. Laten f en g lineaire afbeeldingen zijn tussen K-vectorruimten V en W . Bewijs dat geldt: f = g dan en slechts dan als f (v) = g(v) voor alle v ∈ V dan en slechts dan als f (b) = g(b) voor elke b in een basis voor V . Opgave 71. Geef een isomorfisme tussen K[x](n) en K n+1 . Opgave 72. Laat zien dat de afbeelding d die aan f ∈ K[x] diens afgeleide f 0 toevoegt een lineaire transformatie van K[x] is. Kies een basis B voor K[x] en bepaal de matrix MdB2 . Bepaal ook een basis voor de kern en voor het beeld van d2 . 32 1.6 Enkele Constructies van Vectorruimten In deze sectie zullen we een aantal constructies van vectorruimten geven die we in het vervolg zullen gebruiken. 1.6.1 Definitie Als V en W twee K-vectorruimten zijn, dan vormt de verzameling van K-lineaire afbeeldingen van V naar W een K-vectorruimte (die we met Hom K (V, W ) aangeven) onder optelling, waar de som gedefinieerd is door: (f + g)(v) = f (v) + g(v), voor v ∈ V, wanneer f, g beide K-lineaire afbeeldingen van V naar W zijn, en scalaire vermenigvuldiging (λf )(v) = λ · f (v), voor v ∈ V, voor elke λ ∈ K. Als W = K, de 1-dimensionale K-vectorruimte, noemen we Hom(V, W ) = Hom(V, K) de duale ruimte van V , en gebruiken we de notatie V ∗ = Hom(V, K), terwijl we de elementen van die duale al lineaire functionalen noemden. 1.6.2 Stelling Als V en W eindig-dimensionale vectorruimten zijn met dim V = m en dim W = n, dan is Hom(V, W ) ∼ = Mn×m (K). Bewijs. Kies K-bases B voor V en C voor W . De afbeelding α: Hom K (V, W ) → Mn×m (K) die aan φ de matrix MφB,C toevoegt is surjectief, K-lineair, en heeft als kern slechts de nulafbeelding. 1.6.3 Gevolg Er geldt: dim Hom(V, W ) = mn, en in het bijzonder dim V ∗ = dim V = m. 1.6.4 Definities Zij V een K-vectorruimte van dimensie m, en laat B = {b 1 , b2 , . . . bm } een basis voor V zijn. We definiëren de lineaire functionalen b∗1 , b∗2 , . . . , b∗m door b∗i aan v = v1 b1 +· · ·+vi bi +· · ·+vm bm ∈ V het element vi ∈ K toe te laten voegen; deze b∗i heten de coördinatenfuncties van V (met betrekking tot B). Op grond van de volgende stelling wordt B ∗ = {b∗1 , b∗2 , . . . , b∗m } de duale basis van V met betrekking tot B genoemd. Opgave 73. Ga na dat b∗i (bj ) = δij , waar als gebruikelijk de Kronecker-delta gegeven is door δij = 1 als i = j en δij = 0 als i 6= j. 33 1.6.5 Stelling B ∗ = {b∗1 , b∗2 , . . . , b∗m } vormt een basis voor V ∗ . Bewijs. Op grond van het voorgaande Gevolg is het voldoende te laten zien dat de b ∗i onafhankelijk zijn (men ziet eenvoudig in dat het elementen van V ∗ zijn). Veronderstel daartoe dat λ1 b∗1 + λ2 b∗2 + · · · λm b∗m = 0 ∈ V ∗ , voor zekere λi ∈ K; dan is 0(bi ) = λ1 b∗1 (bi ) + λ2 b∗2 (bi ) + · · · λm b∗m (bi ) = λi , en dus zijn alle λi = 0. Hetgeen te bewijzen was. Opgave 74. Laat B = {(2, 1), (−1, 3)} Q-basis voor Q2 zijn. Bepaal B ∗ . 1.6.6 Stelling Voor een eindig-dimensionale vectorruimte V geldt: V ∼ = V ∗∗ . Bewijs. Definieer β: V → V ∗∗ door aan v ∈ V de afbeelding v̂: V ∗ → K toe te voegen waarvoor v̂(u∗ ) = u∗ (v) voor elke u∗ ∈ V ∗ . Dan is het gemakkelijk in te zien dat v̂ inderdaad een lineaire functionaal op V ∗ is, dus een element van V ∗∗ . Ook is eenvoudig in te zien dat β een isomorfisme is, als volgt. Lineariteit geldt omdat β(v1 + λv2 )(u∗ ) = u∗ (v1 + λv2 ) = u∗ (v1 ) + λu∗ (v2 ) = (β(v1 ) + λβ(v2 ))(u∗ ). Veronderstel dat β(v) = 0 ∈ V ∗∗ , dat wil zeggen dat v̂(u∗ ) = 0 voor elke u∗ ∈ V ∗ ; als v 6= 0 dan is {v} aan te vullen tot een basis {v, b 2 , . . . , bm } voor V . Maar dan is v̂(v ∗ ) = v ∗ (v) = 1 6= 0 in tegenspraak met het bewezene, dus volgt uit β(v) = 0 dat v = 0, met andere woorden, β is injectief. Tenslotte is dim V ∗∗ = dim V ∗ = dim V , en dus is β een isomorfisme. 1.6.7 Definitie Laten V en W eindig-dimensionale K-vectorruimten zijn van dimensie m en n. Als f een Klineaire afbeelding f : V → W is dan definiëren we de getransponeerde van f als de afbeelding f T : W ∗ → V ∗ waarvoor f T (w∗ ) = w∗ ◦ f . Opgave 75. Laat zien dat transponeren zo aan een element f ∈ Hom(V, W ) een element f T ∈ Hom(Hom(W, K), Hom(V, K)) toevoegt. 1.6.8 Stelling Laten V en W eindig-dimensionale K-vectorruimten zijn met bases V = {v 1 , . . . , vm } en W = {w1 , . . . , wn }. Dan geldt: ∗ ∗ MfWT ,V = (MfV,W )T . Bewijs. De essentiële stap in het bewijs is de volgende regel, die laat zien dat ten opzichte van de basis V ∗ de i-de coëfficiënt van f T (wj∗ ) (die op plaats i, j in de matrix voor f T staat), gelijk is aan (wj∗ ◦ f )(vi ) = wj∗ (α1i w1 + · · · + αni wn ) = αji , waar αrs op plaats r, s in de matrix voor f staat. 34 1.6.9 Definities Als V een K-vectorruimte is, en U een lineaire deelruimte, dan heet voor iedere v ∈ V de verzameling v + U = {v + u: u ∈ U }, een nevenklasse van U in V . Omdat v1 + U = v2 + U dan en slechts dan als v1 − v2 ∈ U , geldt dat v1 + U en v2 + U ofwel disjunct zijn, ofwel samenvallen: (v1 + U ) ∩ (v2 + U ) = of v1 + U = v2 + U. Daarom splitsen de nevenklassen de hele ruimte op in een disjuncte vereniging. Bovendien vormen de nevenklassen een vectorruimte, die we met V /U aangeven, als we optelling definiëren door (v1 +U )+(v2 +U ) = (v1 +v2 )+U en scalaire vermenigvuldiging door λ(v 1 +U ) = (λv1 )+U . De ruimte V /U is de quotiëntruimte van U in V . 1.6.10 Stelling Als V een eindig-dimensionale vectorruimte is, dan geldt voor elke lineaire deelruimte U : dim V /U = dim V − dim U. Bewijs. Vul een basis u1 , u2 , . . . , uk van U aan tot een basis u1 , . . . , uk , uP k+1 , . . . , um van V . Dan vormen uk+1 P +U, . . . , um +U een basis voor V /U . Een afhankelijkheid m λi (ui +U ) = i=k+1 Pm m 0 impliceert dat i=k+1 λi ui ∈ U , en dus het bestaan van λ1 , . . . , λk zodat i=k+1 λi ui − Pk van V is. Anderzijds j=1 λj uj = 0, in tegenspraak met het gegeven dat u 1 , . . . , um een basisP m impliceert datzelfde gegeven dat elke v ∈ V te schrijven is als v = i=1 λi ui , en omdat Pm Pk i=k+1 λi ui + U . i=1 λi ui ∈ U , is v + U = Als V eindig-dimensionaal is heet de dimensie van V /U wel de co-dimensie van U in V . Opgave 76. Geef een mooier (basiskeuze-vrij) bewijs van bovenstaande stelling door op de afbeelding φ : V → V /U , die aan v ∈ V de nevenklasse v + U toevoegt, de dimensiestelling 1.5.3 toe te passen. 1.6.11 Definitie Als W een K-vectorruimte is en V1 , V2 , . . . , Vk zijn lineaire deelruimten van W , dan is de som van die deelruimten de deelruimte gedefinieerd door V = k X i=1 Vi = V1 + V2 + · · · + Vk = {v1 + v2 + · · · + vk : vi ∈ Vi }. Een som heet een directe som (en we schrijven V = V 1 ⊕ V2 ⊕ · · · ⊕ Vk ) als geldt dat elke v ∈ V op precies één manier te schrijven is als v = v 1 + v2 + · · · + vk met vi ∈ Vi voor 1 ≤ i ≤ k. Opgave 77. Ga na dat de som V1 + · · · + Vk een lineaire deelruimte van W is. 1.6.12 Stelling Zij V een vectorruimte met lineaire deelruimten V 1 , V2 , . . . , Vk . Dan zijn de volgende beweringen equivalent: (i) V = V1 ⊕ V2 ⊕ · · · ⊕ Vk ; 35 P (ii) V = V1 + V2 + · · · + Vk en Vi ∩ j6=i Vj = {0} voor i = 1, 2, . . . , k; (iii) B1 , B2 , . . . , Bk vormen een basis voor V als Bi een basis voor Vi is (voor 1 ≤ i ≤ k). Bewijs. ((i)P ⇒ (ii)) Als V = V1 ⊕ V2 ⊕ · · · Vk dan zeker V = V1 + V2 + · · · Vk , en veronderstel dat v ∈ Vi ∩ j6=i Vj . Dan is 0 = 0 + 0 =P v + (−v) en dat geeft twee verschillende manieren om 0 ∈ V als som van elementen van Vi en j6=i Vj te schrijven (in tegenspraak met de aanname dat de som direct is), tenzij v = 0. (i) (i) ((ii) ⇒ (iii)) Laat Bi = {b1 , . . . , bni } een basis voor Vi zijn. Het is eenvoudig in te zien dat B = B1 , B2 , . . . , Bk dan een Popspannend stelsel voor V1 + V2 + · · · + Vk is. We moeten laten zien dat de voorwaarde Vi ∩ j6=i Vj = {0} voor i = 1, 2, . . . , k impliceert dat B een basis is. Veronderstel eens dat B geen basis is, dan is er kennelijk een afhankelijkheid van de vorm k X j=1 (j) (j) (λ1 b1 + · · · + λn(j)j bn(j)j ) = 0. (i) Veronderstel dat λr 6= 0 voor zekere 1 ≤ r ≤ ni ; als voor elke j 6= i en elke index m met (j) (i) (i) (i) (i) met het 1 ≤ m ≤ nj geldt dat λm = 0 dan is w = λ1 b1 + · · · + λni bni = 0, in tegenspraak P feit dat Bi een basis voor Vi is. Maar dan moet w 6= 0, en is w ∈ Vi en −w ∈ j6=i Vj , en dus zit w in de doorsnede van beide, in tegenspraak met onze aanname. Kennelijk kan er geen (i) λr 6= 0 bestaan: het stelsel B is onafhankelijk. ((iii) ⇒ (i)) Laat Bi een basis voor Vi zijn, en veronderstel dat B = B1 , B2 , . . . , Bk een basis voor V is; het is direct duidelijk dat V = V 1 + V2 + · · · + Vk , we moeten aantonen dat de som direct is. Veronderstel eens dat dit niet zo is, dat wil zeggen, er is een v ∈ V die twee Vi voor 1 ≤ i ≤ P k. Voor schrijfwijzen v = v10 + · · · + vk0 = v100 + · · · + vk00 heeft met vi0 , vi00 ∈ P tenminste één i is vi0 6= vi00 ; schrijf w 0 = vi0 en w00 = vi00 , en ook x0 = j6=i vj0 en x00 = j6=i vj00 . Dan is w0 + x0 = w00 + x00 = v, en dus w 0 − w00 = x00 − x0 . Schrijf elk van de vr0 en vr00 nu op de basis Br voor 1 ≤ r ≤ k, dan is w 0 − w00 een lineaire combinatie van de elementen van Bi en x00 − x0 een lineaire combinatie van elementen van ∪ j6=i Bj . Maar dan hebben we twee verschillende schrijfwijzen van hetzelfde element als lineaire combinatie van elementen van B, in tegenspraak met de veronderstelling dat het een basis voor V is. 1.6.13 Gevolg Als V = V1 ⊕ V2 ⊕ · · · ⊕ Vk dan is dim V = dim V1 + dim V2 + · · · + dim Vk . 1.6.14 Voorbeelden en Opmerkingen Elke vectorruimte is de directe som van de 1-dimensionale deelruimten opgespannen door een basisvector. Zo is K 3 natuurlijk te schrijven als K 3 = K ⊕ K ⊕ K = K · e1 ⊕ K · e2 ⊕ K · e3 , maar ook is K 3 = K 2 ⊕ K. Als U ⊂ V een lineaire deelruimte is, bestaat er altijd een deelruimte T ⊂ V zodat T ⊕ U = V . Dat is eenvoudig in te zien door een basis van U aan te vullen met vectoren t1 , . . . , tk tot een basis voor V . De ruimte opgespannen door de t i kan dan voor T genomen worden. De ruimte T heet in zo’n geval een complement van U . Opgave 78. Laat B = {b1 , b2 , b3 } een basis voor K 3 zijn. Laat zien dat K 3 = S1,2 + S2,3 waar Si,j voor i 6= j de ruimte opgespannen is door Bi,j = {bi , bj }. Laat ook zien dat K 3 6= S1,2 ⊕ S2,3 ; toch is B1,2 ∪ B2,3 = B. Dit is de reden dat in 1.6.12(iii) niet gewoon kunnen schrijven: ∪i Bi is een basis voor V als Bi een basis voor Vi is. 36 1.6.15 Definitie De directe som van vierkante matrices A (t) ∈ Mnt ×nt (K), for t = 1, 2, . . . k, is de vierkante matrix A ∈ Mn×n (K), met n = n1 + n2 + · · · + nk , gedefinieerd door: Ai,j (1) Ai,j (2) Ai,j .. = . (k) A i,j 0 0 < i, j ≤ n1 n1 < i, j ≤ n2 .. . n − nk = n1 + n2 + · · · + nk−1 < i, j ≤ nk elders. Dit schrijven we wel als A = A(1) ⊕ A(2) ⊕ · · · ⊕ A(k) = 1.6.16 A(1) 0 ··· 0 (2) 0 A ··· 0 .. .. .. .. . . . . (k) 0 0 ··· A . Opmerkingen Een matrix van de vorm heet wel een blok-diagonaal matrix bestaande uit k blokken. Elke matrix is een blok-diagonaal matrix bestaand uit 1 blok. Een n × n diagonaalmatrix is een blok-diagonaal matrix bestaande uit n blokken. Het verband tussen directe sommen van deelruimten en van matrices wordt gegeven in de stelling beneden; in volgende hoofdstukken zullen we ons bezighouden met het vinden van geschikte blokken. 1.6.17 Definitie Een lineaire deelruimte U van een vectorruimte V heet invariant met betrekking tot de lineaire transformatie φ als geldt dat φ(u) ∈ U voor alle u ∈ U . We schrijven ook wel φ[U ] ⊂ U . 1.6.18 Stelling Laat een eindig-dimensionale vectorruimte V met een lineaire transformatie φ gegeven zijn, en veronderstel dat er deelruimten U1 , U2 , . . . , Uk van V bestaan zodanig dat V = U1 ⊕U2 ⊕· · ·⊕Uk en Ui is invariant ten opzichte van φ. Dan geldt: M φ = M φ1 ⊕ M φ2 ⊕ · · · ⊕ M φk , wanneer φi = φ|Ui de beperking tot Ui is, en Mφ = MφB en Mφi = MφBi , waar B = B1 , B2 , . . . , Bk voor bases Bi van Ui . Bewijs Bekijk het beeld van een basis vector uit B j : dat is een lineaire combinatie van de vectoren uit Bj zelf, gegeven door de juiste kolom uit M φj . Opgave 79. Laat zien dat {0}, V , Kerφ en Imφ invariante deelruimten zijn voor elke lineaire transformatie φ van een vectorruimte V . Opgave 80. Als T en U beide K-vectorruimten zijn kunnen we hun directe product T × U definiëren als de verzameling {(t, u): t ∈ T, u ∈ U } met scalaire vermenigvuldiging λ(t, u) = (λt, λu), voor λ ∈ K. Laat zien dat T × U een K-vectorruimte is van dimensie dim T + dim U . 37 Opgave 81. Veronderstel dat T en U beide deelruimten zijn van de K-vectorruimte V . Definieer de lineaire afbeelding φ: T × U → V door φ(t, u) = t − u voor t ∈ T , u ∈ U . Gebruik φ om te bewijzen dat dim(T + U ) − dim(T ∩ U ) = dim T + dim U . 38 Hoofdstuk 2 Eigenwaarden en Diagonaliseerbaarheid 2.1 Diagonaliseerbaarheid Zoals we zagen hangt de matrix die behoort bij een lineaire transformatie af van de keuze van een basis voor de ruimte. In dit hoofdstuk buigen we ons eerst over de vraag of er altijd een basiskeuze bestaat waarvoor de matrix diagonaalvorm heeft. 2.1.1 Definities Een matrix D ∈ Mn,n (K) heet diagonaalmatrix als Di,j = 0 voor alle i 6= j, (met 1 ≤ i, j ≤ n). Een matrix M ∈ Mn,n (K) heet diagonaliseerbaar als er een met M geconjugeerde matrix bestaat die diagonaalmatrix is. Een lineaire transformatie T van een eindig-dimensionale vectorruimte V heet diagonaliseerbaar als er een basis B bestaat zodat M TB een diagonaalmatrix is. Opgave 82. Laat zien dat de diagonaalmatrix D = dIn met constante diagonaal commuteert met elke andere n × n matrix. 2.1.2 Stelling Een lineaire transformatie T van een eindig-dimensionale vectorruimte V is diagonaliseerbaar dan en slechts dan als MTB diagonaliseerbaar is voor elke basis B van V . Bewijs. Duidelijk. Laat nu T een diagonaliseerbare lineaire transformatie zijn, en B = {b 1 , b2 , . . . , bn } een basis ten opzichte waarvan MTB = D een diagonaalmatrix is. Dan is Db i = Di,i bi , met Di,i ∈ K, met andere woorden: de vectoren bi worden door D met een factor Di,i vermenigvuldigd. Omgekeerd, als je in V een basis B = {b 1 , b2 , . . . , bn } kunt vinden zodanig dat T bi = di bi , dan is MTB de diagonaalmatrix D met op de diagonaal D i,i = di . 2.1.3 Definitie Een eigenvector voor een lineaire transformatie T van de K-vectorruimte V is een v ∈ V zodanig dat v 6= 0 en T v = λv, voor zekere λ ∈ K; deze λ heet de (bij v behorende) eigenwaarde voor T . Een eigenvector voor de matrix M ∈ M n,n (K) is een 0 6= v ∈ V met M v = λv voor zekere λ ∈ K; die λ heet de (bij v behorende) eigenwaarde voor M . De bij een eigenwaarde 39 λ van een transformatie T (of matrix M ) behorende eigenruimte E λ is de lineaire deelruimte van V bestaande uit de vectoren u ∈ V met T u = λu (danwel M u = λu), Eλ = {v ∈ V : T v = λv}. Opgave 83. Ga na dat Eλ een lineaire deelruimte van V is. We hebben boven, samenvattend, zojuist de volgende stelling bewezen. 2.1.4 Stelling Een lineaire transformatie T : V → V is diagonaliseerbaar dan en slechts dan als er een basis van V is die bestaat uit eigenvectoren voor T . 2.1.5 Opmerkingen Per definitie is de eigenschap dat v een eigenvector is voor een lineaire transformatie T niet afhankelijk van de keuze van een basis B voor de vectorruimte V ; in het bijzonder zal een eigenvector van T dus een eigenvector zijn voor M TB , voor elke basis B. Omgekeerd zal een eigenvector voor een MTB eigenvector voor T en dus voor elke M TB zijn. Het is duidelijk dat de eigenruimte bij de eigenwaarde 0 de kern van de transformatie (of matrix) is. Meetkundig, over R, is een vector v eigenvector voor T als zijn beeld een (reëel) veelvoud λv van v zelf is. Is λ > 1 dan wordt de vector opgeblazen, is 0 < λ < 1 dan wordt v ingekrompen. Met λ = 1 blijft v invariant. Is λ < 0 dan wordt v eerst gespiegeld in de oorsprong, waarna hetzelfde geldt met |λ| in plaats van λ. Opgave 84. Ga na dat bovenstaande meetkundige opmerkingen omtrent een reële vectorruimte gelden voor de hele lijn µv opgespannen door een eigenvector v. Opgave 85. Geef een voorbeeld van een lineaire transformatie die geen eigenvectoren heeft. 2.1.6 Voorbeeld Veronderstel dat A de matrix is van een lineaire transformatie van Q 2 (ten opzichte van de standaardbasis) met 1 3 A= . 4 2 Een berekening leert onmiddellijk dat 1 1 , = −2 A −1 −1 A 3 4 =5 3 4 , n 1 3 o de transformatie gegeven wordt door , zodat ten opzichte van de basis B = 4 −1 AB = −2 0 0 5 . Natuurlijk is het de kunst om die twee eigenvectoren te vinden. 40 2.2 Eigenruimten In deze paragraaf is V een n-dimensionale K-vectorruimte, met n > 0. Het is niet moeilijk in te zien wat de eigenwaarden van een lineaire transformatie kunnen zijn. Immers, λ is een eigenwaarde voor T dan en slechts dan als T v = λv voor een v ∈ V met v 6= 0, dat wil zeggen (λ − T )v = 0, oftewel v ∈ Ker(λ − T ). Hier is λ de vermenigvuldiging met de scalar λ, en dat schrijven we ook wel als λI, waar I = id V , de identieke afbeelding op V . We vinden onmiddellijk de volgende stelling. 2.2.1 Stelling Zij V een eindig-dimensionale K-vectorruimte. Dan is λ ∈ K een eigenwaarde voor T dan en slechts dan als U = Ker(λI −T ) niet {0} is, en in dat geval is U de bij λ behorende eigenruimte Eλ voor T . Omdat λ eigenwaarde voor T is dan en slechts dan als λ een eigenwaarde is voor M = M TB , waar B een basis voor V is, geldt dit dan en slechts dan als M v = λv = λI n v voor een v ∈ V met v 6= 0, dat wil zeggen (λIn − M )v = 0, oftewel v ∈ Ker(λIn − M ), waar In natuurlijk de n × n eenheidsmatrix is. 2.2.2 Gevolg Met notaties als boven, en B een basis voor V , geldt: λ ∈ K is eigenwaarde voor T dan en slechts als det(λIn − M ) = 0, waar M = MTB . 2.2.3 Definitie Zij M ∈ Mn×n (K); het polynoom pM (x) = det(xIn − M ) ∈ K[x] heet het karakteristieke polynoom van M . Voor een lineaire transformatie T van V met matrix M = M TB ten opzichte van een basis B voor V heet het polynoom p M ∈ K[x] een karakteristiek polynoom voor T . 2.2.4 Lemma Het karakteristieke polynoom van T hangt niet af van de keuze voor de basis B. 0 Bewijs. Als B en B 0 twee bases voor V zijn, geldt met M = M TB en M 0 = MTB dat M = CM 0 C −1 voor zekere C ∈ Mn×n (K). Dan is pM = det(xIn − M ) = det(xIn − CM 0 C −1 ) = det(C(xIn − M 0 )C −1 ) = det(xIn − M 0 ) = pM 0 , dat wil zeggen: de karakteristieke polynomen van M en M 0 zijn gelijk. 2.2.5 Opmerkingen We kunnen dus spreken van het karakteristieke polynoom van T , dat we met p T aan zullen geven. Bovendien hebben we bewezen dat λ ∈ K een eigenwaarde voor T is dan en slechts dan als het een nulpunt van het karakteristieke polynoom van T is. Met volledige inductie (naar n) is het duidelijk dat pT een polynoom in K[x] is van graad n. Op grond van de opgave na 1.3.18 weten we dan dat T niet meer dan n = dim V eigenwaarden kan hebben. Bij een gegeven eigenwaarde is de eigenruimte precies de kern van de afbeelding λI − T . Opgave 86. Bewijs dat voor het karakteristieke polynoom pT = pn xn +pn−1 xn−1 +· · ·+p1 x+p0 ∈ K[x] P van T : V → V geldt dat pn = 1, dat pn−1 = − i Mi,i en dat p0 = (−1)n det M , waar M = MTB voor 41 een willekeurige basis B voor V . De som M genoemd. 2.2.6 P i Mi,i van diagonaalelementen wordt het spoor van de matrix Voorbeeld Laat A= 1 1 4 1 de matrix van een lineaire transformatie van Q 2 ten opzichte van de standaardbasis zijn. Teneinde de eigenwaarden van A te vinden bepalen we λ − 1 −1 = (λ − 1)2 − 4 = (λ − 3)(λ + 1). det(λI2 − A) = −4 λ − 1 De eigenwaarden van de bij A horende transformatie zijn dus 3 en −1. Om E3 te vinden, moeten we Ker(3I2 − A) bepalen, dat wil zeggen de kern van de matrix waarvan we hierboven de determinant uitrekenden, met λ = 3 ingevuld: 2 −1 E3 = Ker(3I2 − A) = Ker . −4 2 v1 Voor vectoren v = in de eigenruimte E3 geeft dat maar één lineaire conditie, namelijk v2 1 2v1 = v2 . De eigenruimte bestaat dan uit alle (rationale) veelvouden van . 2 Net zo is E−1 de kern van −2 −1 , −4 −2 n −1 o zodat E−1 = µ :µ ∈ Q . 2 n 1 −1 o Om de matrix van de transformatie ten opzichte van de basis B = , in 2 2 plaats van de standaardbasis te bepalen, kunnen we volgens 1.5.4 dus A conjugeren met de matrix ΦE,B die een vector gegeven in basis B coordinaten uitdrukt in coordinaten ten opzichte van de standaardbasis; maar dan is 1 −1 MΦ = , 2 2 en dus de gevraagde matrix B A = MΦ−1 AMΦ = 1 −1 2 2 −1 1 1 4 1 1 −1 2 2 . Anderzijds weten we natuurlijk al precies wat het resultaat zal zijn: immers B is een basis bestaande uit eigenvectoren, en omdat de bijbehorende eigenwaarden 3 en −1 zijn zal het resultaat 3 0 B A = 0 −1 moeten zijn! Opgave 87. Ga na dat de identiteit AB = MΦ−1 AMΦ inderdaad geldt. De grootste nog resterende complicatie is gelegen in de mogelijkheid dat eigenwaarden met zekere multipliciteiten voorkomen. 42 2.2.7 Definitie De (algebraı̈sche) multipliciteit van een nulpunt α ∈ K van een polynoom f ∈ K[x] is de grootste k ≥ 1 waarvoor (x − α)k het polynoom f deelt in K[x]. Eerst laten we zien dat de situatie overzichtelijk is wanneer alle multipliciteiten 1 zijn. 2.2.8 Stelling Als xi eigenvector van T is met eigenwaarde λ i , en λi 6= λj voor 1 ≤ i < j ≤ k, dan zijn x1 , x2 , . . . , xk lineair onafhankelijk. Bewijs. Inductie naar k. Voor k = 1 is de stelling zeker waar. Veronderstel eens dat µ1 x1 + µ2 x2 + · · · + µk xk = 0, met k > 1, en xi als in de stelling. Er geldt dan (T − λk )(µ1 x1 + µ2 x2 + · · · + µk xk ) = (λ1 − λk )µ1 x1 + · · · + (λk−1 − λk )µk−1 xk−1 = 0. Op grond van de inductiehypothese is x 1 , x2 , . . . , xk−1 lineair onafhankelijk, dus (λj − λk )µj = 0, voor j = 1, 2, . . . , k − 1, en omdat λj 6= λk moet µj = 0, voor j = 1, 2, . . . , k − 1. Maar dan ook µk = 0, en we zijn klaar! 2.2.9 Gevolg Als T over K precies n verschillende eigenwaarden heeft is T diagonaliseerbaar over K. Bewijs. De n = dim V verschillende eigenvectoren x i zijn op grond van voorgaande stelling onafhankelijk en vormen dus een basis voor V , ten opzichte waarvan T diagonaalvorm heeft. Let wel dat er in feite twee voorwaarden staan in dit gevolg: alle nulpunten van het karakteristieke polynoom moeten in K liggen en ze moeten ook allemaal verschillend zijn! Opgave 88. Geef een voorbeeld van een lineaire transformatie van Q2 die pas aan de voorwaarden van het gevolg voldoet als we hem opvatten als transformatie van R2 . 2.2.10 Stelling Als T een diagonaliseerbare transformatie van de eindig-dimensionale K-vectorruimte V is, dan splitst het karakteristieke polynoom p T (x) ∈ K[x] in K[x] volledig in lineaire factoren. Bewijs. Ten opzichte van zekere basis is T een diagonaalmatrix; op de diagonaal staan dan de eigenwaarden λi van T . Die moeten in het lichaam K zitten, en dus valt p T over K uiteen in de lineaire factoren x − λi . Let wel: het belangrijkste van de laatste stelling is dat p T al over het lichaam K in lineaire factoren uiteen valt. Dat garandeert natuurlijk nog niet dat alle eigenwaarden verschillend zijn. De omkering van Stelling 2.2.10 blijkt ook niet te gelden! 43 2.2.11 Voorbeeld Beschouw de lineaire transformatie van Q 3 gegeven 3 1 A = −1 0 −1 −1 Het karakteristieke polynoom van A is door −2 5 . 4 det |λI3 − A| = (λ − 2)2 (λ − 3). Om E2 te bepalen kijk je naar de kern van −1 −1 2 1 2 −5 ; 1 1 −2 omdat de rang van deze matrix 2 is, zal de kern dimensie 1 hebben. Daarom is E 2 ook 1dimensionaal, net als E3 . Andere eigenwaarden zijn er niet, en dus kan er geen basis voor Q 3 zijn bestaande uit eigenvectoren: A is niet diagonaliseerbaar! Opgave 89. Bepaal E2 en E3 in dit voorbeeld. Het niet-diagonaliseerbaar zijn van A in het voorbeeld werd veroorzaakt doordat voor een zekere eigenwaarde (λ = 2) de multipliciteit van die eigenwaarde (2) groter was dan de dimensie van de eigenruimte Eλ (1). Opgave 90. Bewijs dat dit fenomeen niet op kan treden als de multipliciteit 1 is, door te laten zien dat als λ eigenwaarde is, er geldt dim Eλ ≥ 1. De dimensie van Eλ wordt ook wel de meetkundige multipliciteit van λ genoemd; de volgende stelling drukt dan uit dat de meetkundige multipliciteit ten hoogste gelijk is aan de algebraı̈sche multipliciteit. 2.2.12 Stelling Als T eigenwaarde λ met multipliciteit m heeft dan geldt 1 ≤ dim Eλ ≤ m. Bewijs. Omdat λ eigenwaarde is, geldt dim E λ ≥ 1 (zie voorgaande opgave). Voor de andere ongelijkheid vullen we een basis van de deelruimte E λ van dimensie ` aan tot een basis B voor V . Ten opzichte van die basis is de matrix D A , MTB = 0 C waar D= λ 0 ··· 0 0 λ ··· 0 . .. . . . . . . .. . 0 ··· 0 λ 44 , een ` × ` matrix is, en dus pT (x) = (x − λ)` det(xIn−` − C). De multipliciteit m van λ is dus minstens ` = dim E λ . In feite gebruiken we in het bewijs alleen maar een speciaal geval van het volgende lemma, dat we later nogmaals zullen gebruiken. 2.2.13 Lemma Als U een onder T invariante deelruimte van V is, dan is p T |U , het karakteristieke polynoom van de beperking van T tot U , een deler van p T . Bewijs. Vul een basis voor U aan tot een basis voor V ; dan wordt T ten opzichte van die basis gegeven door de matrix B A , M= 0 C waar B de matrix voor de beperking T | U is. De bewering volgt dan omdat det(λI n − M ) = det(λIk − B) det(λIn−k − C). Opgave 91. Bewijs dat laatste netjes! 2.2.14 Stelling Laat T een lineaire transformatie zijn van de K-vectorruimte V , van eindige dimensie n. Dan zijn de volgende beweringen equivalent: (i) T is diagonaliseerbaar; (ii) pT (x) splitst in K[x] in lineaire factoren: Y pT = (x − λ)mλ λ èn dim Eλ = mλ , waar λ de verschillende eigenwaarden van T doorloopt. (iii) V = ⊕λ Eλ . Bewijs. Als (i) geldt, splitst pT volledig in lineaire factoren over K volgens Stelling 2.2.10. Kies nu een basis B ten opzichte waarvan T door een diagonaalmatrix wordt gegeven; dan is elke bi ∈ B eigenvector bij één van de eigenwaarden λ van T , en bovendien is het duidelijk dat Bλ = {b ∈ B : T b = λb} een basis is voor Eλ , voor elke eigenwaarde λ. Maar dan is #Bλ = dim Eλ en X X X mλ = deg pT = n, dim Eλ ≤ #Bλ = n = #B = λ λ λ op grond van Stelling 2.2.12, dus moet dim E λ = mλ , voor elke eigenwaarde λ. Als λ0 6= λ dan is het duidelijk dat Eλ0 ∩ Eλ = {0}, want λ0 v = T v = λv voor een v in de doorsnijding. Omdat u0 en u zelfs lineair onafhankelijk zijn als u 0 ∈ Eλ0 en u ∈ Eλ , op grond van Stelling 2.2.8, vormt ∪λ Bλ dan een onafhankelijk stelsel in V als B λ een basis voor Eλ is. Geldt nu (ii), dan is n = # ∪λ Bλ , en dus is ∪λ Bλ een basis voor V , terwijl Eλ0 ∩ Eλ = {0}. Daaruit volgt (iii). Tenslotte volgt (i) direct uit (iii) omdat een basis voor E λ bestaat uit eigenvectoren van T . Ten opzichte van een basis voor V die bestaat uit de vereniging van bases voor de E λ heeft T dus een diagonaalmatrixvoorstelling. 45 De stelling zegt dus, onder andere, dat T diagonaliseerbaar is dan en slechts dan als V de directe som is van eigenruimten. Opgave 92. Bewijs dat dim Eλ = mλ dan en slechts dan als rang(λIn − M ) = n − mλ , waar M de matrix van de lineaire transformatie ten opzichte van een basis voor V is. Opgave 93. Laat zien dat als T een lineaire transformatie van een eindig-dimensionale V is en V is (i) (i) de directe som van invariante deelruimten Vi (met 1 ≤ i ≤ k), dan is pT het product van pT , waar pT het karakteristieke polynoom is van de beperking van T tot Vi , voor 1 ≤ i ≤ k. 2.3 Cayley-Hamilton Doel van deze paragraaf is te laten zien dat lineaire transformaties aan zekere algebraı̈sche vergelijkingen voldoen. Daartoe blijkt het nuttig te zijn om, voor een niet-nul vector w in een eindig-dimensionale K-vectorruimte V waarop een lineaire transformatie T werkt, te kijken naar w, T w, T 2 w, . . . en in het bijzonder naar lineaire relaties daartussen. Als T w lineair afhankelijk is van w = T 0 w moet w wel een eigenvector van T zijn. Is T w onafhankelijk van w, dan kan het zijn dat T 2 w lineair afhankelijk is van w en T w, enzovoorts. We kijken naar de kleinste k waarvoor T k w lineair afhankelijk is van w, T w, T 2 w, . . . , T k−1 w. Omdat de ruimte Tw opgespannen door alle T i w een lineaire deelruimte is van V bestaat er zo’n k. Bovendien is Tw invariant onder T . Er zijn coëfficiënten c0 , c1 , . . . , ck−1 ∈ K met T k w = c0 w + c1 T w + · · · + ck−1 T k−1 w, en hierin zijn een matrix voor Tw en diens karakteristieke polynoom nu eenvoudig uit te drukken. 2.3.1 Lemma Met notatie als boven geldt dat de matrix voor de beperking T | Tw van T tot Tw gegeven wordt door 0 0 0 · · · 0 0 c0 1 0 0 · · · 0 0 c1 0 1 0 · · · 0 0 c2 .. .. . . . . .. .. , . . . . M T |Tw = . . .. 0 0 . 0 0 ck−3 0 0 0 · · · 1 0 ck−2 0 0 0 · · · 0 1 ck−1 ten opzichte van de basis w, T w, , . . . , T k−1 w. Bovendien is het karakteristieke polynoom van T |Tw gelijk aan xk − ck−1 xk−1 − · · · − c1 x − c0 . Bewijs Voor de vorm van de matrix gebruikt men simpelweg dat T de basisvectoren T i w opschuift, voor 0 ≤ i ≤ k − 2, en de relatie voor T k w. De rest volgt direct. Opgave 94. Bewijs met inductie naar k dat het karakteristieke polynoom van de matrix uit het lemma inderdaad xk − ck−1 xk−1 − · · · − c1 x − c0 is. 2.3.2 Opmerkingen De matrix uit het voorafgaande lemma wordt wel de companion matrix van het polynoom xk − ck−1 xk−1 − · · · − c1 x − c0 genoemd. 46 In het volgende willen we uitdrukkingen van de vorm a 0 + a1 T + · · · + ak−1 T k−1 , voor een lineaire transformatie T van V , weer als lineaire transformatie van V opvatten. Het zal duidelijk zijn hoe dit moet: (a0 + a1 T + · · · + ak−1 T k−1 )v = a0 v + a1 T v + · · · + ak−1 T k−1 v, een combinatie van vermenigvuldiging met een scalar en het loslaten van T op een vector. Deze lineaire afbeeldingen vormen een ring, die we wel met K[T ] aangeven. Maken we een basiskeuze, dan kunnen we T door een matrix M T voorstellen, en de lineaire afbeelding a0 + a1 T + · · · + ak−1 T k−1 door a0 + a1 MT + · · · + ak−1 MTk−1 . We krijgen dan een ring K[MT ], die een deelring is van Mn×n (K). 2.3.3 Stelling [Cayley-Hamilton] Voor een lineaire transformatie T van een eindig-dimensionale vectorruimte V met karakteristiek polynoom pT geldt: pT (T ) = 0. Bovendien is, als MT een matrix voor T is ten opzichte van een basis voor V pT (MT ) = 0. Dat wil zeggen: T en MT voldoen aan hun eigen karakteristieke vergelijking. Bewijs. Om te laten zien dat pT (T ) = 0 (de nulafbeelding), moeten we laten zien dat pT (T ) : v 7→ 0 voor elke v ∈ V . Als v = 0, dan is pT (T )(v) = 0, omdat 0 het beeld van 0 is voor elke lineaire afbeelding. Als v 6= 0, bekijk dan Tv , de ruimte opgespannen door v, T v, T 2 v, . . .. Dit is een lineaire deelruimte van V , en daarom eindig-dimensionaal, zeg dim T v = k. Maar dan is de k + 1-ste vector T k v al bevat in v, T v, . . . , T k−1 v, dat wil zeggen, er bestaan coëfficiënten c0 , c1 , . . . , ck−1 in K zodat T k v = −c0 v − c1 T v · · · − ck−1 T k−1 v. Volgens Lemma 2.3.1 geldt nu pT |Tv (x) = xk + ck−1 xk−1 + · · · + c1 x + c0 , terwijl volgens Lemma 2.2.13 dit polynoom een deler is van p T . Dus is er een polynoom q(x) ∈ K[x] zodat pT (x) = q(x)(xk + ck−1 xk−1 + · · · + c1 x + c0 ). Substitueren we hierin T voor x, dan geeft dit pT (T ) = q(T )(T k + ck−1 T k−1 + · · · + c1 T + c0 ), een gelijkheid tussen twee lineaire afbeeldingen waarvoor het rechterlid toegepast op v beeld 0 heeft, vanwege bovenstaande relatie. Maar dan is dus ook p T (T )(v) = 0, zoals te bewijzen was. De bewering voor matrices volgt hieruit (of volgens een analoog argument). 47 2.3.4 Voorbeeld Laat T : Q3 → Q3 gegeven zijn door a −b + c b = a + c , c 3c zodat, ten opzichte van de standaardbasis {e 1 , e2 , e3 } de afbeelding gegeven wordt door: 0 −1 1 MT = 1 0 1 . 0 0 3 Daaruit volgt direct dat T e1 = e2 , en T 2 e1 = T e2 = −e1 . Daarom is de ruimte Te1 opgespannen door e1 , T e1 , T 2 e1 , . . . dezelfde als die opgespannen door e 1 en T e1 , dat wil zeggen door {e1 , e2 }. We zien op twee manieren dat het karakteristieke polynoom va de beperking tot T e1 het kwadratische polynoom x2 + 1 is: immers T 2 e1 = −e1 . Ook kunnen we kijken naar de matrix van beperking T |Te1 , namelijk 0 −1 M T |T1 = , 1 0 zodat volgens de definitie van het karakteristiek polynoom we p T |T1 = x2 + 1 krijgen. Dit polynoom deelt pT . Kijken we naar de ruimte Te3 opgespannen door e3 , T e3 , T 2 e3 , . . ., dan vinden we: 0 1 1 2 2 0 , T e3 = 1 1 4 , e3 = , T e3 = T = 1 3 3 9 en vervolgens 2 1 0 5 2 T 3 e3 = T 4 = 11 = 3 0 − 1 + 3 4 , 9 3 1 27 9 oftewel T 3 e3 = 3T 2 e3 − T e3 + 3e3 . Het karakteristieke polynoom is dus pT |Te (x) = x3 − 3x2 + x − 3 = (x2 + 1)(x − 3). 3 Op grond van de graad moet dit de hele p T zijn! Opgave 95. Bereken pT |Te (x) met behulp van de definitie. 3 2.3.5 Toepassingen De stelling van Cayley-Hamilton kan toegepast worden om bijvoorbeeld de onderstaande drie (met elkaar samenhangende) problemen op te lossen. Om de inverse van een (inverteerbare) matrix M ∈ M n×n (K) te bepalen, gebruikt men de algebraı̈sche relatie pM (M ) = 0: laat pM (x) = xk + ck−1 xk−1 + · · · + c1 x + c0 , dan geldt dus M (M k−1 + ck−1 M k−2 + · · · + c1 ) = −c0 , 48 zodat M −1 = M k−1 + ck−1 M k−2 + · · · + c1 . −c0 Opgave 96. Laat zien dat c0 = ± det M , en daarom c0 6= 0 voor een inverteerbare M . Om een (grote) macht van M (nu niet noodzakelijk inverteerbaar) te bepalen, zeg M m , kan men Cayley-Hamilton tezamen met het algoritme van Euclides gebruiken. Bepaal namelijk polynomen q en r zodanig dat xm = q(x)pM (x) + r(x), met deg r < deg pM . Dan is M m = q(M )pM (M ) + r(M ), zodat M m = r(M ). Het polynoom r heeft dan kleine graad (maar mogelijk grote coëfficiënten!). Net zo kan men het uitgebreide algoritme van Euclides toepassen om polynomen s en t te bepalen waarvoor s(x)pM (x) + t(x)xm = 1, wanneer M een inverteerbare matrix is. Deze gelijkheid van lineaire afbeeldingen (met rechts de identieke afbeelding 1 = id impliceert met Cayley-Hamilton dat M −m = t(M ). Omdat voor grote m de graad van t(x), die begrensd wordt door de graad van p M , veel kleiner is dan m, kan dit een goed manier zijn om een grote negatieve macht van een inverteerbare matrix uit te rekenen. Wederom kunnen de coëfficiënten van t(x) groot worden. 2.3.6 Voorbeeld Laat M= 2 1 1 −1 , dan vinden we eenvoudig pM (x) = x2 −x−3. Volgens Cayley-Hamilton is dus M 2 −M −3I = 0, zodat M −I . M −1 = 3 Opgave 97. Bereken pM op twee manieren. Opgave 98. Bereken (M − I)/3 en laat zien dat het de inverse van M is. Wanneer we met dezelfde M de beschreven methode toepassen om M 10 uit te rekenen, vinden we eerst de rest r(x) = 1159x + 1524 bij deling van x 10 door pM = x2 − x − 3; dan laat M 10 = r(M ) zich eenvoudig bepalen. Opgave 99. Bereken q(x) en r(x) zodat x10 = q(x)pM (x) + r(x). Opgave 100. Bereken r(M ), en vergelijk het resultaat (en de moeite!) met een directe berekening van M 10 . Opgave 101. Bepaal M −10 met de methode uit 2.3.5, en met behulp van de vorige opgaven. 2.4 Jordan normaalvorm We hebben reeds gezien dat lineaire transformaties niet altijd diagonaliseerbaar zijn. Een belangrijke reden is dat het karakteristieke polynoom niet noodzakelijk geheel in lineaire factoren splitst over het lichaam waarover we werken. Maar zelfs als dat wel het geval is — bijvoorbeeld wanneer we over de complexe getallen werken — zien we uit Stelling 2.2.14 dat het voor diagonaliseerbaarheid noodzakelijk is dat de dimensies van alle eigenruimten gelijk zijn aan de multipliciteiten van de bijbehorende eigenwaarden. 49 2.4.1 Voorbeeld Het is eenvoudig om een voorbeelden van lineaire transformaties te maken (in vectorruimten van eindige dimensie over een willekeurig lichaam!) die niet diagonaliseerbaar zijn terwijl het karakteristieke polynoom wel volledig in lineaire factoren uiteenvalt. Zorg er bijvoorbeeld voor dat 0 de enige eigenwaarde is, door een bovendriehoeksmatrix voor de transformatie te kiezen met bovendien op de diagonaal allemaal nullen. Dan is het karakteristieke polynoom gelijk aan xn , en 0 de enige eigenwaarde, met multipliciteit n. De eigenruimte bij λ = 0 is de kern van de matrix, waarvan de dimensie gelijk is aan n − r, met r de rang van de matrix. Zodra er niet-nul elementen in de bovendriehoek staan is de rang groter dan nul en dus de dimensie van de kern kleiner dan n. Wat we in deze paragraaf willen laten zien is dat een lineaire transformatie T van een eindigdimensionale vectorruimte V , mits het karakteristieke polynoom ervan geheel in lineaire factoren uiteenvalt, ‘bijna diagonaliseerbaar’ is, in een heel precieze zin. Namelijk, dat er dan een basis voor V bestaat ten opzichte waarvan de transformatie een matrix heeft die bestaat uit ‘bijna-diagonaal’ blokken. Preciezer, ten opzichte van die basis is de matrix van T de directe som van Jordan blokken, waar een k × k Jordan blok J k (λ) een k × k matrix van de vorm λ 1 0 ··· 0 0 λ 1 0 .. . . . . . . .. . . . . . .. 0 . λ 1 0 ··· 0 0 λ is. Een directe som van Jordan blokken heet een Jordan matrix. Opgave 102. Laat zien dat een Jordan matrix een diagonaalmatrix is dan en slechts dan als alle blokken afmeting 1 × 1 hebben. Q Opgave 103. Bewijs dat het karakteristieke polynoom van een Jordanmatrix gelijk is aan (x − λi ), waar de λi de diagonaalelementen van de matrix zijn. Opgave 104. Bewijs dat de dimensie van de eigenruimte bij de eigenwaarde λ van het Jordan blok J(λ) precies 1 is. Laat zien dat hieruit volgt dat de dimensie van Eλ voor een Jordanmatrix J gelijk is aan het aantal Jordanblokken J(λ) in de directe som die J vormt. Opgave 105. Geef vier 4 × 4 Jordanmatrices (over de rationale getallen) met uitsluitend eigenwaarde 2, en eigenruimten E2 van dimensie respectievelijk 1, 2, 3 en 4. 2.4.2 Definities Zij T een transformatie van de eindig-dimensionale vectorruimte V . Met I geven we de identieke afbeelding idV aan. Een vector v ∈ V met v 6= 0 is gegeneraliseerde eigenvector bij λ als er een k ∈ Z≥1 bestaat zodat (λI − T )k (v) = 0. De gegeneraliseerde eigenruimte bij λ van T is de deelruimte Gλ = {v ∈ V | ∃k ∈ Z≥1 : (λI − T )k (v) = 0}. Opgave 106. Laat zien dat een lineaire combinatie van twee gegeneraliseerde eigenvectoren bij λ inderdaad weer een gegeneraliseerde eigenvector bij λ is. Opgave 107. Als k minimaal is met de eigenschap dat (λI − T )k (v) = 0, dan is (λI − T )k−1 (v) een eigenvector van T . Toon dit aan en concludeer dat gegeneraliseerde eigenvectoren alleen kunnen optreden bij eigenwaarden λ van T . 50 Opgave 108. Laat zien dat Gλ invariant is onder T . Opgave 109. Bewijs dat Eλ ⊂ Gλ . Opgave 110. Bewijs dat alle basisvectoren gegeneraliseerde eigenvector zijn voor T als T ten opzichte van de basis een Jordanmatrix is. 2.4.3 Voorbeeld Laat de 6 × 6 Jordanmatrix J gegeven zijn als directe som van J 1 (2) ⊕ J2 (5) ⊕ J3 (2): 2 0 0 0 0 0 0 5 0 0 0 0 0 1 5 0 0 0 0 0 0 2 0 0 0 0 0 1 2 0 0 0 0 0 1 2 ten opzichte van de basis b1 , . . . , b6 . De vectoren b1 , b2 , b4 zijn dan eigenvectoren (bij eigenwaarden 2, 5, 2), terwijl b3 , b5 , b6 gegeneraliseerde eigenvector zijn, bij 5, 2, 2. Immers, (5I6 − J)(b3 ) = b2 , dus (5I6 − J)2 (b3 ) = 0, en net zo (2I6 − J)(b6 ) = b5 , en (2I6 − J)(b5 ) = b4 , zodat (2I6 − J)3 (b6 ) = (2I6 − J)2 (b5 ) = (2I6 − J)(b4 ) = 0. De ruimte G2 is de directe som van een 1-dimensionale en een 3-dimensionale deelruimte, terwijl E 2 dimensie 2 heeft. 2.4.4 Definitie Als v een gegeneraliseerde eigenvector van T is bij λ, en m minimaal zodat (λI − T ) m (v) = 0, dan noemen we (λI − T )m−1 (v), (λI − T )m−2 (v), . . . , (λI − T )(v), v, een cykel van gegeneraliseerde eigenvectoren voor T (van lengte m). Merk op dat de eerste vector in zo’n cykel eigenvector bij λ is en dat dit ook de enige eigenvector in de cykel is. 2.4.5 Lemma De vectoren in een cykel van gegeneraliseerde eigenvectoren voor T zijn lineair onafhankelijk. Bewijs. Met inductie naar de lengte m. Voor m = 1 is het duidelijk. Laat nu v m−1 , . . . v0 zo’n cykel zijn bij λ, en veronderstel dat µ m−1 vm−1 + · · · µ0 v0 = 0. Pas (λI − T ) toe: omdat (λI −T )vi = vi+1 voor i = m−2, . . . , 0 en (λI −T )vm−1 = 0, geeft dat µm−2 vm−1 +· · · µ0 v1 = 0. Volgens de inductiehypothese zijn dan µ i = 0 voor i = m − 2, . . . , 0 . Dan ook µm−1 vm−1 = 0 en dus µm−1 = 0 (want vm−1 6= 0 is eigenvector). In het voorbeeld zagen we dat bij Jordanblokken cykels van gegeneraliseerde eigenvectoren horen. Dat is algemeen waar. 2.4.6 Stelling De matrix van de transformatie T is ten opzichte van een basis B een Jordanmatrix dan en slechts dan als B een vereniging van cykels van gegeneraliseerde eigenvectoren is. Bewijs. Bij elk k × k Jordanblok hoort een cykel van lengte k, dat is duidelijk. Omgekeerd geeft zo’n cykel vk−1 , . . . v0 ook een Jordanblok, precies omdat steeds (λI − T )v i = vi+1 voor i = k − 2, . . . , 0 en (λI − T )vk−1 = 0. 51 Het idee is nu om bij elke eigenvector van T een cykel van gegeneraliseerde eigenvectoren van maximale lengte te maken, en als basis voor de ruimte de vereniging van die cykels te nemen. We moeten nog laten zien dat zo’n vereniging van cykels een linear onafhankelijk stelsel geeft, en dat we zo een aantal vectoren krijgen dat de dimensie van de hele ruimte is. We zagen al dat de cykels zelf louter onafhankelijke vectoren bevatten. De volgende steeling zegt dat cykels bij verschillende eigenwaarden ook onafhankelijk zijn. (Merk op dat uit het voorbeeld blijkt dat dat niet genoeg is: er kunnen ook verschillende cykels bij dezelfde λ zijn; merk ook op dat dit stelling 2.2.8 generaliseert.) 2.4.7 Stelling Als xi gegeneraliseerde eigenvector van T is bij eigenwaarde λ i , en λi 6= λj voor 1 ≤ i < j ≤ k, dan zijn x1 , x2 , . . . , xk lineair onafhankelijk. Bewijs. Inductie naar k. Voor k = 1 is de stelling zeker waar. Zij k > 1, en x i als in de stelling. Laat mi minimaal zijn met de eigenschap dat (λ i I − T )mi (xi ) = 0. Dan is, zoals we al zagen, wi = (λi I − T )mi −1 (xi ) eigenvector voor T bij de eigenwaarde λ i . Veronderstel nu eens dat µ1 x1 + µ2 x2 + · · · + µk xk = 0, dan is enerzijds k−1 Y i=i (λi I − T )mi ! · (λk I − T )mk −1 (µ1 x1 + µ2 x2 + · · · + µk xk ) gelijk aan 0, maar anderzijds gelijk aan µk k−1 Y i=i (λi I − T )mi ! · wk = µk k−1 Y i=i (λi − λk )mi · wi . Maar wk is eigenvector bij λk , dus niet nul, en ook is λi 6= λk . Maar dan moet µk = 0. Op grond van de inductiehypothese is x 1 , . . . , xk−1 lineair onafhankelijk, dus zijn alle µ i gelijk aan 0: alle xi zijn lineair onafhankelijk. 2.4.8 Gevolg Als Bi een basis is voor de gegeneraliseerde eigenruimte G λi , en λi 6= λj voor i 6= j dan is B1 , B2 , . . . Bk een onafhankelijk stelsel. 2.4.9 Lemma Als C1 , . . . , Ck cykels van gegeneraliseerde eigenvectoren van T zijn bij dezelfde eigenwaarde λ, en de eigenvectoren wi ∈ Ci vormen een lineair onafhankelijk stelsel, dan vormt C = C1 ∪ C2 ∪ · · · ∪ Ck een lineair onafhankelijk stelsel vectoren. Bewijs. Het bewijs gaat weer met inductie naar het aantal elementen n van C. Voor de inductiestap kijken we naar de deelruimte W opgespannen door n de elementen van C i ; die ruimte is invariant onder λI − T , en het beeld wordt opgespannen door de n − k vectoren uit C \ {w1 , . . . , wk } (de laatste vector uit elke cykel weggelaten). Onder de inductiehypothese heeft dat beeld dan dimensie precies n − k. De kern van λI − T bevat de k onafhankelijke eigenvectoren wi , en de dimensiestelling zegt dan dat W dimensie n heeft. 52 2.4.10 Gevolg Als het karakteristieke polynoom van de transformatie T op V volledig in lineaire factoren splitst, dan bestaat er een basis voor V ten opzichte waarvan de matrix van T Jordanmatrix is. Bewijs. Kies voor elke λ een basis voor E λ , en bij elke basisvector een cykel van gegeneraliseerde eigenvectoren. 2.4.11 Stelling Laat T een transformatie van de K-vectorruimte V zijn waarvoor het karakteristieke polynoom pT (x) over K splitst als pT (x) = (x − λ1 )m1 · · · (x − λk )mk (met λi 6= λj als i 6= j). Dan is voor i = 1, . . . , k: Gλi = Ker((λi I − T )mi ), dim Gλi = mi . Bewijs. Kies een basis B voor V ten opzichte waarvan T een Jordanmatrix heeft. Op de diagonaal komen precies mi eigenwaarden λi voor, dus dim Gλi ≥ mi . Anderzijds vormt een vereniging van bases voor Gλi een basis voor V , dus n= k X i=1 dim Gλi ≥ k X mi = n. i=1 Omdat per definitie Gλi ⊃ Ker((λi I − T )mi ), resteert slechts de bewering Gλi ⊂ Ker((λi I − T )mi ), te bewijzen. Omdat dim Gλi = mi kan geen cykel van gegeneraliseerde eigenvectoren in G λi langer zijn dan mi . Dus elke vector in dim Gλi is bevat in Ker((λi I − T )mi ). 2.4.12 Gevolg Onder dezelfde aannamen als in de voorgaande stelling geldt: T is diagonaliseerbaar ⇐⇒ ∀λ : Gλ = Eλ . Op de uniciteit van de Jordan normaalvorm (op volgorde van de blokken na) gaan we hier niet verder in. 53 Hoofdstuk 3 Inproductruimten 3.1 Bilineaire Vormen In dit hoofdstuk en het volgende gaan we gebruik maken van afstandsbegrip op reële en complexe vectorruimten. In het algemeen is er geen begrip afstand (of lengte) gedefinieerd in een lichaam. Maar in C, en dus in deellichamen daarvan, is dat wel het geval. Het afstandsbegrip in een vectorruimte wordt bepaald door het inproduct; dat is een speciaal geval van een bilineaire vorm, die we wel voor willekeurige lichamen kunnen definiëren. 3.1.1 Definitie Zij V een K-vectorruimte. Dan heet een afbeelding B : V × V → k, die aan v × w een getal B(v, w) toevoegt een bilineaire vorm als (1) Voor elke w ∈ V is de afbeelding Bw : V → k, gedefinieerd door Bw (v) = B(v, w), een k-lineaire afbeelding; en (2) Voor elke v ∈ V is de afbeelding Bv : V → k, gedefinieerd door Bv (w) = B(v, w), een k-lineaire afbeelding. We noemen B symmetrisch als B(v, w) = B(w, v) voor elke v, w ∈ V . We noemen B anti-symmetrisch als B(v, w) = −B(w, v) voor elke v, w ∈ V . Het zal duidelijk zijn waar de naam vandaan komt: een bilineaire afbeelding is lineair in beide argumenten v, w. Het belangrijkste voorbeeld van een bilineaire vorm wordt gegeven door het inproduct. 3.1.2 Voorbeelden P (1) Het gewone inproduct op Rn gegeven door B(v, w) =< v, w >= ni=1 vi wi is een bilineaire vorm. (2) Als A ∈ Mn×n (K) een n × n matrix is dan geeft de afbeelding B A (v, w) = v T Aw ∈ K een bilineaire vorm op K n . De volgende stelling drukt uit dat wanneer we in V een basis kiezen, zeg E = {e 1 , . . . , en }, B vastligt door de waarden B(ei , ej ) op deze basis. Bijgevolg kunnen we B representeren door een matrix, namelijk de matrix waarin op positie i, j de waarde van B(e i , ej ) staat. 54 3.1.3 Stelling Als B een bilineaire vorm is op een vectorruimte V met basis E = {e 1 , . . . , en }, dan geldt: B( n X αi ei , i=1 n X βj ej ) = n n X X αi βj B(ei , ej ) i=1 j=1 j=1 Bewijs. Gebruik achtereenvolgens lineariteit in het eerste en het tweede argument: B( n X αi ei , i=1 n X βj ej ) = j=1 n X αi B(ei , i=1 = n X n X n X βj ej ) j=1 αi βj B(ei , ej ). i=1 j=1 3.1.4 Definitie We noteren de matrix met op plek i, j het getal B(e i , ej ) met MEB of MB als de basis duidelijk is. Deze matrix heet de Gram matrix van B. 3.1.5 Stelling Zij B een bilineaire vorm. Zij C de bilineaire vorm gedefinieerd door C(v, w) = v T MBE w. Dan geldt B = C. Bewijs. Voor de lezer. 3.1.6 Opmerking Blijkbaar heeft elke bilineaire vorm de vorm van voorbeeld 3.1.2(2). Na basiskeuze is elke bilineaire vorm te schrijven als: β1 β1 α1 B( ... , ... ) = a11 α1 β1 + a12 α1 β2 + . . . + ann αn βn = (α1 , . . . , αn )A ... αn βn βn waar A de matrix (aij ) = MB is. Veel eigenschappen van een bilineaire vorm B zijn van de matrix M B af te lezen. 3.1.7 Stelling B is symmetrisch ⇐⇒ MB is symmetrisch. Bewijs. MB is symmetrisch dan en slechts dan als (M B )ij = (MB )ji voor alle i, j. Per definitie is (MB )ij = B(ei , ej ), dus symmetrie van MB is equivalent met: B(ei ,P ej ) = B(ejP , ei ) voor alle n n i, jP hetgeen volgens Stelling 3.1.3 het geval is dan en slechts dan als B( α e , i=1 i i j=1 βj ej ) = P n n B( j=1 βj ej , i=1 αi ei ) voor alle α1 , . . . , αn , β1 , . . . , βn , dat wil zeggen B(v, w) = B(w, v) voor alle v, w. In het bovenstaande hebben we niets geëist over de gekozen basis. Dus symmetrie is onafhankelijk van de keuze van basis. 55 3.1.8 Gevolg Voor bases E, F van V geldt: MBE symmetrisch ⇐⇒ MBF symmetrisch. Zoals we ons in het vorige hoofdstuk afvroegen of we een matrix die een lineaire afbeelding ten opzichte van een gekozen basis representeerde altijd op diagonaalvorm konden brengen door basisverandering, zo kunnen we hier dezelfde vraag stellen voor de matrix die een bilineaire vorm representeert. 3.1.9 Voorbeeld Zij V = R3 en laat B((α1 , α2 , α3 ), (β1 , β2 , β3 )) = α1 β1 − α1 β2 − α2 β1 + 2α2 β2 + 4α3 β3 . We bekijken het effect van het gebruik van een andere dan de standaardbasis E; zij bijvoorbeeld F := {f1 , f2 , f3 } = {e1 , e1 + e2 , 12 e3 }. Laten we eens kijken hoe B er ten opzichte van F uitziet. B(a1 f1 + a2 f2 + a3 f3 , b1 f1 + b2 f2 + b3 f3 ) 1 1 = B(a1 e1 + a2 (e1 + e2 ) + a3 e3 , b1 e1 + b2 (e1 + e2 ) + b3 e3 ) 2 2 1 1 = B((a1 + a2 )e1 + a2 e2 + a3 e3 , (b1 + b2 )e1 + b2 e2 + b3 e3 ) 2 2 1 1 = (a1 + a2 )(b1 + b2 ) − (a1 + a2 )b2 − a2 (b1 + b2 ) + 2a2 b2 + 4( a3 b3 ) 2 2 = a 1 b1 + a 2 b2 + a 3 b3 . Ten opzichte van deze basis is de bilineaire afbeelding gewoon het inproduct! Het is dus van belang om bilineaire vormen op verschillende bases te beschouwen. Met B F zullen we de bilineaire vorm ten opzichte van de basis F aangeven. In het voorgaande voorbeeld: B E ((α1 , α2 , α3 ), (β1 , β2 , β3 )) = α1 β1 − α1 β2 − α2 β1 + 2α2 β2 + 4α3 β3 en B F ((α1 , α2 , α3 ), (β1 , β2 , β3 )) = α1 β1 + α2 β2 + α3 β3 . De volgende Stelling geeft het verband tussen de matrix M BE = MBE en de matrix MBF = MBF aan. 3.1.10 Stelling −→E , de transformatiematrix die F in E Laten E en F bases voor V zijn, en zij T = Φ F I overvoert. Dan geldt: MBF = T T MBE T. Opgave 111. Bewijs deze bewering. Ging een matrix die een lineaire afbeelding representeerde onder basistransformatie over in een geconjugeerde matrix T −1 M T , de matrix van een bilineare vorm gaat over in T T MB T. 56 3.1.11 Definitie We noemen twee vierkante matrices M, N ∈ M n×n (K) equivalent als er een inverteerbare T bestaat zodat M = T T N T . We schrijven M ∼ N . Twee bilineaire vormen B en C noemen we equivalent (en we schrijven wel B ∼ C) als voor zekere basiskeuze geldt: M C ∼ MB . Met andere woorden: B en C zijn equivalent als er bases E, F bestaan zodat B E = CF . Opgave 112. Laat zien dat dit ook echt een equivalentierelatie definieert. Opgave 113. Als er een inverteerbare T is zodat T T MB T een diagonaalmatrix is dan is B symmetrisch. Bewijs dat. We kunnen ons (wederom) afvragen of een symmetrsiche matrix altijd equivalent is met een diagonaalmatrix. In dit geval is het antwoord ‘bijna altijd’ bevestigend. Eerst maar eens een uitzondering. 3.1.12 Voorbeeld Zij M= 0 1 1 0 ∈ M2×2 (F2 ). Dan is M niet equivalent met een diagonaalmatrix. Kijk maar: laat T een willekeurige inverteerbare matrix zijn dan a c 0 1 a b 2ca ad + bc T TM T = = b d 1 0 c d ad + bc 2bd en ad + bc = ad − bc = det(T ) 6= 0 in F2 . Dat dit niet werkt in dit geval heeft te maken met het feit dat in F 2 de gelijkheid 2 = 0 geldt. In een lichaam met 2 6= 0 gaat het wel goed. 3.1.13 Stelling Zij M een symmetrische matrix over een lichaam K van karakteristiek 6= 2. Dan is M equivalent met een diagonaalmatrix D. Bewijs. We geven een bewijs in de vorm van een algoritme, dat je precies vertelt hoe je D kunt construeren. We veronderstellen dat M ∈ M n×n (K). Stap 1: Als M een diagonaalmatrix is (bijvoorbeeld de nulmatrix, of een 1 × 1 matrix), dan ben je klaar. Stap 2: Veronderstel dat n ≥ 2. Allereerst moet je een v 1 vinden met v1T M v1 6= 0: Als er een diagonaalelement Mii 6= 0 is, kies dan v1 = ei (want eT i M ei = Mii ). Zijn alle elementen op de diagonaal 0 zoek dan i, j zodat M ij 6= 0. Neem v1 = ei + ej , T T T want (ei + ej )T M (ei + ej ) = eT i M ei + ei M ej + ej M ei + ej M ej = Mii + Mij + Mji + Mjj = Mij + Mji = 2Mij 6= 0. Stap 3: Laat w = M v1 , en bepaal de kern van de afbeelding f : V → K gedefinieerd door f (u) = uT w. Merk op dat dit een lineaire afbeelding is. Bovendien is f surjectief: laat a = f (v 1 ) ∈ K, dan is a 6= 0 door de keuze van v1 . Voor b ∈ K is f ((b/a)v1 ) = (b/a)f (v1 ) = b. Omdat n = dim(Kerf ) + dim(Imf ) heeft Ker(f ) ⊆ V dimensie n − 1. Laat {v2 , . . . , vn } een basis voor Kerf zijn. Stap 4: Maak nu Tn = (v1 , v2 , . . . , vn ), met de vectoren vi als kolommen. 57 Stel Tn is niet inverteerbaar. Dat is equivalent met: {v 1 , v2 , . . . , vn } is een afhankelijk stelsel. Omdat {v2 , . . . , vn } een onafhankelijk stelsel is, kan dat laatste alleen als v 1 ∈ {v2 , . . . , vn } = Ker(f ), oftewel f (v1 ) = 0; dat is in tegenspraak met de keuze in Stap 2. Dus Tn is inverteerbaar. Bovendien is TnT M Tn van de vorm a 0 0 0 M 0 waar M een symmetrische (n − 1) × (n − 1) matrix is, omdat (T nT M Tn )ij = viT M vj en vi M v1 = f (vi ) = 0 voor i > 1 want vi ∈ Ker(f ). 0 Ga nu naar Stap 1 en herhaal de procedure voor M . Het is duidelijk dat dit proces na eindig veel stappen een diagonaalmatrix D oplevert. Opgave 114. Ga na waar in het bewijs gebruikt is dat de karakteristiek van het lichaam geen 2 is. Tot slot van deze paragraaf introduceren we kwadratische vormen. 3.1.14 Definitie Een kwadratische vorm Q over een lichaam K in n variabelen is een homogeen polynoom van graad 2 met coëfficiënten in K, dus uit K[x1 , x2 , . . . , xn ]. 3.1.15 Opmerkingen Dat een polynoom P = P (x1 , x2 , . . . , xn ) in n variabelen homogeen van graad k is betekent dat wanneer we P schrijven als som van termen X P = pk1 ,k2 ,...,kn xk11 xk22 · · · xknn , met natuurlijke exponenten kj , een coëfficiënt pk1 ,k2 ,...,kn alleen maar ongelijk 0 mag zijn als k1 + k2 + · · · + kn = k. Een kwadratische vorm bestaat dus uit termen van de vorm q i,j xi xj (waar i en j gelijk kunnen zijn). Door substitutie kunnen we een polynoom over een lichaam K in n variabelen opvatten als een afbeelding van K n (of een willekeurige n-dimensionale K-vectorruimte V ) naar K; met andere woorden, via Q(v) = Q((v1 , v2 , . . . , vn )) = Q(v1 , v2 , . . . , vn ), kan een kwadratische vorm als afbeelding Q : K n → K worden opgevat. 3.1.16 Stelling Als K een lichaam is van karakteristiek ongelijk aan 2 dan is er een één-éénduidig verband tussen kwadratische vormen in n variabelen op K en symmetrische n × n matrices over K. Bewijs. Laat Q(x1 , x2 , . . . , xn ) = X qi,j xi xj . 1≤i≤j≤n Definieer dan de matrix P ∈ Mn×n (K) door Pii = qi,i en Pij = qi,j /2 voor i 6= j; hier is 1 ≤ i, j ≤ n. 58 3.1.17 Gevolg Over een lichaam van karakteristiek ongelijk 2 kunnen we met een kwadratische vorm Q in n variabelen een unieke symmetrische bilineaire vorm B op K n , voorzien van de standaardbasis, associëren. Dan geldt: Q(x) = B(x, x). Bewijs. Deze associatie volgt uit de stelling, omdat een symmetrische matrix P uit M n×n (K) correspondeert met een symmetrische bilineaire vorm op K n met een gegeven basis, via B(v, w) = v T P w. Dan is Q(x) = B(x, x). Opgave 115. Onder bovenstaande correspondentie geldt: B(v, w) = (Q(v + w) − Q(v) − Q(w))/2. 3.1.18 Voorbeeld Laat Q de kwadratische vorm in 3 variabelen over Q zijn gegeven door Q(x 1 , x2 , x3 ) = x21 + 5x1 x2 + 2x2 x3 + x23 . Dit is een homogeen polynoom, waarmee we de symmetrische matrix 1 25 0 5 0 1 2 0 1 1 associëren. Met Q correspondeert dan de symmetrische bilineaire vorm B(v, w) = v 1 w1 + 5/2v2 w1 + 5/2v1 w2 + v2 w3 + v3 w2 + v3 w3 . 3.2 Reëel-symmetrische bilineaire vormen In deze sectie laten we zien dat we symmetrische bilineaire vormen (en daarmee kwadratische vormen) op een reële vectorruimte onder equivalentie kunnen karakteriseren door drie invarianten. 3.2.1 Definitie Voor een reële diagonaalmatrix D definiëren we de 3 natuurlijke getallen n0 , n+ , n− als volgt: n0 (D) is het aantal nullen op de diagonaal van D, n + (D) is het aantal positieve elementen op de diagonaal van D, en n− (D) is het aantal negatieve getallen op de diagonaal van D. Voor een symmetrische bilineaire vorm B op een eindig-dimensionale reële vectorruimte V definiëren we dan n0 (B) = n0 (D), n+ (B) = n+ (D), n− (B) = n− (D), voor een diagonaalmatrix D met D ∼ MB . Merk op dat bij elke symmetrische B volgens Stelling 3.1.13 zo’n D bestaat. In het algemeen zijn er natuurlijk meerdere diagonaalmatrices die voldoen (je kunt immers bijvoorbeeld de basisvectoren verwisselen, of met een factor opblazen), maar de volgende stelling drukt uit dat dit toch een goede definitie is, namelijk, dat deze onafhankelijk is van de mogelijke keuze van D. Opgave 116. Als B = T T AT en T is inverteerbaar, dan is rang(B) = rang(A). 3.2.2 Stelling Laat B een bilineaire vorm op een reële n-dimensionale vectorruimte V zijn. Als D ∼ M B ∼ D 0 , met diagonaalmatrices D en D 0 , dan geldt: n0 (D) = n0 (D 0 ), n+ (D) = n+ (D 0 ), 59 n− (D) = n− (D 0 ). Bewijs. Merk eerst op dat ∼ een equivalentierelatie is, zodat de twee diagonaalmatrices D en D 0 voldoen aan D ∼ D 0 , oftewel er is een inverteerbare T zodat T T D 0 T = D. Nu is n0 (D) = n − rang(D) de dimensie van de kern van D, en net zo n 0 (D 0 ) = n − rang(D 0 ) de dimensie van de kern van D 0 . Maar omdat T inverteerbaar is, geldt rang(D) = rang(D 0 ) = r en dus n0 (D) = n0 (D 0 ). Laat B nu de basis van V zijn ten opzichte waarvan B matrix D = M BB heeft, dan is D 0 = T T D 0 T = D de matrix MBC waar C = T B. We ordenen deze bases zo dat de eerste p = n+ (D), resp. p0 = n+ (D 0 ) elementen b1 , . . . , bp en c1 , . . . , cp0 positieve waarden B(bi , bi ) en B(cj , cj ) opleveren, en de volgende m = n− (D), resp. m0 = n− (D 0 ) negatieve waarden. Veronderstel nu eens dat p = n+ (D) < n+ (D 0 ) = p0 ; omdat n = n0 + n+ + n− voor een diagonaalmatrix, geldt dan m = n− (D) > n− (D 0 ) = m0 . Bekijk nu de verzameling vectoren S = {b1 , b2 , . . . , bp , cp0 +1 , . . . cp0 +m0 }. Dat zijn er p + m0 < p + m = r. De lineaire afbeelding 0 f : V → Rp+m gegeven door f (v) = (B(v, b1 ), . . . , B(v, bp ), B(v, cp0 +1 ), . . . B(v, cp0 +m0 )) heeft een beeld van dimensie ≤ p+m0 < n−n0 (D) = r, dus kern van dimensie ≥ n−(p+m 0 ) > n − (n − n0 (D)) = n0 (D) = n − r, en daarom is er een w in de kern van f die niet bevat is in de ruimte opgespannen door {br+1 , . . . , bn }. Schrijf w op basis B en gebruik dat w ∈ Kerf , dan is voor 1 ≤ i ≤ p: 0 = f (w)i = B( n X wk bk , bi ) = wi B(bi , bi ), k=1 zodat B(w, w) = B( n X wk bk , k=1 n X wk bk ) = k=1 n X wk2 B(bk , bk ) = k=1 p+m X wk2 B(bk , bk ) < 0, k=p+1 omdat minstens één wk 6= 0. Schrijf vervolgens w op basis C, dan is voor p 0 + 1 ≤ j ≤ p0 + m0 : 0 = f (w)j = B( n X wk0 ck , cj ) = wj0 B(cj , cj ), k=1 zodat B(w, w) = B( n X k=1 wk0 ck , n X k=1 wk0 ck ) = n X k=1 0 2 wk0 B(ck , ck ) = p X 2 wk0 B(ck , ck ) > 0, k=1 omdat weer minstens één wk 6= 0. Maar dat is een tegenspraak! Omdat het geval n+ (D) > n+ (D 0 ) op precies dezelfde manier tot een tegenspraak leidt, moet n+ (D) = n+ (D 0 ), en dus ook n− (D) = n− (D 0 ). 3.2.3 Gevolg Twee symmetrische bilineaire vormen op een reële vectorruimte V zijn equivalent dan en slechts dan als hun invarianten n0 , n+ , n− hetzelfde zijn. 60 3.2.4 Gevolg Zij B een symmetrische bilineaire vorm op een reële vectorruimte V . Dan bestaat er een basis voor V zodanig dat voor elk tweetal vectoren v, w ∈ V met coördinaten vi , wi ten opzichte van deze basis geldt: B(v, w) = v1 w1 + · · · + vp wp − vp+1 wp+1 − · · · − vr wr , waar p = n+ (B) ≥ 0, en r = p + m met m = n− (B) ≥ 0. Bewijs. De bewering is equivalent met de bewering dat de Gram matrix van B een diagonaalmatrix is (ten opzichte van zekere basis) met op de diagonaal p getallen 1, dan m getallen −1 en tenslotte n − r getallen 0. Stelling 3.2.2 zegt dat een basis B bestaat zodat M B diagonaalmatrix D is met positieve Dii voor p 1 ≤ i ≤ p en negatieve Dii voor p + 1 ≤ i ≤ r. Vervangen we de basisvectoren bi door bi / |Dii | dan volgt de bewering. 3.2.5 Voorbeeld We bekijken het voorbeeld uit 3.1.18, en laten B op R 3 gegeven zijn door 1 25 0 M = 52 0 1 , 0 1 1 ten opzichte van de standaardbasis e 1 , e2 , e3 . Het algoritme uit het bewijs van 3.1.13 heeft het volgende effect. Omdat M11 6= 0 nemen we v1 = e1 ; dan heeft w = M v1 coördinaten 1, 5/2, 0 en de kern van de afbeelding f (u) = u1 + 5/2u2 wordt voortgebracht door van (−5/2, 1, 0) T en (0, 0, 1)T . Dat ebetekent dat we moeten kijken naar 1 0 0 1 25 0 1 − 25 0 1 0 0 T3T M T3 = − 25 1 0 52 0 1 0 1 0 = 0 − 25 1 , 4 0 0 1 0 1 1 0 0 1 0 1 1 en het algoritme met de 2 × 2 deelmatrix herhalen. We vinden 25 25 1 0 −4 1 −4 1 1 T 0 T2 M T2 = = 25 1 25 1 1 0 0 4 4 0 725 16 . Als diagonaalvorm van B vinden we dus (na normalisatie van de lengten): B(v, w) = v 1 w1 − v2 w2 + v 3 w3 . 3.2.6 Gevolg Bij elke kwadratische vorm Q in n variabelen x i over R bestaat een lineaire transformatie P T : Rn → Rn zodanig dat voor de variabelen yi , gegeven door y = T x geldt: Q(y) = ni=1 qi yi2 . Bovendien is het aantal qi dat positief, negatief, of nul is onafhankelijk van de keuze van T , en kan qi ∈ {−1, 0, 1} door geschikte keuze van T bereikt worden. Bewijs. Dit volgt onmiddellijk uit de resultaten van deze en de vorige paragraaf. 61 3.2.7 Voorbeeld Natuurlijk werkt het algoritme uit het bewijs van Stelling 3.1.13 altijd, zoals in het voorgaande voorbeeld. We geven een alternatieve methode om met de hand de ‘diagonaalvorm’ voor een kwadratische vorm te bepalen. Daarvoor bezien we hetzelfde geval als in het vorige voorbeeld, waar Q correspondeert met 1 25 0 5 0 1 , 2 0 1 1 dus Q(x1 , x2 , x3 ) = x21 + 5x1 x2 + 2x2 x3 + x23 . We proberen eerst alle termen met x 1 erin als sommen (of verschillen) van kwadraten te schrijven; 5 5 x21 + 5x1 x2 = (x1 + x2 )2 − ( x2 )2 , 2 2 en daarna hetzelfde voor x2 (bedenk dat net we een term met x22 hebben toegevoegd!): 5 5 2 −( x2 )2 + 2x2 x3 = −( x2 − x3 )2 , 2 2 5 zodat we vinden: 5 5 2 29 Q(x1 , x2 , x3 ) = (x1 + x2 )2 − ( x2 − x3 )2 + x23 . 2 2 5 25 Na overgang op nieuwe variabelen wordt dit: Q(y 1 , y2 , y3 ) = y12 − y22 + y32 . Opgave 117. Schets voor alle mogelijk waarden van (n+ , n− , n0 ) voor een symmetrische bilineaire B op R3 de oplossingsverzameling in R3 van Q(x1 , x2 , x3 ) = 0. 3.3 Inproductruimten We herhalen eerst de definitie van een reële inproductruimte. 3.3.1 Definities Een inproduct op een reële vectorruimte V is een symmetrische bilineaire vorm B op V waarvan de bijbehorende kwadratische vorm Q positief definiet is op V , dat wil zeggen, voor alle 0 6= v ∈ V geldt Q(v) = B(v, v) > 0. We geven zo’n inproduct meestal aan met < v, w > in plaats van B(v, w). De ruimte V voorzien van een inproduct heet een inproductruimte. √ De lengte of norm ||v|| van een v ∈ V is gedefinieerd door ||v|| = < v, v >. De afstand d(v, w) tussen twee vectoren v, w ∈ V is per definitie de lengte van de verschilvector: d(v, w) = ||v − w||. De hoek tussen niet-nul vectoren v, w ∈ V is de hoek φ waarvoor de cosinusregel geldt: cos φ = < v, w > . ||v|| · ||w|| Twee vectoren v, w staan loodrecht op elkaar (genoteerd als v ⊥ w) als hun inproduct 0 is: < v, w >= 0. We zeggen ook wel dat v en w orthogonaal zijn; algemener is een stelsel van vectoren v1 , v2 , . . . , vn orthogonaal als elk tweetal het is, dus < v i , vj >= 0 voor i 6= j. Het stelsel heet orthonormaal als het orthogonaal is en elk vector lengte 1 heeft: ||v i || = 1. Als W een lineaire deelruimte is van een inproductruimte V geven we met W ⊥ de lineaire deelruimte aan van vectoren die orthogonaal zijn met alle vectoren van W . Als verzameling is dus W ⊥ = {v ∈ V |∀w ∈ W :< v, w >= 0}. 62 3.3.2 Opmerkingen In een algemene K-vectorruimte kun je niet over positief definiet spreken; het is dan ook niet zo duidelijk hoe het lengtebegrip te generaliseren naar K-vectorruimten (maar we zullen dat straks wel doen voor complexe vectorruimten). Omdat deellichamen van R (zoals bijvoorbeeld Q) de ordening van R erven, kunnen we op vectorruimten over zulke lichamen wel eenvoudig dezelfde begrippen definiëren. Merk op dat de hoek tussen vectoren slechts bepaald is op veelvouden van 2π na; vaak legt men de hoek eenduidig vast door een representantensysteem modulo 2π te kiezen. Zowel 0 ≤ φ < 2π als −π ≤ φ < π wordt daarvoor wel genomen. De nulvector staat loodrecht op elke andere vector, maar maakt nooit deel uit van een orthogonaal stelsel. Een bondige manier om een orthonormaal stelsel te karakteriseren is door < v i , vj >= δij , het Kroneckersymbool. 3.3.3 Voorbeelden • Het standaardinproduct op Rn wordt gegeven door < v, w >= v1 w1 +· · ·+vn wn ; de lengte p 2 van v = (v1 , v2 , . . . , vn ) is dan ||v|| = v1 + v22 + · · · + vn2 . Voor n = 1 is die lengte dus de absolute waarde: ||v|| = |v|. De ruimte R n voorzien van het standaardinproduct wordt wel de n-dimensionale Euclidische vectorruimte genoemd. • Dit voorbeeld kwamen we ook al in Algebra 2 tegen: De verzameling van reëelwaardige, continue functies C([0, 1]) op het interval [0, 1] vormt een vectorruimte onder de gebruikelijke optelling van functies en vermenigvuldiging met scalairen. We kunnen deze tot een inproductruimte maken door Z 1 < f, g >= f (x)g(x)dx 0 als inproduct te nemen. • Op de vectorruimte Mn×n (R) van reële n × n matrices (onder optelling) kunnen we een inproduct definiëren door < M, N >= Tr(N T M ). Opgave 118. Laat zien dat alle inproducten op Rn equivalent zijn met het standaardinproduct (als bilineaire vorm). Opgave 119. Ga na dat Tr(N T M ) een inproduct definieert. De volgende stelling karakteriseert de inproducten onder de bilineaire vormen, aan de hand van hun bijbehorende matrices. Opgave 120. Laat zien dat als M ∼ N voor M, N ∈ Mn×n (R) dan det M > 0 ⇐⇒ det N > 0. 3.3.4 Stelling Als M = MB de matrix van de symmetrische bilineaire vorm B op de n-dimensionale reële vectorruimte V is ten opzichte van een willekeurige basis, dan geldt: B is een inproduct ⇐⇒ det M (k) > 0 waar M (k) de k × k ‘linksbovendeelmatrix’ (Mij )1≤i,j≤k is. 63 voor 1 ≤ k ≤ n, Bewijs Kies een basis E = {e1 , e2 , . . . , en } voor V ten opzichte waarvan M diagonaalvorm heeft. Als B een inproduct is, geldt M ii = B(ei , ei ) > 0. Voor elke 1 ≤ k ≤ n geldt bovendien dat B een inproduct is op de ruimte opgespannen door e 1 , . . . , ek , en daarop is MB = M (k) en det M (k) = M11 · · · Mkk > 0. Laat, omgekeerd, M = MB gegeven zijn ten opzichte van een basis E, en de eigenschap hebben dat de linksbovendeelmatrices M (k) allemaal positieve determinant hebben. Bepaal dan voor k = 1, 2, . . . , n met behulp van de Gram-Schmidt orthogonalisatiemethode vectoren f1 , f2 , . . . , fk uit e1 , e2 , . . . , ek met de eigenschappen dat f1 , f2 , . . . , fk en e1 , e2 , . . . , ek dezelfde deelruimte van V opspannen, dat f1 , f2 , . . . , fk een orthogonaal stelsel vormt en dat ||f 1 || · ||f2 || · · · ||fk || = det M (k) . Dan is ten opzichte van de basis f1 , . . . , fn de symmetrische vorm B gegeven door B(fi , fj ) = 0 als i 6= j en B(fi , fi ) = det M (i) / det M (i−1) > 0, voor i = 2, 3, . . . n, terwijl B(f1 , f1 ) = M11 > 0. Dus is B( n X i=1 λi fi , n X λi fi ) = n X λ2i B(fi , fi ) > 0. i=1 i=1 Vervolgens definiëren we complexe inproductruimten. Het is niet goed genoeg om naar bilineaire vormen te kijken, omdat de waarden van B(v, v) niet altijd reëel zijn (en dan geen zinnige ‘lengte’ geven). 3.3.5 Definities Een Hermitese vorm op een complexe vectorruimte V is een afbeelding H : V × V → C die voldoet aan: (1) Voor elke w ∈ V is de afbeelding Hw : V → k, gedefinieerd door Hw (v) = H(v, w), een C-lineaire afbeelding; en (2) Voor elke v, w ∈ V geldt H(v, w) = H(w, v), de complex geconjugeerde van H(w, v). Opgave 121. Laat zien dat een Hermitese H wel voldoet aan H(v, w1 + w2 ) = H(v, w1 ) + H(v, w2 ), maar dat H(v, λw) = λH(v, w). 3.3.6 Opmerkingen Vanwege de eigenschap uit de opgave noemt men H wel sesquilineair (‘anderhalf lineair’). Merk ook op dat een Hermitese H wél bilineair is op een reële (deel)vectorruimte, en dat H(v, v) ∈ R voor elke v ∈ V . 3.3.7 Definities Een complex inproduct is een positief definiete Hermitese vorm H op een complexe vectorruimte V , dus H(v, v) > 0 voor v ∈ V . Een paar bestaande uit V met een complex inproduct heet een complexe inproductruimte. 3.3.8 Voorbeelden • Het standaardinproduct op Cn wordt gegeven door < v, w >= v1 w1 +·p· ·+vn wn ; de lengte √ van v = (v1 , v2 , . . . , v√ v1 v1 + v2 v2 + · · · + vn vn = |v1 |2 + · · · + |vn |2 , n ) is dan ||v|| = 2 2 als we met |a + bi = a + b de modulus van een complex getal aangeven. Voor n = 1 is de lengte dus gewoon de modulus: ||v|| = |v|. 64 • De verzameling van complexwaardige, continue functies op het interval [0, 1] vormt een vectorruimte onder de gebruikelijke optelling van functies en vermenigvuldiging met scalairen. We kunnen deze tot een inproductruimte maken door Z 2π 1 f (x)g(x)dx < f, g >= 2π 0 als inproduct te nemen. • Op de vectorruimte Mn×n (C) van complexe n × n matrices (onder optelling) kunnen we een inproduct definiëren door < M, N >= Tr(N ∗ M ), waar N ∗ = N t de complexgeconjugeerde getransponeerde van N is (die soms ook wel ge-adjungeerde wordt genoemd). Opgave 122. Ga na dat 1 < f, g >= 2π Z 2π f (x)g(x)dx 0 inderdaad een inproduct op C C ([0, 2π]) definieert; waar wordt de continuı̈teit gebruikt? Opgave 123. Ga na dat Tr(N ∗ M ) een inproduct definieert. 3.3.9 Stelling Zij V een inproductruimte over het lichaam L der reële of complexe getallen. Dan: (i) (ii) (iii) (iv) voor elke v ∈ V en λ ∈ L geldt: ||λv|| = |λ| · ||v||; ||v|| ≥ 0; en bovendien geldt: ||v|| = 0 ⇐⇒ v = 0; voor elke v, w ∈ V geldt: | < v, w > | ≤ ||v|| · ||w||; voor elke v, w ∈ V geldt: ||v + w|| ≤ ||v|| + ||w||. Bewijs. Bewering (i) volgt onmiddellijk uit q p √ < λv, λv > = λλ < v, v > = |λ| < v, v >. In het bijzonder is < 0, 0 >= 0, en omdat vanwege het positief definiet zijn van < v, v > geldt √ ||v|| = < v, v > > 0 tenzij < v, v >= 0, volgt (ii). Als w = 0 geldt ongelijkheid (iii) trivialerwijze; neem nu aan w 6= 0. Dan is voor λ ∈ L: 0 ≤ ||v − λw||2 =< v − λw, v − λw >=< v, v > −λ < v, w > −λ < w, v > +λλ < w, w > . Met de speciale keuze: λ= < v, w > < w, w > levert dat het niet-negatief zijn van < v, v > − | < v, w > |2 | < v, w > |2 = ||v||2 − < w, w > ||w||2 en dan volgt (iii). Gebruik nu (iii) om te zien dat: ||v + w||2 =< v + w, v + w >= ||v||2 + < v, w > +< v, w > + ||w||2 ≤ ||v||2 + 2||v|| · ||w|| + ||w||2 hetgeen gelijk is aan (||v|| + ||w||) 2 . 3.3.10 Opmerkingen De ongelijkheden in 3.3.9(iii) en (iv) staan bekend als de Cauchy-Schwarz ongelijkheid en de driehoeksongelijkheid; voor het reéle geval zagen we deze al in Lineaire Algebra 2. 65 Hoofdstuk 4 Transformaties van Inproductruimten 4.1 Inleiding In de komende secties beschouwen we lineaire transformaties van reële en complexe inproductruimten die aan extra eigenschappen voldoen die betrekking hebben op het verband tussen transformatie en inproduct. Het zal blijken dat we daarmee ook eigenschappen kunnen afleiden voor zulke transformaties die met diagonaliseerbaarheid samenhangen. Steeds zullen we een begrip voor reële inproductruimten en een corresponderend begrip voor complexe inproductruimten invoeren, en bovendien begrippen die op de bijbehorende matrices slaan. We moeten ook sterker dan voorheen onderscheid maken tussen eindig- en oneindig-dimensionale vectorruimten. 4.2 Orthogonale en Unitaire Transformaties Het eerste paar begrippen zal blijken die transformaties te karakteriseren die zowel lengten als hoeken behouden. 4.2.1 Definitie Een lineaire afbeelding T : V → W tussen reële inproductruimten heet een isometrie als geldt dat < T v1 , T v2 >=< v1 , v2 > voor alle v1 , v2 ∈ V . Als T bovendien inverteerbaar is, dan heet T orthogonaal. 4.2.2 Stelling Zij T : V → W een lineaire afbeelding tussen reële inproductruimten met dim V = dim W eindig; dan geldt: T is een isometrie ⇐⇒ T is orthogonaal. Bewijs. De ene implicatie is duidelijk; voor de andere moeten we bewijzen dat een isometrie T inverteerbaar is. Omdat dim V = dim W = n < ∞ volstaat het injectiviteit van T te bewijzen, dat wil zeggen, te laten zien dat KerT = {0}. Veronderstel maar dat T v = 0; omdat < v, v >=< T v, T v >= 0 moet v = 0. 66 4.2.3 Definities We zeggen dat een lineaire afbeelding T : V → W tussen reële inproductruimten lengten behoudt als geldt ||T v|| = ||v|| voor alle v ∈ V ; we zeggen dat T hoeken behoudt als voor elk tweetal v1 , v2 geldt dat de hoek tussen T v1 en T v2 gelijk is aan de hoek tussen v1 en v2 . 4.2.4 Stelling Een lineaire afbeelding T : V → W tussen reële inproductruimten behoudt lengten en hoeken dan en slechts dan als T een isometrie is. Bewijs. Dit volgt direkt uit de definities van lengte, hoek, en isometrie. 4.2.5 Definitie Een matrix M ∈ Mn×n (R) heet orthogonaal wanneer M T M = In . Deze definitie zegt dus dat van een orthogonale M de kolommen een orthonormaal stelsel vormen. De volgende stelling laat zien dat het dubbele gebruik van dezelfde term ‘orthogonaal’ geen misverstand is. Opgave 124. Geldt voor een orthogonale matrix M dat M M T = In ? 4.2.6 Stelling Zij T een lineaire transformatie van de n-dimensionale reële inproductruimte V . Dan zijn equivalent: (i) de transformatie T is orthogonaal; (ii) er is een orthonormale basis E voor V zodat M TE een orthogonale matrix is; (iii) de matrix MTB is orthogonaal voor elke orthonormale basis B van V; (iv) T voert orthonormale bases voor V over in orthonormale bases. Bewijs. Voor een orthonormale basis B = {b 1 , . . . , bn } van V is < T bi , T bj > het inproduct van twee kolommen van MTB . Als T orthogonaal is, dan is het stelsel {T b 1 , . . . , T bn } ook weer orthonormaal, dat wil zeggen, MTB is een orthogonale matrix. Dus (i) impliceert (iii). De kolommen van MTB vormen de beelden van {b1 , . . . , bn } onder T ; als deze kolommen een orthonormaal stelsel vormen wanneer B dat is, voert T kennelijk elke orthonormale basis B over in een orthonormale basis T B. Dat is (iv). Als B een orthonormale basis voor V is, dan is < v, w >=< n X vi bi , i=1 n X wj bj >= j=1 n X vi wj < bi , bj >= i,j=1 n X vi wi . i=1 Als (iv) geldt, dan is ook T B = {T b1 , . . . , T bn } een orthonormaal stelsel, en < T v, T w >=< n X i=1 vi T b i , n X wj T bj >= n X i,j=1 j=1 dat wil zeggen: (i) geldt. 67 vi wj < T bi , T bj >= n X i=1 vi wi , Omdat het duidelijk is dat (iii) ook (ii) impliceert, hoeven we tenslotte nog slechts te laten zien dat uit (ii) ook weer (i) volgt. Als M TE orthogonaal is, dan is T E een orthonormaal stelsel, en volgt voor elk tweetal v, w ∈ V door ze op basis E te schrijven dat: < T v, T w >=< T n X vi ei , T i=1 net als < v, w >=< n X wj ej >= j=1 n X i=1 n X vi wj < T ei , T ej >= i,j=1 vi ei , n X wj ej >= n X vi wi , i=1 n X vi wi . i=1 j=1 Opgave 125. Laat zien dat de orthogonale n × n matrices over R een ondergroep vormen van de groep Gln (R). Het complexe analogon van de orthogonale afbeelding is de unitaire afbeelding; de naam wordt duidelijk uit de eerstvolgende stelling. 4.2.7 Definitie Een lineaire afbeelding T : V → W tussen complexe inproductruimten heet een unitaire afbeelding als geldt dat < T v1 , T v2 >=< v1 , v2 > voor alle v1 , v2 ∈ V , en bovendien dat T inverteerbaar is. 4.2.8 Stelling Voor een eigenwaarde λ van een unitaire transformatie geldt: |λ| = 1. Bewijs. Laat λ eigenwaarde zijn van de unitaire T , bij eigenvector v. Dan is < v, v >=< T v, T v >=< λv, λv >= λλ < v, v >, dus (1 − λλ) < v, v >= 0. Omdat v 6= 0 is < v, v >6= 0 en dus |λ| = 1. Opgave 126. Bewijs dat de eigenwaarden van een orthogonale afbeelding slechts ±1 kunnen zijn. 4.2.9 Definitie T Een matrix M ∈ Mn×n (C) heet unitair wanneer M M = In . 4.2.10 Stelling Zij T een lineaire transformatie van de n-dimensionale complexe inproductruimte V . Dan zijn equivalent: (i) (ii) (iii) (iv) de transformatie T is unitair; er is een orthonormale basis E voor V zodat M TE een unitaire matrix is; de matrix MTB is unitair voor elke orthonormale basis B van V; T voert orthonormale bases voor V over in orthonormale bases. Bewijs. Geheel analoog aan 4.2.6. De volgende stelling laat zien dat unitaire afbeeldingen altijd diagonaliseerbaar zijn. 68 4.2.11 Stelling Zij T een unitaire lineaire transformatie van een eindig-dimensionale complexe inproductruimte V . Dan heeft V een orthonormale basis bestaande uit eigenvectoren voor T . Bewijs. Met inductie naar de dimensie n van V . Als n = 1 is er niets te bewijzen. Veronderstel dat n ≥ 2; kies een eigenvector w voor T (dat kan altijd omdat we over de complexe getallen werken!). Die kunnen we eventueel normaliseren (tot lengte 1) door door de lengte te delen. Laat W nu de 1-dimensionale deelruimte van V opgespannen door w zijn. Omdat w eigenvector is en T inverteerbaar, is T [W ] = W . Beschouw ook W ⊥ ; dan is T [W ⊥ ] ⊂ T [W ]⊥ , want als u ∈ W ⊥ dan T u ∈ T [W ]⊥ daar < T u, T w >=< u, w >. Maar V = W ⊕ W ⊥ (dit volgt bijvoorbeeld uit Gram-Schmidt orthogonalisatie), zodat V = T [V ] = T [W ] ⊕ T [W ]⊥ = W ⊕ T [W ]⊥ zodat T beperkt tot W ⊥ een transformatie van een n − 1dimensionale deelruimte is, waarvoor de unitaire eigenschap natuurlijk nog steeds geldt. De orthonormale basis van W ⊥ bestaande uit eigenvectoren voor (de beperking van) T , die op grond van de inductiehypothese dan bestaat, kan met de genormaliseerde van w aangevuld worden tot zo’n basis voor heel V . 4.3 Symmetrische en Hermitese Transformaties De volgende begrippen hebben bepaalde symmetrie-eigenschappen ten aanzien van beide argumenten in een inproduct. 4.3.1 Definitie Een lineaire transformatie T : V → V van een reële inproductruimte heet een symmetrische transformatie als geldt dat < T v1 , v2 >=< v1 , T v2 > 4.3.2 voor alle v1 , v2 ∈ V . Stelling Zij T een lineaire transformatie van de n-dimensionale reële inproductruimte V . Dan zijn equivalent: (i) de afbeelding T is symmetrisch; (ii) er is een orthonormale basis E voor V zodat M TE symmetrisch is; (iii) de matrix MTB is symmetrisch voor elke orthonormale basis B van V. Bewijs. Ten opzichte van een orthonormale basis B = {b 1 , . . . , bn } van V is < T bi , bj >= Mji en < bi , T bj >= Mij , als Mkl de k-de coëfficiënt van de l-de kolom van M = MTB is, en die kolom is T bl . Als T symmetrisch is, geldt Mij =< bi , T bj >=< T bi , bj >= Mji , dus M is een symmetrische matrix. Daarom volgt (iii) uit (i). Het is duidelijk dat (ii) uit (iii) volgt. Als (ii) geldt voor de orthonormale basis E = {e 1 , . . . , en } van V , dan is < T v, w >=< n X i=1 vi T e i , n X j=1 69 wj ej >= n n X X i=1 j=1 vi wj Mji , voor elke v, w, en < v, T w >=< n X i=1 vi ei , n X wj T ej >= j=1 n X n X vi wj Mij . i=1 j=1 Beide inproducten zijn gelijk als M = M TE een symmetrische matrix is, en dan is T een symmetrische transformatie. Dus (i) volgt uit (ii). Het complexe analogon van de symmetrische afbeelding is de Hermitese afbeelding. 4.3.3 Definitie Een lineaire transformatie T : V → V tussen van een complexe inproductruimte heet een Hermitese transformatie als geldt dat < T v1 , v2 >=< v1 , T v2 > 4.3.4 voor alle v1 , v2 ∈ V . Stelling Voor een complexe eigenwaarde λ van een Hermitese afbeelding geldt: λ ∈ R. Bewijs. Laat λ eigenwaarde zijn van de Hermitese T , bij eigenvector v. Dan is λ < v, v >=< λv, v >=< T v, v >=< v, T v >=< v, λv >= λ < v, v >, dus (λ − λ) < v, v >= 0. Omdat v 6= 0 is is λ = λ. 4.3.5 Definitie T Een matrix M ∈ Mn×n (C) heet Hermites wanneer (M ∗ =)M = M . 4.3.6 Stelling Zij T een lineaire transformatie van de n-dimensionale complexe inproductruimte V . Dan zijn equivalent: (i) de afbeelding T is Hermites; (ii) er is een orthonormale basis E zodat M TE Hermites is; (iii) de matrix MTB is Hermites voor elke orthonormale basis B van V; Bewijs. Geheel analoog aan 4.3.2. Ook Hermitese afbeeldingen blijken weer diagonaliseerbaar te zijn. 4.3.7 Stelling Zij T een Hermitese lineaire transformatie van een eindig-dimensionale complexe inproductruimte V . Dan heeft V een orthonormale basis bestaande uit eigenvectoren voor T . Bewijs. Het bewijs is vrijwel gelijk aan dat van 4.2.11, en gaat met inductie naar n = dim V . Als n = 1 is er niets te bewijzen. Voor n ≥ 2 kiest men weer een eigenvector w voor T , en laat W de 1-dimensionale deelruimte van V opgespannen door w zijn. Wederom is T [W ] ⊂ W en T [W ⊥ ] ⊂ W ⊥ ; dat laatste omdat voor u ∈ W ⊥ en voor alle y ∈ W nu geldt dat 0 =< u, T y >=< T u, y >, dus T u ∈ W ⊥ . Vanwege V = W ⊕ W ⊥ en de inductiehypothese volgt de bewering. In dit geval geldt een zelfde conclusie voor het reële geval. 70 4.3.8 Gevolg Zij T een symmetrische lineaire transformatie van een eindig-dimensionale reële inproductruimte V . Dan heeft V een orthonormale basis bestaande uit eigenvectoren voor T . Bewijs. Kies een orthonormale basis B voor V , dan is M TB een reëel symmetrische matrix, die ook een transformatie T̂ op Cn (met n = dim V ) definieert. Bovendien is T̂ Hermites, zodat T̂ een eigenvector w heeft met eigenwaarde λ ∈ R volgens 4.3.4. Het reële (of het imaginaire) deel van w is dan een reële eigenvector van T̂ , en dus van T . Maar dat betekent dat bij elke symmetrische T een reële eigenvector gevonden kan worden, en dus kan het bewijs met inductie net zo uitgevoerd worden als van stelling 4.3.7. Opgave 127. Laat zien dat als A, B Hermitese matrices zijn, ook AB + BA en i(AB − BA) Hermites zijn. Geldt hetzelfde met symmetrisch in plaats van Hermites? Opgave 128. Laat zien dat AB niet noodzakelijk Hermites is als de matrices A en B het zijn. Opgave 129. Laat A ∈ M3×3 (R) de matrix 1 −2 −2 1 −2 −2 1 3 −2 1 −2 zijn. Bepaal een orthonormale basis van eigenvectoren van A en bepaal ook een B ∈ M 3×3 (C) met B 2 = A. Opgave 130. Bewijs dat voor een symmetrische reële n × n matrix A geldt: det A = n Y λi , i=1 waar λ1 , . . . , λn de eigenwaarden van A zijn. Geldt dit ook als A complex is? 4.4 Geadjungeerde en Normaliteit In 4.2 en 4.3 werd bewezen dat voor het bestaan van een orthonormale basis bestaande uit eigenvectoren van een lineaire transformatie T in een eindig-dimensionale complexe inproductruimte V het voldoende is dat T Hermites is (volgens 4.3.7) of dat T unitair is (volgens 4.2.11). In deze paragraaf onderzoeken we noodzakelijke voorwaarden voor T voor het bestaan van zo’n basis. Eerst een Lemma dat we al eens gebruikten. 4.4.1 Lemma Zij V een eindig-dimensionale inproductruimte met orthonormale basis E = {e 1 , e2 , . . . , en }. Dan geldt: P (i) x = ni=1 < x, ei > ·ei voor elke x ∈ V ; (ii) als T : V → V een lineaire transformatie is, dan geldt M TE = (< T ej , ei >)ni,j=1 . Bewijs. (i) Volgt direct uit: < x, ei >=< n X j=1 xj · ej , ei >= omdat E een orthonormale basis is. 71 n X j=1 xj < ej , ei >= xi , Gebruik voor (ii) dat de j-de kolom van M TE bestaat uit het beeld van ej ; volgens (i) is: T ej = n X i=1 < T ej , ei > ·ei , en er volgt dat op de i-de plaats van de j-de kolom (M TE )i,j =< T ej , ei > staat. 4.4.2 Stelling Zij V een eindig-dimensionale complexe inproductruimte, en laat U : V → C een lineaire afbeelding zijn. Dan bestaat er een uniek bepaalde vector y ∈ V zodat voor alle x ∈ V geldt: U (x) =< x, y >. P Bewijs. Kies een orthonormale basis {e 1 , e2 , . . . , en } van V , dan is y = ni=1 U (ei ) · ei de gevraagde vector. Definieer namelijk S(x) =< x, y >, voor alle x ∈ V , dan is S lineair (omdat het inproduct lineair in het eerste argument is), en er geldt: S(ej ) =< ej , y >=< ej , n X i=1 U (ei ) · ei >= n X U (ei )· < ej , ei >= U (ej ). i=1 Dus S = U . Dat bewijst het bestaan van y. Om te laten zien dat y uniek is, veronderstel je dat er een y 0 zodat ook U (x) =< x, y 0 > voor alle x; met U (x) =< x, y > volgt dan dat < x, y − y 0 >= 0 voor elke x. Kiezen we x = ei dan volgt dat de i-de coefficient van y − y 0 ten opzichte van de basis E gelijk 0 moet zijn. Omdat dit voor elke i geldt is y − y 0 = 0, dus y = y 0 . 4.4.3 Stelling Zij V een eindig-dimensionale complexe inproductruimte, en laat T : V → V een lineaire transformatie zijn. Dan bestaat er een unieke lineaire transformatie T ∗ : V → V zodat voor elke x, y ∈ V : < T x, y >=< x, T ∗ y > . Bewijs. Kies y ∈ V . Definieer de afbeelding U : V → C door U (x) =< T x, y >, voor alle x ∈ V . Dan is U lineair omdat T en het inproduct het zijn: U (x1 + x2 ) =< T (x1 + x2 ), y >=< T x1 + T x2 , y >=< T x1 , y > + < T x2 , y >= U (x1 ) + U (x2 ), en U (λx) =< T (λx), y >=< λT x, y >= λ < T x, y >= λU (x). Volgens de voorgaande Stelling is er dus een unieke vector z ∈ V zodat U (x) =< x, z > voor alle x ∈ V . Definieer nu T ∗ : V → V door T ∗ y = z, dan geldt zeker < T x, y >= U (x) =< x, z >=< x, T ∗ y > voor alle x, y ∈ V . Bovendien is T ∗ lineair, want < x, T ∗ (y1 + y2 ) >=< T x, y1 + y2 >=< T x, y1 > + < T x, y2 >=< x, T ∗ y1 + T ∗ y2 >, en < x, T ∗ (λy) >=< T x, λy >= λ̄ < T x, y >= λ̄ < x, T ∗ y >=< x, λT ∗ y > . Tenslotte is T ∗ uniek bepaald, want veronderstel dat er een lineaire transformatie R is zodat < T x, y >=< x, Ry > voor alle x, y ∈ V . Dan is < x, T ∗ y >=< x, Ry > voor alle x, y, dus < x, (T ∗ − R)y >= 0. Dan moet (T ∗ − R)y = 0, voor alle y ∈ V , dus T ∗ = R. 72 4.4.4 Definitie De unieke T ∗ bij een lineaire transformatie T wordt de geadjungeerde van T genoemd. Deze geadjungeerde heeft dus de eigenschap dat altijd < T x, y >=< x, T ∗ y >. Maar we weten dat voor het inproduct ook geldt dat < x, T y >= < T y, x > = < y, T ∗ x > =< T ∗ x, y >, met andere woorden: mits men adjungeert mag de transformatie T binnen het inproduct van argument wisselen! 4.4.5 Stelling Zij V een eindig-dimensionale complexe inproductruimte, en laten T en U lineaire transformaties van V zijn. Dan: (i) (ii) (iii) (iv) (T + U )∗ = T ∗ + U ∗ ; (λT )∗ = λ̄T ∗ ; (T U )∗ = U ∗ T ∗ ; T ∗∗ = T . Het bewijs van 4.4.5 bestaat uit eenvoudige verificatie. Maar het volgt ook direkt uit de eigenschappen van matrices (zie beneden). Voor matrices A hadden we al eerder de notatie A ∗ ingevoerd, zie 3.3.8, en wel om de complex-geconjugeerde getransponeerde van A aan te geven: A ∗ = ĀT . We laten nu zien dat dit niet een ongelukkige keuze van notatie is: ten opzichte van een orthonormale basis is de matrix van de geadjungeerde van T inderdaad de geconjugeerd-getransponeerde van de matrix van T . 4.4.6 Stelling Zij V een eindig-dimensionale complexe inproductruimte met orthonormale basis E, en laat T : V → V een lineaire transformatie zijn. Dan geldt: MTE ∗ = (MTE )∗ . Bewijs. Laat A = MTE de matrix van T ten opzichte van E zijn, en B = M TE ∗ die van T ∗ . Dan (volgens 4.4.1(ii)): Bi,j =< T ∗ ej , ei >=< ej , T ei >= < T ei , ej > = Āj,i , zodat B = ĀT . 4.4.7 Propositie Laten A en B element van Mn×n (C) zijn. Dan geldt: (i) (A + B)∗ = A∗ + B ∗ ; (ii) (λA)∗ = λ̄A∗ ; (iii) (AB)∗ = B ∗ A∗ ; (iv) A∗∗ = A. 73 Bewijs. Volgt onmiddellijk uit de eigenschappen van complexe conjugatie en transpositie. Het bewijs van 4.4.5 volgt nu direkt uit 4.4.6 en 4.4.7. De eerder geintroduceerde begrippen Hermites en unitair voor lineaire transformaties van complexe vectorruimten zijn nauw verwant aan adjungeren. De eis voor Hermites zijn was dat < T x, y >=< x, T y > voor elke x, y ∈ V , terwijl een unitaire afbeelding voldoet aan < T x, T y >=< x, y > voor elke x, y ∈ V . Met I V geven we de identieke afbeelding op V aan. 4.4.8 Propositie Laat T een lineaire transformatie van de eindig-dimensionale complexe vectorruimte V zijn. Dan geldt: (i) T is Hermites ⇐⇒ T∗ = T, (ii) T is unitair ⇐⇒ T T ∗ = IV = T ∗ T ⇐⇒ T ∗ = T −1 . Bewijs. De transformatie T is Hermites dan en slechts dan als < T x, y >=< x, T y > altijd geldt; anderzijds geldt altijd < T x, y >=< x, T ∗ y > dus Hermites zijn is equivalent met T = T ∗. Unitair zijn betekent dat altijd < T x, T y >=< x, y >. Maar er geldt ook steeds dat < T x, T y >=< T ∗ T x, y > en dus is unitair zijn equivalent met T ∗ T = IV . Dus T ∗ = T −1 , maar dan is ook T ∗ T = T T ∗ . We zagen ook reeds dat Hermites zijn het bestaan van een orthonormale basis van eigenvectoren impliceerde (en dus diagonaliseerbaarheid). De omgekeerde implicatie blijkt in het complexe geval nı́et op te gaan: een noodzakelijke en voldoende voorwaarde voor diagonaliseerbaarheid in het complexe geval blijkt normaliteit te zijn. 4.4.9 Definitie De lineaire transformatie T van een complexe vectorruimte heet normaal als T T ∗ = T ∗ T . We noemen een matrix A ∈ Mn×n (C) normaal wanneer A∗ A = AA∗ . 4.4.10 Gevolg T is normaal dan en slechts dan als MTE normaal is, voor een orthonormale basis E. 4.4.11 Gevolg (i) Als T Hermites is dan is T normaal. (ii) Als T unitair is dan is T normaal. Alvorens we afleiden dat normaliteit equivalent is met het bestaan van een orthonormale basis van eigenvectoren, bekijken we enkele eigenschappen van normale transformaties. 4.4.12 Stelling Laat V een eindig-dimensionale complexe inproductruimte met orthonormale basis E zijn en laat T : V → V een lineaire transformatie zijn. Als T normaal is, dan geldt: (i) kT xk = kT ∗ xk voor alle x ∈ V ; (ii) T − λIV is normaal, voor elke λ ∈ C; 74 (iii) als v een eigenvector voor T is met eigenwaarde λ, dan is v ook een eigenvector voor T ∗ , en wel met eigenwaarde λ̄; (iv) als v1 en v2 eigenvectoren van T zijn bij verschillende eigenwaarden, dan < v 1 , v2 >= 0. Bewijs. (i) Voor elke x ∈ V geldt kT xk2 =< T x, T x >=< T ∗ T x, x >=< T T ∗ x, x >=< T ∗ x, T ∗ x >= kT ∗ xk2 , en lengten zijn altijd niet-negatief. (ii) Omdat IV∗ = IV is (T − λIV )∗ (T − λIV ) = (T ∗ − λ̄IV )(T − λIV ) = T ∗ T − λ̄T − λT ∗ + |λ|2 IV = = T T ∗ − λT ∗ − λ̄T + |λ|2 IV = (T − λIV )(T − λIV )∗ . (iii) Beschouw U = T − λIV voor de eigenwaarde λ van T . Voor de bijbehorende eigenvector v is dan U v = 0. Volgens (ii) is U normaal, zodat op grond van (i): 0 = kU vk = kU ∗ vk = k(T − λIV )∗ vk = kT ∗ v − λ̄vk, en daarom is T ∗ v = λ̄v. (iv) Omdat λ1 < v1 , v2 >=< λ1 v1 , v2 >=< T v1 , v2 >=< v1 , T ∗ v2 >=< v1 , λ̄2 v2 >= λ2 < v1 , v2 >, en omdat λ1 6= λ2 volgt dat < v1 , v2 >= 0. Opgave 131. Waar in het bewijs van 4.4.12(iv) wordt normaliteit gebruikt? 4.4.13 Stelling Zij V een eindig-dimensionale complexe inproductruimte, en laat T een lineaire transformatie van V zijn. Dan is T normaal dan en slechts dan als er een orthonormale basis voor V is bestaande uit eigenvectoren van T . Bewijs. Veronderstel dat T normaal is. We plegen inductie naar de dimensie n. Als n = 1 is het duidelijk. Laat λ een nulpunt zijn van het karakteristieke polynoom van T , en zij w een eigenvector van T bij λ. Dan is w ook een eigenvector van T ∗ (bij λ̄). Zij W de ruimte opgespannen door w en laat x ∈ W ⊥ . Dan is < T x, w >=< x, T ∗ w >=< x, λ̄w >= λ < x, w >= 0, dus T x ∈ W ⊥ , dus W ⊥ is T -invariant. Omdat V = W ⊕ W ⊥ , is W ⊥ een n − 1-dimensionale T -invariante ruimte, waarop we de inductiehypothese kunnen toepassen: we vinden een orthonormale basis w2 , w3 , . . . , wn van eigenvectoren van T . Dan is w/kwk, w 2 , w3 , . . . , wn een basis van de gevraagde vorm voor V . Veronderstel, voor de omkering, dat B = {b 1 , . . . , bn } een orthonormale basis van V is, bestaande uit eigenvectoren voor T . Ten opzichte van die basis wordt T gegeven door een diagonaalmatrix: λ1 0 · · · 0 0 λ2 · · · 0 A = MTB = .. . . . , ... . .. . 0 0 75 ··· λn maar dan is A∗ = MTB∗ λ̄1 0 = ... 0 0 λ̄2 .. . ··· ··· .. . 0 ··· 0 0 .. . λ̄n ook een diagonaalmatrix, en diagonaalmatrices commuteren, dus T T ∗ = T ∗ T . 4.4.14 Stelling Zij V een eindig-dimensionale complexe inproductruimte, en laat T een lineaire transformatie van V zijn. Dan is T unitair dan en slechts dan als er een orthonormale basis voor V is bestaande uit eigenvectoren van T bij eigenwaarden van absolute waarde 1. Bewijs. Als T unitair is dan is T normaal (volgens Gevolg 4.4.11) en dus bestaat er een orthonormale basis van eigenvectoren; elke eigenwaarde λ van een unitaire afbeelding heeft |λ| = 1, omdat unitaire afbeeldingen lengten behouden (zie 4.2.8). Dat bewijst de ene implicatie. Voor de omkering nemen we het bestaan aan van zo’n speciale basis B bestaande uit vectoren bi bij de eigenwaarden λi met |λi | = 1. Dan is T normaal (volgens Stelling 4.4.13), dus bi is ook eigenvector van T ∗ met eigenwaarde λ̄i volgens 4.4.12. Dus: T ∗ T bi = T ∗ (λi bi ) = λi λ̄i bi = |λi |2 bi = bi , dus T ∗ T = IV en T is orthogonaal. Tenslotte nog een stelling die verband legt tussen de begrippen normaal en unitair voor matrices. 4.4.15 Definitie Twee matrices A en B heten unitair equivalent als A = U ∗ BU voor een unitaire matrix U . Merk op dat voor zulke matrices U ∗ = U −1 . 4.4.16 Stelling Laat A ∈ Mn×n (C). Dan is A normaal dan en slechts dan als A unitair equivalent is aan een diagonaalmatrix. Bewijs. Als A normaal is, dan bestaat er een orthonormale basis voor de vectorruimte opgebouwd uit eigenvectoren van A die orthonormaal zijn; maar na transformatie naar die basis is A dan op diagonaalvorm gebracht, en de transformatiematrix bestaat uit de kolommen die de eigenvectoren zijn, en deze vormen een orthonormaal stelsel. Dus is de transformatiematrix unitair. Omgekeerd, veronderstel dat A = U ∗ DU , met U unitair en D een diagonaalmatrix; dan: AA∗ = (U ∗ DU )(U ∗ DU )∗ = (U ∗ DU )(U ∗ D ∗ U ) = U ∗ DD ∗ U = U ∗ D ∗ DU = A∗ A, dus A is normaal. Voor reële inproductruimten is de situatie een kleine beetje anders. In dit geval blijkt symmetrie (het reële equivalent van Hermites) de belangrijke eigenschap te zijn. 76 4.4.17 Stelling Zij V een eindig-dimensionale reële inproductruimte, en laat T een lineaire transformatie van V zijn. Dan is T symmetrisch dan en slechts dan als er een orthonormale basis voor V is bestaande uit eigenvectoren van T . Bewijs. Dit volgt direkt uit 4.3.8 en 4.3.2. 4.4.18 Stelling Laat A ∈ Mn×n (R). Dan is A symmetrisch dan en slechts dan als A orthogonaal equivalent is aan een diagonaalmatrix. Bewijs. Net als in het complexe geval 4.4.16. Opgave 132. Geef een voorbeeld van lineaire transformatie T van de R2 die wel voldoet aan T ∗ T = T T ∗ maar die niet diagonaliseerbaar is. Opgave 133. Laat B de basis van V = R3 zijn bestaande uit 2 √ 1 2 4 1 1 √ 0 , √2 , 2 √23 en MTB = 0 −1 −4 3 √1 0 0 0 1 0 3 de matrix voor een lineaire transformatie T van V . Laat zien dat T orthogonaal is, en dat T symmetrisch is, en bepaal een orthonormale basis van V bestaande uit eigenvectoren voor T . Opgave 134. Laat het reële lineaire stelsel vergelijkingen Ax = b gegeven zijn door: 4 1 2 1 A = 1 −1 2 , en b = −11 . 19 1 5 0 Bepaal een oplossing v voor AA∗ v = b en laat zien dat w = A∗ v voldoet aan Ax = b en dat voor elke andere oplossing w 0 geldt dat ||w0 || ≥ ||w||. 77