1 Triangulatiestellingen voor lineaire transformaties Zoals bekend kan niet iedere lineaire transformatie L : V → V van een vectorruimte (V, K) gediagonaliseerd worden. Als het lichaam K echter algebraı̈sch afgesloten is, dan is het daarentegen wel altijd mogelijk om L op bovendriehoeksvorm te brengen. Definitie 1.1 Een lichaam K heet algebraı̈sch afgesloten als ieder niet-constant polynoom p ∈ K[X] met coëfficiënten in K een nulpunt heeft in K. Voorbeeld 1.2 (Hoofdstelling van de Algebra) Het lichaam C is algebraı̈sch afgesloten. Naast dit bekende voorbeeld van een algebraı̈sch afgesloten lichaam geven we nog een tweede voorbeeld, met als doel te laten zien dat de komende stellingen niet uitsluitend over C gaan. Definitie 1.3 (Algebraı̈sche en transcendente getallen) Een getal a ∈ C heet algebraı̈sch als a een nulpunt is van een polynoom p ∈ Z[X]. We schrijven Q voor de verzameling van algebraı̈sche getallen. De getallen in C \ Q heten transcendent. Voorbeeld 1.4 De aftelbare deelverzameling Q ⊂ C is een algebraı̈sch afgesloten lichaam. Het is de doorsnede van alle algebraı̈sch afgesloten lichamen die Q bevatten. In Stelling 1.5 en Stelling 1.6 geven we nu twee equivalente formuleringen van hetzelfde resultaat, dat we vervolgens in een aantal stappen, geı̈llustreerd met voorbeelden, gaan bewijzen. Stelling 1.5 (Triangulatiestelling van Jacobi) Zij (V, K) een vectorruimte over een algebraı̈sch afgesloten lichaam K. Voor iedere lineaire transformatie L : V → V bestaat er een basis γ van V waarvoor de matrix Lγγ van L een bovendriehoeksmatrix is. Een equivalente formulering van Stelling 1.5 in termen van matrices is de volgende. Stelling 1.6 (Matrixtriangulatie) Laat A ∈ Kn×n met K algebraı̈sch afgesloten. Dan bestaat er een X ∈ GLn (K) zodanig dat X −1 AX = R een bovendriehoeksmatrix is. Opmerking 1.7 Stelling 1.6 beweert dus dat iedere A ∈ Kn×n met K algebraı̈sch afgesloten gelijkvormig is met een bovendriehoeksmatrix R ∈ Kn×n . 1.1 Geschiedenis en motivatie: van Jacobi naar Schur Stelling 1.6 is vernoemd naar Carl Jacobi (1804-1851), die hem in 1837 publiceerde. Carl Jacobi (1804-1851) en Issai Schur (1875-1941) 1 Issai Schur (1875-1941) liet zien dat er onder dezelfde voorwaarden zelfs altijd een orthonormale basis β van V bestaat zodanig dat de matrix Lββ van de lineaire transformatie L bovendriehoeks is. Dit sterkere resultaat staat te boek als de Schurdecompositie. We bewijzen het in Sectie 1.6. Vervolgens illustreren we het belang van de Schurdecompositie. In Sectie 1.7 zien we hoe de Schurdecompositie kan worden ingezet om een kort bewijs te geven in de context van Google’s PageRank. In Sectie 1.8 leiden we er de diverse spectraalstellingen mee af. We beginnen echter in Secties 1.2 en 1.3 met het bestuderen van twee eenvoudige gevallen van Stelling 1.6, te weten A ∈ K2×2 en A ∈ K3×3 , en geven enkele voorbeelden. Daarna zal een inductieargument in Sectie 1.4 de stelling bewijzen voor A ∈ Kn×n voor alle n ∈ N. 1.2 Triangulatie van 2 × 2 matrices A ∈ K2×2 De volgende relatief eenvoudige observatie staat aan de basis van alle triangulatiestellingen. Lemma 1.8 Gegeven een matrix A ∈ Kn×n met K algebraı̈sch afgesloten. Laat λ ∈ K en 0 6= x ∈ Kn met Ax = λx. Laat X ∈ GLn (K) zijn, met eerste kolom gelijk aan x. Dan is λ ∗ ... ∗ 0 ∗ ... ∗ X −1 AX = . . (1) .. . . . . . . 0 ∗ ... ∗ Oftewel, de eerste kolom van X −1 AX is gelijk aan λe1 . Bewijs. Omdat Xe1 gelijk is aan de eerste kolom x van X, geldt Ax = λx ⇔ AXe1 = λXe1 ⇔ X −1 AXe1 = λe1 . Omdat X −1 AXe1 de eerste kolom is van de matrix X −1 AX, bewijst dit de bewering. Opmerking 1.9 Als A ∈ Kn×n en K is algebraı̈sch afgesloten, dan heeft het karakteristieke polynoom p(A) ∈ K[X]≤n van A tenminste één nulpunt in K en dus bestaan λ ∈ K en x ∈ Kn , x 6= 0 zodanig dat Ax = λx. Daarnaast kan {x} ook altijd uitgebreid worden tot een basis γ = {x, x2 , . . . , xn } van Kn , en dus bestaat er een X ∈ GLn (K) met eerste kolom Xe1 = x. Dus voor alle A ∈ Kn×n is voldaan aan de (overige) voorwaarden van Lemma 1.8. Opmerking 1.10 Beschouw de reële vectorruimte (R2 , R). Het lichaam R is niet algebraı̈sch afgesloten: het niet-constante polynoom p(X) = 1 + X 2 heeft immers geen nulpunt in R. De rotatie om de oorsprong van R2 over 90 graden is een lineaire transformatie L : R2 → R2 zonder reële eigenwaarden. Er bestaat daarom geen basis β van R2 zodanig dat Lββ een bovendriehoeksmatrix is. Lemma 1.8 geeft onmiddellijk het bewijs van Stelling 1.6 voor n = 2, en ook een constructieve methode om X ∈ GL2 (K) te bepalen zodanig dat X −1 AX = R bovendriehoeks is. Gevolg 1.11 Laat A ∈ K2×2 en Ax = λx met λ ∈ K en 0 6= x ∈ K2 . Laat X ∈ GL2 (K) een matrix zijn met eerste kolom gelijk aan x. Dan is λ ∗ −1 X AX = (2) 0 ∗ en dit is dus een bovendriehoeksmatrix die gelijkvormig is met de matrix A. 2 Bewijs. De matrix X −1 AX in (1) is nu 2 × 2 en dus triviaal bovendriehoeks. Voorbeeld 1.12 We beschouwen de matrix A ∈ C2×2 met als enige eigenwaarde λ = 1, 7 4 −2 A= , ker(A − I) = span{x} met x = . (3) −9 −5 3 Omdat A geen twee lineair onafhankelijke eigenvectoren heeft, is A niet diagonaliseerbaar. We gaan daarom A op bovendriehoeksvorm brengen. Kies hiertoe, als één van de vele mogelijke keuzes (zie ook Opmerking 1.13) voor X ∈ GL2 (C) de matrix −2 1 −2 3 −1 X= , dan is X = (4) 3 −2 1 −2 en vinden we X −1 AX = −2 3 1 −2 7 4 −9 −5 −2 1 3 −2 = 1 1 0 1 En dus is R een bovendriehoeksmatrix gelijkvormig met A. = R. (5) Opmerking 1.13 De keuze van X in (4) is verre van uniek; de eerste kolom kan iedere eigenvector van A zijn, de tweede kolom iedere vector die geen veelvoud is van de eerste. Hier kozen we de tweede kolom zo, dat det(X) = 1. Hierdoor bevat de inverse X −1 geen breuken. Verschillende keuzes resulteren doorgaans in verschillende bovendriehoeksvormen van A. Opmerking 1.14 De matrix X kan zelfs zo worden gekozen, dat de kolommen orthonormaal zijn, door de gevonden eigenvector op lengte één te schalen, en er een tweede kolom met lengte één loodrecht op de eerste naast te zetten. In Sectie 1.6 komen we hier uitgebreid op terug. Het volgende voorbeeld illustreert Stelling 1.5 ingeval n = 2. Voorbeeld 1.15 Beschouw de complexe vectorruimte (C[X]≤1 , C) van polynomen van graad ten hoogste één in X met complexe coëfficiënten, met daarop de lineaire transformatie L: C[X]≤1 → C[X]≤1 : p 7→ p + p(0)X. (6) Het polynoom p1 met voorschrift p1 (X) = X is een eigenvector van L bij eigenwaarde 1, immmers, L(p1 ) = p1 + 0 · p1 = p1 . Samen met het constante polynoom p2 (X) = 1 geeft dit een basis β = {p1 , p2 } van C[X]≤1 . Het is eenvoudig om na te gaan dat 1 1 β Lβ = , (7) 0 1 dus de matrix van L ten opzichte van β is een bovendriehoeksmatrix. Opmerking 1.16 De algemene werkwijze bij een lineaire transformatie L van een tweedimensionale vectorruimte V is, om eerst de matrix Lγγ ∈ K2×2 horend bij een willekeurige basis γ = {γ1 , γ2 } van V te bepalen. Immers, als vervolgens x = (x1 , x2 )> een eigenvector is van Lγγ in K2 , dan is u = x1 γ1 + x2 γ2 een eigenvector van L in V . Vul vervolgens {u} op willekeurige wijze aan tot een basis β = {u, v} van V , dan is Lββ bovendriehoeks. 3 1.3 Triangulatie van 3 × 3 matrices A ∈ K3×3 We laten nu middels een voorbeeld zien hoe we een matrix A ∈ K3×3 op bovendriehoeksvorm kunnen brengen, gebruik makend van het feit dat we dit voor 2 × 2 matrices al kunnen. Eerst een nuttig lemma over het rekenen met matrices die in blokvorm zijn gepartitioneerd. Lemma 1.17 (Blokvermenigvuldiging) Laat X, Y ∈ Kn×n en laat k, ` ∈ N met k+` = n. Partitioneer A B E F X= en Y = , (8) C D G H waarbij A, E ∈ Kk×k en D, H ∈ K`×` . Dan geldt AE + BG AF + BH XY = . CE + DG CF + DH (9) Bewijs. Volgt door geduldig uitschrijven. De blokvermenigvuldiging in (9) is dus volstrekt analoog aan die van twee 2 × 2 matrices. Gevolg 1.18 Veronderstel dat X ∈ Kn×n gepartitioneerd wordt als A B , X= 0 D waarbij A ∈ Kk×k en D ∈ K`×` met k, ` ∈ N, k + ` = n. Laat H ∈ GL` (K), dan geldt −1 I 0 I 0 A BH X = , 0 H 0 H 0 H −1 DH (10) (11) waarbij I ∈ Kk×k de identiteitsmatrix is. De blokvermenigvuldiging in Gevolg 1.18 zullen we gebruiken in het volgende voorbeeld. Voorbeeld 1.19 De volgende matrix A heeft als enige eigenwaarde λ = 1, −1 −1 3 1 A = −2 −2 5 en ker(A − I) = span{x} met x = 1 . −2 −3 6 1 (12) Er zijn dus geen drie lineair onafhankelijke eigenvectoren, en dus is A niet diagonaliseerbaar. We laten zien hoe we A op bovendriehoeksvorm kunnen brengen. Hiertoe construeren we eerst een eenvoudig inverteerbare matrix X ∈ GL3 (K) waarvoor Xe1 = x, bijvoorbeeld, 1 0 0 1 0 0 X = 1 1 0 , waarvoor X −1 = −1 1 0 , (13) 1 0 1 −1 0 1 en vinden we in overeenstemming met Lemma 1 X −1 AX = 0 0 4 1.8 dat −1 3 −1 2 = B −2 3 (14) een matrix is met als eerste kolom λe1 = e1 . Beschouw vervolgens de 2 × 2 matrix −1 2 1 C= met eigenvector . −2 3 1 (15) Deze 2 × 2 matrix kan, net als in Voorbeeld 1.12, op bovendriehoeksvorm worden gebracht, bijvoorbeeld middels de matrix Y ∈ GL2 (C) 1 0 −1 2 1 0 1 2 −1 Y CY = = . (16) −1 1 −2 3 1 1 0 1 En dus, met behulp van Gevolg 1.18 vinden we dat 1 0 0 Y −1 B 1 0 0 Y 1 2 3 = 0 1 2 = R. 0 0 1 Combineren we (14) en (17) dan zien we dat we met 1 0 0 1 0 0 1 0 0 1 0 Z=X = 1 1 0 0 1 0 = 1 1 0 0 Y 1 0 1 0 1 1 1 1 1 een matrix Z ∈ GL3 (C) hebben gecontrueerd waarvoor Z −1 AZ = R bovendriehoeks is. (17) (18) Opmerking 1.20 Ondanks dat in (13) iedere inverteerbare matrix X met een niet-triviaal veelvoud van x als eerste kolom volstaat, is het plezierig als X zonder al te veel rekenwerk geı̈nverteerd kan worden. Merk hiertoe op dat X altijd van de vorm 1 0 0 0 0 1 0 0 1 a 1 0 of 1 0 0 of 0 1 0 , (a, b ∈ K) (19) b 0 1 a 1 0 1 0 0 kan worden gekozen, en dat de inverses hiervan vrijwel onmiddellijk op te schijven zijn. Opmerking 1.21 Ook de 2 × 2 matrix Y in (16) is op soortgelijke wijze gekozen om zijn eenvoudige inverse: het is altijd mogelijk om voor Y een marix van de vorm 1 0 0 1 Y = of Y = (20) a 1 1 0 te kiezen, en ook hiervan zijn de inverse direct op te schrijven. Opmerking 1.22 Ook in dit voorbeeld kan zowel de matrix X als de matrix Y zo worden gekozen, dat de kolommen orthonormaal zijn. De matrix X zal echter doorgaans niet meer van de vorm (19) zijn, noch zal Y van de vorm (20) zijn. Dit resulteert dan in een matrix Z met orthonormale kolommen zodanig dat Z −1 AZ bovendriehoeks is. Zie weer Sectie 1.6. Het zal nu duidelijk zijn hoe een matrix A ∈ Kn×n op bovendriehoeksvorm kan worden gebracht, ervanuitgaande dat we weten hoe dat moet voor een matrix B ∈ K(n−1)×(n−1) . 5 1.4 Bewijs van de triangulatiestelling van Jacobi We bewijzen nu Stelling 1.6 met behulp van volledige inductie. We veronderstellen dat K een algebraı̈sch afgesloten lichaam is. Inductiebasis: In Gevolg 1.11 in Sectie 1.2 zagen we reeds dat Stelling 1.6 geldt voor n = 2. Inductiehypothese: Voor iedere matrix B ∈ K(n−1)×(n−1) bestaat er een Y ∈ GLn−1 (K) zodanig dat Y −1 BY = T een bovendriehoeksmatrix is. Inductiestap: Laat A ∈ Kn×n . Dan bestaat er volgens Lemma 1.8 een matrix X ∈ GLn (K) zodanig dat λ b −1 X AX = . (21) 0 B Hierbij is b ∈ K1×(n−1) en B ∈ K(n−1)×(n−1) en is λ ∈ K een eigenwaarde van A. Volgens de inductiehypothese bestaat er een Y ∈ GLn−1 (K) zodanig, dat Y −1 BY = T bovendriehoeks is. Met behulp van Gevolg 1.18 geldt nu dat −1 −1 1 0 1 0 1 0 λ b 1 0 λ bY −1 X AX = = = R, 0 Y 0 Y 0 Y 0 B 0 Y 0 T en omdat T bovendriehoeks is, is R dat ook. Merk tot slot op dat de matrix 1 0 Z=X ∈ GLn (K), 0 Y (22) als product van twee inverteerbare matrices. We concluderen dat Z −1 AZ = R bovendriehoeks is. Dit bewijst Stelling 1.6. Opmerking 1.23 De triangulatieconstructie van Jacobi kan al worden ingezet zodra één eigenwaarde van A bekend is. Daarna moet steeds een eigenwaarde van een kleinere matrix gevonden worden om het proces te kunnen continueren. Mocht A diagonaliseerbaar zijn, dan leidt dit proces in het algemeen echter niet tot een diagonalisatie van A. Voorbeeld 1.24 Gegeven de matrix 1 −1 −1 1 1 −2 met Ax = x voor x = 1 . A = −2 2 1 4 −1 Een eenvoudig inverteerbare matrix 1 0 X= 1 1 −1 0 We vinden nu dat X ∈ GL3 (C) met x als eerste 0 1 0 0 met X −1 = −1 1 1 1 0 1 −1 −1 2 −1 = R, X −1 AX = 0 0 0 3 kolom is 0 0 . 1 (23) (24) (25) en R is bij toeval al bovendriehoeks. De eigenwaarden van A staan op de diagonaal van R. Indien gewenst kan A nu gediagonaliseerd worden door een basis van eigenvectoren te bepalen. 6 1.5 Invariante deelruimtes en complete vlaggen Om de meetkundige betekenis van de triangulatiestelling van Jacobi te duiden, introduceren we twee nieuwe meetkundige begrippen. Definitie 1.25 (Invariante deelruimte) Zij L : V → V een lineaire transformatie van een vectorruimte (V, K). Een deelruimte U van V heet invariant onder L, of, indien de context duidelijk is kortweg invariant, als geldt dat L(u) ∈ U voor alle u ∈ U . Om aan te geven dat L(u) ∈ U voor alle u ∈ U zullen we ook de notatie L(U ) ⊂ U gebruiken. Voorbeeld 1.26 Zij u een eigenvector van een lineaire transformatie L : V → V van een vectorruimte (V, K). Dan is U = span{u} een invariante deelruimte onder L. Voorbeeld 1.27 Iedere deelruimte U ⊂ V van een vectorruimte (V, K) is invariant onder zowel de identieke afbeelding id : V → V : v 7→ v, als de nulafbeelding 0 : V → V : v 7→ 0. Definitie 1.28 (Vlag) Zij V een vectorruimte van dimensie n. Een rij geneste deelruimtes U1 ⊂ U2 ⊂ · · · ⊂ Uk ⊂ V met dim(U1 ) < dim(U2 ) < · · · < dim(Uk ) (26) met strict stijgende dimensies heet een vlag, en een complete vlag indien k = n. Definitie 1.29 (Geı̈nduceerde complete vlag) Zij γ = {c1 , . . . , cn } een basis van een vectorruimte (V, K). Laat voor iedere k ∈ {1, . . . , n}, Uk = span{c1 , . . . , ck }. (27) Dan heet U1 ⊂ U2 ⊂ · · · ⊂ Un = V de door γ geı̈nduceerde complete vlag. Voorbeeld 1.30 De standaardbasis {e1 , . . . , en } induceert E1 ⊂ E2 ⊂ · · · ⊂ En = Kn met Ek = span{e1 , . . . , ek }. Deze complete vlag heet de standaardvlag in Kn . Het volgende lemma combineert de concepten van complete vlag en invariante deelruimte. Lemma 1.31 Laat R ∈ Kn×n . De standaardvlag bestaat uit invariante deelruimtes onder de lineaire transformatie L : Kn → Kn : x 7→ Rx als en alleen als R bovendriehoeks is. Bewijs. Laat k ∈ {1, . . . , n}. Duidelijk is dat Rx ∈ Ek voor alle x ∈ Ek als R bovendriehoeks is, en dus is Ek invariant onder L. Als R niet bovendriehoeks is, is e> i Rej 6= 0 voor zekere n ≥ i > j ≥ 1. Maar dat betekent dat Rej 6∈ Ej , en dus is Ej niet invariant. We herformuleren nu de triangulatiestelling van Jacobi in deze nieuwe terminologie. Stelling 1.32 Zij (V, K) een vectorruimte met K algebraisch afgesloten. Voor iedere lineaire transformatie L : V → V bestaat er een complete vlag van invariante deelruimtes onder L. 7 Bewijs. Laat op grond van Stelling 1.6 γ = {c1 , . . . , cn } een basis van V zijn waarvoor Lγγ een bovendriehoeksmatrix is. We gaan aantonen dat de door γ geı̈nduceerde complete vlag U1 ⊂ U2 ⊂ . . . Un−1 ⊂ Un = V bestaat uit invariante deelruimtes Uk = span{c1 , . . . , ck }. Merk hiertoe op dat Lγγ de matrix is waarvoor geldt dat coγ (L(v)) = Lγγ coγ (v) (28) voor alle v ∈ V , waarbij coγ : V → Kn de coördinaatafbeelding is. Laat nu k ∈ {1, . . . , n} gegeven zijn en kies u ∈ Uk . Dan is coγ (u) ∈ Ek = span{e1 , . . . , ek }. Omdat Lγγ bovendriehoeks is, is wegens Lemma 1.31 ook Lγγ coγ (u) ∈ Ek . En dus geeft (28) dat coγ (L(u)) ∈ Ek , wat equivalent is met L(u) ∈ Uk . Dit bewijst de bewering. We besteden nu even kort aandacht aan de omkering van de uitspraak in Stelling 1.32. Stelling 1.33 Zij L : V → V een lineaire transformatie van een vectorruimte (V, K). Veronderstel dat U1 ⊂ U2 ⊂ . . . Un−1 ⊂ Un = V een complete vlag van invariante deelruimtes onder L is. Dan bestaat er een basis γ van V waarvoor Lγγ bovendriehoeks is. Bewijs. Laat γ1 = {c1 } een basis zijn van U1 . Kies nu voor iedere k ∈ {2, . . . , n} achtereenvolgens γk = γk−1 ∪ {ck } waarbij ck ∈ Uk en ck 6∈ Uk−1 . Dan is γ = γn = {c1 , . . . , cn } een basis van V met de eigenschap dat L(ck ) ∈ Uk , en dus is Lγγ een bovendriehoeksmatrix. 1.6 De triangulatiestelling van Schur In deze sectie gaan we na wat het concept inproduct kan toevoegen aan de triangulatiestelling van Jacobi. Dit zal leiden tot de triangulatiestelling van Schur. Lemma 1.34 Laat (V, K, h·, ·i) een inproductruimte zijn met basis γ = {c1 , . . . , cn }. Laat U1 ⊂ U2 ⊂ · · · ⊂ Un de complete vlag zijn geı̈nduceerd door de basis γ van V . Dan bestaat er ook een orthonormale basis β die diezelfde vlag induceert. Bewijs. Definieer U0 = {0}. Voor iedere opeenvolgende k ∈ {1, . . . , n}, kies bk ∈ Uk met bk ⊥ Uk−1 en kbk k = 1. Dan is span{b1 , . . . , bk } = Uk voor alle k ∈ {1, . . . , n}. Dus induceert {b1 , . . . , bn } dezelfde comlete vlag als γ. Omdat bk loodrecht staat op b1 , . . . , bk−1 en kbk k = 1 voor alle k ∈ {1, . . . , n} is β = {b1 , . . . , bn } daarnaast ook een orthonormale basis van V . Gevolg 1.35 Het Gram-Schmidt proces toegepast op γ resulteert in een orthonormale basis β die dezelfde vlag induceert als γ. Immers, één van de karakteriserende eigenschappen van het Gram-Schmidt proces is dat voor alle k ∈ {1, . . . , n} span{b1 , . . . , bk } = span{c1 , . . . , ck }. (29) Gram-Schmidt is dus een speciaal geval van de constructie in het bewijs van Lemma 1.34. Na deze inleiding zijn we in staat om de triangulatiestelling van Schur te bewijzen. Stelling 1.36 (Triangulatiestelling van Schur) Zij (V, K, h·, ·i) een inproductruimte over een algebraı̈sch afgesloten lichaam K. Voor elke lineaire transformatie L : V → V bestaat er een orthonormale basis β van V waarvoor de matrix Lββ van L een bovendriehoeksmatrix is. 8 Bewijs. Op grond van Stelling 1.5 bestaat er een basis γ = {c1 , . . . , cn } van V zodanig, dat de matrix Lγγ een bovendriehoeksmatrix is. Laat U1 ⊂ U2 ⊂ · · · ⊂ Un = V de door γ geı̈nduceerde complete vlag zijn. Volgens Stelling 1.32 bestaat deze uit invariante deelruimtes onder L. Volgens Lemma 1.34 bestaat er een orthonormale basis β = {b1 , . . . , bn } zodanig dat voor alle k ∈ {1, . . . , n} dat span{b1 , . . . , bk } = span{c1 , . . . , ck } = Uk . (30) Omdat Uk invariant is, geldt L(bk ) ∈ span{b1 , . . . , bk }, en dus is Lββ bovendriehoeks. De overeenkomstige formulering van Stelling 1.36 in termen van matrices is de volgende. Stelling 1.37 Gegeven een matrix A ∈ Kn×n met K algebraı̈sch afgesloten en een inproduct h·, ·i op Kn . Dan bestaat er een matrix U ∈ Kn×n met h·, ·i-orthonormale kolommen zodanig dat U −1 AU = R een bovendriehoeksmatrix is. Opmerking 1.38 Met A ∈ Cn×n en h·, ·i het standaardinproduct op Cn , zegt Stelling 1.37 dat er een unitaire matrix U bestaat zodanig dat U ∗ AU = R bovendriehoeks is. Definitie 1.39 (Schurvorm en Schurdecompositie) Een bovendriehoeksmatrix R als in Stelling 1.36 en Stelling 1.37 heet een Schurvorm van L of A, en de factorisatie A = U RU ∗ equivalent aan Stelling 1.37 een Schurdecompositie of Schurfactorisatie van de matrix A. Opmerking 1.40 Stelling 1.37 kan ook als volgt worden bewezen. Laat Au = λu met kuk = 1. Laat U ∈ Kn×n een matrix zijn met orthonormale kolommen met U e1 = u. Dan is volgens Lemma 1.8 de eerste kolom van U −1 AU gelijk is aan λe1 . Vervolgens kan een inductiebewijs worden gegeven, met als enige verschil met Sectie 1.6 dat de transformatiematrices niet alleen inverteerbaar zijn, maar zelfs orthonormale kolommen hebben. Dit alternatieve korte bewijs heeft twee nadelen. Ten eerste zouden we dan de triangulatiestelling van Jacobi niet zijn tegengekomen, en die zal later zijn nut nog bewijzen. Ten tweede is het veel minder rekenwerk eerst een basis γ te bepalen ten opzichte waarvan Lγγ bovendriehoeks is, en deze vervolgens met Gram-Schmidt te orthonormaliseren. Het boven gesuggereerde inductiebewijs volgend hebben we voor iedere k ∈ {2, . . . , n} een k × k matrix nodig met orthonormale kolommen. Voorbeeld 1.41 In Voorbeeld 1.12 zagen we de matrix A ∈ C2×2 , 7 4 −2 A= , ker(A − I) = span{x} met x = . −9 −5 3 (31) We brachten A op bovendriehoeksvorm door een X ∈ GL2 (C) te construeren met x als eerste kolom. We willen nu een sterker resultaat, namelijk, A op bovendriehoeksvorm brengen middels een matrix U met orthonormale kolommen. Kies derhalve 1 −2 3 U=√ (32) 3 2 13 dan heeft U orthonormale kolommen, geldt dus dat U −1 = U ∗ , en vinden we vervolgens 1 1 −2 3 7 4 −2 3 1 −13 ∗ √ U AU = √ = . (33) 3 2 −9 −5 3 2 0 1 13 13 De rechtermatrix is inderdaad bovendriehoeks, maar niet gelijk aan R uit Voorbeeld 1.12. 9 De Frobeniusnorm kAkF van een matrix A ∈ Cn×n is de wortel van de som van de kwadraten van de entries van A. Het is niet moelijk in te zijn dat als U unitair is, kU ∗ AU kF = kAkF . (34) In het bovenstaande voorbeeld uit zich dit in de gelijkheid 42 + 52 + 72 + 92 = 12 + 12 + 132 . (35) We beschouwen nu nogmaals de matrix uit Voorbeeld 1.19. Voorbeeld 1.42 In Voorbeeld 1.19 zagen we de matrix A ∈ C3×3 met enige eigenwaarde λ = 1 en −1 −1 3 1 A = −2 −2 5 en ker(A − I) = span{x} met x = 1 . (36) −2 −3 6 1 Na enig rekenwerk vonden we in (17) 1 2 −1 Z AZ = 0 1 0 0 dat 3 2 , waarbij 1 1 0 0 Z = 1 1 0 . 1 1 1 (37) Om een matrix U met orthonormale kolommen te vinden waarvoor U −1 AU bovendriehoeks is, volstaat het volgens Gevolg 1.35 om het Gram-Schmidt proces (van links naar rechts) toe te passen op de kolommen van Z. Dit geeft p √ √ √ 1/√3 −2/√6 18 p200/3 1 √0 U = 1/√3 (38) 1/√6 1/√2 en U ∗ AU = 0 1 16/3 . 1/ 3 1/ 6 −1/ 2 0 0 1 Deze bovendriehoeksmatrix is daarmee dus een Schurvorm van A. Opmerking 1.43 Het berekenen van een Schurvorm is doorgaans lastiger dan het berekenen van een willekeurige bovendriehoeksvorm. Dit komt doordat orthonormalisatie breuken en wortels en zelfs wortels van breuken introduceert, ook als A alleen gehele getallen bevat. 1.7 Toepassing: Schur decompositie en Google’s PageRank In het PageRank model van Page en Brin, de oprichters van Google, wordt een eigenvector berekend van de Google matrix G ∈ Rn×n . Deze matrix G is van de vorm G = αS + (1 − α)T, met T = ee> en α ∈ [0, 1). n (39) Hierbij is e de all-ones vector, oftewel, de som van alle standaard basisvectoren, α is een geheime parameter, en S ∈ Rn×n is een matrix die de link-structuur van het internet codeert. 10 Larry Page (b. 1973) en Sergey Brin (b. 1973) Bekend is dat de entries in iedere kolom van S niet-negatief zijn en optellen op tot één, oftewel, e> S = e> en dus S > e = e. Zo’n matrix heet kolomstochastisch. Merk op dat hier niets anders staat dan dat e een eigenvector is van S > horend bij eigenwaarde λ = 1. Dus heeft ook S een eigenwaarde 1. Omdat ook de kolommen van T optellen tot één, geldt hetzelfde voor G. Dus ook G is kolomstochastisch, en G> e = e. Dus is 1 ook een eigenwaarde van G. De volgende stelling is van groot belang voor het efficiënt kunnen uitrekenen van een eigenvector horend bij λ = 1. Stelling 1.44 Er geldt dim ker(G−I) = 1. Als λ 6= 1 een eigenwaarde is van G, dan |λ| ≤ α. Bewijs. Deze stelling werd in 2003 bewezen door S. Kamvar and T. Haveliwala. Sepandar Kamvar en Taher Haveliwala Ze publiceerden het in een onderzoeksartikel van acht bladzijden getitled The Second Eigenvalue of the Google Matrix (Technical Report, Stanford University) dat inmiddels al ruim driehonderd keer is geciteerd. Het kan veel korter met de Schurdecompositie. Bewijs. Laat U ∗ S > U = R een Schurvorm van S > zijn met de eigenschap dat de eerste kolom √ √ u = U e1 gelijk is aan de (genormaliseerde) eigenvector e/ n van S > . Dan is U ∗ e = ne1 , is de linksboven entry van R aan één, en zijn alle andere diagonaalentries van R in absolute waarde ten hoogste één. Het is niet moeilijk te zien dat ook de matrix U ∗ G> U = αU ∗ S > U + (1 − α) U ∗ ee∗ U = αR + (1 − α)e1 e> 1, n (40) bovendriehoeks is. Immers, αR is bovendriehoeks, en (1 − α)e1 e> 1 is een matrix waarvan de linksboven-entry gelijk is aan 1 − α en de overige entries zijn nul. De linksboven-entry van 11 U ∗ G> U is gelijk aan α · 1 + (1 − α) = 1. De overige diagonaalentries zijn in absolute waarde ten hoogste gelijk aan α. Maar deze diagnonaalentries zijn de eigenwaarden van U ∗ G> U , en dus ook de eigenwaarden van G> , en dus de complex geconjugeerden van de eigenwaarden van G. Omdat we al weten dat G ook een eigenwaarde λ = 1 heeft, weten we nu dat de eigenruimte behorende bij deze eigenwaarde dimensie één heeft als 0 ≤ α < 1. 1.8 Spectraalstellingen voor normale, Hermietse, en unitaire matrices In deze sectie beperken we ons tot lineaire transformaties van complexe inproductruimtes en hun matrices A ∈ Cn×n . We brengen eerst de geadjungeerde transformatie in de herinnering. Definitie 1.45 ((Zelf-)geadjungeerde transformatie) Zij L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i). Dan is de lineaire transformatie L∗ : V → V met de eigenschap dat hL∗ (v), wi = hv, L(w)i voor alle v, w ∈ V (41) de geadjungeerde van de transformatie L. Als L = L∗ heet L zelfgeadjungeerd. Opmerking 1.46 De afbeelding L∗ is door (41) goedgedefinieerd: laat β = {b1 , . . . , bn } een orthonormale basis zijn van V , dan is L∗ (v) = β1 b1 + . . . βn bn waarbij βk uniek bepaald wordt door w = bk te substitueren in (41). De lineariteit van L∗ is nu een eenvoudige oefening. Definitie 1.47 ((Zelf-)geadjungeerde matrix) De geadjungeerde A∗ van een matrix A ∈ > Cn×n is de matrix A∗ = A . Als A∗ = A dan heet A zelfgeadjungeerd. Lemma 1.48 Zij L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i) en K : V → V zijn geadjungeerde. Laat β = {b1 , . . . , bn } een orthonormale basis zijn van V . Dan geldt (42) Kββ = (Lββ )∗ , oftewel, de matrix van de geadjungeerde is gelijk aan de geadjungeerde van de matrix. Bewijs. We passen stap voor stap bekende definities en resultaten toe, 1 2 3 4 5 6 β > > > β e> i (Lβ ej ) = ei coβ (L(bj )) = hbi , L(bj )i = hK(bi ), bj i = hbj , K(bi )i = ej coβ (K(bi )) = ej Kβ ei en concluderen van de ij-de entry van Lββ de geconjugeerde is van de ji-de entry van Kββ . Toelichtingen: (1) coβ (L(v)) = Lββ coβ (v) voor alle v ∈ V en dus ook voor v = bj , waarmee coβ (v) = ej ; (2) als L(bj ) = α1 b1 + · · · + αn bn dan is e> i coβ (L(bj )) = αi maar ook hbi , L(bj )i = αi ; (3) dit geldt precies wegens de definitie (41) van geadjungeerde afbeelding; (4) geconjugeerde symmetrie van een complex inproduct; (5) als K(bi ) = γ1 b1 + · · · + γn bn dan is hbj , K(bj )i = γj maar ook e> j coβ (K(bi )) = γj ; (6) coβ (K(v)) = Kββ coβ (v) voor alle v ∈ V en dus ook voor v = bi , waarmee coβ (v) = ei . 12 Gevolg 1.49 De matrix ten opzichte van een orthonormale basis van een zelfgeadjungeerde lineaire transformatie is zelfgeadjungeerd. Na de geadjungeerde in de herinnering te hebben geroepen, zijn we in staat om normale lineaire transformaties te definiëren. Definitie 1.50 (Normale lineaire transformatie) Een lineaire transformatie L : V → V van een inproductruimte (V, C, h·, ·i) heet normaal als L∗ ◦ L = L ◦ L∗ , (43) waarbij ◦ staat voor de samenstelling van afbeelingen. Definitie 1.51 (Normale matrix) Een matrix A ∈ Cn×n heet normaal als A∗ A = AA∗ . De normale matrices zijn via orthonormale bases gerelateerd aan normale transformaties. Lemma 1.52 Zij L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i) en β een orthonormale basis van V . Dan is L normaal als en alleen als Lββ normaal is. Bewijs. Als Lββ de matrix is van L, dan geeft Lemma 1.48 dat (Lββ )∗ de matrix is van L∗ . Omdat daarnaast de matrix van een samengestelde afbeelding gelijk is aan het product van de matrices van de samenstelende afbeeldingen, volgt de bewering onmiddellijk. We bewijzen nu nog twee belangrijke hulpresultaten, Lemma’s 1.53 en 1.54, voor normale matrices, die zullen uitmonden in de spectraalstelling voor normale matrices en transformaties. Lemma 1.53 A ∈ Cn×n is normaal als en alleen als iedere Schurvorm R van A normaal is. Bewijs. Zij A = U RU ∗ een Schurdecompositie van A. Dan is A∗ = U R∗ U ∗ en dus AA∗ = (U RU ∗ )(U R∗ U ∗ ) = U RR∗ U ∗ en A∗ A = (U R∗ U ∗ )(U RU ∗ ) = U R∗ RU ∗ (44) Dus A∗ A = AA∗ als en alleen als U R∗ RU ∗ = U RR∗ U ∗ . En omdat U inverteerbaar is, is dit zo als en alleen als R∗ R = RR∗ . Lemma 1.54 Iedere normale bovendriehoeksmatrix R ∈ Cn×n is een diagonaalmatrix. Bewijs. Met volledige inductie. Voor n = 1 is de uitspraak triviaal waar. Neem als inductiehypothese aan dat de uitspraak geldt voor iedere bovendriehoeksmatrix T ∈ C(n−1)×(n−1) . Laat R ∈ Cn×n een bovendriehoeksmatrix zijn, en schrijf R∗ R = RR∗ gepartitioneerd uit als ρ 0 ρ r∗ ρ r∗ ρ 0 = (45) r T∗ 0 T 0 T r T∗ waarbij ρ ∈ C, r ∈ Cn−1 en T ∈ C(n−1)×(n−1) bovendriehoeks. Uitvermenigvuldigen met behulp van Lemma 1.17 geeft dat ρρ ρr∗ ρρ + r∗ r r∗ T ∗ = (46) rρ rr∗ + T ∗ T Tr T ∗T Dus is ρρ = ρρ + r∗ r, dus r∗ r = 0 en volgt uit de inproduct-axioma’s dat r = 0. Maar dan is ook rr∗ = 0, dus is T ∗ T = T ∗ T , en dus is T volgens de inductiehypothese diagonaal. 13 Stelling 1.55 (Spectraalstelling: normale matrices) Er is een unitaire matrix U zodanig dat U ∗ AU = Λ een diagonaalmatrix is als en alleen als A ∈ Cn×n normaal is. Bewijs. Zij A ∈ Cn×n normaal. Omdat C algebraı̈sch afgesloten is, bestaat er een volgens Stelling 1.37 een Schurdecompositie A = U RU ∗ van A met U unitair en R bovendriehoeks. Lemma 1.34 geeft dat R net als A normaal is, en Lemma 1.53 bewijst vervolgens dat R een diagonaalmatrix is. Veronderstel omgekeerd dat A = U ΛU ∗ met U unitair en Λ diagonaal, dan geldt dat A∗ = U Λ∗ U ∗ en dus dat A∗ A = (U Λ∗ U ∗ )(U ΛU ∗ ) = U (Λ∗ Λ)U ∗ = U (ΛΛ∗ )U ∗ = (U ΛU ∗ )(U Λ∗ U ∗ ) = AA∗ waarbij we gebruikten dat diagonaalmatrices triviaal normaal zijn. Dus is A normaal. (47) Spectraalstelling 1.55 is van centraal belang binnen de lineaire algebra. Het vertelt exact welke lineaire transformaties L : V → V van een inproductruimte (V, C, h·, ·i) ten opzichte van een geschikt gekozen orthonormale basis β van V een diagonaalgedaante Lββ aannemen. Stelling 1.56 (Spectraalstelling: normale transformaties) Laat L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i) zijn. Dan bestaat er een orthonormale basis β waarvoor Lββ een diagonaalmatrix is als en alleen als L normaal is. Bewijs. Veronderstel dat L normaal is, en laat γ = {c1 , . . . , cn } een orthonormale basis van V zijn. Volgens Lemma 1.52 is Lγγ dan een normale matrix. Op grond van Stelling 1.55 bestaat er een unitaire matrix U zodanig dat U ∗ Lγγ U diagonaal is. De kolommen van U vormen dus een orthonormale basis van eigenvectoren van Lγγ . Zoals bekend is iedere eigenvector van Lγγ de coördinaatvector coγ (v) van een eigenvector v van L. Dus is voor iedere j ∈ {1, . . . , n} is de vector bj ∈ V gedefinieerd door u11 . . . u1n n X .. bj = u1j c1 + · · · + unj cn = uij ci , voor U = ... (48) . i=1 un1 . . . unn een eigenvector van L. Daarnaast is ook β = {b1 , . . . , bn } een orthonormale basis van V , omdat voor alle i, j ∈ {1, . . . , n} geldt hbi , bj i = hu1i c1 + · · · + uni cn , u1j c1 + · · · + unj cn i = u1i u1j + · · · + uni unj = ei U ∗ U ej . (49) Dus is Lββ diagonaal, en zelfs gelijk aan U ∗ Lγγ U . Dit bewijst één van beide implicaties. De andere implicatie is een eenvoudige oefening. De volgende spectraalstelling gaat over de deelverzameling van zelfgeadjungeerde matrices; hiervoor kan een sterker resultaat worden bewezen dan voor normale matrices, in de zin dat de diagonaalmatrix reële entries heeft, welke corresponderen met reële eigenwaarden. Stelling 1.57 (Spectraalstelling: zelfgeadjungeerde matrices) Er bestaat een unitaire matrix U zodanig dat U ∗ AU = Λ een reële diagonaalmatrixis als en alleen als A ∈ Cn×n zelfgeadjungeerd is. 14 Bewijs. Laat A ∈ Cn×n met A∗ = A. Dan is A normaal en bestaat er volgens Stelling 1.55 een unitaire matrix U en een diagonaalmatrix Λ zo, dat U ∗ AU = Λ. Dus is A = U ΛU ∗ , en is A∗ = U Λ∗ U ∗ . Maar omdat A = A∗ volgt hieruit dat Λ = Λ∗ , en dus is de diagonaal reëel. Omgekeerd is triviaal A∗ = A zodra A = U ΛU ∗ met U unitair en Λ reëel diagonaal. Stelling 1.58 (Spectraalstelling: zelfgeadjungeerde transformaties) Laat L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i) zijn. Dan is er een orthonormale basis β waarvoor Lββ reël diagonaal is als en alleen als L zelfgeadjungeerd is. Bewijs. Volledig analoog aan het bewijs van Stelling 1.56, met als toevoeging dat uit Stelling 1.57 volgt dat de eigenwaarden van L reëel zijn. Tot slot bewijzen we de spectraalstellingen voor unitaire afbeeldingen en matrices. Definitie 1.59 (Unitaire lineaire transformatie) Een lineaire transformatie L : V → V van een inproductruimte (V, C, h·, ·i) heet unitair als L∗ ◦ L = id = L ◦ L∗ , waarbij id : V → V staat voor de identieke afbeelding. Opmerking 1.60 De karakterisering L∗ ◦ L = id is equivalent met h(L∗ ◦ L)(v), wi = hv, wi (50) voor alle v, w ∈ V , en met behulp van de definitie van geadjungeerde transformatie met hL(v), L(w)i = hv, wi (51) voor alle v, w ∈ V , wat laat zien dat L hoeken en afstanden behoudt. Definitie 1.61 Een getal z ∈ C heet unimodulair als |z| = 1. Stelling 1.62 (Spectraalstelling: unitaire matrices) Er bestaat een unitaire matrix U en een diagonaalmatrix Λ met unimodulaire diagonaalentries zodanig dat A = U ΛU ∗ als en alleen als A ∈ Cn×n unitair is. Bewijs. Laat A ∈ Cn×n met A∗ A = I. Dan is A normaal en bestaat er volgens Stelling 1.55 een unitaire matrix U en een diagonaalmatrix Λ zo, dat U ∗ AU = Λ. Dus is A = U ΛU ∗ , en is A∗ = U Λ∗ U ∗ . Maar omdat AA∗ = I volgt hieruit dat ΛΛ∗ = I, en dus geldt voor een diagonaalentry λ van Λ dat λλ = 1. Dus is |λ| = 1. Omgekeerd is triviaal A∗ A = I zodra A = U ΛU ∗ met U unitair en Λ diagonaal met unimodulaire diagonaalentries. Stelling 1.63 (Spectraalstelling: unitaire transformaties) Laat L : V → V een lineaire transformatie van een inproductruimte (V, C, h·, ·i) zijn. Dan is er een orthonormale basis β waarvoor Lββ diagonaal is met unimodulaire diagonaalentries als en alleen als L unitair is. Bewijs. Volledig analoog aan het bewijs van Stelling 1.56, met als toevoeging dat uit Stelling 1.62 volgt dat de eigenwaarden van L unimodulair zijn. 15