Eigenwaarden en eigenvectoren in Rn

advertisement
Eigenwaarden en eigenvectoren in Rn
Definitie
Als Ax = λx voor zekere x in Rn met x ̸= 0, dan is λ een eigenwaarde van A en x een
eigenvector van A behorende bij λ.
Nota Bene
Een eigenvector is op een multiplicatieve constante na bepaald.
Definitie
Het polynoom p met p(λ) = det (A − λI) is het karakteristieke polynoom van A.
Nota Bene
Het karakteristieke polynoom p is een polynoom van de graad n.
Stelling
De eigenwaarden van A zijn de wortels van het karakteristieke polynoom.
Bewijs
Als Ax = λx met x ̸= 0, dan geldt (A − λI)x = 0, dus A − λI is singulier, d.w.z.
det (A − λI) = 0.
Definitie
Als het karakteristieke polynoom p te schrijven is als (c − λ)k q(λ) met q een polynoom
van de graad n − k, dan heeft de eigenwaarde c algebraı̈sche multipliciteit k.
Definitie
De eigenruimte behorende bij de eigenwaarde λ bestaat uit alle eigenvectoren van A behorende bij de eigenwaarde λ tezamen met de nulvector. De meetkundige multipliciteit
van λ is de dimensie van de eigenruimte.
Stelling
Zij c een eigenwaarde van A, dan is de algebraı̈sche multipliciteit van c groter dan, of
gelijk aan, de meetkundige multipliciteit.
Bewijs
Zij de meetkundige multipliciteit van c gelijk aan k, dan is er een lineair onafhankelijke
verzameling {v1 , . . . , vk } van eigenvectoren van A behorende bij de eigenwaarde c, dus
Avi = cvi voor i = 1, . . . , k.
Vul de verzameling
{v1 , . . . , vk } aan tot een]basis {v1 , . . . , vk , wk+1 , . . . , wn } van Rn .
[
Noteer P = [v1 · · · vk wk+1 · · · wn , dan geldt
]
(A[− λI)P = (A − λI)v1 · · · (A − λI)vk (A − λI)wk+1 · · ·] (A − λI)wn
= (c − λ)v1 · · · (c − λ)vk (A − λI)wk+1 · · · (A − λI)wn .
Neem
de determinant, dan det (A − λI) det P = det ((A − λI)P )
= (c − λ)v
n
1 · · · (c − λ)vk (A − λI)wk+1 · · · (A − λI)w
k
= (c − λ) v1 · · · vk (A − λI)wk+1 · · · (A − λI)wn 1
= (c − λ)k q(λ) met q een polynoom van de graad n − k. Aangezien det P ̸= 0, geldt
det (A − λI) =
(c − λ)k q(λ)
,
det P
dus de algebraı̈sche multipliciteit van c is groter dan, of gelijk aan, k.
Definitie
De matrices A en B zijn similair als AP = P B voor zekere niet-singuliere matrix P .
Nota Bene
P −1 AP = B en A = P BP −1 .
Stelling
De similaire matrices A en B hebben dezelfde eigenwaarden.
Bewijs
Als AP = P B voor zekere niet-singuliere matrix P , dan det (B − λI) = det (P −1 AP −
λI) = det (P −1 (A − λI)P ) = det P −1 det (A − λI) det P = det1 P det (A − λI) det P =
det (A − λI).
Stelling
Als λ een eigenwaarde van A is met bijbehorende eigenvector x, dan is P −1 x een eigenvector van B behorende bij λ.
Bewijs
Als P BP −1 x = Ax = λx, dan B(P −1 x) = BP −1 x = P −1 Ax = P −1 (λx) = λ(P −1 x).
Definitie
Een matrix A is diagonaliseerbaar als A similair is met een diagonaalmatrix.
Stelling
Een matrix A is diagonaliseerbaar dan, en slechts dan als, A heeft een lineair onafhankelijke verzameling van n eigenvectoren.
Bewijs
(⇒): Veronderstel dat AP = P D met een niet-singuliere matrix P en een diagonaalmatrix D met diag
[ D = (λ1 , . . .], λn ).
Noteer
{v1 , . . . , ]vn } lineair onafhankelijk
[ P = v1 · · ]· vn , dan is de verzameling
[
en Av1 · · · Avn = AP = P D = λ1 v1 · · · λn vn , dus Avi = λi vi voor
i = 1, . . . , n.
(⇐): Veronderstel dat Avi = λi vi voor i = 1, . . . , n met lineair onafhankelijke verzameling {v1 , . . . , vn }.
[
]
v
·
·
·
v
Zij D een
diagonaalmatrix
met
diag
D
=
(λ
,
.
.
.
,
λ
)
en
P
=
, dan geldt
1
n
1
n
[
] [
]
AP = Av1 · · · Avn = λ1 v1 · · · λn vn = P D.
Nota Bene
P en D zijn niet uniek bepaald, maar de volgorde van eigenvectoren in P en eigenwaarden
2
in D moet overeenkomen.
Stelling
Veronderstel dat A m verschillende eigenwaarden heeft, en kies bij iedere eigenwaarde één
bijbehorende eigenvector, dan is de verzameling van deze eigenvectoren lineair onafhankelijk.
Bewijs
Neem aan dat de verzameling van deze m eigenvectoren lineair afhankelijk is, dan geldt
vj = c1 v1 + · · · + cj−1 vj−1 voor zekere j met j ≤ m en Avi = λi vi voor i = 1, . . . , j en
{v1 , . . . , vj−1 } is lineair onafhankelijk, waarbij alle λi verschillend zijn.
Nu geldt Avj = c1 Av1 + · · · + cj−1 Avj−1 = c1 λ1 v1 + · · · + cj−1 λj−1 vj−1 en λj vj =
c1 λj v1 + · · · + cj−1 λj vj−1 , dus 0 = Avj − λj vj = c1 (λ1 − λj )v1 + · · · + cj−1 (λj−1 − λj )vj−1 .
Aangezien {v1 , . . . , vj−1 } lineair onafhankelijk is, volgt c1 (λ1 − λj ) = · · · = cj−1 (λj−1 −
λj ) = 0, dus c1 = · · · = cj−1 = 0, d.w.z. vj = 0.
Dit is in tegenspraak met het gegeven dat vj een eigenvector is, dus de verzameling van
m eigenvectoren is lineair onafhankelijk.
Stelling
Een matrix A is diagonaliseerbaar dan, en slechts dan als, de som van de meetkundige
multipliciteiten van de eigenwaarden van A is n.
Bewijs
(⇒): Als A diagonaliseerbaar is, dan heeft A een lineair onafhankelijke verzameling van n
eigenvectoren, dus de som van de meetkundige multipliciteiten van de eigenwaarden van
A is n.
(⇐): Veronderstel dat de som van de meetkundige multipliciteiten van de eigenwaarden
van A gelijk is aan n, dan heeft A m verschillende eigenwaarden λi voor i = 1, . . . , m.
Bij iedere eigenwaarde λi is er een lineair onafhankelijke verzameling van ki eigenvectoren
{vi,1 , . . . , vi,ki } met k1 + · · · + km = n. Veronderstel dat
m
∑
(ci,1 vi,1 + · · · + ci,ki vi,ki ) = 0.
i=1
Noteer vi = ci,1 vi,1 + · · · + ci,ki vi,ki , dan geldt Avi = λi vi voor i = 1, . . . , m met verschillende λi , en dus v1 + · · · + vm = 0. Uit de vorige stelling volgt dat 0 = vi =
ci,1 vi,1 + · · · + ci,ki vi,ki en dus ci,1 = · · · = ci,ki = 0 voor i = 1, . . . , m, d.w.z. de verzameling van alle n eigenvectoren is lineair onafhankelijk, dus A is diagonaliseerbaar.
Nota Bene
A is diagonaliseerbaar, als A n verschillende eigenwaarden heeft.
Definitie
Als Ax = λx voor zekere x in Cn met x ̸= 0, dan is λ een eigenwaarde van A en x een
eigenvector van A behorende bij λ.
Nota Bene
3
Alle voorgaande stellingen gelden onverminderd in Cn .
Hoofdstelling van de Algebra
Ieder niet-constant polynoom met complexe coëfficiënten heeft tenminste één complexe
wortel.
Stelling
det (A − λI) = (c1 − λ) · · · (cn − λ) voor zekere complexe getallen c1 , . . . , cn .
Bewijs
Zij pn (λ) = det (A − λI) voor alle λ in C, dan heeft pn een complexe wortel cn , en een
staartdeling geeft het (n − 1)e -graads polynoom pn−1 met
pn−1 (λ) =
pn (λ)
.
cn − λ
Nu heeft pn−1 een wortel cn−1 , en geeft een staartdeling het (n − 2)e -graads polynoom
pn−2 met
pn−2 (λ) =
pn−1 (λ)
.
cn−1 − λ
Zo voortgaand volgt dat pn (λ) = (cn − λ) · · · (c1 − λ) voor zekere complexe getallen
c1 , . . . , c n .
Nota Bene
Sommige van de getallen c1 , . . . , cn kunnen gelijk zijn. Dit betekent dat niet iedere matrix
een lineair onafhankelijke verzameling van n eigenvectoren heeft.
Stelling
Zij x een complexe eigenvector behorende bij een complexe eigenwaarde λ van A, dan
gheldt
λ=
x̄T Ax
.
x̄T x
Bewijs
Als Ax = λx, dan geldt x̄T Ax = x̄T (λx) = λx̄T x.
definitie
Een reële matrix A is symmetrisch als AT = A.
Stelling
Zij A een reële matrix. Als A symmetrisch is, dan geldt det (A − λI) = (c1 − λ) · · · (cn − λ)
voor zekere reële getallen c1 , . . . , cn .
Bewijs
det (A − λI) = (c1 − λ) · · · (cn − λ) voor zekere complexe getallen c1 , . . . , cn , dus zijn er
4
vectoren v1 , . . . , vn , zodat Avi = ci vi voor i = 1, . . . , n. Nu geldt
c¯i =
xT Āx̄
x̄T Ax
x̄T Āx
x̄T Ax
=
=
=
= ci .
x̄T x
x̄T x
x̄T x
x̄T x
Definitie De verzameling reële vectoren {v1 , . . . , vm } is orthonormaal als
{
1 als i = j,
T
vi vj =
0 als i ̸= j.
Stelling
Een orthonormale verzameling vectoren is lineair onafhankelijk.
Bewijs
Veronderstel dat {v1 , . . . , vm } orthonormaal is. Zij c1 v1 + · · · + cm vm = 0, dan volgt voor
i = 1, . . . , m:
ci = ci viT vi = viT (ci vi ) = viT (c1 v1 + · · · + cm vm ) = viT 0 = 0.
Stelling Zij A een reële matrix. Als A symmetrisch is, dan is er een orthonormale
verzameling van n eigenvectoren van A.
Bewijs
De reële matrix A is symmetrisch, dus det (A − λI) = (c1 − λ) · · · (cn − λ) voor zekere
reële getallen c1 , . . . , cn .
Zij vn een eigenvector behorende bij de eigenwaarde cn van A, waarbij vnT vn = 1. Noteer
An = A.
Definieer An−1 = An −cn vn vnT , dan geldt ATn−1 = ATn −cn (vnT )T vnT = An −cn vn vnT = An−1 ,
d.w.z. An−1 is symmetrisch.
Tevens geldt An−1 vn = An vn − cn vn vnT vn = cn vn − cn vn = 0, d.w.z. vn is een eigenvector van An−1 behorende bij de eigenwaarde 0. Hieruit volgt, dat det (An−1 − λI) =
(c1 − λ) · · · (cn−1 − λ)λ voor zekere reële getallen c1 , . . . , cn−1 . Als vnT w = 0, dan geldt
vnT (An−1 w) = wT An−1 vn = wT 0 = 0, dus de overige eigenvectoren van An−1 staan loodrecht op Span{vn }.
T
Zij nu vn−1 een eigenvector behorende bij de eigenwaarde cn−1 van A, waarbij vn−1
vn−1 =
T
1. Definieer An−2 = An−1 −cn−1 vn−1 vn−1 , dan is An−2 symmetrisch, en vn−1 en vn zijn eigenvectoren van An−2 behorende bij de eigenwaarde 0. Hieruit volgt, dat det (An−2 −λI) =
(c1 − λ) · · · (cn−2 − λ)λ2 voor zekere reële getallen c1 , . . . , cn−2 . De overige eigenvectoren
van An−2 staan loodrecht op Span {vn−1 , vn }. Enzovoorts.
Nota Bene
Als de reële matrix A symmetrisch is, dan det (A − λI) = (c1 − λ) · · · (cn − λ) met
een orthonormale verzameling van eigenvectoren {v1 , . . . , vn }, d.w.z. Avi = ci vi voor
i = 1, . . . , n. Nu geldt
A = c1 v1 v1T + · · · + cn vn vnT .
Definitie
5
Een reële vierkante matrix P is orthogonaal als P T P = I.
Stelling
[
]
Zij P = v1 · · · vn , dan geldt:
P is orthogonaal dan , en slechts dan als, {v1 , . . . , vn } is orthonormnaal.
Bewijs
Dit volgt direct uit


v1T
[

P T P =  ...  v1 · · ·
vnT

vn
]


=

v1T v1 v1T v2 · · ·
v2T v1 v2T v2 · · ·
..
..
.
.
T
T
vn v1 vn v2 · · ·
v1T vn
v2T vn
..
.



.

vnT vn
Nota Bene
Als P orthogonaal is, dan geldt P −1 = P T .
Definitie
Een reële matrix A is orthogonaal diagonaliseerbaar als AP = P D met orthogonale matrix P en diagonaalmatrix D.
Nota Bene
P T AP = D en A = P DP T .
Stelling
Zij A een reële matrix, dan geldt:
A is orthogonaal diagonaliseerbaar dan, en slecht dan als, A is symmetrisch.
Bewijs
(⇒): Zij AP = P D met orthogonale matrix P en diagonaalmatrix D, dan geldt A =
P DP T en dus AT = (P T )T DT P T = P DP T .
(⇐): Zij A symmetrisch, dan is er een orthonormale verzameling {v1 , [. . . , vn } van eigen]
vectoren van A, d.w.z. Avi = ci vi voor i = 1, . . . , n. Definieer P = [ v1 · · · vn ] en
[de diagonaalmatrix
] D[met diag D = (c1], . . . , cn ), dan geldt AP = A v1 · · · vn =
Av1 · · · Avn = c1 v1 · · · cn vn = P D en P is orthogonaal.
Nota Bene
A = P DP T = c1 v1 v1T + · · · + cn vn vnT .
Definitie
Zij A een reële matrix. Als A symmetrisch is, dan wordt de kwadratische vorm van A
gedefinieerd door Q(x) = xT Ax voor alle x in Rn .
Definitie
Een kwadratische vorm is:
• positief definiet als Q(x) > 0 voor alle x met x ̸= 0,
6
• negatief definiet als Q(x) < 0 voor alle x met x ̸= 0,
• indefiniet als Q(x) positieve en negatieve waarde aanneemt.
Stelling
Zij A een reële matrix. Als A symmetrisch is, dan is de kwadratische vorm Q van A:
• positief definiet dan, en slechts dan als, alle eigenwaarden van A zijn positief,
• negatief definiet dan, en slechts dan als, alle eigenwaarden van A zijn positief,
• indefiniet dan, en slecht dan als, A heeft positieve en negatieve eigenwaarden.
Bewijs
Als A symmetrisch is, dan geldt AP = P D met orthogonale matrix P en diagonaalmatrix D met diag D = (c1 , . . . , cn ). Hieruit volgt Q(x) = xT Ax = xT P DP T x =
(P T x)D(P T x) = yT Dy = c1 y12 + · · · + cn yn2 met y = P T x. Hieruit volgen de te bewijzen
beweringen.
7
Download