a appendix - lineaire algebra

advertisement
A APPENDIX - LINEAIRE ALGEBRA
A
241
APPENDIX - LINEAIRE ALGEBRA
A.1
A.1.1
Vectorrekening over de reële ruimte
Scalaren en vectoren
We onderscheiden
• scalaren (of scalaire grootheden): door een getal bepaalde grootheden, zoals massa en
temperatuur.
• vectoren: door een richting èn een getal bepaalde grootheden, zoals snelheid en kracht. Dit
getal heet de grootte of de absolute waarde van de vector.
Notaties
a, b, p, x, etc. zijn scalaren
~ B,
~ x, y, x, y zijn vectoren
A, B, A,
|A| = A is de absolute waarde van A.
a heet een eenheidsvector als |a| = 1.
A k B betekent: A en B hebben dezelfde richting. Er geldt dan ook B k A.
A en −A zijn vectoren met gelijke grootte en tegengestelde richtingen.
Opmerkingen
• Vectoren kunnen door pijlen gerepresenteerd worden. Alle evenwijdige, gelijkgerichte, even
lange pijlen stellen éénzelfde ‘vrije’ vector voor.
• De nulvector 0 is een vector met onbepaalde richting en met grootte 0.
• Uit A k B en A = B volgt A = B en omgekeerd.
A.1.2
Product van een scalar en een vector
Voor het product van een scalar en een vector geldt de volgende definitie:
als c > 0, dan (cA) k A en |cA| = cA;
als c < 0, dan (cA) k −A en |cA| = −cA;
als c = 0, dan cA = 0;
met als gevolg dat wanneer a de eenheidsvector is in de richting van A dan is A = Aa.
A.1.3
Som en verschil van vectoren
Elke twee vectoren A en B hebben een som, A+B. Als het beginpunt van de pijl die B representeert samenvalt met het eindpunt van de pijl die A voorstelt, dan wordt A + B gerepresenteerd
door de pijl vanaf het beginpunt van de A-pijl naar het eindpunt van de B-pijl. Dit wordt
weergegeven in Fig. 101.
Voor optellen van vectoren gelden de axioma’s
1. ∀A,B [A + B = B + A]
commutatieve eigenschap
2. ∀A,B,C [(A + B) + C = A + (B + C)]
3. ∃0 ∀A [A + 0 = A]
associatieve eigenschap
0 heet het neutrale element
4. ∀A ∃−A [A + (−A) = 0]
Voor vermenigvuldigen van vectoren met scalaren gelden de axioma’s
inversiteits eigenschap
A APPENDIX - LINEAIRE ALGEBRA
242
1. ∀p,q,A [(p + q)A = pA + qA]
eerste distributieve eigenschap
2. ∀p,A,B [p(A + B) = pA + pB]
tweede distributieve eigenschap
3. ∀p,q,A [p(qA) = (pq)A]
associatieve eigenschap
4. ∀A [1A = A]
neutraliteitseigenschap van het getal 1.
Figuur 101: Representatie van het optellen van twee vectoren A en B. Het resultaat is de
vector A+B.
Verder geldt de definitie
A − B = A + (−B) en A − B heet het verschil van A en B.
A.1.4
Lineaire afhankelijkheid; ontbinden van vectoren, kentallen
De som pA + qB heet een lineaire combinatie van A en B, terwijl pA + qB + rC een lineaire
combinatie heet van A, B en C.
Definitie: een stelsel vectoren heet lineair onafhankelijk als geen van die vectoren gelijk is aan
een lineaire combinatie van andere vectoren uit dat stelsel.
Stelling: A, B en C zijn lineair onafhankelijk dan en slechts dan als uit pA + qB + rC = 0 volgt
dat p = q = r = 0.
Als A + B = C, dan heten A en B de componenten van C in de richtingen van A en B.
Als i, j en k de eenheidsvectoren zijn in de richtingen van de positieve x-, y- en z-as van een
cartesiaans coördinatenstelsel, dan is
A = A1 i + A2 j + A3 k.
(840)
Elke vector A is dus gelijk aan een lineaire combinatie van de onderling lineair onafhankelijke
vectoren i, j en k. De getallen A1 , A2 en A3 noemen we de kentallen van A ten opzichte van de
basis {i, j, k}.
Blijkbaar geldt
1. A + B = (A1 + B1 )i + (A2 + B2 )j + (A3 + B3 )k,
2. cA = cA1 i + cA2 j + cA3 k,
p
3. A = A21 + A22 + A23 .
A APPENDIX - LINEAIRE ALGEBRA
243
Figuur 102: De vector A kan ontbonden worden in een lineaire combinatie van de onderling
lineair onafhankelijke vectoren i, j en k die een basis vormen.
A.1.5
Inwendig of scalair product van vectoren
Definitie
A · B ≡ A · B · cos ∠(A; B)
(841)
Het inwendig product van vectoren is dus een scalar.
Eigenschappen
1. ∀A,B [A · B = B · A]
commutatieve eigenschap
2. ∀A,B,C [A · (B + C) = A · B + A · C]
distributieve eigenschap
Uit de definitie volgt
A · A = A2
en
A·B=0
als A ⊥ B.
(842)
Dus ook i · i = j · j = k · k = 1 en i · j = j · k = k · i = 0 en dus
A · B = A1 B1 + A2 B2 + A3 B3 =
3
X
Ai B i .
(843)
i=1
Merk op dat als A · B = 0, dan is A = 0 of B = 0 of A ⊥ B.
A.1.6
Uitwendig of vectorieel product van vectoren
Definitie: A × B is een vector C waarvan
1. de absolute waarde gelijk is aan C = AB| sin ∠(A; B)| en
2. (als C 6= 0) de richting bepaald worden door C ⊥ A en C ⊥ B, terwijl de richting van
voortgang van C volgens de rechterhandregel past bij de richting van draaiing van A naar
B over de kleinste hoek.
A APPENDIX - LINEAIRE ALGEBRA
244
Merk op dat de grootte van het uitwendig product A × B gelijk is aan de oppervlakte van de op
A en B als zijden beschreven parallellogram.
Voor het uitwendig product gelden de eigenschappen
1. ∀A,B [B × A = −(A × B)]
anti-commutativiteits eigenschap.
2. ∀A,B,C [A × (B + C) = A × B + A × C]
distributiviteits eigenschap.
Uit de definitie volgt
i × j = −j × i = k
j × k = −k × j = i
k × i = −i × k = j
(844)
en
A × B = 0,
als
A k B.
(845)
In het bijzonder geldt dus dat
A × A = 0,
(846)
i × i = j × j = k × k = 0.
(847)
en dus ook
Volgens de distributiviteits eigenschap is dus
A × B = (A2 B3 − A3 B2 )i + (A3 B1 − A1 B3 )j + (A1 B2 − A2 B1 )k.
(848)
Merk op dat als A × B = 0, dan A = 0 of B = 0 of A k ±B.
A.1.7
Determinantnotatie voor het uitwendig product
Definitie
a b
c d
Definitie
a b c
p q r
x y z
Dus
≡a· q r
y z
≡ ad − bc.
−b· p r
x z
(849)
+c· p q
x y
i
j
k
A × B = A1 A2 A3 .
B1 B2 B3 A.1.8
(850)
(851)
Tripelproducten
Drie vectoren kunnen zodanig vermenigvuldigd worden dat het resultaat een scalar of een vector
is. In dat geval vinden we de volgende relaties.
1. Scalair product
De inhoud van het parallellepipedum op A, B en C is gelijk aan de absolute waarde van
A1 A2 A3 A · (B × C) = B · (C × A) = C · (A × B) = (ABC) = B1 B2 B3 .
(852)
C1 C2 C3 2. Vectorieel product
A × (B × C) = (A · C)B − (A · B)C.
(853)
A APPENDIX - LINEAIRE ALGEBRA
245
Figuur 103: De inhoud van het parallellepipedum op A, B en C is gelijk aan de absolute
waarde van A · (B × C).
A.1.9
Voorbeelden
1. Als A = 2i − 3j + k, dan is A =
p
√
22 + (−3)2 + 12 = 14.
2. Gegeven: A = 2i − 3j + k en B = 5i + j − 7k.
Te bewijzen: A ⊥ B.
Bewijs:
A · B = A1 B1 + A2 B2 + A3 B3
= 2 · 5 + (−3) · 1 + 1 · (−7)
= 10 − 3 − 7 = 0,
(854)
dus A ⊥ B.
3. Gegeven: A = 3i − 4j + 5k en B = i + 2j − k.
Te berekenen: cos ∠(A; B).
Oplossing:
A · B = AB
p · cos ∠(A; B) p
= √ 32 +√(−4)2 + 52 · 12 + 22 + (−1)2 · cos ∠(A; B)
= 50 · 6 · cos ∠(A; B).
(855)
Verder geldt
A · B = A1 B1 + A2 B2 + A3 B3 = 3 − 8 − 5 = −10.
√
√
Dus 10 3 · cos ∠(A; B) = −10, ofwel cos ∠(A; B) = − 13 3.
4. Als A = 2i − 3j + k en B = 5i + j − 7k, dan is
i j
k
−3 1 2 1 2 −3 A × B = 2 −3 1 = i − j 5 −7 + k 5 1 1
−7
5 1 −7 = (−3 · −7 − 1 · 1)i − (2 · −7 − 1 · 5)j + (2 · 1 − −3 · 5)k
= 20i + 19j + 17k.
(856)
(857)
A APPENDIX - LINEAIRE ALGEBRA
A.2
246
Complexe grootheden
We definiëren de imaginaire eenheid als i2 ≡ −1 en hiermee geldt i =
wordt nu geschreven als
z ≡ x + iy,
√
−1. Een complex getal
(858)
waarbij x = Re z het reële deel en y = Im z het imaginaire deel130 van z is. Verder geldt
er dezelfde algebra als voor gewone getallen. Bijvoorbeeld hebben we z1 = z2 als x1 = x2 en
y1 = y2 .
De complex geconjugeerde van z = x + iy duiden we aan met z ∗ en er geldt
z ∗ ≡ x − iy,
complex geconjugeerde van z.
(859)
Hiermee geldt
z ∗ z = (x − iy)(x + iy) = x2 − i2 y 2 − ixy + ixy = x2 − i2 y 2 = x2 + y 2 .
(860)
Dit doet direct denken aan de stelling van Pythagoras. We zien hier de definitie van het inprodukt
voor complexe getallen. Fig. 104 geeft hiervan een geometrische voorstelling in het complexe vlak.
Figuur 104: Representatie van het complexe getal z door het punt met label P in het complexe
vlak.
Het complexe vlak wordt gevormd door de reële en imaginaire as. We kunnen het getal z
voorstellen door het punt P met cartesische coördinaten x = r cos α en y = r sin α, waarbij men
r de modulus en α de fase noemt. Er geldt dan dat r2 = x2 + y 2 en dus
z = r(cos α + i sin α)
en
z ∗ z = r 2 = x2 + y 2 .
(861)
Fig. 105 geeft de rotatie weer in het complexe vlak van punt P naar P 0 over een kleine hoek dα.
Hierbij ligt punt P op de reële as. We merken op dat
dz = izdα →
dz
= idα.
z
Integratie van een eindige rotatie over hoek α levert
Z zeind
Z α
dz
zeind
=i
dα → ln
= iα → zeind = zbegin eiα .
zbegin
zbegin z
0
130
Merk op dat y een reëel getal is.
(862)
(863)
A APPENDIX - LINEAIRE ALGEBRA
247
Figuur 105: Rotatie over een infinitesimale hoek dα van het punt met label P in het complexe
vlak.
We nemen vervolgens r = 1 en dus zbegin = 1 en vinden zeind = cos α + i sin α. Vergelijken van
beide resultaten geeft de stelling van Euler,
eiα = cos α + i sin α.
(864)
Uit een rotatie in negatieve zin vinden we
e−iα = cos α − i sin α.
(865)
Combineren van de laatste twee vergelijkingen levert de uitdrukkingen
cos α =
eiα + e−iα
2
en
sin α =
eiα − e−iα
.
2i
(866)
We kunnen met behulp van de stelling van Euler de complex geconjugeerde definiëren als
∗
eiα = e−iα .
(867)
∗
Verder geldt ook r2 = z ∗ z = eiα eiα = e−iα eiα = e0 = 1.
We kunnen de complexe exponent als volgt differentiëren,
deiα
= ieiα .
dα
(868)
Merk op dat we vaak functies als eikx , ei(kx−ωt) en e−iEt/k zullen gebruiken. We hebben dan
bijvoorbeeld
deikx
= ikeikx .
(869)
dx
Tenslotte merken we op dat de veel voorkomende superpositie van vlakke golven,
ψ(x, t) = cos (kx − ωt) + γ sin (kx − ωt),
(870)
met γ = ±i geschreven kan worden als
ψ(x, t) = e±i(kx−ωt) .
(871)
Deze functies stellen vlakke golven voor van een vrij deeltje met golfgetal k en hoekfrequentie ω.
A APPENDIX - LINEAIRE ALGEBRA
A.3
A.3.1
248
Lineaire ruimten en lineaire afbeeldingen
Lineaire ruimten
Elke verzameling, waarbinnen de elementen ‘opgeteld’ en ‘met een scalar vermenigvuldigd’ kunnen worden, wordt een lineaire ruimte ofwel een vectorruimte genoemd en de elementen ervan
heten vectoren.
Definitie: Een verzameling L heet een lineaire ruimte over een getallenlichaam K als geldt
• ∀a,b∈L ∃!c∈L [a + b = c]
• ∀p∈K,a∈L ∃!b∈L [pa = b],
terwijl de volgende acht axioma’s gelden
1. ∀a,b∈L [a + b = b + a]
2. ∀a,b,c∈L [(a + b) + c = a + (b + c)]
3. ∃0∈L ∀a∈L [a + 0 = a]
4. ∀a∈L ∃−a∈L [a + (−a) = 0]
5. ∀p,q∈K,a∈L [(p + q)a = pa + qa]
6. ∀a,b∈L,p∈K [p(a + b) = pa + pb
7. ∀p,q∈K,a∈L [p(qa) = (pq)a]
8. ∀a∈L [1a = a]
We hebben in hoofdstuk A.1 reeds gezien dat vectoren aan bovenstaande axioma’s voldoen.
Hier bekijken we een en ander op meer abstractie wijze en het getallenlichaam K kan K ∈ R,
respectievelijk K ∈ C, zijn. Men spreekt dan van een reële, respectievelijk complexe, vectorruimte
L. In paragraaf A.1 hebben we ons beperkt tot een discussie van reële vectorruimten. Ook in
deze paragraaf beschouwen we enkel reële vectorruimten. Later zullen we de discussie uitbreiden
tot complexe vectorruimten.
A.3.2
Eigenschappen
Als L een lineaire ruimte is gelden de volgende
Stellingen
1. ∃!0∈L ∀a∈L [a + 0 = a]
2. ∀a∈L ∃!−a∈L [a + (−a) = 0]
Definitie a − b ≡ a + (−b)
Stellingen
1. ∀a,b,c∈L [a + b = c ⇔ a = c − b]
2. ∀a∈L [0a = 0]
3. ∀a∈L [(−1)a = −a]
4. ∀p∈R [p0 = 0]
A APPENDIX - LINEAIRE ALGEBRA
A.3.3
249
Lineaire onafhankelijkheid, basis, dimensie
Definitie: Een deelverzameling S van een lineaire ruimte L heet een onafhankelijke stelsel vectoren
als S 6= {0}, terwijl geen enkel element van S gelijk is aan een lineaire combinatie van andere
elementen van S.
Stelling 1: Als 0 ∈ S, dan is S een afhankelijk stelsel.
Stelling 2: S = {a1 , .., an } is dan en slechts dan een onafhankelijk stelsel als uit
volgt dat ci = 0 voor alle i = 1, .., n.
Pn
i=1 ci ai
=0
Definitie: B heet een basis van de lineaire ruimte L als
1. B ⊂ L,
2. B een onafhankelijk stelsel is,
3. elk element van L gelijk is aan een lineaire combinatie van elementen van B.
Als B = {e1 , ..en } dan geldt
"
∀a∈L ∃a1 ,..,an ∈R a =
n
X
#
ai ei .
(872)
i=1
Deze getallen a1 tot en met an heten de kentallen van a ten opzichte van de basis B. We noemen
(i, j, k) ‘de’ basis van R3 van de drietallige getalgrepen.
Stelling 3: Als de lineaire ruimte L een basis heeft die uit n elementen bestaat, dan bestaat elke
basis van L uit n elementen.
Definitie: De dimensie van L is het aantal elementen van de basis van L.
A.3.4
Inwendig product, norm en orthogonaliteit van vectoren
Definitie: Een inwendig product binnen een vectorruimte L is een afbeelding van L × L naar R,
waarvoor, als (a, b) ∈ R het aan a ∈ L en b ∈ L toegevoegde getal is, geldt
1. ∀a,b∈L [(a, b) = (b, a)]
2. ∀a,b,c∈L [(a, b + c) = (a, b) + (a, c)]
3. ∀a,b∈L,p∈R [(pa, b) = p(a, b)]
4. ∀a∈L [(a, a) ≥ 0]; (a, 0) = 0
Het getal A · B = AB cos ∠(A; B) zullen we ‘het’ inwendig product in V3 noemen. Met ‘het’
inwendig product in Rn duiden we aan


b1
 . 
n

 X


(a, b) = (a1 , .., an )  .  =
ai bi .
(873)
 .  i=1
bn
Dit inwendig product noteren we dus door de eerste vector als rijvector en de tweede als kolomvector te schrijven.
p
Definitie: De norm |a| van de vector a is het getal (a, a).
Definitie: De vectoren a en b zijn onderling orthogonaal dan en slechts dan als (a, b) = 0.
A APPENDIX - LINEAIRE ALGEBRA
A.3.5
250
Lineaire afbeeldingen
Een afbeelding van de verzameling A naar de verzameling B is een relatie waarvan A de originelenverzameling is en B de beeldverzameling omvat, terwijl elk origineel één beeld heeft (een
functie is dus een afbeelding).
Definitie: Een afbeelding F van de lineaire ruimte L1 naar de lineaire ruimte L2 heet een lineaire
afbeelding als
1. ∀a,b∈L1 [F(a + b) = F(a) + F(b)] en
2. ∀a∈L1 ,p∈R [F(pa) = pF(a)] .
Merk op dat als B = {e1 , .., eP
n } een basis is van L dan is de afbeelding van L naar Rn , waarvoor
geldt dat het beeld van a = ni=1 ai ei de ‘kentalvector’ (a1 , .., an ) is, een lineaire afbeelding.
A APPENDIX - LINEAIRE ALGEBRA
A.4
A.4.1
251
Matrixrekening
Matrices
Het stelsel van k lineaire vergelijkingen met n onbekenden x1 tot en met xn ,
a11 x1 + a12 x2 + ... + a1n xn = b1
a21 x1 + a22 x2 + ... + a2n xn = b2
.
.
.
.
.
.
.
.
.
ak1 x1 + ak2 x2 + ... + akn xn = bk
is volkomen gekarakteriseerd

a11
 a21

 .

 .

 .
ak1
door de getalverzamelingen
 

a12 ... a1n
x1


a22 ... a2n 
  x2 


. 
, . 


.   . 

.   . 
ak2 ... akn
xn

en







b1
b2
.
.
.
bk
(874)




.



(875)
Het eerste van deze getallenschema’s heet een matrix van de orde k × n; deze matrix bevat
namelijk k rijen en n kolommen. De andere twee getalgroepen zijn blijkbaar kolomvectoren, die
ook opgevat kunnen worden als matrices van de orde n × 1, respectievelijk k × 1.
Definitie: Een matrix is een in rijen en kolommen gesorteerde getalverzameling.
De getallen van die verzameling heten de elementen van de matrix. Ze worden bij voorkeur met
twee indices genoteerd, waarvan de eerste het rangnummer van de rij en de tweede dat van de
kolom aangeeft.
Als het aantal rijen k en het aantal kolommen n is dan heet k × n de orde van de matrix. Als
k = n dan heet de matrix een vierkante matrix van de orde n ofwel een n × n matrix.
De matrix met elementen aij , (i = 1, .., k; j = 1, .., n) wordt dan wel kortweg aangeduid met
A = (aij ), (k × n).
(876)
Opmerkingen:
1. Elke rij van een matrix is op zichzelf beschouwd een rijvector en elke kolom van de matrix
een kolomvector.
2. A = B betekent dat A en B van dezelfde orde, k × n, zijn en dat aij = bij voor elke
i = 1, .., k en elke j = 1, .., k.
A.4.2
Determinant van een matrix
a b
De determinant van de matrix A =
is het
c d
a b
|A| = det A = c d
getal
= ad − bc.
(877)
De ondermatrix Aij van de matrix A is de matrix die ontstaat als uit A de ide rij en de j de
kolom weggelaten worden.
A APPENDIX - LINEAIRE ALGEBRA
252


1 2 3
2 3
Voorbeeld: Als A =  2 5 6 , dan is A21 =
.
9 2
1 9 2
De determinant van de vierkante matrix A, (n × n) is het getal
det A = |A| =
n
X
(−1)i+j aij |Aij |, (i = 1, . . . , n),
(878)
(−1)i+j aij |Aij |, (j = 1, . . . , n).
(879)
j=1
en ook
det A = |A| =
n
X
i=1
Dit zijn de formules voor het ontwikkelen van det A volgens de ide rij, respectievelijk volgens de
j de kolom.
Voorbeeld: We ontwikkelen volgens de eerste rij.
1
2
3
0 5 −1 5 −1
0
−1
0 5 =1·
−2·
+ 3 · −3 1
2 1
2 −3
2 −3 1 A.4.3
= 15 + 22 + 9 = 46.
(880)
Product van een matrix met een kolomvector
Definitie: Het product van een k × n-matrix A met een n-dimensionale kolomvector x is gelijk
aan de k-dimensionale kolomvector b waarvan het ie -element, (i = 1, .., k), gelijk is aan het
inwendig product van de ie -rijvector van de matrix A met de kolomvector x.
Dus
Pn als A = (aij ), (k × n) en x = (xi ), (n × 1), dan is b = (bi ), (k × 1), waarbij bi =
j=1 aij xj , (i = 1, .., k).
Het hele vergelijkingenstelsel van de paragraaf A.4.1 kan dus genoteerd worden als Ax = b.
A.4.4
Matrix als transformatie-operator
Als A = (aij ), (k × n), dan definieert Ax = y een afbeelding van x naar Rk ,
A : x(∈ Rn ) → Ax(= y ∈ Rk ).
(881)
Deze afbeelding is blijkbaar een lineaire afbeelding, want
1. ∀x,y∈Rn [A(x + y) = Ax + Ay] en
2. ∀x∈Rn ,p∈C [A(px) = pAx].
Stellingen:
1. Als A = (aij ), (k × n), terwijl {e1 , .., en } de basis van Rn is, dan is Aei de ie -kolomvector
van A, (i = 1, .., n).
2. Als T een lineaire afbeelding is van Rn naar Rk , dan bestaat er een matrix A, (k × n),
zodanig , dat voor elke x ∈ Rn geldt, dat het beeld van x onder de transformatie T (dus
T x) gelijk is aan het product Ax.
Deze matrix A is de matrix waarvan de ie -kolomvector, (i = 1, .., n), het T -beeld van de ie
basisvector ei van Rn (dus T ei ) is. Deze A heet de transformatiematrix van de afbeelding
T.
A APPENDIX - LINEAIRE ALGEBRA
A.4.5
253
Som van matrices
Als A = (aij ), (k × n) en B = (bij ), (k × n), dan is de afbeelding C die aan x ∈ Rn als beeld
toevoegt Cx = Ax + Bx een lineaire afbeelding. De transformatiematrix van deze afbeelding is
C = (cij ), (k × n),
met
cij = aij + bij , (i = 1, .., k; j = 1, .., n).
(882)
Deze matrix C noemen we de som van matrices A en B. Merk op dat enkel matrices van gelijke
orde een som hebben. De vermenigvuldiging met een kolomvector is distributief ten opzichte van
matrixoptelling. Bovendien is matrixoptelling commutatief en associatief.
1 2 3
2 3 0
Voorbeeld: Als A =
en B =
, dan
0 1 4
−1 2 5
A+B=
en
A−B=
A.4.6
1+2 2+3 3+0
0 + (−1) 1 + 2 4 + 5
1−2 2−3 3−0
0 − (−1) 1 − 2 4 − 5
=
=
3 5 3
−1 3 9
−1 −1
3
1 −1 −1
(883)
.
(884)
Product van scalar met matrix
Als A = (aij ), (k × n), dan is A + A = (aij + aij ) = (2aij ). Deze matrix van orde k × n noemen
we 2A. Analoog kan het product van een matrix met een willekeurige scalar gedefinieerd worden
als
pA = (paij ).
(885)
Zowel ten opzichte van optellen van matrices als van scalaren is deze vermenigvuldiging distributief, (p + q)A = pA + qA en p(A + B) = pA + pB. Bovendien geldt de associatieve eigenschap
(pq)A = p(qA), terwijl kennelijk 1A = A.
Samenvattend concluderen we dat de verzameling van matrices van een bepaalde orde een lineaire
ruimte is.
A.4.7
Product van matrices
Definitie: Het product AB = C van de matrix A = (aij ), (k × m) met de matrix B = (bij ), (m ×
n), is de matrix C = (cij ), (k × n), waarvan
cij =
m
X
aih bhj , (i = 1, .., k; j = 1, .., n).
(886)
h=1
Het element cij van C is dus gelijk aan het inwendig product van de ie rijvector van A met de
j e kolomvector van B.


3 −4
1 2 1
5 , dan
Voorbeeld: Als A =
en B =  1
4 0 2
−2
2
AB =
1 2 1
4 0 2
Opmerkingen


3 −4
1(3)
+
2(1)
+
1(−2)
1(−4)
+
2(5)
+
1(2)
3
8
 1
5 =
=
.
4(3) + 0(1) + 2(−2) 4(−4) + 0(5) + 2(2)
8 −12
−2
2
(887)
A APPENDIX - LINEAIRE ALGEBRA
254
1. De vermenigvuldiging van een matrix met een kolomvector is een bijzonder geval van deze
matrixvermenigvuldiging: een kolomvector is immers een matrix van de orde m × 1.
2. Het product AB bestaat slechts dan als het aantal kolommen van A gelijk is aan het aantal
rijen van B.
Matrix vermenigvuldiging is in het algemeen niet commutatief, AB 6= BA. Het verschil tussen
deze twee volgordes noemen we de commutator,
[A, B] ≡ AB − BA.
(888)
Tenslotte merken we op dat matrixvermenigvuldiging wel associatief is ((AB)C = A(BC) =
ABC) en distributief ((A + B)C = AC + BC en A(B + C) = AB + AC).
A.4.8
Diagonale matrices
Onder de hoofddiagonaal van een vierkante matrix A = (aij ) van de n-de orde verstaan we de
getallenrij (a11 , a22 , .., ann ). Een diagonale matrix is een vierkante matrix A = (aij ), waarvoor
geldt, dat aij = 0 als i 6= j, terwijl er minstens één i is waarvoor aii 6= 0. Alleen in de
hoofddiagonaal staan dus elementen die ongelijk nul zijn.
Als P een diagonale matrix is waarvan alle diagonaalelementen gelijk aan p zijn en B een zodanige
matrix is, dat PB, respectievelijk BP bestaat, dan is volgens de definitie van matrixvermenigvuldiging en vermenigvuldigen met een scalar
PB = pB,
respectievelijk
BP = pB.
(889)
Een diagonale matrix, waarvan alle diagonaaltermen onderling gelijk zijn heet daarom een scalaire
matrix. Een scalaire matrix, waarvan alle diagonaaltermen gelijk zijn aan 1 wordt aangeduid
met de letter I. Zo een eenheidsmatrix I is neutraal element ten opzichte van matrixvermenigvuldiging.
A.4.9
Geadjugeerde en inverse matrices
Definitie: De geadjugeerde matrix adj A = (αij ), (n × n), van de matrix A = (aij ), (n × n), is
de matrix, waarvan het algemene element gelijk is aan αij = (−1)i+j |Aji |.
Definitie: Als AB = I, dan heet B een rechterinverse van A en A een linkerinverse van B.





1 2 3
6 −2 −3
1 0 0
1
0  =  0 1 0  = I, is iedere matrix in
Voorbeeld: Omdat  1 3 3   −1
1 2 4
−1
0
1
0 0 1
het product de inverse van de ander.
Stelling 1: Als A een (k × n)-matrix is, AB = Ik×k en CA = In×n , dan B = C, (n × k).
Bewijs: B = In×n B = (CA)B = C(AB) = CIk×k = C.
Stelling 2: Als AB = I en BA = I, dan is A vierkant.
Bewijs: Als A = (aij ), (k × n), dan B = (bij ), (n × k), AB = I, (k × k), en BA = I, (n × n).
P P
De som van de diagonaalelementen van respectievelijk AB en BA is dan k = ki=1 nj=1 aij bji
P
P
en n = nj=1 ki=1 aij bji , dus n = k.
Definitie: Als AB = BA = I dan heten A en B elkaars inverse matrix: A = B−1 en B = A−1 .
Een matrix die een inverse heeft heet regulier, terwijl een matrix die geen inverse heeft singulier
heet. Iedere reguliere matrix is vierkant. Als A regulier is dan heeft Ax = b juist één oplossing,
namelijk x = A−1 b.
A APPENDIX - LINEAIRE ALGEBRA
255
Door gebruik te maken van de definities van de determinant, kan men laten zien dat
A(adj A) = (adj A)A = (det A)I,
adj
dus als det A 6= 0 en B = det
adj A
A regulier en A−1 = det
A.
A
A,
(890)
dan AB = BA = I. We vinden dus dat als det A 6= 0, dan is
Een matrix is dan en slechts dan regulier als zijn determinant ongelijk is aan nul. Een vierkante
matrix is dan en slechts dan singulier als zijn determinant gelijk is aan nul.


1 −2
4
1
2 , dan
Voorbeeld: Als A =  −3
5
4 −3
1 −2
4 −3 1 −3
1
2 2 1
2 = 1 (891)
+
(4)
−
(−2)
|A| = −3
5 4 = −81,
5 −3 4 −3 5
4 −3
terwijl
−3
1
2 = −11, |A12 | = |A11 | = 5
4 −3
−2
1
4 |A21 | = =
−10,
|A
|
=
22
5
4 −3 −2 4 = −8, |A32 | = 1
|A31 | = −3
1 2
zodat
A.4.10

−11
10 −8
1 −23 −14  ,
adj A = 
−17 −14 −5
−3 1 2 = −17,
= −1, |A13 | = 5 4 −3 1 −2 4 = 14,
= −23, |A23 | = −3 5
4 1 −2 4 = −5,
= 14, |A33 | = 2 −3
1 

11 −10 8
1 
−1
23 14  .
=
81
17
14 5
(892)
(893)
(894)

dus
A−1
(895)
De getransponeerde van een matrix; symmetrische en alternerende matrices
Als A = (aij ) een (k × n)-matrix is en B = (bij ) een (n × k)-matrix, terwijl bij = aji voor elke
i = 1, .., n en elke j = 1, .., k, dan heten A en B elkaars getransponeerde, B = AT en A = BT .


1 4
1 2 3
Voorbeeld: De getransponeerde van A =
is AT =  2 5 .
4 5 6
3 6
1. De getransponeerde van een vierkante matrix wordt dus verkregen door die matrix te
‘spiegelen ten opzichte van de hoofddiagonaal’.
2. De getransponeerde van een kolomvector is een rijvector en omgekeerd.
Stellingen:
1. (AT )T = A.
2. (A + B)T = AT + BT .
3. (AB)T = BT AT .
4. Als x een kolomvector is dan is xT x = |x|2 .
A APPENDIX - LINEAIRE ALGEBRA
256
Definities: A heet een symmetrische matrix als A = AT .
A heet een alternerende (anti-symmetrische of scheefsymmetrische) matrix als AT = −A.




1
2
3
0 −2 3
4 −5  is symmetrisch, terwijl de matrix A =  2
0 4 .
Voorbeeld: De matrix A =  2
3 −5
6
−3 −4 0
anti-symmetrisch is.
A.4.11
Orthogonale matrices
Definitie: De matrix A heet orthogonaal als AAT = AT A = I, dus als AT = A−1 .
Stelling 1: Een orthogonale matrix is een matrix waarvan de rijvectoren zowel als de kolomvectoren een orthonormaal stelsel vormen (dit wil zeggen dat elke twee onderling verschillende
rijvectoren, respectievelijk kolomvectoren, onderling orthogonaal zijn, terwijl al die vectoren de
norm 1 hebben.
Stelling 2: Als A orthogonaal is, dan geldt voor elke x (van de juiste dimensie) dat |Ax| = |x|.
We concluderen dat de norm van een vector invariant is voor een transformatie waarvan de
transformatiematrix orthogonaal is. Het omgekeerde van deze stelling geldt ook: als voor een
lineaire afbeelding de norm invariant is, dan is de transformatiematrix orthogonaal.
Bewijs: |Ax|2 = (Ax)T (Ax) = (xT AT )(Ax) = xT (AT A)x = xT Ix = xT x = |x|2 .

 1
√
√1
− √12
3
6

0 
Voorbeeld: De lineaire transformatie y = Ax =  √13 − √26
 x is orthogonaal. Het
beeld van x = (a, b, c) is y =
√
lengte a2 + b2 + c2 .
√a
3
+
√b
6
−
√c , √a
2
3
−
√1
3
2b √a
√
,
6
3
√1
6
+ √b6
+
√1
2
√c
2
en beide vectoren hebben
A APPENDIX - LINEAIRE ALGEBRA
A.5
A.5.1
257
Vectorrekening over de complexe ruimte
Vectoren
We generaliseren nu de concepten die we geleerd hebben van vectoren over een reële ruimte
in twee opzichten. Ten eerste mogen de scalaren nu complexe getallen worden, en ten tweede
beperken we ons niet tot drie dimensies, maar beschouwen we vectoren die leven in ruimten met
oneindig veel dimensies. Merk op dat een en ander redelijk rechttoe rechtaan is, maar dat we
abstractie notatie gebruiken. Deze notatie sluit aan bij wat gebruikelijk is in de quantum fysica.
De reden dat we dit doen, is dat we dan later onze intuitie van vectoren kunnen gebruiken voor
andere systemen die dezelfde formele eigenschappen bezitten.
Een vectorruimte bestaat uit een verzameling vectoren (we noteren dit als |α >, |β >, |γ >
, ...), samen met een verzameling scalaren (a, b, c, ...)131 , die aan twee bewerkingen - vector
optelling en scalaire vermenigvuldiging - onderhevig zijn.
Vector optelling De som van twee willekeurige vectoren is een vector,
|α > +|β >= |γ > .
(896)
|α > +|β >= |β > +|α >
(897)
|α > +(|β > +|γ >) = (|α > +|β >) + |γ > .
(898)
Vector additie is commutatief
en associatief
Er bestaat een nulvector, |0 >, met de eigenschap
|α > +|0 >= |α >
(899)
voor elke vector |α >. Verder bestaat er voor elke vector |α > een geassocieerde inverse vector,
| − α >, zodat
|α > +| − α >= |0 > .
(900)
Scalaire vermenigvuldiging Het product van een scalar met een willekeurige vector is een
vector
a|α >= |γ > .
(901)
Het scalaire product is distributief ten opzichte van vector optelling
a(|α > +|β >) = a|α > +a|β >
(902)
en ten opzichte van scalaire optelling
(a + b)|α >= a|α > +b|α > .
(903)
Het is ook associatief ten opzichte van gewone vermenigvuldiging met scalaren
a(b|α >) = (ab)|α > .
(904)
Vermenigvuldiging met de scalaren 0 en 1 heeft het gebruikelijke effect
0|α >= |0 >
en
1|α >= |α > .
(905)
Blijkbaar geldt er | − α >= (−1)|α >.
131
We beperken ons tot eenvoudige complexe getallen, want dit is wat we voor quantum fysica nodig hebben.
Wiskundig gezien zouden we ook meer gecompliceerde objecten kunnen beschouwen.
A APPENDIX - LINEAIRE ALGEBRA
258
Lineaire combinaties van vectoren Een lineaire combinatie van de vectoren |α >, |β >
, |γ >, ... is een uitdrukking van de vorm
a|α > +b|β > +c|γ > +...
(906)
Een vector |λ > wordt lineair onafhankelijk van de verzameling |α >, |β >, |γ >, ... genoemd
als het niet geschreven kan worden als een lineaire combinatie van deze vectoren. Op dezelfde
wijze is een verzameling vectoren lineair onafhankelijk als elke vector lineair onafhankelijk is van
de rest. Een verzameling vectoren spant een ruimte op als elke vector geschreven kan worden
als een lineaire combinatie van de elementen van deze verzameling. De verzameling van lineair
onafhankelijke vectoren die een ruimte opspant, wordt een basis genoemd. Het aantal vectoren
in een basis wordt de dimensie van de ruimte genoemd. Op dit moment nemen we aan dat de
dimensie, n, eindig is.
Ten opzichte van een voorgeschreven basis
|e1 >, |e2 >, |e3 >, .., |en >,
(907)
|α >= a1 |e1 > +a2 |e2 > +.. + an |en >
(908)
wordt een willekeurige vector
op unieke wijze vertegenwoordigd door de (geordende) verzameling van zijn componenten
|α >↔ (a1 , a2 , .., an ).
(909)
Het is vaak eenvoudiger om met de componenten te werken dan met de abstracte vectoren zelf.
Om twee vectoren op te tellen, tel je dan de corresponderende componenten op
|α > +|β >↔ (a1 + b1 , a2 + b2 , .., an + bn ).
(910)
Vermenigvuldigen met een scalar betekent
c|α >↔ (ca1 , ca2 , .., can ),
(911)
terwijl de nulvector door een reeks nullen wordt voorgesteld
|0 >= (0, 0, .., 0)
(912)
en de componenten van de inverse vector hebben het tegenovergestelde teken
| − α >↔ (−a1 , −a2 , .., −an ).
(913)
Het enige nadeel van het werken met componenten, is dat men zich moet commiteren tot een
bepaalde basis en dat sommige manipulaties er verschillend uit zullen zien voor iemand die in
een andere basis werkt.
A.5.2
Inproduct
In drie dimensies zijn we twee soorten vectorproduct tegengekomen: inproduct en uitproduct.
In n-dimensionale ruimten beschouwen we enkel het inproduct. Het inproduct van twee vectoren
|α > en |β > is een complex getal, dat we noteren als < α|β >, met de volgende eigenschappen
< β|α >=< α|β >∗ ,
< α|α >≥ 0,
en
< α|α >= 0 ↔ |α >= |0 >,
(914)
(915)
A APPENDIX - LINEAIRE ALGEBRA
259
< α| (b|β > +c|γ >) = b < α|β > +c < α|γ > .
(916)
We zien hier in een nieuwe notatie weer het vertrouwde gedrag van inproducten. Een vectorruimte
met een inproduct wordt een inproductruimte genoemd.
Omdat het inproduct van een willekeurige vector met zichzelf een niet-negatief getal is, noemen we dit de norm of lengte van een vector
p
kαk ≡ < α|α >.
(917)
Een eenheidsvector heeft norm 1 en wordt genormaliseerd genoemd. Twee vectoren waarvan
het inproduct nul is worden orthogonaal genoemd. Een verzameling van onderling orthogonale
genormaliseerde vectoren,
< αi |αj >= δij ,
δij = 1 als i = j en δij = 0 als i 6= j
(918)
wordt een orthonormale verzameling genoemd. Het is altijd mogelijk en bijna altijd makkelijk om
een orthonormale basis te kiezen. In dat geval kan het inproduct van twee vectoren geschreven
worden als
< α|β >= a∗1 b1 + a∗2 b2 + .. + a∗n bn ,
(919)
en (het kwadraat van) de norm wordt
< α|α >= |a1 |2 + |a2 |2 + ... + |an |2 ,
(920)
ai =< ei |α > .
(921)
en de componenten zijn
Een andere geometrische grootheid die men kan generaliseren is de hoek tussen twee vectoren.
In gewone vectorrekening hebben cos θ = (a · b)/|a||b|. Echter, omdat het inproduct in het
algemeen een complex getal is, definieert de analoge formule geen reëele hoek. Het is echter zo
dat de absolute waarde van deze grootheid een getal kleiner dan 1 is,
| < α|β > |2 ≤< α|α >< β|β > .
(922)
Dit belangrijke resultaat staat bekend als de ongelijkheid van Schwarz. We kunnen hiermee de
hoek tussen |α > en |β > definiëren als
s
< α|β >< β|α >
cos θ =
.
(923)
< α|α >< β|β >
Voorbeeld: Stel |α >= (1 + i, −i, 1) en |β >= (2 + 3i, 1 − 2i, i). Dan is |α >∗ =< α| = (1 − i, i, 1).
Het inproduct < α|β > is dan


2 + 3i
< α|β >= (1 − i, i, 1)  1 − 2i  = (1 − i)(2 + 3i) + i(1 − 2i) + 1(i) = 7 + 3i.
(924)
i
Het inproduct < β|α > is dan


1+i
< β|α >= (2 − 3i, 1 + 2i, −i)  −i  = 7 − 3i.
1
(925)
A APPENDIX - LINEAIRE ALGEBRA
A.5.3
260
De Gram-Schmidt procedure
Stel je begint met een basis (|e1 >, |e2 >, .., |en >) die niet orthonormaal is. De Gram-Schmidt
procedure beschrijft hoe men dan een orthonormale basis (|e01 >, |e02 >, .., |e0n >) kan genereren.
Dit gaat als volgt.
1. Normeer de eerste basis vector (deel door de norm),
|e01 >=
|e1 >
.
ke1 k
(926)
2. Bereken de projectie van de tweede vector langs de eerste en trek die eraf,
|e2 > − < e01 |e2 > |e01 > .
(927)
Deze vector is orthogonaal met |e01 >. We normeren de vector en vinden hiermee |e02 >.
3. Trek van |e3 > de projecties langs |e01 > en |e02 > af,
|e3 > − < e01 |e3 > |e01 > − < e02 |e3 > |e02 > .
(928)
De gevonden vector is orthogonaal op |e01 > en |e02 >. Normeer deze vector om |e03 > te
vinden. Enzovoort.
A.5.4
Eigenvectoren en eigenwaarden
Beschouw de lineaire transformatie T in 3D die bestaat uit een rotatie, om een gegeven as, over
een hoek θ. De meeste vectoren |α > zullen in een gecompliceerde manier veranderen, maar
vectoren die toevallig langs de draaias liggen gedragen zich eenvoudig: zij veranderen helemaal
niet: T |α >= |α >. Als θ = 180◦ , dan zullen vectoren die in het ‘equator’ vlak liggen van teken
veranderen, T |α >= −|α >. In een complexe vectorruimte heeft elke lineaire transformatie van
dit soort speciale vectoren, die getransformeerd worden in eenvoudige veelvouden van zichzelf,
T |α >= λ|α >,
(929)
en deze worden de eigenvectoren van de transformatie genoemd, terwijl de (complexe) getallen
λ de eigenwaarden zijn (de nulvector telt hierbij niet mee). Merk op dat ieder veelvoud van een
eigenvector nog steeds een eigenvector met dezelfde eigenwaarde is.
Ten opzichte van een bepaalde basis, neemt de eigenwaarde vergelijking de matrix vorm
Ta = λa
(930)
(T − λ1)a = 0.
(931)
aan, ofwel
Hierbij stelt 0 de nulmatrix voor, waarvan alle elementen gelijk aan nul zijn. Als de matrix
(T − λ1) een inverse heeft, kunnen we beide zijden van vergelijking (931) vermenigvuldigen met
(T − λ1)−1 , en concluderen dan dat a = 0. We hebben echter aangenomen dat a ongelijk aan
nul is en dus dient de matrix (T − λ1) singulier te zijn, hetgeen betekent dat haar determinant
verdwijnt,
(T11 − λ)
T
.
.
.
T
12
1n
T21
(T22 − λ) . . .
T2n
det(T − λ1) = (932)
= 0.
..
..
..
.
.
.
Tn1
Tn2
. . . (Tnn − λ) A APPENDIX - LINEAIRE ALGEBRA
261
Expansie van de determinant levert een algebraïsche vergelijking voor λ,
Cn λn + Cn−1 λn−1 + . . . + C1 λ + C0 = 0,
(933)
waarbij de coëfficienten Ci van de matrixelementen van T afhangen. Dit wordt de karakteristieke
vergelijking van de matrix genoemd; haar oplossingen bepalen de eigenwaarden. Merk op dat
het een nde-orde vergelijking is, die dus n complexe wortels heeft. Sommige van deze wortels
kunnen hetzelfde zijn en alles wat we kunnen zeggen is dat een n × n matrix op zijn minst één
en op zijn meest n unieke eigenwaarden heeft.
Voorbeeld: Vind de eigenwaarden en eigenvectoren van de matrix


2 0 −2
M =  −2i i 2i  .
1 0 −1
De karakteristieke vergelijking is
(2 − λ)
0
−2
−2i
(i
−
λ)
2i
1
0
(−1 − λ)
= −λ3 + (1 + i)λ2 − iλ = 0,
(934)
(935)
en de wortels zijn 0, 1 en i. Noem de componenten van de eerste eigenvector (a1 , a2 , a3 ), dan




  
2 0 −2
a1
a1
0
 −2i i 2i   a2  = 0  a2  =  0  ,
(936)
1 0 −1
a3
a3
0
hetgeen de volgende drie vergelijkingen levert
2a1 − 2a3 = 0,
−2ia1 + ia2 + 2ia3 = 0,
a1 − a3 = 0.
(937)
De eerste bepaalt a3 (in termen van a1 ), a3 = a1 ; de tweede bepaalt a2 , a2 = 0; en de derde is
redundant. We kunnen net zo goed a1 = 1 kiezen, omdat een veelvoud van een eigenvector weer
een eigenvector is. We vinden
 
1
(1)

0  , voor λ1 = 0.
a =
(938)
1
Voor de tweede eigenvector (we recyclen dezelfde notatie voor de componenten) hebben we




 

2 0 −2
a1
a1
a1
 −2i i 2i   a2  = 1  a2  =  a2  ,
(939)
1 0 −1
a3
a3
a3
hetgeen leidt tot de vergelijkingen
2a1 − 2a3 = a1 ,
−2ia1 + ia2 + 2ia3 = a2 ,
a1 − a3 = a3 ,
(940)
A APPENDIX - LINEAIRE ALGEBRA
met als oplossing a3 = (1/2)a1 , a2 = [(1 − i)/2]a2 ; deze keer kiezen we a1 = 2, zodat


2
a(2) =  (1 − i)  , voor λ2 = 1.
1
Tenslotte geldt voor de derde

2
 −2i
1
eigenvector

 



ia1
a1
0 −2
a1
i 2i   a2  = i  a2  =  ia2  ,
ia3
a3
0 −1
a3
262
(941)
(942)
hetgeen leidt tot de vergelijkingen
2a1 − 2a3 = ia1 ,
−2ia1 + ia2 + 2ia3 = ia2 ,
a1 − a3 = ia3 ,
(943)
met als oplossing a3 = a1 = 0, terwijl a2 onbepaald is. We kiezen a2 = 1 en concluderen
 
0
(3)

1  , voor λ3 = i.
a =
(944)
0
A.5.5
Geconjugeerde en Hermitische matrices
De (complex) geconjugeerde van een matrix A = (aij ) wordt aangeduid met A∗ en wordt verkregen door de complex toegevoegde van elk element te nemen A∗ = (a∗ij ).
1 − 2i
−i
1 + 2i
i
.
, dan is A∗ =
Voorbeeld: Als A =
3 2 + 3i
3 2 − 3i
Een matrix is reëel als alle elementen reëel zijn, A∗ = A, en imaginair als alle elementen imaginair
zijn, A∗ = −A.
De Hermitisch geconjugeerde (of Hermitisch toegevoegde) van een matrix A = (aij ) wordt aangeduid met A† en wordt verkregen door transponeren en complex conjugeren, A† = (a∗ji ).
Met deze notatie kunnen we het inproduct van twee vectoren, ten opzichte van een orthogonale
basis, schrijven als
< α|β >= a† b.
(945)
Evenzo als bij een getransponeerde matrix, geldt voor de Hermitisch toegevoegde van een product
dat
(AB)† = B† A† .
(946)
Een vierkante matrix is Hermitisch als hij gelijk is aan zijn Hermitisch geconjugeerde, A† =
A; als Hermitische conjugatie een minteken introduceert, dan wordt de matrix anti-Hermitisch
genoemd.


1 1−i 2
3 i  is Hermitisch.
Voorbeeld: De matrix A =  1 + i
2
−i 0
We hebben gezien dat voor de Hermitisch geconjugeerde van een matrix geldt dat A† = AT∗ .
De Hermitisch geconjugeerde van een lineaire transformatie, A† geeft, als hij wordt toegepast
A APPENDIX - LINEAIRE ALGEBRA
263
op het eerste lid van een inproduct, hetzelfde resultaat als wanneer A zou zijn toegepast op de
tweede vector,
< A† α|β >=< α|Aβ >
(947)
voor alle vectoren |α > en |β >. Voor de duidelijkheid: |Aβ > betekent A|β > en < A† α|β >
betekent het inproduct van de vector A† |α > met de vector |β >. Merk op dat
< α|cβ >= c < α|β >,
(948)
< cα|β >= c∗ < α|β >
(949)
maar
voor elke scalar c. Voor een lineaire transformatie kunnen we nu schrijven
< α|Aβ >= a† Ab = (A† a)† b =< A† α|β > .
(950)
Als de matrix Hermitisch is, T = T† , dan kunnen we het bovenstaande schrijven als
< α|T β >=< T α|β >=< α|T |β > .
(951)
Hermitische transformaties spelen een fundamentele rol in de quantummechanica. De eigenvectoren en eigenwaarden van een Hermitische transformatie bezitten drie cruciale eigenschappen.
1. De eigenwaarden van een Hermitische transformatie zijn reëel.
Bewijs: Stel dat λ een eigenwaarde van T is, T |α >= λ|α >, met |α >6= |0 >. Dan geldt
< α|T α >=< α|λα >= λ < α|α > .
(952)
Als T Hermitisch is, dan geldt ook
< α|T α >=< T α|α >=< λα|α >= λ∗ < α|α > .
(953)
Omdat < α|α >6= 0, geldt λ = λ∗ en is λ dus reëel.
2. De eigenvectoren van een Hermitische transformatie die horen bij aparte eigenwaarden zijn
orthogonaal.
Bewijs: Stel dat T |α >= λ|α > en T |β >= µ|β >, met λ 6= µ. Dan geldt
< α|T β >=< α|µβ >= µ < α|β >,
(954)
< α|T β >=< T α|β >=< λα|β >= λ∗ < α|β > .
(955)
en als T Hermitisch is, dan
Maar λ = λ∗ (zie hierboven) en de aanname was dat λ 6= µ. Dientengevolge is < α|β >= 0.
3. De eigenvectoren van een Hermitische operator spannen de ruimte op.
Opmerking: Wanneer alle n wortels van de karakteristieke vergelijking verschillend zijn,
dan hebben we n onderling orthogonale eigenvectoren en kunnen deze vectoren vanzelfsprekend de ruimte opspannen. De zaak wordt ingewikkeld als de eigenwaarden ontaard
zijn en dezelfde wortels optreden. We dienen dan lineaire combinaties te vormen en dienen
vervolgens te bewijzen dat we hiermee ook lineair onafhankelijke eigenvectoren verkrijgen.
Vervolgens kunnen we deze vectoren orthonormaliseren met de Gram-Schmidt procedure.
A APPENDIX - LINEAIRE ALGEBRA
A.5.6
264
Unitaire matrices
Definitie: Een matrix is unitair als haar inverse gelijk is aan haar Hermitisch geconjugeerde,
A† = A−1 . De kolommen van een unitaire matrix vormen een orthonormale set, evenals haar
rijen.
Merk op dat terwijl de elementen van een orthogonale matrix in Rn liggen, liggen de elementen
van een unitaire matrix in de ruimte Cn .
Unitaire transformaties behouden het inproduct in de zin dat geldt
< U α|U β >=< α|β >
voor alle vectoren |α > en |β >.
(956)
B APPENDIX - WAARSCHIJNLIJKHEID
B
265
APPENDIX - WAARSCHIJNLIJKHEID
B.1
Inleiding
Waarschijnlijkheid speelt een centrale rol in de quantummechanica. We zullen de basisbegrippen
verduidelijken aan de hand van een concreet voorbeeld. Hierbij gebruiken we de notatie die
gangbaar is in de quantummechanica. Stelt U zich hierbij een kamer voor met 14 mensen
waarvan de leeftijd als volgt gegeven is:
een persoon is 14 jaar,
een persoon is 15 jaar,
drie personen zijn 16 jaar,
twee personen zijn 22 jaar,
twee personen zijn 24 jaar,
vijf personen zijn 25 jaar.
Als we stellen dat N (j) het aantal mensen met leeftijd j voorstelt, dan hebben we nu
N (14) = 1,
N (15) = 1,
N (16) = 3,
N (22) = 2,
N (24) = 2,
N (25) = 5,
terwijl N (17), bijvoorbeeld, gelijk is aan nul. Het totaal aantal mensen in de kamer is
N=
∞
X
N (j).
(957)
j=0
Fig. 106 geeft een histogram van de data. Men kan onder meer de volgende vragen stellen over
Figuur 106: Histogram van het aantal mensen, N (j), met leeftijd j, dat zich in een bepaalde
kamer bevindt.
deze verdeling.
• Als U willekeurig een persoon van deze groep kiest, wat is dan de waarschijnlijkheid dat
de leeftijd van deze persoon 15 is?
Antwoord: Één op de 14, want er zijn 14 mogelijke keuzes (N = 14), die elk even waarschijnlijk zijn, waarvan er slechts één deze bepaalde leeftijd heeft. Als P (j) de waarschijnlijkheid
is om leeftijd j te kiezen, dan is P (14) = 1/14, P (15) = 1/14, P (16) = 3/14, enzovoort.
In het algemeen,
N (j)
P (j) =
.
(958)
N
B APPENDIX - WAARSCHIJNLIJKHEID
266
Merk op dat de waarschijnlijkheid om of 14 of 15 te kiezen gelijk is aan de som van de
individuele waarschijnlijkheden (in dit geval 1/7). In het bijzonder moet gelden dat de som
van alle waarschijnlijkheden gelijk is aan 1. Dus
∞
X
P (j) = 1.
(959)
j=1
• Wat is de meest waarschijnlijke leeftijd?
Het antwoord is 25, want vijf van de mensen delen deze leeftijd, terwijl op zijn meest drie
een andere leeftijd delen. In het algemeen is de meest waarschijnlijke j, die j waarvoor
P (j) maximaal is.
• Wat is de mediane leeftijd?
Het antwoord is 23, want 7 mensen zijn jonger dan 23 en er zijn 7 ouder dan 23. In het
algemeen is de mediaan die waarde van j waarvoor de waarschijnlijkheid om een groter
resultaat te krijgen hetzelfde is als die voor een kleiner resultaat.
• Wat is de gemiddelde leeftijd?
Het antwoord is
(14) + (15) + 3(16) + 2(22) + 2(24) + 5(25)
294
=
= 21.
14
14
(960)
In het algemeen wordt de gemiddelde waarde van j (hetgeen we noteren als < j >) gegeven
door
P
∞
jN (j) X
=
jP (j).
(961)
< j >=
N
j=0
Merk op dat het niet nodig is dat er iemand in de kamer is met een gemiddelde leeftijd of
mediane leeftijd - in dit voorbeeld is er niemand die 21 of 23 jaar oud is. In de quantummechanica is de gemiddelde waarde meestal de belangrijkste grootheid. We noemen het
dan de verwachtingswaarde. Dit is een misleidende term omdat het suggereert dat het de
meest waarschijnlijke uitkomst is die men zou krijgen bij een enkele meting (maar dat is
de meest waarschijnlijke waarde).
• Wat is het gemiddelde van het kwadraat van de leeftijden?
Antwoord: Men kan 142 = 196 vinden met waarschijnlijkheid 1/14, of 152 = 225 met waarschijnlijkheid 1/14, of 162 = 256 met waarschijnlijkheid 3/14, enzovoort. Het gemiddelde
is dan
∞
X
2
< j >=
j 2 P (j).
(962)
j=0
In het algemeen is de gemiddelde waarde voor een functie van j gegeven door
< f (j) >=
∞
X
f (j)P (j).
(963)
j=0
Merk op dat het gemiddelde van de kwadraten, < j 2 >, in het algemeen niet gelijk is aan
het kwadraat van het gemiddelde, < j >2 . Stel je voor dat de kamer slechts twee babies
bevat met leeftijden 1 en 3 jaar, dan is < x2 >= 5, maar < x >2 = 4.
B APPENDIX - WAARSCHIJNLIJKHEID
267
Figuur 107: Twee histogrammen met dezelfde mediaan, hetzelfde gemiddelde en dezelfde meest
waarschijnlijke waarde, alsook een gelijk aantal elementen. Er is echter een verschil in de ‘spreiding’ van de verdelingen, ten opzichte van de gemiddelde waarde.
Fig. 107 toont twee histogrammen die er verschillend uitzien, terwijl ze dezelfde mediaan, hetzelfde gemiddelde en dezelfde meest waarschijnlijke waarde, alsook een gelijk aantal elementen
hebben. De eerste is echter scherp gepiekt rond de gemiddelde waarde, terwijl de tweede breed
en vlak is. We hebben een numerieke maat nodig voor de grootte van de ‘spreiding’ in een
verdeling, ten opzichte van de gemiddelde waarde. Recht toe recht aan zouden we zeggen dat we
voor elk element de afwijking van het gemiddelde bepalen, ∆j = j− < j >, om vervolgens het
gemiddelde van ∆j uit te rekenen. Het is probleem is echter dat we in dat geval altijd nul zullen
vinden, omdat, vanwege de aard van het gemiddelde, ∆j even vaak positief als negatief zal zijn,
X
X
X
< ∆j >=
(j− < j >)P (j) =
jP (j)− < j >
P (j) =< j > − < j >= 0.
(964)
Merk op dat < j > constant is en daarom buiten de sommatie genomen kan worden. Om dit
probleem te omzeilen kunnen we besluiten om het gemiddelde uit te rekenen en gebruik te maken
van absolute waarden voor ∆j. We geven er echter de voorkeur aan om het probleem op te lossen
door het kwadraat te nemen voordat we middelen,
σ 2 ≡< (∆j)2 > .
(965)
Deze grootheid staat bekend als de variantie van een verdeling, terwijl σ de standaarddeviatie
genoemd wordt. Voor varianties geldt het volgende
P
P
2 >=
σ 2 =<
(∆j)2 P (j) = (j− < j >)2 P (j)
P(∆j)
= P(j 2 − 2j < j > + <Pj >2 )P (j)
P
(966)
P (j)
= j 2 P (j) − 2 < j > jP (j)+ < j >2
=< j 2 > −2 < j >< j > + < j >2 ,
ofwel
σ 2 =< j 2 > − < j >2 .
(967)
Bovenstaande vergelijking geeft een snelle manier om σ 2 uit te rekenen: bereken < j 2 > en
< j >2 en trek de twee getallen van elkaar af. Omdat σ 2 niet-negatief is, moet gelden
< j 2 > ≥ < j >2 ,
(968)
en de twee waarden zijn slechts dan aan elkaar gelijk als σ = 0.
Tot zover heb ik in de beschouwingen aangenomen dat we te maken hebben met een discrete
variabele (in ons geval namen we voor j een integer aan). We kunnen het formalisme echter
eenvoudig generaliseren tot continue distributies. Als men een willekeurig persoon op straat selecteert, dan is de waarschijnlijkheid dat haar leeftijd gelijk is aan 18 jaar, 3 maanden, 1 week en
B APPENDIX - WAARSCHIJNLIJKHEID
268
3,1892 seconden gelijk aan nul. Het is zinvoller te spreken van een leeftijd die ligt in een interval
- bijvoorbeeld tussen 18 jaar en 18 jaar en 1 maand. Indien het interval voldoende klein is, dan
is de waarschijnlijkheid evenredig met de lengte van het interval. Technisch gezien kiezen we
infinitesimaal kleine intervallen en vinden dan dat de waarschijnlijkheid dat een de leeftijd van
een willekeurig persoon ligt tussen x en (x + dx) gelijk is aan ρ(x)dx. De evenredigheidsfactor,
ρ(x), wordt vaak losjes ‘de kans om x te vinden’ genoemd, maar een betere term is waarschijnlijkheidsdichtheid. De waarschijnlijkheid dat x ligt tussen a en b (een eindig interval) wordt
gegeven door de integraal
Z b
ρ(x)dx,
(969)
Pab =
a
en de regels die we voor discrete verdelingen gevonden hebben vertalen zich vanzelfsprekend tot
Z +∞
ρ(x)dx = 1,
(970)
−∞
Z
+∞
< x >=
xρ(x)dx,
(971)
f (x)ρ(x)dx,
(972)
−∞
Z
+∞
< f (x) >=
−∞
σ 2 ≡< (∆x)2 >=< x2 > − < x >2 .
B.2
(973)
Connectie met de quantummechanica
We merken op dat de golffunctie, bijvoorbeeld opgebouwd uit harmonische golven ψ = ei(kx−ωt) ,
veelal een complexe functie is met een reëel en een imaginair deel. De waarschijnlijkheidsdichtheid
wordt gegeven door
P (x, t) = ψ ∗ ψ,
(974)
waarbij P dx de kans voorstelt dat het deeltje wordt aangetroffen132 in het interval (x, x + dx).
We normeren de golffunctie van een deeltje zo, dat geldt
Z +∞
Z +∞
P dx =
ψ ∗ ψdx = 1.
−∞
De verwachtingswaarde < x > van de positie is
Z +∞
Z +∞
Z
∗
< x >=
xP dx =
ψ xψdx =
−∞
(975)
−∞
−∞
+∞
ψ ∗ xψdx =< ψ|x|ψ >,
(976)
−∞
terwijl voor elke observabele O geldt dat zijn verwachtingswaarde < O > gegeven is door
Z +∞
< O >=
ψ ∗ Oψdx =< ψ|O|ψ >,
(977)
−∞
waarbij O een Hermitische operator is.
Als we de notatie ψ = x + iy gebruiken, dan volgt direct dat ψ ∗ ψ = x2 + y 2 ≥ 0! en zien we dat deze kans
altijd reëel en positief is.
132
C APPENDIX: FUNDAMENTELE CONSTANTEN
C
269
APPENDIX: FUNDAMENTELE CONSTANTEN
c = 2.998 × 108 m/s
lichtsnelheid
h = 6.626 ×
10−34
Js
constante van Planck
e = 1.602 ×
10−19
C
lading van het elektron
me = 9.109 ×
10−31
kg
massa van het elektron
mp = 1.672 ×
10−27
kg
massa van het proton
0 = 8.854 ×
µ0 = 4π ×
10−12
10−7
NA = 6.022 ×
C2 /Nm2
N/A2
1023
1/mol
k = 1.381 × 10−23 J/K
permittiviteit van het vacuum
permeabiliteit van het vacuum
constante van Avogadro
constante van Boltzmann
D APPENDIX: COÖRDINATENSYSTEMEN
D
270
APPENDIX: COÖRDINATENSYSTEMEN
CARTESIAANSE COÖRDINATEN
dl = dx x̂ + dy ŷ + dz ẑ
lijn-element
dτ = dxdydz
∇t =
volume-element
∂t
∂t
+ ∂y
ŷ + ∂z
ẑ
∂vy
∂vx
∂vz
∂x + ∂y + ∂z
∂t
∂x x̂
∇·v =
∇×v =
∂vz
∂y
∆t = ∇2 t =
∂vy
∂z
−
∂2t
∂x2
+
gradiënt
divergentie
x̂ +
∂2t
∂y 2
∂vx
∂z
−
∂vz
∂x
ŷ +
∂vy
∂x
−
∂vx
∂y
ẑ
rotatie
∂2t
∂z 2
+
Laplace operator
SFERISCHE COÖRDINATEN
dl = dr r̂ + rdθ θ̂ + r sin θdφ φ̂
dτ =
∇t =
lijn-element
r2 sin θdrdθdφ
∂t
∂r r̂
∇·v =
+
1 ∂t
r ∂θ θ̂
+
1 ∂
(r2 vr )
r2 ∂r
∇×v =
1
r sin θ
∆t = ∇2 t =
h
volume-element
1
∂t
r sin θ ∂φ φ̂
+
1
∂
r sin θ ∂θ (sin θvθ )
∂
∂θ (sin θvφ )
1 ∂
r2 ∂r
r
gradiënt
2 ∂t
∂r
+
−
∂vθ
∂φ
i
+
r̂ +
1
∂
r2 sin θ ∂θ
1
r
1 ∂vφ
r sin θ ∂φ
h
1 ∂vr
sin θ ∂φ
∂t
sin θ ∂θ +
divergentie
−
∂
∂r (rvφ )
i
θ̂ +
1
∂2t
r2 sin2 θ ∂φ2
1 ∂
r
∂r (rvθ )
−
∂vr
∂θ
φ̂
rotatie
Laplace operator
CILINDRISCHE COÖRDINATEN
dl = ds ŝ + sdφ φ̂ + dz ẑ
lijn-element
dτ = sdsdφdz
∇t =
∇·v =
volume-element
1 ∂t
s ∂φ φ̂
∂t
+
+ ∂z
ẑ
1 ∂
1 ∂vφ
s ∂s (svs ) + s ∂φ
∂t
∂s ŝ
∇×v =
h
1 ∂vz
s ∂φ
∆t = ∇2 t =
−
1 ∂
s ∂s
∂vφ
∂z
i
gradiënt
z
+ ∂v
∂z
s
ŝ + ∂v
∂z −
∂vz
∂s
1 ∂2t
s2 ∂φ2
∂2t
∂z 2
∂t
s ∂s
+
+
divergentie
FUNDAMENTELE THEOREMAS
Rb
(∇f ) · dl = f (b) − f (a)
Ra
H
(∇ · A)dτ = A · da
R
H
(∇ × A) · da = A · dl
φ̂ +
1
s
h
∂
∂s (svφ )
−
∂vs
∂φ
i
ẑ
rotatie
Laplace operator
Gradiënt theorema
Divergentie theorema (stelling van Gauss)
Rotatie theorema (stelling van Stokes)
E APPENDIX: CONVENTIES, EENHEDEN EN NOTATIES
E
271
APPENDIX: CONVENTIES, EENHEDEN EN NOTATIES
Elke richting in de fysica heeft de neiging een eigen set eenheden te definiëren, en de subatomaire
fysica vormt hierop geen uitzondering. Processen in de subatomaire fysica spelen zich af in het
domein van de quantummechnica, dat beheerst wordt door de gereduceerde constante van Planck
~≡
h
= 1.054 572 66(63) × 10−34 J s = 6.582 122 0(20) × 1022 MeV s,
2π
(978)
en in het domein van de relativiteitstheorie, dat gekarakteriseerd wordt door de grootte van de
lichtsnelheid133
c ≡ 299 792 458 m s−1 .
(979)
Vanaf nu zullen we werken met zogenaamde natuurlijke eenheden, die zo gekozen zijn dat geldt
~ = 1,
c = 1.
(980)
Dit betekent dat ~ en c gebruikt worden als fundamentele eenheden voor de actie (of impulsmoment) en snelheid. Alle eenheden voor lengte, tijd, energie en massa kunnen nu uitgedrukt worden
in één eenheid, waarvoor we die van energie kiezen. We gebruiken hiervoor de elektronvolt (eV),
met als afkortingen keV (103 eV), MeV (106 eV), GeV (109 eV) en TeV (1012 eV).
We kunnen massa’s (M ), afstanden (L), en tijden (T ) uitdrukken in combinaties van ~, c en
energie E, door gebruik te maken van de relaties
M = E/c2 ,
L = ~c/E,
T = ~/E,
(981)
en we vinden hiermee dat de massa 1 kg = 5.61 × 1026 GeV, de lengte 1 m = 5.07 × 1015 GeV−1 ,
en de tijd 1 s = 1.52 × 1024 GeV−1 .
Voor de conversies gebruiken we de belangrijke betrekkingen
~c
= 197.327 053(59) MeV fm
(1 fm ≡ 10−15 m)
(~c)2 = 0.389 379 66(23) GeV2 mbarn (1 barn ≡ 10−28 m2 ).
(982)
In relaties tussen klassieke grootheden spelen ~ en c geen rol, terwijl grootheden die enkel ~
bevatten, zoals de Bohr straal, a∞ = 4π0 ~2 /me e2 = 0.529 177 249 (24) × 10−10 m, van belang
zijn in de niet-relativistische quantummechanica. Grootheden die enkel c bevatten, zoals de
rustmassa van het elektron, me c2 = 0.510 999 06(15) MeV/c2 = 9.109 389 7(54) × 10−31 kg,
of de klassieke elektronstraal, re = e2 /4π0 me c2 = 2.817 940 92(38) × 10−15 m, komen voor
in de klassieke relativiteitstheorie. Tenslotte spelen grootheden die zowel ~ als c bevatten een
rol in de relativistische quantummechanica. Als voorbeelden gelden hier de Compton golflengte
van het elektron, −
λ e = ~/me c = 3.861 593 23(35) × 10−13 m en de fijnstructuurconstante,
α = e2 /4π0 ~c = 1/137.035 989 5(61).
133
De meter is de lengte van het pad dat afgelegd wordt door licht in vacuum gedurende een tijdinterval van
1/299 792 458 seconde. Met deze definitie is de waarde van c exact.
F APPENDIX: FASERUIMTE
F
272
APPENDIX: FASERUIMTE
We zullen hier een afleiding geven van de toestandsdichtheid ρ(E) ≡ dN/dE. Hiertoe beschouwen
we allereerst het één-dimensionale geval, waarbij een deeltje in de x-richting beweegt met een
impuls px . We kunnen de positie en impuls van het deeltje beschrijven met een punt (x, px )
in de zogenaamde x − px faseruimte. Deze representatie is echter in de quantummechanica
verschillend van die in de klassieke mechanica. In de klassieke mechanica kunnen we positie
en impuls tegelijkertijd exact kennen, maar quantummechanica beperkt onze kennis tot een
nauwkeurigheid gegeven door de onzekerheidsrelatie,
∆p∆px ≥ ~.
(983)
Quantummechanisch dient het deeltje dan ook door een cel met volume h = 2π~ in de faseruimte
gerepresenteerd te worden in plaats van door een punt. De precieze vorm van de cel hangt van
de uitgevoerde meting af, maar het volume is altijd gelijk aan h. Figuur 108 toont dat in een
Figuur 108: Schematische voorstellen van de één-dimensionale faseruimte voor klassieke mechanica en quantummechanica. Klassiek kunnen we de toestand van een deeltje door een punt
weergeven. In de quantummechanica dient een toestand beschreven te worden door een cel met
volume h = 2π~.
faseruimte met totaal volume Lp het aantal cellen dat in dit volume past, gegeven wordt door
N=
Lp
,
2π~
(984)
waarbij N het aantal toestanden is in het volume Lp. De toestandsdichtheid ρ(E) ≡ dN/dE
in één dimensie kunnen we in het niet relativistische geval vinden door E = p2 /2m in te vullen
(voor het ultra-relativistische geval gebruiken we E 2 = p2 c2 + (mc2 )2 , terwijl we voor het ultrarelativistische geval E = pc invullen). We vinden dan
ρ(E) =
dN
dN dp
L 2m
=2
=
.
dE
dp dE
2π~ p
(985)
De factor 2 is geintroduceerd, omdat er voor elke energie E twee ontaarde toestanden zijn met
impuls p en −p.
Voor een deeltje in drie dimensies
het celvolume gegeven door h3 = (2π~)2 , terwijl het
R wordt
aantal toestanden in een volume d3 xd3 p in de zes-dimensionale faseruimte gegeven wordt door
Z
1
N1 =
d3 xd3 p.
(986)
(2π~)3
F APPENDIX: FASERUIMTE
273
Het subscript geeft aan dat N1 het aantal toestanden voor één deeltje is. Als het deeltje opgesloten is in een ruimtelijk volume V , dan kunnen we integreren over d3 x en vinden
Z
V
N1 =
d3 p.
(987)
(2π~)3
De toestandsdichtheid volgt uit
dN1
V
d
ρ1 =
=
3
dE
(2π~) dE
Z
V
d
d p=
3
(2π~) dE
3
Z
p2 dpdΩ,
(988)
met dΩ het ruimtehoek element. De relatie E 2 = (pc)2 + (mc2 )2 geeft
E d
d
= 2
dE
pc dp
en we vinden met
d
dp
R
(989)
dp → 1
V pE
ρ1 =
(2π~)3 c2
Z
dΩ.
(990)
Voor overgangen naar alle eindtoestanden, ongeacht de richting van de impuls, luidt de toestandsdichtheid voor één deelje
V pE
ρ1 = 2 2 3 .
(991)
2π c ~
We continueren onze beschouwen van toestandsdichtheid voor twee deeltjes, 1 en 2. Indien de
totale impuls van de twee deeltjes bepaald is, dan bepaalt de impuls van de een de ander en
hebben we geen extra vrijheidsgraden. Het totaal aantal toestanden in de impulsruimte is dan
gelijk aan die voor één deeltje, N1 . De toestandsdichtheid ρ2 is echter verschillend, omdat E nu
de totale energie van de twee deeltjes is. We vinden
Z
Z
V
d
V
d
3
ρ2 =
d p1 =
p21 dp1 dΩ1 ,
(992)
(2π~)3 dE
(2π~)3 dE
met
dE = dE1 + dE2 =
p1 c2
p2 c2
dp1 +
dp2 .
E1
E2
(993)
We berekenen dit in het zwaartepuntsysteem met p1 + p2 = 0, dus
p21 = p22 → p1 dp1 = p2 dp2 ,
en
dE = p1 dp1
(E1 + E2 ) 2
c .
E1 E2
(994)
De toestandsdichtheid wordt nu gegeven door
ρ2 =
=
V
E1 E2
d
3
2
(2π~) c (E1 + E2 )p1 dp1
Z
V
E1 E2 p1
dΩ1 .
(2π~)3 c2 E1 + E2
Z
p21 dp1 dΩ1
(995)
We kunnen de discussie nu uitbreiden tot drie of meer deeltjes. Beschouw drie deeltjes, waarbij
in het zwaartepuntsysteem de impulsen beperkt zijn door
p1 + p2 + p3 = 0.
(996)
F APPENDIX: FASERUIMTE
274
De impulsen van twee deeltjes kunnen onafhankelijk van elkaar gevarieerd worden, maar de derde
is bepaald. Het aan toestanden is dan
Z
Z
V2
3
d3 p2 ,
(997)
N3 =
d
p
1
(2π~)6
en de toestandsdichtheid is gelijk aan
V2 d
ρ3 =
(2π~)6 dE
Z
3
d p1
Z
d3 p2 .
Voor n deeltjes kunnen we het boven generaliseren tot
Z
Z
d
V n−1
3
ρn =
d p1 . . . d3 pn−1 .
3(n−1)
dE
(2π~)
(998)
(999)
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
G
275
APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
G.1
Inleiding
Golven zijn fysische verschijnselen die zich in een medium kunnen voortplanten van één plaats
naar een andere en die daarbij energie en impuls overbrengen. De fysische eigenschappen worden
hierbij door een veld beschreven en variëren van elektromagnetische velden tot de transversale
verplaatsing van een snaar.
G.2
Wiskundige beschrijving
Een fysische situatie die zich zonder vervorming voortplant langs de x-as wordt een golfbeweging
genoemd en wordt beschreven door de uitdrukking
ξ(x, t) = f (x ± vt).
(1000)
Men noemt v de fasesnelheid en als s = vt, waarin t de tijd voorstelt, dan is de vervorming over
een afstand s naar links opgeschoven (zie Fig. 109). De grootheid ξ(x, t) kan een verscheidenheid
aan observabelen voorstellen, zoals de druk in een gas, transversale uitwijking van een snaar.
Figuur 109: Representatie van een fysische situatie die zich zonder vervorming voortplant langs
de x-as.
Een bijzonder geval treedt op als ξ(x, t) een sinusfunctie of harmonische functie is, zoals
ξ(x, t) = ξ0 sin k(x − vt),
(1001)
waarbij k het golfgetal wordt genoemd. Als we x vervangen door x + 2π
k krijgen we voor ξ(x, t)
weer dezelfde waarde, namelijk
2π
2π
ξ(x +
, t) = ξ0 sin k x +
− vt = ξ(x, t),
(1002)
k
k
met λ = 2π/k de golflengte van de kromme. We kunnen vergelijking (1001) ook schrijven als
ξ(x, t) = ξ0 sin (kx − ωt),
(1003)
waarin ω = kv = 2πv
λ de cirkelfrequentie van de golf voorstelt. Omdat ω ≡ 2πν, met ν de
frequentie, vinden we de belangrijke relatie
λν = v
(1004)
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
276
tussen golflengte, frequentie en fasesnelheid. Als T de periode van de trilling in elk punt is,
kunnen we vergelijking (1001) ook schrijven als
x
t
ξ(x, t) = ξ0 sin 2π
,
(1005)
−
λ T
Men kan gemakkelijk nagaan dat de algemene uitdrukking voor een lopende golf geschreven
kan worden als
x
ξ(x, t) = F (t ± ),
(1006)
v
waarin het positieve teken beantwoordt aan een voortplanting in de negatieve x-richting en het
minteken aan een voorplanting in positieve x-richting. Voor een harmonische golf kunnen we ook
schrijven
x
ξ(x, t) = ξ0 sin ω(t ± ) = ξ0 sin (ωt ± kx).
(1007)
v
Alternatief kunnen we schrijven
ξ(x, t) = ξ0 cos ω(t ±
x
) = ξ0 cos (ωt ± kx).
v
(1008)
Gebruikmakend van de stelling van Euler, eix = cos x + i sin x, kunnen we een harmonische golf
schrijven als superpositie van sin- en cos-functies en vinden dan
x
ξ(x, t) = ξ0 eiω(t± v ) = ξ0 ei(ωt±kx) .
(1009)
Tenslotte merken we op dat een harmonische golf in drie dimensies geschreven kan worden als
ξ(x, t) = ξ0 ei(ωt±k·x) ,
(1010)
waarbij k = (kx , ky , kz ) en x = (x, y, z).
G.3
G.3.1
Fourieranalyse van golfverschijnselen
Fouriercoëfficiënten en Fourierreeksen
Volgens de stelling van Fourier kan elke periodieke beweging worden uitgedrukt als een superpositie van harmonische bewegingen met frequenties ω, 2ω, .., nω ofwel perioden T , T2 , .., Tn .
Stel dat ξ = f (x − vt) een periodieke golfbeweging is, dit wil zeggen een golfbeweging die zich
op een gegeven punt herhaalt na T , 2T , .., nT . Dan geldt
ξ = f (x − vt) = f [x − v(t ± T )] = f (x − vt ∓ vT ).
(1011)
Dit betekent dat op een gegeven tijdstip ξ zich herhaalt als x toe- of afneemt met vT , 2vT , ..,
nvT , .. Als we dus, in plaats van t te veranderen, x veranderen met λ = vT , herhaalt de golf
zich in de ruimte. Een golfbeweging die periodiek in de tijd is, is dus ook periodiek in de ruimte.
Wij hadden al gevonden dat dit het geval was voor een eenvoudige sinusvormige of harmonische
golfbeweging.
Stel nu dat ξ = f (x) een in de ruimte periodieke functie is met golflengte λ, dus f (x) =
f (x + λ). Volgens de stelling van Fourier mogen we dan schrijven
ξ = f (x) =
a0
2
+ a1 cos kx + a2 cos 2kx + · · · + an cos nkx + · · ·
+ b1 sin kx + b2 sin 2kx + · · · + bn sin nkx + · · ·
(1012)
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
277
De golfbeweging ξ = f (x − vt) kan met ω = kv uitgedrukt worden als
ξ = f (x − vt) =
a0
2
+
+
+
+
a1 cos (kx − ωt) + a2 cos 2(kx − ωt)
· · · + an cos n(kx − ωt) + · · ·
b1 sin (kx − ωt) + b2 sin 2(kx − ωt)
· · · + bn sin n(kx − ωt) + · · · ,
(1013)
waaruit blijkt dat elke periodieke beweging kan worden uitgedrukt als een superpositie van
harmonische golven met frequentie ω, 2ω, .., nω, .. en golflengten λ, λ/2, .., λ/n, ...
Figuur 110: Het verschil in klank tussen bijvoorbeeld een viool en een fluit ontstaat door de
aanwezigheid van de boventonen met verschillende relatieve amplitudes. Het Fourierspectrum
van het geluid is voor elk instrument verschillend.
Door harmonische golven op te tellen, waarvan de frequenties een veelvoud van een bepaalde
grondfrequentie zijn en waarvan de amplitudes geschikt gekozen zijn, kunnen we dus bijna elke
willekeurige periodieke functie verkrijgen. De frequentie ω wordt de grondfrequentie (of grondtoon) genoemd en de frequenties 2ω, 3ω, .., nω, .. vormen de harmonischen (of boventonen). De
stelling van Fourier geeft ook een verklaring voor het verschil in klank van het geluid dat door
diverse muziekinstrumenten wordt voortgebracht. Dezelfde toonhoogte, voortgebracht door een
piano, gitaar en hobo, klinkt verschillend in onze oren, hoewel de tonen dezelfde grondfrequentie hebben. Het verschil ontstaat door de aanwezigheid van de boventonen met verschillende
relatieve amplitudes. Het Fourierspectrum van het geluid is voor elk instrument verschillend.
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
278
De coëfficiënten die horen bij de Fourierreeks van
∞
f (x) =
a0 X
+
(an cos nx + bn sin nx)
2
(1014)
1
kunnen bepaald worden met de formules van Euler
Z
1 π
f (x) cos nxdx
an =
∀n≥0
π −π
Z
1 π
bn =
∀n≥1
f (x) sin nxdx .
π −π
(1015)
Voorbeeld: De functie f (x) getoond in Fig. 111 is periodiek met periode 2π en wordt gegeven
door f (x) = x als −π < x ≤ π. Bereken de Fourierreeks van f (x).
Figuur 111: De zaagtandfunctie f (x) wordt rechtsboven getoond en is periodiek met periode
2π. De functie wordt gegeven door f (x) = x. Ook andere functies worden getoond. Het is
mogelijk deze functies op te bouwen met harmonische golven. De successievelijke benadering
voor de eerste vier termen wordt getoond.
Oplossing: Merk allereerst op dat f (x) op het interval −π < x ≤ π een oneven functie134 is ,
dus an = 0 voor elke n. Er geldt
Z
Z π
2
1 π
bn =
x sin nxdx =
xd(− cos nx)
π −π
nπ 0
π
Z π
−x cos nx
2
−2 cos nx
= 2
+
cos nxdx =
+ 0,
nπ
nπ 0
n
0
(1016)
134
De functie f (x) heet een even functie als voor elke x uit zijn definitieverzameling geldt dat f (−x) = f (x).
Voor een oneven functie geldt f (−x) = −f (x). De cos-functie is even, terwijl de sin-functie oneven is.
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
dus bn = − n2 als n even is en bn =
2
n
279
als n oneven is. De gevraagde Fourierreeks is dus
f (x) = 2
∞
X
(−1)n+1
1
sin nx
.
n
(1017)
Fig. 111 geeft een voorstelling van de opbouw van een zaagtandfunctie uit haar harmonische
golven.
G.3.2
Complexe schrijfwijze van de Fourierreeks
Uit de formule eix = cos x + i sin x volgt dat sin x = 21 i e−ix − eix en cos x =
Dus
1
2
eix + e−ix .
∞
a0 X
+
(an cos nx + bn sin nx)
2
f (x) =
1
∞
a0 1 X
+
(an − ibn ) einx + (an + ibn ) e−inx .
2
2
=
1
(1018)
Stellen we nu An = 12 (an − ibn ) , (n > 0), A−n = 12 (an + ibn ) , (n > 0), en A0 = 21 a0 , dan gaat
de goniometrische reeks over in
∞
X
f (x) =
An einx .
(1019)
−∞
Deze reeks is de Fourierreeks van een periodieke functie f (x) met periode 2π als
1
An =
2π
Z
2π
f (x)e−inx dx.
(1020)
0
Merk op dat wanneer F (t) periodiek is met periode T , en ω =
F (t) =
∞
X
An e
−∞
inωt
met
1
An =
T
T
Z
2π
T ,
dan is
F (t)e−inωt dt
(1021)
0
de Fourierreeks van F (t).
G.3.3
Fouriertransformatie
We beschouwen nu een functie f (x) die gedefinieerd is op L = (−∞, ∞) en die niet noodzakelijkerwijs periodiek is. We kunnen ons voorstellen dat f (x) benaderd kan worden met een
superpositie van periodieke functies waarvan de periode ∞ benadert.
De Fouriertransformatie is een generalisatie van de complexe Fourierreeks in de limiet L → ∞.
We vervangen de discrete An door de continue F (k)dk en laten n/L → k. Vervolgens vervangen
we de som door een integraal. Voor elke functie f (x), waarbij x zowel reëel als complex kan zijn,
verkrijgen we
Z ∞
Z ∞
2πikx
f (x) =
F (k)e
dk en F (k) =
f (x)e−2πikx dx.
(1022)
−∞
−∞
We noemen F (k) de Fouriergetransformeerde en f (x) de inverse transformatie.
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
280
Met name fysici geven er de voorkeur aan om de transformatie te schrijven in termen van hoekfrequenties, bijvoorbeeld ω = 2πν, en we krijgen dan
Z ∞
Z ∞
1
1
−ikx
−1
F (k) = F[f (x)] = √
f (x)e
dx en f (x) = F [F (k)] = √
F (k)eikx dk.
2π −∞
2π −∞
(1023)
Tenslotte kunnen we nog een n-dimensionale Fouriertransformatie definiëren voor k, x ∈ Rn door
Z ∞ Z ∞
1
..
f (x)e−ik·x dn x
(1024)
F (k) = F[f (x)] = √
( 2π)n −∞ −∞
{z
}
|
n
en
f (x) = F
−1
1
[F (k)] = √
( 2π)n
Z
∞
Z
..
−∞
{z
|
n
G.3.4
∞
F (k)eik·x dn k.
(1025)
−∞
}
Beschrijving van een golfpakket
Als voorbeeld beschouwen we een golf die op t = 0 beschreven wordt door de functie f (x)
afgebeeld in Fig. 112. De golf wordt ‘gechopped’, waardoor er een puls of golfpakket met lengte
∆x = x2 − x1 = a wordt verkregen. We stellen de golffunctie van de puls voor als
ξ0 sin k0 x x1 ≤ x ≤ x2
f (x, 0) =
(1026)
0
erbuiten
Elke functie kan geschreven worden als een superpositie van harmonische golven. We schrijven
Figuur 112: Fourier analyse van een golfpakket met lengte ∆x = a en amplitude ξ0 sin k0 x voor
het interval x1 ≤ x ≤ x2 . Links wordt het golfpakket gegeven, terwijl rechts het impulsspectrum
getoond wordt.
dan
1
f (x, 0) = √
2π
Z
∞
b(k)eikx dk.
(1027)
−∞
Vervolgens proberen we de coëfficiënten te berekenen door
Z ∞
1
b(k) = √
f (x, 0)e−ikx dx.
2π −∞
(1028)
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
281
We merken op dat de golffunctie ξ0 sin k0 x van de puls geschreven kan worden als het imaginaire
deel van eik0 x en vinden voor ons geval
r
Z +a/2
1
2 sin [(k − k0 )a/2]
ik0 x −ikx
e
e
dx =
b(k) = √
.
(1029)
πa
k − k0
2πa −a/2
Deze amplitude is geschetst in het rechter paneel van Fig. 112.
Indien de originele puls, ξ0 sin k0 x, zich uitstrekte van −∞, ∞, dan was het niet nodig geweest
om een Fourieranalyse te maken, omdat de kromme dan een harmonische beweging met golfgetal
k0 voorstelde. Echter, om de kromme voor x < x1 en x > x2 tot nul te reduceren moeten we
andere frequenties toevoegen, zodat de resulterende Fourierreeks in die gebieden nul is. Een
eindige puls is dus een samenstelling van vele frequenties, ook al heeft de trillingsbron een zeer
bepaalde frequentie.
We zien dat het frequentiespectrum b(k) een maximum heeft voor k = k0 . Het gebied van k
waarvoor b(k) groter is dan de helft van het maximum voldoet bij benadering aan de voorwaarde
1
π
π
(k − k0 )∆x < π of
−
< k − k0 <
,
(1030)
2
2
∆x
∆x
waarbij ∆x = a. Als we dus stellen dat ∆k = 2π/∆x, dan zien we dat de enige frequenties met
behoorlijke amplitudes in het gebied ∆k rond het maximum k0 liggen, gegeven door
∆x∆k ≈ 2π.
(1031)
We zien dat hoe korter de tijdsduur van de puls is, des te groter het frequentiegebied is dat nodig
is om de puls nauwkeurig voor te stellen.
G.4
De golfvergelijking
In het volgende gaan we na hoe we kunnen bepalen of een bepaald fysisch verschijnsel, voorgesteld
door een gegeven tijdafhankelijk veld, zich als een golf zonder vervorming voortplant. De velden
worden veelal door dynamische wetten beheerst, die in de vorm van differentiaalvergelijkingen
kunnen worden uitgedrukt. De vergelijking die het golfverschijnsel beschrijft wordt de golfvergelijking genoemd en dit is in het algemeen een differentiaalvergelijking. Als voorbeeld bespreken
we hier de transversale golven op een snaar (van bijvoorbeeld een gitaar).
In de snaar heerst een spankracht T en in de evenwichtstoestand is de snaar recht. Vervolgens
verplaatsen we de snaar loodrecht op zijn lengterichting over een kleine afstand (zie Fig. 113).
We beschouwen een deel AB met lengte dx dat zich op een afstand ξ van de evenwichtstoestand
bevindt. Omdat we de verplaatsing ξ klein aannemen, mogen we aannemen dat de tangentiële
spankracht in elk punt van de snaar gelijk is gebleven. Wegens de kromming van de snaar zijn
de krachten T niet precies tegengesteld gericht. De resulterende kracht op het stuk AB is naar
boven gericht en bedraagt
Fy = T (sin α0 − sin α).
(1032)
Omdat de snaar slechts zwak gekromd is, zijn de hoeken α0 en α klein en kunnen ze door hun
tangenten vervangen worden. We vinden
Fy = T (tan α0 − tan α) = T d(tan α) = T
∂
(tan α)dx.
∂x
(1033)
We merken op dat tan α de helling van de snaar is en deze is gelijk aan ∂ξ/∂x. We vinden
hiermee
∂
∂ξ
∂2ξ
Fy = T
dx = T 2 dx.
(1034)
∂x ∂x
∂x
G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN
282
Figuur 113: Een snaar waarin een spankracht T heerst wordt over een kleine afstand ξ vanuit
zijn evenwichtstoestand verplaatst. We beschouwen een deel AB met lengte dx.
De massa per lengte-eenheid van de snaar is µ en de massa van het stuk AB is gelijk aan µdx.
2
We gebruiken nu de tweede wet van Newton, F = ma = m ∂∂t2ξ , die de dynamica beschrijft en
vinden
∂2ξ
∂2ξ
∂2ξ
T ∂2ξ
(µdx) 2 = T 2 dx of
=
.
(1035)
∂t
∂x
∂t2
µ ∂x2
Dit is de golfvergelijking die transversale trillingen op een snaar
p beschrijft als de amplitude klein
is. De voortplantingssnelheid van de transversale golf is v = T /µ.
G.4.1
Partiële afgeleiden en oplossingen van de golfvergelijking
Stel dat de functie ξ afhangt van zowel de plaats x als de tijd t. Als voorbeeld kiezen we de
volgende golffunctie,
x
ξ(x, t) = ξ0 sin 2π
− νt = ξ0 sin (kx − ωt),
(1036)
λ
met k = 2π
λ het golfgetal en ω = 2πν de hoekfrequentie. We kunnen nu de partiële afgeleide van
ξ(x, t) naar de plaats nemen, door aan te nemen dat de tijd hierbij een constante is. We vinden
∂ξ(x, t)
= kξ0 cos (kx − ωt).
∂x
(1037)
Op analoge wijze vinden we
∂ξ(x, t)
= −ωξ0 cos (kx − ωt).
∂t
De tweede-orde partiële afgeleiden kunnen nu ook worden bepaald en we vinden
∂ 2 ξ(x,t)
∂x2
(1038)
= −k 2 ξ0 sin (kx − ωt),
(1039)
∂ 2 ξ(x,t)
∂t2
=
−ω 2 ξ
0 sin (kx
− ωt).
We kunnen op deze wijze ook partiële afgeleiden nemen van andere functies.
Door invullen van de tweede-orde partiële afgeleiden zien we direct dat de golffunctie gegeven
p
door vergelijking (1036) voldoet aan de golfvergelijking (1035) met als voorwaarde ω/k = T /µ.
Download