A APPENDIX - LINEAIRE ALGEBRA A 241 APPENDIX - LINEAIRE ALGEBRA A.1 A.1.1 Vectorrekening over de reële ruimte Scalaren en vectoren We onderscheiden • scalaren (of scalaire grootheden): door een getal bepaalde grootheden, zoals massa en temperatuur. • vectoren: door een richting èn een getal bepaalde grootheden, zoals snelheid en kracht. Dit getal heet de grootte of de absolute waarde van de vector. Notaties a, b, p, x, etc. zijn scalaren ~ B, ~ x, y, x, y zijn vectoren A, B, A, |A| = A is de absolute waarde van A. a heet een eenheidsvector als |a| = 1. A k B betekent: A en B hebben dezelfde richting. Er geldt dan ook B k A. A en −A zijn vectoren met gelijke grootte en tegengestelde richtingen. Opmerkingen • Vectoren kunnen door pijlen gerepresenteerd worden. Alle evenwijdige, gelijkgerichte, even lange pijlen stellen éénzelfde ‘vrije’ vector voor. • De nulvector 0 is een vector met onbepaalde richting en met grootte 0. • Uit A k B en A = B volgt A = B en omgekeerd. A.1.2 Product van een scalar en een vector Voor het product van een scalar en een vector geldt de volgende definitie: als c > 0, dan (cA) k A en |cA| = cA; als c < 0, dan (cA) k −A en |cA| = −cA; als c = 0, dan cA = 0; met als gevolg dat wanneer a de eenheidsvector is in de richting van A dan is A = Aa. A.1.3 Som en verschil van vectoren Elke twee vectoren A en B hebben een som, A+B. Als het beginpunt van de pijl die B representeert samenvalt met het eindpunt van de pijl die A voorstelt, dan wordt A + B gerepresenteerd door de pijl vanaf het beginpunt van de A-pijl naar het eindpunt van de B-pijl. Dit wordt weergegeven in Fig. 101. Voor optellen van vectoren gelden de axioma’s 1. ∀A,B [A + B = B + A] commutatieve eigenschap 2. ∀A,B,C [(A + B) + C = A + (B + C)] 3. ∃0 ∀A [A + 0 = A] associatieve eigenschap 0 heet het neutrale element 4. ∀A ∃−A [A + (−A) = 0] Voor vermenigvuldigen van vectoren met scalaren gelden de axioma’s inversiteits eigenschap A APPENDIX - LINEAIRE ALGEBRA 242 1. ∀p,q,A [(p + q)A = pA + qA] eerste distributieve eigenschap 2. ∀p,A,B [p(A + B) = pA + pB] tweede distributieve eigenschap 3. ∀p,q,A [p(qA) = (pq)A] associatieve eigenschap 4. ∀A [1A = A] neutraliteitseigenschap van het getal 1. Figuur 101: Representatie van het optellen van twee vectoren A en B. Het resultaat is de vector A+B. Verder geldt de definitie A − B = A + (−B) en A − B heet het verschil van A en B. A.1.4 Lineaire afhankelijkheid; ontbinden van vectoren, kentallen De som pA + qB heet een lineaire combinatie van A en B, terwijl pA + qB + rC een lineaire combinatie heet van A, B en C. Definitie: een stelsel vectoren heet lineair onafhankelijk als geen van die vectoren gelijk is aan een lineaire combinatie van andere vectoren uit dat stelsel. Stelling: A, B en C zijn lineair onafhankelijk dan en slechts dan als uit pA + qB + rC = 0 volgt dat p = q = r = 0. Als A + B = C, dan heten A en B de componenten van C in de richtingen van A en B. Als i, j en k de eenheidsvectoren zijn in de richtingen van de positieve x-, y- en z-as van een cartesiaans coördinatenstelsel, dan is A = A1 i + A2 j + A3 k. (840) Elke vector A is dus gelijk aan een lineaire combinatie van de onderling lineair onafhankelijke vectoren i, j en k. De getallen A1 , A2 en A3 noemen we de kentallen van A ten opzichte van de basis {i, j, k}. Blijkbaar geldt 1. A + B = (A1 + B1 )i + (A2 + B2 )j + (A3 + B3 )k, 2. cA = cA1 i + cA2 j + cA3 k, p 3. A = A21 + A22 + A23 . A APPENDIX - LINEAIRE ALGEBRA 243 Figuur 102: De vector A kan ontbonden worden in een lineaire combinatie van de onderling lineair onafhankelijke vectoren i, j en k die een basis vormen. A.1.5 Inwendig of scalair product van vectoren Definitie A · B ≡ A · B · cos ∠(A; B) (841) Het inwendig product van vectoren is dus een scalar. Eigenschappen 1. ∀A,B [A · B = B · A] commutatieve eigenschap 2. ∀A,B,C [A · (B + C) = A · B + A · C] distributieve eigenschap Uit de definitie volgt A · A = A2 en A·B=0 als A ⊥ B. (842) Dus ook i · i = j · j = k · k = 1 en i · j = j · k = k · i = 0 en dus A · B = A1 B1 + A2 B2 + A3 B3 = 3 X Ai B i . (843) i=1 Merk op dat als A · B = 0, dan is A = 0 of B = 0 of A ⊥ B. A.1.6 Uitwendig of vectorieel product van vectoren Definitie: A × B is een vector C waarvan 1. de absolute waarde gelijk is aan C = AB| sin ∠(A; B)| en 2. (als C 6= 0) de richting bepaald worden door C ⊥ A en C ⊥ B, terwijl de richting van voortgang van C volgens de rechterhandregel past bij de richting van draaiing van A naar B over de kleinste hoek. A APPENDIX - LINEAIRE ALGEBRA 244 Merk op dat de grootte van het uitwendig product A × B gelijk is aan de oppervlakte van de op A en B als zijden beschreven parallellogram. Voor het uitwendig product gelden de eigenschappen 1. ∀A,B [B × A = −(A × B)] anti-commutativiteits eigenschap. 2. ∀A,B,C [A × (B + C) = A × B + A × C] distributiviteits eigenschap. Uit de definitie volgt i × j = −j × i = k j × k = −k × j = i k × i = −i × k = j (844) en A × B = 0, als A k B. (845) In het bijzonder geldt dus dat A × A = 0, (846) i × i = j × j = k × k = 0. (847) en dus ook Volgens de distributiviteits eigenschap is dus A × B = (A2 B3 − A3 B2 )i + (A3 B1 − A1 B3 )j + (A1 B2 − A2 B1 )k. (848) Merk op dat als A × B = 0, dan A = 0 of B = 0 of A k ±B. A.1.7 Determinantnotatie voor het uitwendig product Definitie a b c d Definitie a b c p q r x y z Dus ≡a· q r y z ≡ ad − bc. −b· p r x z (849) +c· p q x y i j k A × B = A1 A2 A3 . B1 B2 B3 A.1.8 (850) (851) Tripelproducten Drie vectoren kunnen zodanig vermenigvuldigd worden dat het resultaat een scalar of een vector is. In dat geval vinden we de volgende relaties. 1. Scalair product De inhoud van het parallellepipedum op A, B en C is gelijk aan de absolute waarde van A1 A2 A3 A · (B × C) = B · (C × A) = C · (A × B) = (ABC) = B1 B2 B3 . (852) C1 C2 C3 2. Vectorieel product A × (B × C) = (A · C)B − (A · B)C. (853) A APPENDIX - LINEAIRE ALGEBRA 245 Figuur 103: De inhoud van het parallellepipedum op A, B en C is gelijk aan de absolute waarde van A · (B × C). A.1.9 Voorbeelden 1. Als A = 2i − 3j + k, dan is A = p √ 22 + (−3)2 + 12 = 14. 2. Gegeven: A = 2i − 3j + k en B = 5i + j − 7k. Te bewijzen: A ⊥ B. Bewijs: A · B = A1 B1 + A2 B2 + A3 B3 = 2 · 5 + (−3) · 1 + 1 · (−7) = 10 − 3 − 7 = 0, (854) dus A ⊥ B. 3. Gegeven: A = 3i − 4j + 5k en B = i + 2j − k. Te berekenen: cos ∠(A; B). Oplossing: A · B = AB p · cos ∠(A; B) p = √ 32 +√(−4)2 + 52 · 12 + 22 + (−1)2 · cos ∠(A; B) = 50 · 6 · cos ∠(A; B). (855) Verder geldt A · B = A1 B1 + A2 B2 + A3 B3 = 3 − 8 − 5 = −10. √ √ Dus 10 3 · cos ∠(A; B) = −10, ofwel cos ∠(A; B) = − 13 3. 4. Als A = 2i − 3j + k en B = 5i + j − 7k, dan is i j k −3 1 2 1 2 −3 A × B = 2 −3 1 = i − j 5 −7 + k 5 1 1 −7 5 1 −7 = (−3 · −7 − 1 · 1)i − (2 · −7 − 1 · 5)j + (2 · 1 − −3 · 5)k = 20i + 19j + 17k. (856) (857) A APPENDIX - LINEAIRE ALGEBRA A.2 246 Complexe grootheden We definiëren de imaginaire eenheid als i2 ≡ −1 en hiermee geldt i = wordt nu geschreven als z ≡ x + iy, √ −1. Een complex getal (858) waarbij x = Re z het reële deel en y = Im z het imaginaire deel130 van z is. Verder geldt er dezelfde algebra als voor gewone getallen. Bijvoorbeeld hebben we z1 = z2 als x1 = x2 en y1 = y2 . De complex geconjugeerde van z = x + iy duiden we aan met z ∗ en er geldt z ∗ ≡ x − iy, complex geconjugeerde van z. (859) Hiermee geldt z ∗ z = (x − iy)(x + iy) = x2 − i2 y 2 − ixy + ixy = x2 − i2 y 2 = x2 + y 2 . (860) Dit doet direct denken aan de stelling van Pythagoras. We zien hier de definitie van het inprodukt voor complexe getallen. Fig. 104 geeft hiervan een geometrische voorstelling in het complexe vlak. Figuur 104: Representatie van het complexe getal z door het punt met label P in het complexe vlak. Het complexe vlak wordt gevormd door de reële en imaginaire as. We kunnen het getal z voorstellen door het punt P met cartesische coördinaten x = r cos α en y = r sin α, waarbij men r de modulus en α de fase noemt. Er geldt dan dat r2 = x2 + y 2 en dus z = r(cos α + i sin α) en z ∗ z = r 2 = x2 + y 2 . (861) Fig. 105 geeft de rotatie weer in het complexe vlak van punt P naar P 0 over een kleine hoek dα. Hierbij ligt punt P op de reële as. We merken op dat dz = izdα → dz = idα. z Integratie van een eindige rotatie over hoek α levert Z zeind Z α dz zeind =i dα → ln = iα → zeind = zbegin eiα . zbegin zbegin z 0 130 Merk op dat y een reëel getal is. (862) (863) A APPENDIX - LINEAIRE ALGEBRA 247 Figuur 105: Rotatie over een infinitesimale hoek dα van het punt met label P in het complexe vlak. We nemen vervolgens r = 1 en dus zbegin = 1 en vinden zeind = cos α + i sin α. Vergelijken van beide resultaten geeft de stelling van Euler, eiα = cos α + i sin α. (864) Uit een rotatie in negatieve zin vinden we e−iα = cos α − i sin α. (865) Combineren van de laatste twee vergelijkingen levert de uitdrukkingen cos α = eiα + e−iα 2 en sin α = eiα − e−iα . 2i (866) We kunnen met behulp van de stelling van Euler de complex geconjugeerde definiëren als ∗ eiα = e−iα . (867) ∗ Verder geldt ook r2 = z ∗ z = eiα eiα = e−iα eiα = e0 = 1. We kunnen de complexe exponent als volgt differentiëren, deiα = ieiα . dα (868) Merk op dat we vaak functies als eikx , ei(kx−ωt) en e−iEt/k zullen gebruiken. We hebben dan bijvoorbeeld deikx = ikeikx . (869) dx Tenslotte merken we op dat de veel voorkomende superpositie van vlakke golven, ψ(x, t) = cos (kx − ωt) + γ sin (kx − ωt), (870) met γ = ±i geschreven kan worden als ψ(x, t) = e±i(kx−ωt) . (871) Deze functies stellen vlakke golven voor van een vrij deeltje met golfgetal k en hoekfrequentie ω. A APPENDIX - LINEAIRE ALGEBRA A.3 A.3.1 248 Lineaire ruimten en lineaire afbeeldingen Lineaire ruimten Elke verzameling, waarbinnen de elementen ‘opgeteld’ en ‘met een scalar vermenigvuldigd’ kunnen worden, wordt een lineaire ruimte ofwel een vectorruimte genoemd en de elementen ervan heten vectoren. Definitie: Een verzameling L heet een lineaire ruimte over een getallenlichaam K als geldt • ∀a,b∈L ∃!c∈L [a + b = c] • ∀p∈K,a∈L ∃!b∈L [pa = b], terwijl de volgende acht axioma’s gelden 1. ∀a,b∈L [a + b = b + a] 2. ∀a,b,c∈L [(a + b) + c = a + (b + c)] 3. ∃0∈L ∀a∈L [a + 0 = a] 4. ∀a∈L ∃−a∈L [a + (−a) = 0] 5. ∀p,q∈K,a∈L [(p + q)a = pa + qa] 6. ∀a,b∈L,p∈K [p(a + b) = pa + pb 7. ∀p,q∈K,a∈L [p(qa) = (pq)a] 8. ∀a∈L [1a = a] We hebben in hoofdstuk A.1 reeds gezien dat vectoren aan bovenstaande axioma’s voldoen. Hier bekijken we een en ander op meer abstractie wijze en het getallenlichaam K kan K ∈ R, respectievelijk K ∈ C, zijn. Men spreekt dan van een reële, respectievelijk complexe, vectorruimte L. In paragraaf A.1 hebben we ons beperkt tot een discussie van reële vectorruimten. Ook in deze paragraaf beschouwen we enkel reële vectorruimten. Later zullen we de discussie uitbreiden tot complexe vectorruimten. A.3.2 Eigenschappen Als L een lineaire ruimte is gelden de volgende Stellingen 1. ∃!0∈L ∀a∈L [a + 0 = a] 2. ∀a∈L ∃!−a∈L [a + (−a) = 0] Definitie a − b ≡ a + (−b) Stellingen 1. ∀a,b,c∈L [a + b = c ⇔ a = c − b] 2. ∀a∈L [0a = 0] 3. ∀a∈L [(−1)a = −a] 4. ∀p∈R [p0 = 0] A APPENDIX - LINEAIRE ALGEBRA A.3.3 249 Lineaire onafhankelijkheid, basis, dimensie Definitie: Een deelverzameling S van een lineaire ruimte L heet een onafhankelijke stelsel vectoren als S 6= {0}, terwijl geen enkel element van S gelijk is aan een lineaire combinatie van andere elementen van S. Stelling 1: Als 0 ∈ S, dan is S een afhankelijk stelsel. Stelling 2: S = {a1 , .., an } is dan en slechts dan een onafhankelijk stelsel als uit volgt dat ci = 0 voor alle i = 1, .., n. Pn i=1 ci ai =0 Definitie: B heet een basis van de lineaire ruimte L als 1. B ⊂ L, 2. B een onafhankelijk stelsel is, 3. elk element van L gelijk is aan een lineaire combinatie van elementen van B. Als B = {e1 , ..en } dan geldt " ∀a∈L ∃a1 ,..,an ∈R a = n X # ai ei . (872) i=1 Deze getallen a1 tot en met an heten de kentallen van a ten opzichte van de basis B. We noemen (i, j, k) ‘de’ basis van R3 van de drietallige getalgrepen. Stelling 3: Als de lineaire ruimte L een basis heeft die uit n elementen bestaat, dan bestaat elke basis van L uit n elementen. Definitie: De dimensie van L is het aantal elementen van de basis van L. A.3.4 Inwendig product, norm en orthogonaliteit van vectoren Definitie: Een inwendig product binnen een vectorruimte L is een afbeelding van L × L naar R, waarvoor, als (a, b) ∈ R het aan a ∈ L en b ∈ L toegevoegde getal is, geldt 1. ∀a,b∈L [(a, b) = (b, a)] 2. ∀a,b,c∈L [(a, b + c) = (a, b) + (a, c)] 3. ∀a,b∈L,p∈R [(pa, b) = p(a, b)] 4. ∀a∈L [(a, a) ≥ 0]; (a, 0) = 0 Het getal A · B = AB cos ∠(A; B) zullen we ‘het’ inwendig product in V3 noemen. Met ‘het’ inwendig product in Rn duiden we aan b1 . n X (a, b) = (a1 , .., an ) . = ai bi . (873) . i=1 bn Dit inwendig product noteren we dus door de eerste vector als rijvector en de tweede als kolomvector te schrijven. p Definitie: De norm |a| van de vector a is het getal (a, a). Definitie: De vectoren a en b zijn onderling orthogonaal dan en slechts dan als (a, b) = 0. A APPENDIX - LINEAIRE ALGEBRA A.3.5 250 Lineaire afbeeldingen Een afbeelding van de verzameling A naar de verzameling B is een relatie waarvan A de originelenverzameling is en B de beeldverzameling omvat, terwijl elk origineel één beeld heeft (een functie is dus een afbeelding). Definitie: Een afbeelding F van de lineaire ruimte L1 naar de lineaire ruimte L2 heet een lineaire afbeelding als 1. ∀a,b∈L1 [F(a + b) = F(a) + F(b)] en 2. ∀a∈L1 ,p∈R [F(pa) = pF(a)] . Merk op dat als B = {e1 , .., eP n } een basis is van L dan is de afbeelding van L naar Rn , waarvoor geldt dat het beeld van a = ni=1 ai ei de ‘kentalvector’ (a1 , .., an ) is, een lineaire afbeelding. A APPENDIX - LINEAIRE ALGEBRA A.4 A.4.1 251 Matrixrekening Matrices Het stelsel van k lineaire vergelijkingen met n onbekenden x1 tot en met xn , a11 x1 + a12 x2 + ... + a1n xn = b1 a21 x1 + a22 x2 + ... + a2n xn = b2 . . . . . . . . . ak1 x1 + ak2 x2 + ... + akn xn = bk is volkomen gekarakteriseerd a11 a21 . . . ak1 door de getalverzamelingen a12 ... a1n x1 a22 ... a2n x2 . , . . . . . ak2 ... akn xn en b1 b2 . . . bk (874) . (875) Het eerste van deze getallenschema’s heet een matrix van de orde k × n; deze matrix bevat namelijk k rijen en n kolommen. De andere twee getalgroepen zijn blijkbaar kolomvectoren, die ook opgevat kunnen worden als matrices van de orde n × 1, respectievelijk k × 1. Definitie: Een matrix is een in rijen en kolommen gesorteerde getalverzameling. De getallen van die verzameling heten de elementen van de matrix. Ze worden bij voorkeur met twee indices genoteerd, waarvan de eerste het rangnummer van de rij en de tweede dat van de kolom aangeeft. Als het aantal rijen k en het aantal kolommen n is dan heet k × n de orde van de matrix. Als k = n dan heet de matrix een vierkante matrix van de orde n ofwel een n × n matrix. De matrix met elementen aij , (i = 1, .., k; j = 1, .., n) wordt dan wel kortweg aangeduid met A = (aij ), (k × n). (876) Opmerkingen: 1. Elke rij van een matrix is op zichzelf beschouwd een rijvector en elke kolom van de matrix een kolomvector. 2. A = B betekent dat A en B van dezelfde orde, k × n, zijn en dat aij = bij voor elke i = 1, .., k en elke j = 1, .., k. A.4.2 Determinant van een matrix a b De determinant van de matrix A = is het c d a b |A| = det A = c d getal = ad − bc. (877) De ondermatrix Aij van de matrix A is de matrix die ontstaat als uit A de ide rij en de j de kolom weggelaten worden. A APPENDIX - LINEAIRE ALGEBRA 252 1 2 3 2 3 Voorbeeld: Als A = 2 5 6 , dan is A21 = . 9 2 1 9 2 De determinant van de vierkante matrix A, (n × n) is het getal det A = |A| = n X (−1)i+j aij |Aij |, (i = 1, . . . , n), (878) (−1)i+j aij |Aij |, (j = 1, . . . , n). (879) j=1 en ook det A = |A| = n X i=1 Dit zijn de formules voor het ontwikkelen van det A volgens de ide rij, respectievelijk volgens de j de kolom. Voorbeeld: We ontwikkelen volgens de eerste rij. 1 2 3 0 5 −1 5 −1 0 −1 0 5 =1· −2· + 3 · −3 1 2 1 2 −3 2 −3 1 A.4.3 = 15 + 22 + 9 = 46. (880) Product van een matrix met een kolomvector Definitie: Het product van een k × n-matrix A met een n-dimensionale kolomvector x is gelijk aan de k-dimensionale kolomvector b waarvan het ie -element, (i = 1, .., k), gelijk is aan het inwendig product van de ie -rijvector van de matrix A met de kolomvector x. Dus Pn als A = (aij ), (k × n) en x = (xi ), (n × 1), dan is b = (bi ), (k × 1), waarbij bi = j=1 aij xj , (i = 1, .., k). Het hele vergelijkingenstelsel van de paragraaf A.4.1 kan dus genoteerd worden als Ax = b. A.4.4 Matrix als transformatie-operator Als A = (aij ), (k × n), dan definieert Ax = y een afbeelding van x naar Rk , A : x(∈ Rn ) → Ax(= y ∈ Rk ). (881) Deze afbeelding is blijkbaar een lineaire afbeelding, want 1. ∀x,y∈Rn [A(x + y) = Ax + Ay] en 2. ∀x∈Rn ,p∈C [A(px) = pAx]. Stellingen: 1. Als A = (aij ), (k × n), terwijl {e1 , .., en } de basis van Rn is, dan is Aei de ie -kolomvector van A, (i = 1, .., n). 2. Als T een lineaire afbeelding is van Rn naar Rk , dan bestaat er een matrix A, (k × n), zodanig , dat voor elke x ∈ Rn geldt, dat het beeld van x onder de transformatie T (dus T x) gelijk is aan het product Ax. Deze matrix A is de matrix waarvan de ie -kolomvector, (i = 1, .., n), het T -beeld van de ie basisvector ei van Rn (dus T ei ) is. Deze A heet de transformatiematrix van de afbeelding T. A APPENDIX - LINEAIRE ALGEBRA A.4.5 253 Som van matrices Als A = (aij ), (k × n) en B = (bij ), (k × n), dan is de afbeelding C die aan x ∈ Rn als beeld toevoegt Cx = Ax + Bx een lineaire afbeelding. De transformatiematrix van deze afbeelding is C = (cij ), (k × n), met cij = aij + bij , (i = 1, .., k; j = 1, .., n). (882) Deze matrix C noemen we de som van matrices A en B. Merk op dat enkel matrices van gelijke orde een som hebben. De vermenigvuldiging met een kolomvector is distributief ten opzichte van matrixoptelling. Bovendien is matrixoptelling commutatief en associatief. 1 2 3 2 3 0 Voorbeeld: Als A = en B = , dan 0 1 4 −1 2 5 A+B= en A−B= A.4.6 1+2 2+3 3+0 0 + (−1) 1 + 2 4 + 5 1−2 2−3 3−0 0 − (−1) 1 − 2 4 − 5 = = 3 5 3 −1 3 9 −1 −1 3 1 −1 −1 (883) . (884) Product van scalar met matrix Als A = (aij ), (k × n), dan is A + A = (aij + aij ) = (2aij ). Deze matrix van orde k × n noemen we 2A. Analoog kan het product van een matrix met een willekeurige scalar gedefinieerd worden als pA = (paij ). (885) Zowel ten opzichte van optellen van matrices als van scalaren is deze vermenigvuldiging distributief, (p + q)A = pA + qA en p(A + B) = pA + pB. Bovendien geldt de associatieve eigenschap (pq)A = p(qA), terwijl kennelijk 1A = A. Samenvattend concluderen we dat de verzameling van matrices van een bepaalde orde een lineaire ruimte is. A.4.7 Product van matrices Definitie: Het product AB = C van de matrix A = (aij ), (k × m) met de matrix B = (bij ), (m × n), is de matrix C = (cij ), (k × n), waarvan cij = m X aih bhj , (i = 1, .., k; j = 1, .., n). (886) h=1 Het element cij van C is dus gelijk aan het inwendig product van de ie rijvector van A met de j e kolomvector van B. 3 −4 1 2 1 5 , dan Voorbeeld: Als A = en B = 1 4 0 2 −2 2 AB = 1 2 1 4 0 2 Opmerkingen 3 −4 1(3) + 2(1) + 1(−2) 1(−4) + 2(5) + 1(2) 3 8 1 5 = = . 4(3) + 0(1) + 2(−2) 4(−4) + 0(5) + 2(2) 8 −12 −2 2 (887) A APPENDIX - LINEAIRE ALGEBRA 254 1. De vermenigvuldiging van een matrix met een kolomvector is een bijzonder geval van deze matrixvermenigvuldiging: een kolomvector is immers een matrix van de orde m × 1. 2. Het product AB bestaat slechts dan als het aantal kolommen van A gelijk is aan het aantal rijen van B. Matrix vermenigvuldiging is in het algemeen niet commutatief, AB 6= BA. Het verschil tussen deze twee volgordes noemen we de commutator, [A, B] ≡ AB − BA. (888) Tenslotte merken we op dat matrixvermenigvuldiging wel associatief is ((AB)C = A(BC) = ABC) en distributief ((A + B)C = AC + BC en A(B + C) = AB + AC). A.4.8 Diagonale matrices Onder de hoofddiagonaal van een vierkante matrix A = (aij ) van de n-de orde verstaan we de getallenrij (a11 , a22 , .., ann ). Een diagonale matrix is een vierkante matrix A = (aij ), waarvoor geldt, dat aij = 0 als i 6= j, terwijl er minstens één i is waarvoor aii 6= 0. Alleen in de hoofddiagonaal staan dus elementen die ongelijk nul zijn. Als P een diagonale matrix is waarvan alle diagonaalelementen gelijk aan p zijn en B een zodanige matrix is, dat PB, respectievelijk BP bestaat, dan is volgens de definitie van matrixvermenigvuldiging en vermenigvuldigen met een scalar PB = pB, respectievelijk BP = pB. (889) Een diagonale matrix, waarvan alle diagonaaltermen onderling gelijk zijn heet daarom een scalaire matrix. Een scalaire matrix, waarvan alle diagonaaltermen gelijk zijn aan 1 wordt aangeduid met de letter I. Zo een eenheidsmatrix I is neutraal element ten opzichte van matrixvermenigvuldiging. A.4.9 Geadjugeerde en inverse matrices Definitie: De geadjugeerde matrix adj A = (αij ), (n × n), van de matrix A = (aij ), (n × n), is de matrix, waarvan het algemene element gelijk is aan αij = (−1)i+j |Aji |. Definitie: Als AB = I, dan heet B een rechterinverse van A en A een linkerinverse van B. 1 2 3 6 −2 −3 1 0 0 1 0 = 0 1 0 = I, is iedere matrix in Voorbeeld: Omdat 1 3 3 −1 1 2 4 −1 0 1 0 0 1 het product de inverse van de ander. Stelling 1: Als A een (k × n)-matrix is, AB = Ik×k en CA = In×n , dan B = C, (n × k). Bewijs: B = In×n B = (CA)B = C(AB) = CIk×k = C. Stelling 2: Als AB = I en BA = I, dan is A vierkant. Bewijs: Als A = (aij ), (k × n), dan B = (bij ), (n × k), AB = I, (k × k), en BA = I, (n × n). P P De som van de diagonaalelementen van respectievelijk AB en BA is dan k = ki=1 nj=1 aij bji P P en n = nj=1 ki=1 aij bji , dus n = k. Definitie: Als AB = BA = I dan heten A en B elkaars inverse matrix: A = B−1 en B = A−1 . Een matrix die een inverse heeft heet regulier, terwijl een matrix die geen inverse heeft singulier heet. Iedere reguliere matrix is vierkant. Als A regulier is dan heeft Ax = b juist één oplossing, namelijk x = A−1 b. A APPENDIX - LINEAIRE ALGEBRA 255 Door gebruik te maken van de definities van de determinant, kan men laten zien dat A(adj A) = (adj A)A = (det A)I, adj dus als det A 6= 0 en B = det adj A A regulier en A−1 = det A. A A, (890) dan AB = BA = I. We vinden dus dat als det A 6= 0, dan is Een matrix is dan en slechts dan regulier als zijn determinant ongelijk is aan nul. Een vierkante matrix is dan en slechts dan singulier als zijn determinant gelijk is aan nul. 1 −2 4 1 2 , dan Voorbeeld: Als A = −3 5 4 −3 1 −2 4 −3 1 −3 1 2 2 1 2 = 1 (891) + (4) − (−2) |A| = −3 5 4 = −81, 5 −3 4 −3 5 4 −3 terwijl −3 1 2 = −11, |A12 | = |A11 | = 5 4 −3 −2 1 4 |A21 | = = −10, |A | = 22 5 4 −3 −2 4 = −8, |A32 | = 1 |A31 | = −3 1 2 zodat A.4.10 −11 10 −8 1 −23 −14 , adj A = −17 −14 −5 −3 1 2 = −17, = −1, |A13 | = 5 4 −3 1 −2 4 = 14, = −23, |A23 | = −3 5 4 1 −2 4 = −5, = 14, |A33 | = 2 −3 1 11 −10 8 1 −1 23 14 . = 81 17 14 5 (892) (893) (894) dus A−1 (895) De getransponeerde van een matrix; symmetrische en alternerende matrices Als A = (aij ) een (k × n)-matrix is en B = (bij ) een (n × k)-matrix, terwijl bij = aji voor elke i = 1, .., n en elke j = 1, .., k, dan heten A en B elkaars getransponeerde, B = AT en A = BT . 1 4 1 2 3 Voorbeeld: De getransponeerde van A = is AT = 2 5 . 4 5 6 3 6 1. De getransponeerde van een vierkante matrix wordt dus verkregen door die matrix te ‘spiegelen ten opzichte van de hoofddiagonaal’. 2. De getransponeerde van een kolomvector is een rijvector en omgekeerd. Stellingen: 1. (AT )T = A. 2. (A + B)T = AT + BT . 3. (AB)T = BT AT . 4. Als x een kolomvector is dan is xT x = |x|2 . A APPENDIX - LINEAIRE ALGEBRA 256 Definities: A heet een symmetrische matrix als A = AT . A heet een alternerende (anti-symmetrische of scheefsymmetrische) matrix als AT = −A. 1 2 3 0 −2 3 4 −5 is symmetrisch, terwijl de matrix A = 2 0 4 . Voorbeeld: De matrix A = 2 3 −5 6 −3 −4 0 anti-symmetrisch is. A.4.11 Orthogonale matrices Definitie: De matrix A heet orthogonaal als AAT = AT A = I, dus als AT = A−1 . Stelling 1: Een orthogonale matrix is een matrix waarvan de rijvectoren zowel als de kolomvectoren een orthonormaal stelsel vormen (dit wil zeggen dat elke twee onderling verschillende rijvectoren, respectievelijk kolomvectoren, onderling orthogonaal zijn, terwijl al die vectoren de norm 1 hebben. Stelling 2: Als A orthogonaal is, dan geldt voor elke x (van de juiste dimensie) dat |Ax| = |x|. We concluderen dat de norm van een vector invariant is voor een transformatie waarvan de transformatiematrix orthogonaal is. Het omgekeerde van deze stelling geldt ook: als voor een lineaire afbeelding de norm invariant is, dan is de transformatiematrix orthogonaal. Bewijs: |Ax|2 = (Ax)T (Ax) = (xT AT )(Ax) = xT (AT A)x = xT Ix = xT x = |x|2 . 1 √ √1 − √12 3 6 0 Voorbeeld: De lineaire transformatie y = Ax = √13 − √26 x is orthogonaal. Het beeld van x = (a, b, c) is y = √ lengte a2 + b2 + c2 . √a 3 + √b 6 − √c , √a 2 3 − √1 3 2b √a √ , 6 3 √1 6 + √b6 + √1 2 √c 2 en beide vectoren hebben A APPENDIX - LINEAIRE ALGEBRA A.5 A.5.1 257 Vectorrekening over de complexe ruimte Vectoren We generaliseren nu de concepten die we geleerd hebben van vectoren over een reële ruimte in twee opzichten. Ten eerste mogen de scalaren nu complexe getallen worden, en ten tweede beperken we ons niet tot drie dimensies, maar beschouwen we vectoren die leven in ruimten met oneindig veel dimensies. Merk op dat een en ander redelijk rechttoe rechtaan is, maar dat we abstractie notatie gebruiken. Deze notatie sluit aan bij wat gebruikelijk is in de quantum fysica. De reden dat we dit doen, is dat we dan later onze intuitie van vectoren kunnen gebruiken voor andere systemen die dezelfde formele eigenschappen bezitten. Een vectorruimte bestaat uit een verzameling vectoren (we noteren dit als |α >, |β >, |γ > , ...), samen met een verzameling scalaren (a, b, c, ...)131 , die aan twee bewerkingen - vector optelling en scalaire vermenigvuldiging - onderhevig zijn. Vector optelling De som van twee willekeurige vectoren is een vector, |α > +|β >= |γ > . (896) |α > +|β >= |β > +|α > (897) |α > +(|β > +|γ >) = (|α > +|β >) + |γ > . (898) Vector additie is commutatief en associatief Er bestaat een nulvector, |0 >, met de eigenschap |α > +|0 >= |α > (899) voor elke vector |α >. Verder bestaat er voor elke vector |α > een geassocieerde inverse vector, | − α >, zodat |α > +| − α >= |0 > . (900) Scalaire vermenigvuldiging Het product van een scalar met een willekeurige vector is een vector a|α >= |γ > . (901) Het scalaire product is distributief ten opzichte van vector optelling a(|α > +|β >) = a|α > +a|β > (902) en ten opzichte van scalaire optelling (a + b)|α >= a|α > +b|α > . (903) Het is ook associatief ten opzichte van gewone vermenigvuldiging met scalaren a(b|α >) = (ab)|α > . (904) Vermenigvuldiging met de scalaren 0 en 1 heeft het gebruikelijke effect 0|α >= |0 > en 1|α >= |α > . (905) Blijkbaar geldt er | − α >= (−1)|α >. 131 We beperken ons tot eenvoudige complexe getallen, want dit is wat we voor quantum fysica nodig hebben. Wiskundig gezien zouden we ook meer gecompliceerde objecten kunnen beschouwen. A APPENDIX - LINEAIRE ALGEBRA 258 Lineaire combinaties van vectoren Een lineaire combinatie van de vectoren |α >, |β > , |γ >, ... is een uitdrukking van de vorm a|α > +b|β > +c|γ > +... (906) Een vector |λ > wordt lineair onafhankelijk van de verzameling |α >, |β >, |γ >, ... genoemd als het niet geschreven kan worden als een lineaire combinatie van deze vectoren. Op dezelfde wijze is een verzameling vectoren lineair onafhankelijk als elke vector lineair onafhankelijk is van de rest. Een verzameling vectoren spant een ruimte op als elke vector geschreven kan worden als een lineaire combinatie van de elementen van deze verzameling. De verzameling van lineair onafhankelijke vectoren die een ruimte opspant, wordt een basis genoemd. Het aantal vectoren in een basis wordt de dimensie van de ruimte genoemd. Op dit moment nemen we aan dat de dimensie, n, eindig is. Ten opzichte van een voorgeschreven basis |e1 >, |e2 >, |e3 >, .., |en >, (907) |α >= a1 |e1 > +a2 |e2 > +.. + an |en > (908) wordt een willekeurige vector op unieke wijze vertegenwoordigd door de (geordende) verzameling van zijn componenten |α >↔ (a1 , a2 , .., an ). (909) Het is vaak eenvoudiger om met de componenten te werken dan met de abstracte vectoren zelf. Om twee vectoren op te tellen, tel je dan de corresponderende componenten op |α > +|β >↔ (a1 + b1 , a2 + b2 , .., an + bn ). (910) Vermenigvuldigen met een scalar betekent c|α >↔ (ca1 , ca2 , .., can ), (911) terwijl de nulvector door een reeks nullen wordt voorgesteld |0 >= (0, 0, .., 0) (912) en de componenten van de inverse vector hebben het tegenovergestelde teken | − α >↔ (−a1 , −a2 , .., −an ). (913) Het enige nadeel van het werken met componenten, is dat men zich moet commiteren tot een bepaalde basis en dat sommige manipulaties er verschillend uit zullen zien voor iemand die in een andere basis werkt. A.5.2 Inproduct In drie dimensies zijn we twee soorten vectorproduct tegengekomen: inproduct en uitproduct. In n-dimensionale ruimten beschouwen we enkel het inproduct. Het inproduct van twee vectoren |α > en |β > is een complex getal, dat we noteren als < α|β >, met de volgende eigenschappen < β|α >=< α|β >∗ , < α|α >≥ 0, en < α|α >= 0 ↔ |α >= |0 >, (914) (915) A APPENDIX - LINEAIRE ALGEBRA 259 < α| (b|β > +c|γ >) = b < α|β > +c < α|γ > . (916) We zien hier in een nieuwe notatie weer het vertrouwde gedrag van inproducten. Een vectorruimte met een inproduct wordt een inproductruimte genoemd. Omdat het inproduct van een willekeurige vector met zichzelf een niet-negatief getal is, noemen we dit de norm of lengte van een vector p kαk ≡ < α|α >. (917) Een eenheidsvector heeft norm 1 en wordt genormaliseerd genoemd. Twee vectoren waarvan het inproduct nul is worden orthogonaal genoemd. Een verzameling van onderling orthogonale genormaliseerde vectoren, < αi |αj >= δij , δij = 1 als i = j en δij = 0 als i 6= j (918) wordt een orthonormale verzameling genoemd. Het is altijd mogelijk en bijna altijd makkelijk om een orthonormale basis te kiezen. In dat geval kan het inproduct van twee vectoren geschreven worden als < α|β >= a∗1 b1 + a∗2 b2 + .. + a∗n bn , (919) en (het kwadraat van) de norm wordt < α|α >= |a1 |2 + |a2 |2 + ... + |an |2 , (920) ai =< ei |α > . (921) en de componenten zijn Een andere geometrische grootheid die men kan generaliseren is de hoek tussen twee vectoren. In gewone vectorrekening hebben cos θ = (a · b)/|a||b|. Echter, omdat het inproduct in het algemeen een complex getal is, definieert de analoge formule geen reëele hoek. Het is echter zo dat de absolute waarde van deze grootheid een getal kleiner dan 1 is, | < α|β > |2 ≤< α|α >< β|β > . (922) Dit belangrijke resultaat staat bekend als de ongelijkheid van Schwarz. We kunnen hiermee de hoek tussen |α > en |β > definiëren als s < α|β >< β|α > cos θ = . (923) < α|α >< β|β > Voorbeeld: Stel |α >= (1 + i, −i, 1) en |β >= (2 + 3i, 1 − 2i, i). Dan is |α >∗ =< α| = (1 − i, i, 1). Het inproduct < α|β > is dan 2 + 3i < α|β >= (1 − i, i, 1) 1 − 2i = (1 − i)(2 + 3i) + i(1 − 2i) + 1(i) = 7 + 3i. (924) i Het inproduct < β|α > is dan 1+i < β|α >= (2 − 3i, 1 + 2i, −i) −i = 7 − 3i. 1 (925) A APPENDIX - LINEAIRE ALGEBRA A.5.3 260 De Gram-Schmidt procedure Stel je begint met een basis (|e1 >, |e2 >, .., |en >) die niet orthonormaal is. De Gram-Schmidt procedure beschrijft hoe men dan een orthonormale basis (|e01 >, |e02 >, .., |e0n >) kan genereren. Dit gaat als volgt. 1. Normeer de eerste basis vector (deel door de norm), |e01 >= |e1 > . ke1 k (926) 2. Bereken de projectie van de tweede vector langs de eerste en trek die eraf, |e2 > − < e01 |e2 > |e01 > . (927) Deze vector is orthogonaal met |e01 >. We normeren de vector en vinden hiermee |e02 >. 3. Trek van |e3 > de projecties langs |e01 > en |e02 > af, |e3 > − < e01 |e3 > |e01 > − < e02 |e3 > |e02 > . (928) De gevonden vector is orthogonaal op |e01 > en |e02 >. Normeer deze vector om |e03 > te vinden. Enzovoort. A.5.4 Eigenvectoren en eigenwaarden Beschouw de lineaire transformatie T in 3D die bestaat uit een rotatie, om een gegeven as, over een hoek θ. De meeste vectoren |α > zullen in een gecompliceerde manier veranderen, maar vectoren die toevallig langs de draaias liggen gedragen zich eenvoudig: zij veranderen helemaal niet: T |α >= |α >. Als θ = 180◦ , dan zullen vectoren die in het ‘equator’ vlak liggen van teken veranderen, T |α >= −|α >. In een complexe vectorruimte heeft elke lineaire transformatie van dit soort speciale vectoren, die getransformeerd worden in eenvoudige veelvouden van zichzelf, T |α >= λ|α >, (929) en deze worden de eigenvectoren van de transformatie genoemd, terwijl de (complexe) getallen λ de eigenwaarden zijn (de nulvector telt hierbij niet mee). Merk op dat ieder veelvoud van een eigenvector nog steeds een eigenvector met dezelfde eigenwaarde is. Ten opzichte van een bepaalde basis, neemt de eigenwaarde vergelijking de matrix vorm Ta = λa (930) (T − λ1)a = 0. (931) aan, ofwel Hierbij stelt 0 de nulmatrix voor, waarvan alle elementen gelijk aan nul zijn. Als de matrix (T − λ1) een inverse heeft, kunnen we beide zijden van vergelijking (931) vermenigvuldigen met (T − λ1)−1 , en concluderen dan dat a = 0. We hebben echter aangenomen dat a ongelijk aan nul is en dus dient de matrix (T − λ1) singulier te zijn, hetgeen betekent dat haar determinant verdwijnt, (T11 − λ) T . . . T 12 1n T21 (T22 − λ) . . . T2n det(T − λ1) = (932) = 0. .. .. .. . . . Tn1 Tn2 . . . (Tnn − λ) A APPENDIX - LINEAIRE ALGEBRA 261 Expansie van de determinant levert een algebraïsche vergelijking voor λ, Cn λn + Cn−1 λn−1 + . . . + C1 λ + C0 = 0, (933) waarbij de coëfficienten Ci van de matrixelementen van T afhangen. Dit wordt de karakteristieke vergelijking van de matrix genoemd; haar oplossingen bepalen de eigenwaarden. Merk op dat het een nde-orde vergelijking is, die dus n complexe wortels heeft. Sommige van deze wortels kunnen hetzelfde zijn en alles wat we kunnen zeggen is dat een n × n matrix op zijn minst één en op zijn meest n unieke eigenwaarden heeft. Voorbeeld: Vind de eigenwaarden en eigenvectoren van de matrix 2 0 −2 M = −2i i 2i . 1 0 −1 De karakteristieke vergelijking is (2 − λ) 0 −2 −2i (i − λ) 2i 1 0 (−1 − λ) = −λ3 + (1 + i)λ2 − iλ = 0, (934) (935) en de wortels zijn 0, 1 en i. Noem de componenten van de eerste eigenvector (a1 , a2 , a3 ), dan 2 0 −2 a1 a1 0 −2i i 2i a2 = 0 a2 = 0 , (936) 1 0 −1 a3 a3 0 hetgeen de volgende drie vergelijkingen levert 2a1 − 2a3 = 0, −2ia1 + ia2 + 2ia3 = 0, a1 − a3 = 0. (937) De eerste bepaalt a3 (in termen van a1 ), a3 = a1 ; de tweede bepaalt a2 , a2 = 0; en de derde is redundant. We kunnen net zo goed a1 = 1 kiezen, omdat een veelvoud van een eigenvector weer een eigenvector is. We vinden 1 (1) 0 , voor λ1 = 0. a = (938) 1 Voor de tweede eigenvector (we recyclen dezelfde notatie voor de componenten) hebben we 2 0 −2 a1 a1 a1 −2i i 2i a2 = 1 a2 = a2 , (939) 1 0 −1 a3 a3 a3 hetgeen leidt tot de vergelijkingen 2a1 − 2a3 = a1 , −2ia1 + ia2 + 2ia3 = a2 , a1 − a3 = a3 , (940) A APPENDIX - LINEAIRE ALGEBRA met als oplossing a3 = (1/2)a1 , a2 = [(1 − i)/2]a2 ; deze keer kiezen we a1 = 2, zodat 2 a(2) = (1 − i) , voor λ2 = 1. 1 Tenslotte geldt voor de derde 2 −2i 1 eigenvector ia1 a1 0 −2 a1 i 2i a2 = i a2 = ia2 , ia3 a3 0 −1 a3 262 (941) (942) hetgeen leidt tot de vergelijkingen 2a1 − 2a3 = ia1 , −2ia1 + ia2 + 2ia3 = ia2 , a1 − a3 = ia3 , (943) met als oplossing a3 = a1 = 0, terwijl a2 onbepaald is. We kiezen a2 = 1 en concluderen 0 (3) 1 , voor λ3 = i. a = (944) 0 A.5.5 Geconjugeerde en Hermitische matrices De (complex) geconjugeerde van een matrix A = (aij ) wordt aangeduid met A∗ en wordt verkregen door de complex toegevoegde van elk element te nemen A∗ = (a∗ij ). 1 − 2i −i 1 + 2i i . , dan is A∗ = Voorbeeld: Als A = 3 2 + 3i 3 2 − 3i Een matrix is reëel als alle elementen reëel zijn, A∗ = A, en imaginair als alle elementen imaginair zijn, A∗ = −A. De Hermitisch geconjugeerde (of Hermitisch toegevoegde) van een matrix A = (aij ) wordt aangeduid met A† en wordt verkregen door transponeren en complex conjugeren, A† = (a∗ji ). Met deze notatie kunnen we het inproduct van twee vectoren, ten opzichte van een orthogonale basis, schrijven als < α|β >= a† b. (945) Evenzo als bij een getransponeerde matrix, geldt voor de Hermitisch toegevoegde van een product dat (AB)† = B† A† . (946) Een vierkante matrix is Hermitisch als hij gelijk is aan zijn Hermitisch geconjugeerde, A† = A; als Hermitische conjugatie een minteken introduceert, dan wordt de matrix anti-Hermitisch genoemd. 1 1−i 2 3 i is Hermitisch. Voorbeeld: De matrix A = 1 + i 2 −i 0 We hebben gezien dat voor de Hermitisch geconjugeerde van een matrix geldt dat A† = AT∗ . De Hermitisch geconjugeerde van een lineaire transformatie, A† geeft, als hij wordt toegepast A APPENDIX - LINEAIRE ALGEBRA 263 op het eerste lid van een inproduct, hetzelfde resultaat als wanneer A zou zijn toegepast op de tweede vector, < A† α|β >=< α|Aβ > (947) voor alle vectoren |α > en |β >. Voor de duidelijkheid: |Aβ > betekent A|β > en < A† α|β > betekent het inproduct van de vector A† |α > met de vector |β >. Merk op dat < α|cβ >= c < α|β >, (948) < cα|β >= c∗ < α|β > (949) maar voor elke scalar c. Voor een lineaire transformatie kunnen we nu schrijven < α|Aβ >= a† Ab = (A† a)† b =< A† α|β > . (950) Als de matrix Hermitisch is, T = T† , dan kunnen we het bovenstaande schrijven als < α|T β >=< T α|β >=< α|T |β > . (951) Hermitische transformaties spelen een fundamentele rol in de quantummechanica. De eigenvectoren en eigenwaarden van een Hermitische transformatie bezitten drie cruciale eigenschappen. 1. De eigenwaarden van een Hermitische transformatie zijn reëel. Bewijs: Stel dat λ een eigenwaarde van T is, T |α >= λ|α >, met |α >6= |0 >. Dan geldt < α|T α >=< α|λα >= λ < α|α > . (952) Als T Hermitisch is, dan geldt ook < α|T α >=< T α|α >=< λα|α >= λ∗ < α|α > . (953) Omdat < α|α >6= 0, geldt λ = λ∗ en is λ dus reëel. 2. De eigenvectoren van een Hermitische transformatie die horen bij aparte eigenwaarden zijn orthogonaal. Bewijs: Stel dat T |α >= λ|α > en T |β >= µ|β >, met λ 6= µ. Dan geldt < α|T β >=< α|µβ >= µ < α|β >, (954) < α|T β >=< T α|β >=< λα|β >= λ∗ < α|β > . (955) en als T Hermitisch is, dan Maar λ = λ∗ (zie hierboven) en de aanname was dat λ 6= µ. Dientengevolge is < α|β >= 0. 3. De eigenvectoren van een Hermitische operator spannen de ruimte op. Opmerking: Wanneer alle n wortels van de karakteristieke vergelijking verschillend zijn, dan hebben we n onderling orthogonale eigenvectoren en kunnen deze vectoren vanzelfsprekend de ruimte opspannen. De zaak wordt ingewikkeld als de eigenwaarden ontaard zijn en dezelfde wortels optreden. We dienen dan lineaire combinaties te vormen en dienen vervolgens te bewijzen dat we hiermee ook lineair onafhankelijke eigenvectoren verkrijgen. Vervolgens kunnen we deze vectoren orthonormaliseren met de Gram-Schmidt procedure. A APPENDIX - LINEAIRE ALGEBRA A.5.6 264 Unitaire matrices Definitie: Een matrix is unitair als haar inverse gelijk is aan haar Hermitisch geconjugeerde, A† = A−1 . De kolommen van een unitaire matrix vormen een orthonormale set, evenals haar rijen. Merk op dat terwijl de elementen van een orthogonale matrix in Rn liggen, liggen de elementen van een unitaire matrix in de ruimte Cn . Unitaire transformaties behouden het inproduct in de zin dat geldt < U α|U β >=< α|β > voor alle vectoren |α > en |β >. (956) B APPENDIX - WAARSCHIJNLIJKHEID B 265 APPENDIX - WAARSCHIJNLIJKHEID B.1 Inleiding Waarschijnlijkheid speelt een centrale rol in de quantummechanica. We zullen de basisbegrippen verduidelijken aan de hand van een concreet voorbeeld. Hierbij gebruiken we de notatie die gangbaar is in de quantummechanica. Stelt U zich hierbij een kamer voor met 14 mensen waarvan de leeftijd als volgt gegeven is: een persoon is 14 jaar, een persoon is 15 jaar, drie personen zijn 16 jaar, twee personen zijn 22 jaar, twee personen zijn 24 jaar, vijf personen zijn 25 jaar. Als we stellen dat N (j) het aantal mensen met leeftijd j voorstelt, dan hebben we nu N (14) = 1, N (15) = 1, N (16) = 3, N (22) = 2, N (24) = 2, N (25) = 5, terwijl N (17), bijvoorbeeld, gelijk is aan nul. Het totaal aantal mensen in de kamer is N= ∞ X N (j). (957) j=0 Fig. 106 geeft een histogram van de data. Men kan onder meer de volgende vragen stellen over Figuur 106: Histogram van het aantal mensen, N (j), met leeftijd j, dat zich in een bepaalde kamer bevindt. deze verdeling. • Als U willekeurig een persoon van deze groep kiest, wat is dan de waarschijnlijkheid dat de leeftijd van deze persoon 15 is? Antwoord: Één op de 14, want er zijn 14 mogelijke keuzes (N = 14), die elk even waarschijnlijk zijn, waarvan er slechts één deze bepaalde leeftijd heeft. Als P (j) de waarschijnlijkheid is om leeftijd j te kiezen, dan is P (14) = 1/14, P (15) = 1/14, P (16) = 3/14, enzovoort. In het algemeen, N (j) P (j) = . (958) N B APPENDIX - WAARSCHIJNLIJKHEID 266 Merk op dat de waarschijnlijkheid om of 14 of 15 te kiezen gelijk is aan de som van de individuele waarschijnlijkheden (in dit geval 1/7). In het bijzonder moet gelden dat de som van alle waarschijnlijkheden gelijk is aan 1. Dus ∞ X P (j) = 1. (959) j=1 • Wat is de meest waarschijnlijke leeftijd? Het antwoord is 25, want vijf van de mensen delen deze leeftijd, terwijl op zijn meest drie een andere leeftijd delen. In het algemeen is de meest waarschijnlijke j, die j waarvoor P (j) maximaal is. • Wat is de mediane leeftijd? Het antwoord is 23, want 7 mensen zijn jonger dan 23 en er zijn 7 ouder dan 23. In het algemeen is de mediaan die waarde van j waarvoor de waarschijnlijkheid om een groter resultaat te krijgen hetzelfde is als die voor een kleiner resultaat. • Wat is de gemiddelde leeftijd? Het antwoord is (14) + (15) + 3(16) + 2(22) + 2(24) + 5(25) 294 = = 21. 14 14 (960) In het algemeen wordt de gemiddelde waarde van j (hetgeen we noteren als < j >) gegeven door P ∞ jN (j) X = jP (j). (961) < j >= N j=0 Merk op dat het niet nodig is dat er iemand in de kamer is met een gemiddelde leeftijd of mediane leeftijd - in dit voorbeeld is er niemand die 21 of 23 jaar oud is. In de quantummechanica is de gemiddelde waarde meestal de belangrijkste grootheid. We noemen het dan de verwachtingswaarde. Dit is een misleidende term omdat het suggereert dat het de meest waarschijnlijke uitkomst is die men zou krijgen bij een enkele meting (maar dat is de meest waarschijnlijke waarde). • Wat is het gemiddelde van het kwadraat van de leeftijden? Antwoord: Men kan 142 = 196 vinden met waarschijnlijkheid 1/14, of 152 = 225 met waarschijnlijkheid 1/14, of 162 = 256 met waarschijnlijkheid 3/14, enzovoort. Het gemiddelde is dan ∞ X 2 < j >= j 2 P (j). (962) j=0 In het algemeen is de gemiddelde waarde voor een functie van j gegeven door < f (j) >= ∞ X f (j)P (j). (963) j=0 Merk op dat het gemiddelde van de kwadraten, < j 2 >, in het algemeen niet gelijk is aan het kwadraat van het gemiddelde, < j >2 . Stel je voor dat de kamer slechts twee babies bevat met leeftijden 1 en 3 jaar, dan is < x2 >= 5, maar < x >2 = 4. B APPENDIX - WAARSCHIJNLIJKHEID 267 Figuur 107: Twee histogrammen met dezelfde mediaan, hetzelfde gemiddelde en dezelfde meest waarschijnlijke waarde, alsook een gelijk aantal elementen. Er is echter een verschil in de ‘spreiding’ van de verdelingen, ten opzichte van de gemiddelde waarde. Fig. 107 toont twee histogrammen die er verschillend uitzien, terwijl ze dezelfde mediaan, hetzelfde gemiddelde en dezelfde meest waarschijnlijke waarde, alsook een gelijk aantal elementen hebben. De eerste is echter scherp gepiekt rond de gemiddelde waarde, terwijl de tweede breed en vlak is. We hebben een numerieke maat nodig voor de grootte van de ‘spreiding’ in een verdeling, ten opzichte van de gemiddelde waarde. Recht toe recht aan zouden we zeggen dat we voor elk element de afwijking van het gemiddelde bepalen, ∆j = j− < j >, om vervolgens het gemiddelde van ∆j uit te rekenen. Het is probleem is echter dat we in dat geval altijd nul zullen vinden, omdat, vanwege de aard van het gemiddelde, ∆j even vaak positief als negatief zal zijn, X X X < ∆j >= (j− < j >)P (j) = jP (j)− < j > P (j) =< j > − < j >= 0. (964) Merk op dat < j > constant is en daarom buiten de sommatie genomen kan worden. Om dit probleem te omzeilen kunnen we besluiten om het gemiddelde uit te rekenen en gebruik te maken van absolute waarden voor ∆j. We geven er echter de voorkeur aan om het probleem op te lossen door het kwadraat te nemen voordat we middelen, σ 2 ≡< (∆j)2 > . (965) Deze grootheid staat bekend als de variantie van een verdeling, terwijl σ de standaarddeviatie genoemd wordt. Voor varianties geldt het volgende P P 2 >= σ 2 =< (∆j)2 P (j) = (j− < j >)2 P (j) P(∆j) = P(j 2 − 2j < j > + <Pj >2 )P (j) P (966) P (j) = j 2 P (j) − 2 < j > jP (j)+ < j >2 =< j 2 > −2 < j >< j > + < j >2 , ofwel σ 2 =< j 2 > − < j >2 . (967) Bovenstaande vergelijking geeft een snelle manier om σ 2 uit te rekenen: bereken < j 2 > en < j >2 en trek de twee getallen van elkaar af. Omdat σ 2 niet-negatief is, moet gelden < j 2 > ≥ < j >2 , (968) en de twee waarden zijn slechts dan aan elkaar gelijk als σ = 0. Tot zover heb ik in de beschouwingen aangenomen dat we te maken hebben met een discrete variabele (in ons geval namen we voor j een integer aan). We kunnen het formalisme echter eenvoudig generaliseren tot continue distributies. Als men een willekeurig persoon op straat selecteert, dan is de waarschijnlijkheid dat haar leeftijd gelijk is aan 18 jaar, 3 maanden, 1 week en B APPENDIX - WAARSCHIJNLIJKHEID 268 3,1892 seconden gelijk aan nul. Het is zinvoller te spreken van een leeftijd die ligt in een interval - bijvoorbeeld tussen 18 jaar en 18 jaar en 1 maand. Indien het interval voldoende klein is, dan is de waarschijnlijkheid evenredig met de lengte van het interval. Technisch gezien kiezen we infinitesimaal kleine intervallen en vinden dan dat de waarschijnlijkheid dat een de leeftijd van een willekeurig persoon ligt tussen x en (x + dx) gelijk is aan ρ(x)dx. De evenredigheidsfactor, ρ(x), wordt vaak losjes ‘de kans om x te vinden’ genoemd, maar een betere term is waarschijnlijkheidsdichtheid. De waarschijnlijkheid dat x ligt tussen a en b (een eindig interval) wordt gegeven door de integraal Z b ρ(x)dx, (969) Pab = a en de regels die we voor discrete verdelingen gevonden hebben vertalen zich vanzelfsprekend tot Z +∞ ρ(x)dx = 1, (970) −∞ Z +∞ < x >= xρ(x)dx, (971) f (x)ρ(x)dx, (972) −∞ Z +∞ < f (x) >= −∞ σ 2 ≡< (∆x)2 >=< x2 > − < x >2 . B.2 (973) Connectie met de quantummechanica We merken op dat de golffunctie, bijvoorbeeld opgebouwd uit harmonische golven ψ = ei(kx−ωt) , veelal een complexe functie is met een reëel en een imaginair deel. De waarschijnlijkheidsdichtheid wordt gegeven door P (x, t) = ψ ∗ ψ, (974) waarbij P dx de kans voorstelt dat het deeltje wordt aangetroffen132 in het interval (x, x + dx). We normeren de golffunctie van een deeltje zo, dat geldt Z +∞ Z +∞ P dx = ψ ∗ ψdx = 1. −∞ De verwachtingswaarde < x > van de positie is Z +∞ Z +∞ Z ∗ < x >= xP dx = ψ xψdx = −∞ (975) −∞ −∞ +∞ ψ ∗ xψdx =< ψ|x|ψ >, (976) −∞ terwijl voor elke observabele O geldt dat zijn verwachtingswaarde < O > gegeven is door Z +∞ < O >= ψ ∗ Oψdx =< ψ|O|ψ >, (977) −∞ waarbij O een Hermitische operator is. Als we de notatie ψ = x + iy gebruiken, dan volgt direct dat ψ ∗ ψ = x2 + y 2 ≥ 0! en zien we dat deze kans altijd reëel en positief is. 132 C APPENDIX: FUNDAMENTELE CONSTANTEN C 269 APPENDIX: FUNDAMENTELE CONSTANTEN c = 2.998 × 108 m/s lichtsnelheid h = 6.626 × 10−34 Js constante van Planck e = 1.602 × 10−19 C lading van het elektron me = 9.109 × 10−31 kg massa van het elektron mp = 1.672 × 10−27 kg massa van het proton 0 = 8.854 × µ0 = 4π × 10−12 10−7 NA = 6.022 × C2 /Nm2 N/A2 1023 1/mol k = 1.381 × 10−23 J/K permittiviteit van het vacuum permeabiliteit van het vacuum constante van Avogadro constante van Boltzmann D APPENDIX: COÖRDINATENSYSTEMEN D 270 APPENDIX: COÖRDINATENSYSTEMEN CARTESIAANSE COÖRDINATEN dl = dx x̂ + dy ŷ + dz ẑ lijn-element dτ = dxdydz ∇t = volume-element ∂t ∂t + ∂y ŷ + ∂z ẑ ∂vy ∂vx ∂vz ∂x + ∂y + ∂z ∂t ∂x x̂ ∇·v = ∇×v = ∂vz ∂y ∆t = ∇2 t = ∂vy ∂z − ∂2t ∂x2 + gradiënt divergentie x̂ + ∂2t ∂y 2 ∂vx ∂z − ∂vz ∂x ŷ + ∂vy ∂x − ∂vx ∂y ẑ rotatie ∂2t ∂z 2 + Laplace operator SFERISCHE COÖRDINATEN dl = dr r̂ + rdθ θ̂ + r sin θdφ φ̂ dτ = ∇t = lijn-element r2 sin θdrdθdφ ∂t ∂r r̂ ∇·v = + 1 ∂t r ∂θ θ̂ + 1 ∂ (r2 vr ) r2 ∂r ∇×v = 1 r sin θ ∆t = ∇2 t = h volume-element 1 ∂t r sin θ ∂φ φ̂ + 1 ∂ r sin θ ∂θ (sin θvθ ) ∂ ∂θ (sin θvφ ) 1 ∂ r2 ∂r r gradiënt 2 ∂t ∂r + − ∂vθ ∂φ i + r̂ + 1 ∂ r2 sin θ ∂θ 1 r 1 ∂vφ r sin θ ∂φ h 1 ∂vr sin θ ∂φ ∂t sin θ ∂θ + divergentie − ∂ ∂r (rvφ ) i θ̂ + 1 ∂2t r2 sin2 θ ∂φ2 1 ∂ r ∂r (rvθ ) − ∂vr ∂θ φ̂ rotatie Laplace operator CILINDRISCHE COÖRDINATEN dl = ds ŝ + sdφ φ̂ + dz ẑ lijn-element dτ = sdsdφdz ∇t = ∇·v = volume-element 1 ∂t s ∂φ φ̂ ∂t + + ∂z ẑ 1 ∂ 1 ∂vφ s ∂s (svs ) + s ∂φ ∂t ∂s ŝ ∇×v = h 1 ∂vz s ∂φ ∆t = ∇2 t = − 1 ∂ s ∂s ∂vφ ∂z i gradiënt z + ∂v ∂z s ŝ + ∂v ∂z − ∂vz ∂s 1 ∂2t s2 ∂φ2 ∂2t ∂z 2 ∂t s ∂s + + divergentie FUNDAMENTELE THEOREMAS Rb (∇f ) · dl = f (b) − f (a) Ra H (∇ · A)dτ = A · da R H (∇ × A) · da = A · dl φ̂ + 1 s h ∂ ∂s (svφ ) − ∂vs ∂φ i ẑ rotatie Laplace operator Gradiënt theorema Divergentie theorema (stelling van Gauss) Rotatie theorema (stelling van Stokes) E APPENDIX: CONVENTIES, EENHEDEN EN NOTATIES E 271 APPENDIX: CONVENTIES, EENHEDEN EN NOTATIES Elke richting in de fysica heeft de neiging een eigen set eenheden te definiëren, en de subatomaire fysica vormt hierop geen uitzondering. Processen in de subatomaire fysica spelen zich af in het domein van de quantummechnica, dat beheerst wordt door de gereduceerde constante van Planck ~≡ h = 1.054 572 66(63) × 10−34 J s = 6.582 122 0(20) × 1022 MeV s, 2π (978) en in het domein van de relativiteitstheorie, dat gekarakteriseerd wordt door de grootte van de lichtsnelheid133 c ≡ 299 792 458 m s−1 . (979) Vanaf nu zullen we werken met zogenaamde natuurlijke eenheden, die zo gekozen zijn dat geldt ~ = 1, c = 1. (980) Dit betekent dat ~ en c gebruikt worden als fundamentele eenheden voor de actie (of impulsmoment) en snelheid. Alle eenheden voor lengte, tijd, energie en massa kunnen nu uitgedrukt worden in één eenheid, waarvoor we die van energie kiezen. We gebruiken hiervoor de elektronvolt (eV), met als afkortingen keV (103 eV), MeV (106 eV), GeV (109 eV) en TeV (1012 eV). We kunnen massa’s (M ), afstanden (L), en tijden (T ) uitdrukken in combinaties van ~, c en energie E, door gebruik te maken van de relaties M = E/c2 , L = ~c/E, T = ~/E, (981) en we vinden hiermee dat de massa 1 kg = 5.61 × 1026 GeV, de lengte 1 m = 5.07 × 1015 GeV−1 , en de tijd 1 s = 1.52 × 1024 GeV−1 . Voor de conversies gebruiken we de belangrijke betrekkingen ~c = 197.327 053(59) MeV fm (1 fm ≡ 10−15 m) (~c)2 = 0.389 379 66(23) GeV2 mbarn (1 barn ≡ 10−28 m2 ). (982) In relaties tussen klassieke grootheden spelen ~ en c geen rol, terwijl grootheden die enkel ~ bevatten, zoals de Bohr straal, a∞ = 4π0 ~2 /me e2 = 0.529 177 249 (24) × 10−10 m, van belang zijn in de niet-relativistische quantummechanica. Grootheden die enkel c bevatten, zoals de rustmassa van het elektron, me c2 = 0.510 999 06(15) MeV/c2 = 9.109 389 7(54) × 10−31 kg, of de klassieke elektronstraal, re = e2 /4π0 me c2 = 2.817 940 92(38) × 10−15 m, komen voor in de klassieke relativiteitstheorie. Tenslotte spelen grootheden die zowel ~ als c bevatten een rol in de relativistische quantummechanica. Als voorbeelden gelden hier de Compton golflengte van het elektron, − λ e = ~/me c = 3.861 593 23(35) × 10−13 m en de fijnstructuurconstante, α = e2 /4π0 ~c = 1/137.035 989 5(61). 133 De meter is de lengte van het pad dat afgelegd wordt door licht in vacuum gedurende een tijdinterval van 1/299 792 458 seconde. Met deze definitie is de waarde van c exact. F APPENDIX: FASERUIMTE F 272 APPENDIX: FASERUIMTE We zullen hier een afleiding geven van de toestandsdichtheid ρ(E) ≡ dN/dE. Hiertoe beschouwen we allereerst het één-dimensionale geval, waarbij een deeltje in de x-richting beweegt met een impuls px . We kunnen de positie en impuls van het deeltje beschrijven met een punt (x, px ) in de zogenaamde x − px faseruimte. Deze representatie is echter in de quantummechanica verschillend van die in de klassieke mechanica. In de klassieke mechanica kunnen we positie en impuls tegelijkertijd exact kennen, maar quantummechanica beperkt onze kennis tot een nauwkeurigheid gegeven door de onzekerheidsrelatie, ∆p∆px ≥ ~. (983) Quantummechanisch dient het deeltje dan ook door een cel met volume h = 2π~ in de faseruimte gerepresenteerd te worden in plaats van door een punt. De precieze vorm van de cel hangt van de uitgevoerde meting af, maar het volume is altijd gelijk aan h. Figuur 108 toont dat in een Figuur 108: Schematische voorstellen van de één-dimensionale faseruimte voor klassieke mechanica en quantummechanica. Klassiek kunnen we de toestand van een deeltje door een punt weergeven. In de quantummechanica dient een toestand beschreven te worden door een cel met volume h = 2π~. faseruimte met totaal volume Lp het aantal cellen dat in dit volume past, gegeven wordt door N= Lp , 2π~ (984) waarbij N het aantal toestanden is in het volume Lp. De toestandsdichtheid ρ(E) ≡ dN/dE in één dimensie kunnen we in het niet relativistische geval vinden door E = p2 /2m in te vullen (voor het ultra-relativistische geval gebruiken we E 2 = p2 c2 + (mc2 )2 , terwijl we voor het ultrarelativistische geval E = pc invullen). We vinden dan ρ(E) = dN dN dp L 2m =2 = . dE dp dE 2π~ p (985) De factor 2 is geintroduceerd, omdat er voor elke energie E twee ontaarde toestanden zijn met impuls p en −p. Voor een deeltje in drie dimensies het celvolume gegeven door h3 = (2π~)2 , terwijl het R wordt aantal toestanden in een volume d3 xd3 p in de zes-dimensionale faseruimte gegeven wordt door Z 1 N1 = d3 xd3 p. (986) (2π~)3 F APPENDIX: FASERUIMTE 273 Het subscript geeft aan dat N1 het aantal toestanden voor één deeltje is. Als het deeltje opgesloten is in een ruimtelijk volume V , dan kunnen we integreren over d3 x en vinden Z V N1 = d3 p. (987) (2π~)3 De toestandsdichtheid volgt uit dN1 V d ρ1 = = 3 dE (2π~) dE Z V d d p= 3 (2π~) dE 3 Z p2 dpdΩ, (988) met dΩ het ruimtehoek element. De relatie E 2 = (pc)2 + (mc2 )2 geeft E d d = 2 dE pc dp en we vinden met d dp R (989) dp → 1 V pE ρ1 = (2π~)3 c2 Z dΩ. (990) Voor overgangen naar alle eindtoestanden, ongeacht de richting van de impuls, luidt de toestandsdichtheid voor één deelje V pE ρ1 = 2 2 3 . (991) 2π c ~ We continueren onze beschouwen van toestandsdichtheid voor twee deeltjes, 1 en 2. Indien de totale impuls van de twee deeltjes bepaald is, dan bepaalt de impuls van de een de ander en hebben we geen extra vrijheidsgraden. Het totaal aantal toestanden in de impulsruimte is dan gelijk aan die voor één deeltje, N1 . De toestandsdichtheid ρ2 is echter verschillend, omdat E nu de totale energie van de twee deeltjes is. We vinden Z Z V d V d 3 ρ2 = d p1 = p21 dp1 dΩ1 , (992) (2π~)3 dE (2π~)3 dE met dE = dE1 + dE2 = p1 c2 p2 c2 dp1 + dp2 . E1 E2 (993) We berekenen dit in het zwaartepuntsysteem met p1 + p2 = 0, dus p21 = p22 → p1 dp1 = p2 dp2 , en dE = p1 dp1 (E1 + E2 ) 2 c . E1 E2 (994) De toestandsdichtheid wordt nu gegeven door ρ2 = = V E1 E2 d 3 2 (2π~) c (E1 + E2 )p1 dp1 Z V E1 E2 p1 dΩ1 . (2π~)3 c2 E1 + E2 Z p21 dp1 dΩ1 (995) We kunnen de discussie nu uitbreiden tot drie of meer deeltjes. Beschouw drie deeltjes, waarbij in het zwaartepuntsysteem de impulsen beperkt zijn door p1 + p2 + p3 = 0. (996) F APPENDIX: FASERUIMTE 274 De impulsen van twee deeltjes kunnen onafhankelijk van elkaar gevarieerd worden, maar de derde is bepaald. Het aan toestanden is dan Z Z V2 3 d3 p2 , (997) N3 = d p 1 (2π~)6 en de toestandsdichtheid is gelijk aan V2 d ρ3 = (2π~)6 dE Z 3 d p1 Z d3 p2 . Voor n deeltjes kunnen we het boven generaliseren tot Z Z d V n−1 3 ρn = d p1 . . . d3 pn−1 . 3(n−1) dE (2π~) (998) (999) G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN G 275 APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN G.1 Inleiding Golven zijn fysische verschijnselen die zich in een medium kunnen voortplanten van één plaats naar een andere en die daarbij energie en impuls overbrengen. De fysische eigenschappen worden hierbij door een veld beschreven en variëren van elektromagnetische velden tot de transversale verplaatsing van een snaar. G.2 Wiskundige beschrijving Een fysische situatie die zich zonder vervorming voortplant langs de x-as wordt een golfbeweging genoemd en wordt beschreven door de uitdrukking ξ(x, t) = f (x ± vt). (1000) Men noemt v de fasesnelheid en als s = vt, waarin t de tijd voorstelt, dan is de vervorming over een afstand s naar links opgeschoven (zie Fig. 109). De grootheid ξ(x, t) kan een verscheidenheid aan observabelen voorstellen, zoals de druk in een gas, transversale uitwijking van een snaar. Figuur 109: Representatie van een fysische situatie die zich zonder vervorming voortplant langs de x-as. Een bijzonder geval treedt op als ξ(x, t) een sinusfunctie of harmonische functie is, zoals ξ(x, t) = ξ0 sin k(x − vt), (1001) waarbij k het golfgetal wordt genoemd. Als we x vervangen door x + 2π k krijgen we voor ξ(x, t) weer dezelfde waarde, namelijk 2π 2π ξ(x + , t) = ξ0 sin k x + − vt = ξ(x, t), (1002) k k met λ = 2π/k de golflengte van de kromme. We kunnen vergelijking (1001) ook schrijven als ξ(x, t) = ξ0 sin (kx − ωt), (1003) waarin ω = kv = 2πv λ de cirkelfrequentie van de golf voorstelt. Omdat ω ≡ 2πν, met ν de frequentie, vinden we de belangrijke relatie λν = v (1004) G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 276 tussen golflengte, frequentie en fasesnelheid. Als T de periode van de trilling in elk punt is, kunnen we vergelijking (1001) ook schrijven als x t ξ(x, t) = ξ0 sin 2π , (1005) − λ T Men kan gemakkelijk nagaan dat de algemene uitdrukking voor een lopende golf geschreven kan worden als x ξ(x, t) = F (t ± ), (1006) v waarin het positieve teken beantwoordt aan een voortplanting in de negatieve x-richting en het minteken aan een voorplanting in positieve x-richting. Voor een harmonische golf kunnen we ook schrijven x ξ(x, t) = ξ0 sin ω(t ± ) = ξ0 sin (ωt ± kx). (1007) v Alternatief kunnen we schrijven ξ(x, t) = ξ0 cos ω(t ± x ) = ξ0 cos (ωt ± kx). v (1008) Gebruikmakend van de stelling van Euler, eix = cos x + i sin x, kunnen we een harmonische golf schrijven als superpositie van sin- en cos-functies en vinden dan x ξ(x, t) = ξ0 eiω(t± v ) = ξ0 ei(ωt±kx) . (1009) Tenslotte merken we op dat een harmonische golf in drie dimensies geschreven kan worden als ξ(x, t) = ξ0 ei(ωt±k·x) , (1010) waarbij k = (kx , ky , kz ) en x = (x, y, z). G.3 G.3.1 Fourieranalyse van golfverschijnselen Fouriercoëfficiënten en Fourierreeksen Volgens de stelling van Fourier kan elke periodieke beweging worden uitgedrukt als een superpositie van harmonische bewegingen met frequenties ω, 2ω, .., nω ofwel perioden T , T2 , .., Tn . Stel dat ξ = f (x − vt) een periodieke golfbeweging is, dit wil zeggen een golfbeweging die zich op een gegeven punt herhaalt na T , 2T , .., nT . Dan geldt ξ = f (x − vt) = f [x − v(t ± T )] = f (x − vt ∓ vT ). (1011) Dit betekent dat op een gegeven tijdstip ξ zich herhaalt als x toe- of afneemt met vT , 2vT , .., nvT , .. Als we dus, in plaats van t te veranderen, x veranderen met λ = vT , herhaalt de golf zich in de ruimte. Een golfbeweging die periodiek in de tijd is, is dus ook periodiek in de ruimte. Wij hadden al gevonden dat dit het geval was voor een eenvoudige sinusvormige of harmonische golfbeweging. Stel nu dat ξ = f (x) een in de ruimte periodieke functie is met golflengte λ, dus f (x) = f (x + λ). Volgens de stelling van Fourier mogen we dan schrijven ξ = f (x) = a0 2 + a1 cos kx + a2 cos 2kx + · · · + an cos nkx + · · · + b1 sin kx + b2 sin 2kx + · · · + bn sin nkx + · · · (1012) G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 277 De golfbeweging ξ = f (x − vt) kan met ω = kv uitgedrukt worden als ξ = f (x − vt) = a0 2 + + + + a1 cos (kx − ωt) + a2 cos 2(kx − ωt) · · · + an cos n(kx − ωt) + · · · b1 sin (kx − ωt) + b2 sin 2(kx − ωt) · · · + bn sin n(kx − ωt) + · · · , (1013) waaruit blijkt dat elke periodieke beweging kan worden uitgedrukt als een superpositie van harmonische golven met frequentie ω, 2ω, .., nω, .. en golflengten λ, λ/2, .., λ/n, ... Figuur 110: Het verschil in klank tussen bijvoorbeeld een viool en een fluit ontstaat door de aanwezigheid van de boventonen met verschillende relatieve amplitudes. Het Fourierspectrum van het geluid is voor elk instrument verschillend. Door harmonische golven op te tellen, waarvan de frequenties een veelvoud van een bepaalde grondfrequentie zijn en waarvan de amplitudes geschikt gekozen zijn, kunnen we dus bijna elke willekeurige periodieke functie verkrijgen. De frequentie ω wordt de grondfrequentie (of grondtoon) genoemd en de frequenties 2ω, 3ω, .., nω, .. vormen de harmonischen (of boventonen). De stelling van Fourier geeft ook een verklaring voor het verschil in klank van het geluid dat door diverse muziekinstrumenten wordt voortgebracht. Dezelfde toonhoogte, voortgebracht door een piano, gitaar en hobo, klinkt verschillend in onze oren, hoewel de tonen dezelfde grondfrequentie hebben. Het verschil ontstaat door de aanwezigheid van de boventonen met verschillende relatieve amplitudes. Het Fourierspectrum van het geluid is voor elk instrument verschillend. G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 278 De coëfficiënten die horen bij de Fourierreeks van ∞ f (x) = a0 X + (an cos nx + bn sin nx) 2 (1014) 1 kunnen bepaald worden met de formules van Euler Z 1 π f (x) cos nxdx an = ∀n≥0 π −π Z 1 π bn = ∀n≥1 f (x) sin nxdx . π −π (1015) Voorbeeld: De functie f (x) getoond in Fig. 111 is periodiek met periode 2π en wordt gegeven door f (x) = x als −π < x ≤ π. Bereken de Fourierreeks van f (x). Figuur 111: De zaagtandfunctie f (x) wordt rechtsboven getoond en is periodiek met periode 2π. De functie wordt gegeven door f (x) = x. Ook andere functies worden getoond. Het is mogelijk deze functies op te bouwen met harmonische golven. De successievelijke benadering voor de eerste vier termen wordt getoond. Oplossing: Merk allereerst op dat f (x) op het interval −π < x ≤ π een oneven functie134 is , dus an = 0 voor elke n. Er geldt Z Z π 2 1 π bn = x sin nxdx = xd(− cos nx) π −π nπ 0 π Z π −x cos nx 2 −2 cos nx = 2 + cos nxdx = + 0, nπ nπ 0 n 0 (1016) 134 De functie f (x) heet een even functie als voor elke x uit zijn definitieverzameling geldt dat f (−x) = f (x). Voor een oneven functie geldt f (−x) = −f (x). De cos-functie is even, terwijl de sin-functie oneven is. G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN dus bn = − n2 als n even is en bn = 2 n 279 als n oneven is. De gevraagde Fourierreeks is dus f (x) = 2 ∞ X (−1)n+1 1 sin nx . n (1017) Fig. 111 geeft een voorstelling van de opbouw van een zaagtandfunctie uit haar harmonische golven. G.3.2 Complexe schrijfwijze van de Fourierreeks Uit de formule eix = cos x + i sin x volgt dat sin x = 21 i e−ix − eix en cos x = Dus 1 2 eix + e−ix . ∞ a0 X + (an cos nx + bn sin nx) 2 f (x) = 1 ∞ a0 1 X + (an − ibn ) einx + (an + ibn ) e−inx . 2 2 = 1 (1018) Stellen we nu An = 12 (an − ibn ) , (n > 0), A−n = 12 (an + ibn ) , (n > 0), en A0 = 21 a0 , dan gaat de goniometrische reeks over in ∞ X f (x) = An einx . (1019) −∞ Deze reeks is de Fourierreeks van een periodieke functie f (x) met periode 2π als 1 An = 2π Z 2π f (x)e−inx dx. (1020) 0 Merk op dat wanneer F (t) periodiek is met periode T , en ω = F (t) = ∞ X An e −∞ inωt met 1 An = T T Z 2π T , dan is F (t)e−inωt dt (1021) 0 de Fourierreeks van F (t). G.3.3 Fouriertransformatie We beschouwen nu een functie f (x) die gedefinieerd is op L = (−∞, ∞) en die niet noodzakelijkerwijs periodiek is. We kunnen ons voorstellen dat f (x) benaderd kan worden met een superpositie van periodieke functies waarvan de periode ∞ benadert. De Fouriertransformatie is een generalisatie van de complexe Fourierreeks in de limiet L → ∞. We vervangen de discrete An door de continue F (k)dk en laten n/L → k. Vervolgens vervangen we de som door een integraal. Voor elke functie f (x), waarbij x zowel reëel als complex kan zijn, verkrijgen we Z ∞ Z ∞ 2πikx f (x) = F (k)e dk en F (k) = f (x)e−2πikx dx. (1022) −∞ −∞ We noemen F (k) de Fouriergetransformeerde en f (x) de inverse transformatie. G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 280 Met name fysici geven er de voorkeur aan om de transformatie te schrijven in termen van hoekfrequenties, bijvoorbeeld ω = 2πν, en we krijgen dan Z ∞ Z ∞ 1 1 −ikx −1 F (k) = F[f (x)] = √ f (x)e dx en f (x) = F [F (k)] = √ F (k)eikx dk. 2π −∞ 2π −∞ (1023) Tenslotte kunnen we nog een n-dimensionale Fouriertransformatie definiëren voor k, x ∈ Rn door Z ∞ Z ∞ 1 .. f (x)e−ik·x dn x (1024) F (k) = F[f (x)] = √ ( 2π)n −∞ −∞ {z } | n en f (x) = F −1 1 [F (k)] = √ ( 2π)n Z ∞ Z .. −∞ {z | n G.3.4 ∞ F (k)eik·x dn k. (1025) −∞ } Beschrijving van een golfpakket Als voorbeeld beschouwen we een golf die op t = 0 beschreven wordt door de functie f (x) afgebeeld in Fig. 112. De golf wordt ‘gechopped’, waardoor er een puls of golfpakket met lengte ∆x = x2 − x1 = a wordt verkregen. We stellen de golffunctie van de puls voor als ξ0 sin k0 x x1 ≤ x ≤ x2 f (x, 0) = (1026) 0 erbuiten Elke functie kan geschreven worden als een superpositie van harmonische golven. We schrijven Figuur 112: Fourier analyse van een golfpakket met lengte ∆x = a en amplitude ξ0 sin k0 x voor het interval x1 ≤ x ≤ x2 . Links wordt het golfpakket gegeven, terwijl rechts het impulsspectrum getoond wordt. dan 1 f (x, 0) = √ 2π Z ∞ b(k)eikx dk. (1027) −∞ Vervolgens proberen we de coëfficiënten te berekenen door Z ∞ 1 b(k) = √ f (x, 0)e−ikx dx. 2π −∞ (1028) G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 281 We merken op dat de golffunctie ξ0 sin k0 x van de puls geschreven kan worden als het imaginaire deel van eik0 x en vinden voor ons geval r Z +a/2 1 2 sin [(k − k0 )a/2] ik0 x −ikx e e dx = b(k) = √ . (1029) πa k − k0 2πa −a/2 Deze amplitude is geschetst in het rechter paneel van Fig. 112. Indien de originele puls, ξ0 sin k0 x, zich uitstrekte van −∞, ∞, dan was het niet nodig geweest om een Fourieranalyse te maken, omdat de kromme dan een harmonische beweging met golfgetal k0 voorstelde. Echter, om de kromme voor x < x1 en x > x2 tot nul te reduceren moeten we andere frequenties toevoegen, zodat de resulterende Fourierreeks in die gebieden nul is. Een eindige puls is dus een samenstelling van vele frequenties, ook al heeft de trillingsbron een zeer bepaalde frequentie. We zien dat het frequentiespectrum b(k) een maximum heeft voor k = k0 . Het gebied van k waarvoor b(k) groter is dan de helft van het maximum voldoet bij benadering aan de voorwaarde 1 π π (k − k0 )∆x < π of − < k − k0 < , (1030) 2 2 ∆x ∆x waarbij ∆x = a. Als we dus stellen dat ∆k = 2π/∆x, dan zien we dat de enige frequenties met behoorlijke amplitudes in het gebied ∆k rond het maximum k0 liggen, gegeven door ∆x∆k ≈ 2π. (1031) We zien dat hoe korter de tijdsduur van de puls is, des te groter het frequentiegebied is dat nodig is om de puls nauwkeurig voor te stellen. G.4 De golfvergelijking In het volgende gaan we na hoe we kunnen bepalen of een bepaald fysisch verschijnsel, voorgesteld door een gegeven tijdafhankelijk veld, zich als een golf zonder vervorming voortplant. De velden worden veelal door dynamische wetten beheerst, die in de vorm van differentiaalvergelijkingen kunnen worden uitgedrukt. De vergelijking die het golfverschijnsel beschrijft wordt de golfvergelijking genoemd en dit is in het algemeen een differentiaalvergelijking. Als voorbeeld bespreken we hier de transversale golven op een snaar (van bijvoorbeeld een gitaar). In de snaar heerst een spankracht T en in de evenwichtstoestand is de snaar recht. Vervolgens verplaatsen we de snaar loodrecht op zijn lengterichting over een kleine afstand (zie Fig. 113). We beschouwen een deel AB met lengte dx dat zich op een afstand ξ van de evenwichtstoestand bevindt. Omdat we de verplaatsing ξ klein aannemen, mogen we aannemen dat de tangentiële spankracht in elk punt van de snaar gelijk is gebleven. Wegens de kromming van de snaar zijn de krachten T niet precies tegengesteld gericht. De resulterende kracht op het stuk AB is naar boven gericht en bedraagt Fy = T (sin α0 − sin α). (1032) Omdat de snaar slechts zwak gekromd is, zijn de hoeken α0 en α klein en kunnen ze door hun tangenten vervangen worden. We vinden Fy = T (tan α0 − tan α) = T d(tan α) = T ∂ (tan α)dx. ∂x (1033) We merken op dat tan α de helling van de snaar is en deze is gelijk aan ∂ξ/∂x. We vinden hiermee ∂ ∂ξ ∂2ξ Fy = T dx = T 2 dx. (1034) ∂x ∂x ∂x G APPENDIX - KLASSIEKE GOLFVERSCHIJNSELEN 282 Figuur 113: Een snaar waarin een spankracht T heerst wordt over een kleine afstand ξ vanuit zijn evenwichtstoestand verplaatst. We beschouwen een deel AB met lengte dx. De massa per lengte-eenheid van de snaar is µ en de massa van het stuk AB is gelijk aan µdx. 2 We gebruiken nu de tweede wet van Newton, F = ma = m ∂∂t2ξ , die de dynamica beschrijft en vinden ∂2ξ ∂2ξ ∂2ξ T ∂2ξ (µdx) 2 = T 2 dx of = . (1035) ∂t ∂x ∂t2 µ ∂x2 Dit is de golfvergelijking die transversale trillingen op een snaar p beschrijft als de amplitude klein is. De voortplantingssnelheid van de transversale golf is v = T /µ. G.4.1 Partiële afgeleiden en oplossingen van de golfvergelijking Stel dat de functie ξ afhangt van zowel de plaats x als de tijd t. Als voorbeeld kiezen we de volgende golffunctie, x ξ(x, t) = ξ0 sin 2π − νt = ξ0 sin (kx − ωt), (1036) λ met k = 2π λ het golfgetal en ω = 2πν de hoekfrequentie. We kunnen nu de partiële afgeleide van ξ(x, t) naar de plaats nemen, door aan te nemen dat de tijd hierbij een constante is. We vinden ∂ξ(x, t) = kξ0 cos (kx − ωt). ∂x (1037) Op analoge wijze vinden we ∂ξ(x, t) = −ωξ0 cos (kx − ωt). ∂t De tweede-orde partiële afgeleiden kunnen nu ook worden bepaald en we vinden ∂ 2 ξ(x,t) ∂x2 (1038) = −k 2 ξ0 sin (kx − ωt), (1039) ∂ 2 ξ(x,t) ∂t2 = −ω 2 ξ 0 sin (kx − ωt). We kunnen op deze wijze ook partiële afgeleiden nemen van andere functies. Door invullen van de tweede-orde partiële afgeleiden zien we direct dat de golffunctie gegeven p door vergelijking (1036) voldoet aan de golfvergelijking (1035) met als voorwaarde ω/k = T /µ.