Deeltjes en velden symmetrieën in de deeltjesfysica door Prof.dr Johannes F.J. van den Brand Afdeling Natuurkunde en Sterrenkunde Faculteit der Exacte Wetenschappen Vrije Universiteit, Amsterdam en Nationaal instituut voor subatomaire fysica (Nikhef), Amsterdam INHOUDSOPGAVE 1 Inhoudsopgave 1 Lagrange en Hamilton formalisme 1.1 Lagrange formalisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Hamilton formalisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Lagrangiaan van de Speciale Relativiteitstheorie . . . . . . . . . . . . . . . . . . . 2 2 3 4 2 Klassieke velden 2.1 Relativistische klassieke velden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Lagrange-dichtheid voor een reëel Higgs veld . . . . . . . . . . . . . . . . . . . . . 2.3 Hamiltoniaanse formulering van de klassieke veldentheorie . . . . . . . . . . . . . 8 11 12 12 3 Intermezzo: de quantummechanische harmonische oscilator 13 4 Relativistische quantumvelden 4.1 Het Klein-Gordon veld . . . . . . . . . . . . . 4.2 Het elektromagnetische veld . . . . . . . . . . 4.3 Het geladen scalaire veld . . . . . . . . . . . . 4.4 Afleiding van de Klein-Gordon vergelijking . . 4.5 Oplossingen van de Klein-Gordon vergelijking 4.6 Problematische interpretatie . . . . . . . . . . . . . . . 15 15 16 16 17 18 19 5 Behouden grootheden en het Noether Theorema 5.1 Bewijs van het Noether Theorema . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Voorbeeld: behoud van impuls en energie . . . . . . . . . . . . . . . . . . . . . . 21 22 24 6 IJkinvariantie: het bestaan van fotonen 6.1 Globale ijkinvariantie van het Klein-Gordon veld . 6.2 Lokale ijkinvariantie van het Klein-Gordon veld . . 6.3 Betekenis van Aµ : het Maxwell veld . . . . . . . . 6.4 Minimale substitutie . . . . . . . . . . . . . . . . . 6.5 Het complexe Klein-Gordonveld en haar interacties . . . . . 27 27 28 30 34 34 7 De Higgs-Lagrangiaan 7.1 Spontane Symmetriebreking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Het Higgs-mechanisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 36 38 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 LAGRANGE EN HAMILTON FORMALISME 1 2 Lagrange en Hamilton formalisme In de klassieke mechanica zijn we geïnteresseerd in hoe de coördinaten van objecten veranderen in de tijd. Hierbij kan het gaan om de posities van een verzameling puntdeeltjes, maar ook bijvoorbeeld over de hoek die een slinger maakt ten opzichte van de verticale richting. We gebruiken dus een verzameling gegeneraliseerde coördinaten om de beweging als functie van de tijd te beschrijven. Als we N deeltjes die in drie dimensies bewegen beschouwen, dan kunnen we de posities beschrijven met gegeneraliseerde coördinaten qi (i = 1, 2, .., N ). We kiezen bijvoorbeeld {qi } = {ri } , (1) {qi } = {ri , ϕi , θi } . (2) of Voor elk van de gegeneraliseerde coördinaten, definiëren we de gegeneraliseerde snelheden door q̇i ≡ dqi . dt (3) We kunnen nu het fundamentele dynamisch probleem van de klassieke mechanica definiëren als Gegeven {qi , q̇i } op een tijdstip t = t0 , wat is dan het verloop van het proces in de tijd? 1.1 Lagrange formalisme In de studieboeken over de klassieke mechanica wordt getoond dat de oplossing wordt gegeven door het principe van Hamilton: Er is een grootheid L (die we de "Lagrangiaan" noemen), zodanig dat de integraal (die we de "actie" noemen) Z t1 S= L(qi , q̇i , t)dt (4) t0 een extreme waarde aanneemt als het systeem beweegt van {qi (t0 )} tot {qi (t1 )}. Het pad dat het systeem volgt langs deze extreme oplossing noemen we het "klassieke pad" qicl (t). Laten we eens bekijken hoe het principe van Hamilton ons de bewegingsvergelijkingen van het systeem geeft. We verstoren het klassieke pad in de actie-integraal met een kleine bijdrage δqi (t) (zie Fig. 1), zadat geldt qi (t) = qicl (t) + δqi (t). Figuur 1: Variatie van het pad dat door een systeem wordt gevolgd ten opzichte van het klassieke pad. Merk op dat we eisen dat de eindpunten vastliggen. 1 LAGRANGE EN HAMILTON FORMALISME 3 Volgens Hamiltons principe komt het klassieke pad overeen met een extreme waarde in de actie, en dus geldt dat δS = 0, Z t1 ∂L ∂L (5) δS = δqi + δ q̇i dt = 0. ∂qi ∂ q̇i i0 d Merk op dat δ q̇i = dt δqi . We voeren nu partiële integratie uit, en gebruiken δqi = 0 voor de eindpunten. Dit levert Z t1 ∂L d ∂L − δqi dt = 0. (6) δS = ∂qi dt ∂ q̇i i0 Dit dient te gelden voor elke willekeurige keuze van de variatie δqi (t), en dat is enkel mogelijk als de integrand gelijk is aan nul. We vinden dus ∂L d ∂L − = 0. ∂qi dt ∂ q̇i (7) Bovenstaande vergelijkingen staan bekend als de Euler-Lagrange vergelijkingen en stellen de bewegingsvergelijkingen van het systeem voor. Omdat we te maken hebben met een systeem van tweede-orde differentiaalvergelijkingen, worden de oplossingen gespecificeerd door zowel {qi } als {q̇i } te geven op tijdstip t0 (dat willekeurig gekozen kan worden). We hebben het fundamentele probleem van de klassieke mechanica nu gereduceerd tot het probleem van het vinden van de Lagrangiaan en het oplossen van de Euler-Lagrange vergelijkingen. Als een eenvoudig voorbeeld bekijken we een enkel deeltje met massa m dat beweegt in een potentiaal V (q). In dit geval wordt de Lagrangiaan gegeven door 1 L = mq̇ 2 − V (q). 2 (8) Merk op dat de algemene regel is dat geldt L ≡ T − V , met T de kinetische en V de potentiële energie. De Euler-Lagrange vergelijking geeft nu mq̈ = − ∂V (q) ≡ F, ∂q (9) en dit herkennen we als de tweede wet van Newton (F is de kracht). 1.2 Hamilton formalisme We hebben nu de coördinaten en snelheden in het Langrange formalisme van de klassieke mechanica besproken. Soms gebruiken we echter de formulering met een Hamiltoniaan en dan hebben we coördinaten en impulsen nodig. We beginnen daarom met de definitie van de impulsen die toegevoegd kanoniek zijn aan {qi (t0 )}. Er geldt pi ≡ ∂L(q, q̇) . ∂ q̇i (10) We nemen aan dat deze uitdrukking inverteerbaar is, zodat we de q̇i kunnen uitdrukken in termen van qi en pi . We stellen nu de Hamiltoniaan op door X H≡ pi q̇i − L (q, q̇ (p, q)) . (11) i Vervolgens berekenen we hoe H verandert als we een kleine verandering aanbrengen in de coördinaten en impulsen. Er geldt ∂ q̇j ∂L ∂L ∂ q̇j ∂L dH = q̇i + pj − dpi + − − − pj dqi . (12) ∂pi ∂ q̇j ∂qi ∂qi ∂ q̇j 1 LAGRANGE EN HAMILTON FORMALISME 4 De twee uitdrukkingen tussen ronde haken zijn geijk aan nul (vanwege vergelijking (10)), en als we bovenstaande uitdrukking vergelijken met de algemene relatie ∂H ∂H dpi + dqi , ∂pi ∂qi dH = dan vinden we q̇i = ∂H , ∂pi − en ∂L ∂H = . ∂qi ∂qi (13) (14) Echter volgens vergelijkingen (7) en (10), kunnen we ∂L/∂qi vervangen door ṗi en vinden we de Euler-Lagrange vergelijkingen in de Hamiltoniaanse formulering, q̇i = ∂H , ∂pi en ṗi = − ∂H . ∂qi (15) Laten we nu even terug gaan naar ons eenvoudig voorbeeld. We hadden 1 L = mq̇ 2 − V (q), 2 (16) en dat geeft ∂L = mq̇, ∂ q̇ p= (17) en dus q̇ = p/m. Dan is p2 + V (q) = T + V. 2m De Euler-Lagrange vergelijkingen kunnen we schrijven als H = pq̇ − L = q̇ = ∂H p = , ∂p m en ṗ = − ∂H ∂V =− = F. ∂q ∂q (18) (19) Hiermee vinden we weer dat mq̈ = F . 1.3 Lagrangiaan van de Speciale Relativiteitstheorie Na deze inleiding in het formalisme van Lagrange, kan teruggekeerd worden naar de speciale relativiteitstheorie, en gepoogd worden de mechanica van Newton uit te breiden naar een versie die overeenkomt met het Principe van Relativiteit. De Lagrangiaanse methode leent zich hier uitstekend voor. Allereerst zullen we een vrij deeltje beschouwen, oftewel een deeltje met massa m dat beweegt zonder beinvloed te worden door een kracht. De Lagrangiaan voor zo’n deeltje bestaat dan alleen uit een kinetische term, L = K. (20) In de pre-relativistische mechanica wordt de kinetische energie gegeven door K = 21 m~v 2 . Deze uitdrukking kunnen we echter niet overnemen naar de Relativiteitstheorie. Immers, het Principe van Relativiteit eist dat de natuurwetten zodanig geformuleerd moeten zijn dat zij niet van vorm veranderen wanneer naar een ander inertiaalstelsel wordt getransformeerd. Dit betekent dat de gezochte Lagrangiaan invariant moet zijn onder transformaties tussen inertiaalstelsels, en daar voldoet bovenstaande uitdrukking zeker niet aan. Echter, met enige aanpassing is het eenvoudig een vorm te vinden die erg lijkt op de oude uitdrukking, maar wel degelijk invariant is. Hiervoor schrijven we eerst de oude uitdrukking uit als 1 dxi dxi L=K= m , 2 dt dt (21) 1 LAGRANGE EN HAMILTON FORMALISME 5 waar de Einstein sommatieconventie gebruikt is: dxi dxi = dx2 + dy 2 + dz 2 . Wat de invariantie van deze uitdrukking in de weg staat zijn twee dingen: allereerst zijn de dx’s inertiaalstelselafhankelijk; ten tweede zijn de dt’s dat eveneens. We hadden immers al gezien dat waarnemers in verschillende inertiaalsystemen, verschillende afstanden en tijdsduren meten. Deze uitdrukking kan daarom nooit voldoen aan het Principe van Relativiteit. Echter, wanneer we dxi dxi vervangen door ηµν dxµ dxν staat in de teller nu precies het lijnelement ds2 , waarvan bekend is dat dit invariant is. Op dezelfde manier ligt een uitbreiding van de twee dt’s ook voor de hand: vervang dtdt door dτ 2 , zodat ook dit nu invariant is geworden. Een natuurlijke suggestie voor een relativistische Lagrangiaan voor een vrij deeltje is dan 1 dxµ dxν L = mηµν . 2 dτ dτ (22) Deze overwegingen zijn natuurlijk geen bewijs voor de geldigheid van deze uitdrukking: het is een aanname. Er zijn ook andere Lagrangianen denkbaar die voldoen aan het Principe van Relativiteit. Echter, deze uitdrukking is de meest simpele, en bovendien zal blijken dat de bewegingswettem die hieruit volgen, reduceren tot de oude vertrouwde bewegingswetten van Newton wanneer ze toegepast worden in situaties waarbij snelheden veel lager zijn dan de lichtsnelheid. Uiteindelijk zal het echter aan experiment zijn om aan te tonen of de gevonden wetmatigheden waar zijn. Tot nu toe wijzen alle experimenten uit dat dit inderdaad het geval is. De actie S behorend bij deze Lagrangiaan wordt verkregen door de Lagrangiaan te integreren over de tijd. Ook hier moet het Principe van Relativiteit in acht worden genomen: de uitdrukking moet worden geintegreerd over de eigentijd dτ (in tegenstelling tot over de waarnemerafhankelijke tijd t ) om zo de invariantie van de actie te waarborgen. De actie wordt dan dus Z t2 1 dxµ dxν S= mηµν dτ. (23) 2 dτ dτ t1 Om de bewegingswet voor het deeltje af te leiden, dient het Principe van Extreme Actie weer te worden toegepast: er moet gezocht worden naar het pad xµ (τ ) dat de waarde van deze integraal minimaal of maximaal maakt. De Euler-Lagrange vergelijkingen voor deze situatie hebben de vorm1 ! ∂L d ∂L = . (24) α ∂xα dτ ∂ dx dτ Merk op dat dit vier vergelijkingen zijn: voor elk van de vier coordinaten van het pad xµ (t) is er een vergelijking die moet worden opgelost. Wanneer de relativistische Lagrangiaan wordt ingevuld en beide zijden van de Euler-Lagrange vergelijkingen worden uitgerekend, wordt gevonden dat een vrij relativistisch deeltje een pad xµ (τ ) volgt waarvan de componenten voldoen aan de vergelijkingen d2 xµ (25) m 2 = 0. dτ Dit lijkt sprekend op de wet van Newton voor een vrij deeltje, met twee subtiele verschillen. Ten eerste doet de wet van Newton uitspraken over de drie plaatscoordinaten van het deeltje, waar deze nieuwe uitdrukking ook uitspraak doet over de tijd. Deze laatste stelt dat m 1 dt2 = 0, dτ 2 (26) Dit is een generalisatie van Eq.X. Het bewijs van deze stelling is niet veel moeilijker dan dat van Eq.X, maar wordt voor het moment overgeslagen. 1 LAGRANGE EN HAMILTON FORMALISME 6 dt waaruit volgt dat dτ gelijk is aan een constante. Dat is niet verrassend: we hadden immers al gezien dat de tijd τ zoals gemeten door een waarnemer die het deeltje stil ziet staan, een andere is dan de tijd t gemeten door een waarnemer die het deeltje ziet bewegen. Dit was precies het tijddilatatie effect, en de waarde van deze constante laat zich dan ook aflezen als de Lorentz-factor γ. Het tweede verschil met de wet van Newton is het feit dat er hier afgeleiden worden genomen naar de eigentijd τ , waar in Newtons theorie afgeleiden werden genomen naar de tijd t. Dit maakt van deze nieuwe afgeleide een soort ’bastaard-object’: de gemeten afstanden x worden genomen zoals gemeten door een willekeurige waarnemer ten opzichte van wie het deeltje beweegt, waar de tijd gemeten wordt door de waarnemer die stilstaat ten opzichte van het bewegende deeltje. Dit object wordt de 4-snelheid uµ (t) genoemd; de eigenschappen ervan zullen we later bestuderen. De 4-snelheid kunnen we omschrijven naar een meer natuurlijker object (te weten: afstand en tijd gemeten door een en dezelfde waarnemer). Dit kunnen we doen door ons te beseffen dat de verlopen tijd gemeten door het deeltje, en die door een andere waarnemer, met elkaar gerelateerd zijn via de formule van tijd-dilatatie: dτ = γ −1 dt. Op deze manier is de gevonden wet uit te drukken als d~x2 mγ 2 2 = 0. (27) dt De wet van Newton kan nu gezien worden als een speciaal geval van deze nieuwe wet. Als we aannemen dat het deeltje veel langzamer beweegt dan het licht ten opzichte van de waarnemer in wiens tijdsduur en afstand we nu alles hebben uitgedrukt (oftewel we nemen aan dat v << c), dan kan Eq.() benaderd worden door mγ 2 d~x2 dt2 d~x2 2 2 1 − vc dt v 2 d~x2 ≈ m 1+ c dt2 d~x2 ≈ m 2 = 0, dt ≡ m (28) waar gebruik is gemaakt van de wiskundige regel (1 + x)m ≈ 1 + mx, welke geldt als x << 1. Dit is precies de wet van Newton! Zo is nu aangetoond dat de wet van Newton slechts een speciaal geval is van een meer algemene bewegingswet, Eq.(1.3)! Dit geeft ons vertrouwen dat onze keuze voor de Lagrangiaan waarschijnlijk de juiste was: hij voldoet aan het Principe van Relativiteit, en geeft ons bovendien onze oude vertrouwde bewegingswetten terug. Met dit vertrouwen in het achterhoofd kunnen we nu verder gaan met het afleiden van wetten betreffende de energie en impuls. Zoals besproken in de vorige sectie, volgt een impuls uit een gegeven Lagrangiaan via de regel Eq.(??). Toegepast op de relativistische Lagrangiaan levert dit op voor de impuls van het vrije deeltje pα = ∂L dxν = m ηαν , α dτ ∂ dx dτ (29) en na beide kanten te contraheren met de inverse η µα van de Minkowksi-metriek wordt dit dxµ dτ = muµ . pµ = m (30) Wederom lijkt dit erg op de impuls zoals bekend uit de mechanica van Newton: een massa vermenigvuldigd met een snelheid. Echter, de snelheid is hier nu de 4-snelheid, en deze nieuwe 1 LAGRANGE EN HAMILTON FORMALISME 7 impuls wordt dan ook de 4-impuls genoemd. Vergeleken met de uitdrukking voor de Newtoniaanse variant, p = m dx dt , gaan weer twee verschillen op: ten eerste is er een nul-component aanwezig, en ten tweede is het weer een ’bastaard-object’: afgelegde afstand gemeten door een willekeurige waarnemer, en tijdsduur gemeten door een waarnemer die stilstaat ten opzichte van het deeltje. Het tweede verschil kunnen we weer een plaats geven door de relatie tussen eigentijd en tijd te gebruiken. Dit levert dxα pα = mγ , (31) dt en via dezelfde benaderingsmethode als eerder volgt direct dat de i-component hiervan reduceert tot de impuls zoals bekend uit de mechanica van Newton, wanneer het deeltje maar veel langzamer beweegt dan het licht. De i-componenten van dit object worden daarom opgevat als de relativistische uitdrukkingen van de impuls. Wat de nul-component betreft, deze moet nog een interpretatie krijgen. Deze component is p0 = γmc. (32) Via een dimensie-analyse is meteen te zien dat het de dimensie van een energie gedeeld door een snelheid heeft, en dit wekt de suggestie dat p0 c opgevat kan worden als de energie van het vrije deeltje. De vraag dringt zich dan al snel op: op welke manier is deze uitdrukking gerelateerd aan de Newtoniaanse uitdrukking voor de energie van een vrij deeltje, K = 12 mv 2 ? Ook hier biedt de benadering van lage snelheden uitkomst. Er geldt: 1 p0 c = mc2 q 2 1 − vc 1 v 2 2 ≈ mc 1 + 2 c = mc2 + K, (33) waar de uitdrukking voor de Newtoniaanse energie K van een vrij deeltje is ingevuld. Hier is nu gevolgd dat, in de benadering van lage snelheden, de nul-component maal c van de relativistische impuls reduceert tot de Newtoniaanse energie plus een extra term. Afgezien van deze constante term, is de nul-component maal c bij lage snelheden inderdaad gelijk aan de energie van het deeltje zoals voorspeld door de Newtoniaanse mechanica. Het ligt dan ook voor de hand om aan te nemen dat we p0 c ook bij hoge snelheden mogen opvatten als de energie van het deeltje. Wat de constante term betreft kan de vraag worden gesteld hoe fysisch interessant deze is. Immers, in de natuurkunde kennen alleen energie verschillen een meetbare betekenis2 , en dus zal elke extra constante term toegevoegd aan de energie van een systeem uit de berekening vallen wanneer een energieverschil opgeschreven wordt. Toch heeft de constante term m hier wel degelijk een fysische betekenis: het is namelijk niet zomaar een willekeurige constante, het is een constante die een eigenschap van het deeltje bevat (de massa)! Deze energie is ook aanwezig wanneer het deeltje geen bewegingsenergie heeft voor een gegeven waarnemer, K = 0; we spreken dan ook over rust-energie, en deze is gelijk aan E = mc2 . (34) Dit is wellicht de meest bekende formule uit de natuurkunde. Hij zegt dat elke massa een energie met zich meedraagt gelijk aan deze massa maal c2 , en dat dit energie is die zich niet laat wegtransformeren door naar een ander inertiaalstelsel te gaan. Het is daarom een fundamentele hoeveelheid energie voor een gegeven massa m: voor alle waarnemers geldt dat een massa op zijn minst deze hoeveelheid energie met zich meedraagt. 2 Denk bijvoorbeeld aan de relatie tussen een kracht F in x-richting en de potentiele energie V : F = − dV , dx oftewel een meetbare grootheid is uitgedrukt als een verschil in energie. 2 KLASSIEKE VELDEN 2 8 Klassieke velden We beschouwen snaar met lengte l die beschreven kan worden als een verzameling van N massapunten die met veren aan elkaar verbonden zijn, zoals geschetst in figuur 1. De massapunten bewegen in de verticale richting en we definiëren voor de verticale uitwijking van massa mi de variable ϕi . We leiden nu een uitdrukking af voor de Lagrangiaan van dit systeem. We nemen aan dat de massapunten enkel verticaal kunnen bewegen en verwaarlozen horizontale beweging. We noemen ϕi de verticale uitwijking van massapunt i. Merk op dat x enkel een label is voor de positie van het massapunt, terwijl ϕi de relevante coördinaten voorstellen (dat zijn de dynamische vrijheidsgraden die in de Lagrangiaan verschijnen). De afstand tussen naburige massapunten noemen we ∆x en er geldt l = N ∆x. Later nemen we de limiet dat ∆x → 0. De massa van de snaar is m en de massadichtheid is ρ = m/l. Elk massapunt heeft een massa mi = m/N = ρ∆x en we nemen voor het gemak dus aan dat alle massapunten een gelijke massa hebben. De kinetische energie van beweging in de ϕ-richting (verticaal) vinden we door sommeren en bedraagt 1X 1 X 2 T = mi ϕ̇2i = ρ ϕ̇i ∆x. (35) 2 2 i i De potentiële energie hangt af van de vertical afstand tussen naburige massapunten ϕi+1 − ϕi . Als de twee naburige punten dezelfde vertical afstand hebben, dan is de veer niet uitgerekt en is de kracht nul. Volgens de wet van Hooke is de kracht gelijk aan het product van rek en veerconstante. Merk op dat wanneer we een veer door tweeën delen, dan wordt de veer stugger en neemt de veerconstante met een factor twee toe. Stel dat de veer met lengte l een veerconstante k = κ/l heeft. Indien we deze veer in N = l/∆x delen splitsen, dan wordt de veerconstante κi van elke kleine veer gegeven door κi = kN = κ/∆x. Verder kiezen we alle veerconstanten even groot. De potentiële energie vinden we dan door alle potentiële energieën van naburige paren te sommeren, 1 X (ϕi+1 − ϕi )2 U= κ . (36) 2 ∆x i Hiermee kunnen we de Lagrangiaan schrijven als 1 X 2 1 X (ϕi+1 − ϕi )2 L= ρ ϕ̇i ∆x − κ . 2 2 ∆x i (37) i In de limiet dat we een oneindig aantal massapunten nemen, verkrijgen we een wiskundig model voor een veld ϕ dat bestaat tussen de eindpunten x1 en x2 . Als volgende stap leiden we een uitdrukking af voor de Lagrangiaan van dit systeem. wwe werken in dat geval met massadichtheid ρ. Merk verder op dat een kortere veer een grotere veerconstante heeft. 2 KLASSIEKE VELDEN 9 We kunnen van een som over een eindig aantal punten N overgaan naar een continue integraal, door de definitie van een integraal te gebruiken. Er geldt Z X lim F (xi )∆x → F (x)dx. (38) ∆x→0 i Als we dat toepassen op de kinetische energie, vinden we Z 2 1 X 2 ∂ϕ 1 T = ρ dx. ϕ̇i ∆x → ρ 2 2 ∂t (39) i We zien nu dat x gebruikt wordt om de vrijheidsgraad ϕ te labelen. De positie in de ruimte x is zelf niet de vrijheidsgraad die in de Lagrangiaan voorkomt. Een veldentheorie is een theorie waarvan de velden de vrijheidsgraden zijn en de ruimte vullen. De velden mogen ook van de tijd afhangen. Op elk punt x in de ruimte is er een dergelijke vrijheidsgraad ϕ(x, t). We hebben te maken met een oneindig aantal vrijheidsgraden. Ons voorbeeld laat zien hoe een veldentheorie uit de klassieke mechanica afgeleid kan worden. We kunnen nu abstraheren en ϕ zien als een veld in de ruimte. Dit veld kan een kinetische energie ∂ϕ/∂t hebben. We stellen ons dit niet voor als een beweging in de ruimte, maar in de veldruimte. Als we naar de potentiële energie U kijken, dan zien we dat elk veld ϕi twee keer voorkomt in de sommatie. Om de sommatie te kunnen schrijven als een integraal (zie vergelijking (38)), vermenigvuldigen we met en delen we U door ∆x. Dit levert 1 X (ϕi+1 − ϕi )2 1 X ϕi+1 − ϕi 2 U= κ = κ ∆x. (40) 2 ∆x 2 ∆x i i We herkennen de definitie van de afgeleide (lim∆x→0 (ϕi+1 −ϕi )/∆x = ∂ϕ/∂x) in de factor tussen haakjes, terwijl we de som kunnen schrijven als een integraal. Hiermee vinden we Z 2 1 ∂ϕ U= κ dx. (41) 2 ∂x We kunnen de Lagrangiaan nu schrijven als de volgende integraal, 2 # Z " 2 ∂ϕ ∂ϕ 1 L=T −U = ρ −κ dx. 2 ∂t ∂x De integrand noemen we de Lagrangiaandichtheid en hiervoor geldt 2 2 Z ∂ϕ 1 ∂ϕ 1 L ≡ Ldx → L = ρ − κ 2 ∂t 2 ∂x (42) (43) en we zien dat de uitdrukking eerste orde afgeleiden van het veld ϕ naar plaats en tijd bevat. De bewegingsvergelijking volgt uit de Euler-Lagrange vergelijkingen. De Euler-Lagrange vergelijkingen kunnen geschreven worden als d ∂L ∂L − = 0. (44) dt ∂ ϕ̇ ∂ϕ Voor het educatieve aspect gaan we weer terug naar de discrete Lagrangiaan gegeven door uitdrukking (37). Hiermee vinden we ∂L d ∂L = ρ∆x ϕ̇ → = ρ∆x ϕ̈i . (45) ∂ ϕ̇i dt ∂ ϕ̇i 2 KLASSIEKE VELDEN 10 Evenzo geldt κ ∂L = [(ϕi+1 − ϕi ) − (ϕi − ϕi−1 )] . ∂ϕi ∆x Invullen in de Euler-Lagrange vergelijkingen levert c2 c2 (ϕi+1 − ϕi ) (ϕi − ϕi−1 ) ϕ̈i = [(ϕi+1 − ϕi ) − (ϕi − ϕi−1 )] = . − ∆x ∆x ∆x (∆x)2 (46) (47) Hierbij gebruiken we c2 ≡ κρ . We nemen nu weer de limiet ∆x → 0 en herkennen de definitie van −ϕi ) i−1 ) de tweede afgeleide. Merk op dat de afgeleiden (ϕi+1 en (ϕi −ϕ op twee posities berekend ∆x ∆x moeten worden die een afstand ∆x van elkaar liggen. Dit levert ϕ̈ = c2 ∂2ϕ ∂x2 → 2 ∂2ϕ 2∂ ϕ − c = 0. ∂t2 ∂x2 (48) Bovenstaande bewegingsvergelijking is een golfvergelijking, waarbij de snelheid van de golf gegeven wordt door c, die bepaald wordt door de materiaaleigenschappen van de snaar. Het is mogelijk om de eenheden zodanig te kiezen dat c = 1 (kies de lengte-eenheid gelijk aan de door de golf afgelegde weg in een tijd van 1 seconde). Dat levert de vergelijking ∂2ϕ ∂2ϕ − = 0. ∂t2 ∂x2 (49) We zien dat er een relatief tekenverschil optreedt tussen tijd- en plaatscoördinaten. Verder bevat de bewegingsvergelijking afgeleiden van de tweede orde. Tenslotte geven we nog een verantwoording voor onze keuze van de potentiële energie. Hiertoe beschouwen we de posities van twee massapunten in onderstaande figuur. In het geval dat beide massapunten een gelijke uitwijking ϕi = ϕi+1 hebben, is de q lengte van de veer gelijk aan ∆x. In het geval dat ϕi 6= ϕi+1 , wordt de lengte van de veer (∆x)2 + (ϕi+1 − ϕi )2 . De energie opgeslagen in de veer is evenredig aan (∆x)2 + (ϕi+1 − ϕi )2 . Merk op dat de bijdrage (∆x)2 slechts een getal is en niet afhangt van ϕ. Als we al deze getallen voor N veren optellen, dan is dit gewoon een constante waarde die bij de potentiële energie wordt opgeteld en die daarom geen invloed kan hebben op de beweging van het systeem. De actie S is een getal dat we vinden door de Lagrangiaan over de tijd te integreren tussen beginen eindtoestand. Er geldt 2 # Z teind Z teind Z teind " 2 1 ∂ϕ ∂ϕ S= L dt = L dxdt = ρ −κ dxdt (50) ∂t ∂x tbegin tbegin tbegin 2 We zien dat de actie een integraal is van de Lagrangiaandichtheid over ruimtetijd. 2 KLASSIEKE VELDEN 2.1 11 Relativistische klassieke velden We beschouwen weer een systeem van N deeltjes die in één dimensie bewegen. De deeltjes zijn aan elkaar verbonden met (massaloze) veren met veerconstante k. De deeltjes zijn een afstand a van elkaar gescheiden in de evenwichtstoestand. We noemen ϕi de verplaatsing van de evenwichtspositie van deeltje i. De Lagrangiaan is in dat geval 1 X mϕ̇2i − k(ϕi+1 − ϕi )2 2 i i " # X X1 m ϕi+1 − ϕi 2 2 = aLi , ϕ̇ − ka = a 2 a i a L = X (Ti − Vi ) = i (51) (52) i met Li de Langragiaandichtheid (Lagrangiaan P perRlengte-eenheid) bijgedragen door deeltje i. We nemen nu de continuümlimiet, i → x, i → dx, ϕi → ϕ(x), (ϕi+1 − ϕi )/a → ∂ϕ/∂x, m/a → ρ (massadichtheid), en ka → κ (Youngs modulus). De continuüm Lagrangiaan kunnen we dan schrijven als 2 # Z " 1 ∂ϕ 2 L= ρϕ̇ − κ dx. (53) 2 ∂x We kunnen de actie nu schrijven als Z Z Z ∂ϕ S = Ldt = L ϕ, ϕ̇, dx dt, ∂x (54) met als Lagrangiaandichtheid " 2 # ∂ϕ 1 ∂ϕ L ϕ, ϕ̇, = ρϕ̇2 − κ . ∂x 2 ∂x (55) In dit voorbeeld is ϕ(x, t) het verplaatsingsveld. Een veld is een functie van ruimte en tijd en bevat een oneindig aantal vrijheidsgraden. Om een veld volledig te specificeren dienen we haar waarde te geven op elk punt in de ruimte en op elk tijdstip. We kunnen onze één-dimensionaal voorbeeld uitbreiden naar drie dimensies. Dit levert Z Z Z S = Ldt = L (ϕ, ϕ̇, ∇ϕ) dx dt, (56) en dat leidt tot de volgende Euler-Lagrange vergelijkingen 3 X ∂ ∂L ∂ ∂L ∂L − = 0. + k k ∂x ∂ (∂ϕ/∂x ) ∂t ∂ (∂ϕ/∂t) ∂ϕ (57) k=1 Merk op dat we bovenstaande vergelijking kunnen schrijven in een relativistisch invariante vorm als ∂ ∂L ∂L − = 0. (58) µ µ ∂x ∂ (∂ϕ/∂x ) ∂ϕ Deze vergelijking is Lorentz-invariant als L een scalaire dichtheid is (dat betekent dat L0 (x0µ ) = L (xµ )). 2 KLASSIEKE VELDEN 2.2 12 Lagrange-dichtheid voor een reëel Higgs veld Als het eerste realistische voorbeeld beschouwen we een reëel veld ϕ(x) (dit kan bijvoorbeeld het Higgs-veld zijn). De eenvoudigste niet-triviale Lagrange-dichtheid wordt gegeven door L= 1 (∂µ ϕ) (∂ µ ϕ) − µ2 ϕ2 . 2 (59) De bewegingsvergelijking volgt uit de Euler-Lagrange vergelijkingen, ∂µ ∂ µ ϕ + µ2 ϕ = 0 → + µ2 ϕ = 0, (60) en we herkennen hier de relativistische golfvergelijking die we eerder zijn tegengekomen, de Klein-Gordon vergelijking. 2.3 Hamiltoniaanse formulering van de klassieke veldentheorie Er is ook een Hamiltoniaanse formulering van de klassieke veldentheorie. Hierbij correspondeert er met de gegeneraliseerde coördinaat ϕ (r, t) op elk ruimtetijd punt (t, r) een kanonieke impuls π (r, t) gedefinieerd door ∂L = ϕ̇ (r, t) . (61) π (r, t) = ∂ ϕ̇ (r, t) De Hamilton-dichtheid wordt nu H = π φ̇ − L = i 1h 2 π + (∇ϕ)2 + µ2 ϕ2 . 2 Als we deze dichtheid over de hele ruimte integreren, vinden we de Hamiltoniaan, H = die de totale energie van het veld weergeeft. (62) R V Hd3 r, 3 INTERMEZZO: DE QUANTUMMECHANISCHE HARMONISCHE OSCILATOR 3 13 Intermezzo: de quantummechanische harmonische oscilator Het gebruik van operatoren is nuttig voor de oplossing van het probleem van de harmonische oscillator. Deze methode zal ook nuttig blijken als we het elektromagnetische veld (maar ook andere velden) willen quantiseren. We schrijven de Hamiltoniaan van de één-dimensionale harmonische oscillator als p2 1 H= + mω 2 x2 , (63) 2m 2 en merken op dat dit lijkt op het kwadraat van een operator. We kunnen het herschrijven door gebruik te maken van operator a r p mω a≡ x + i√ (64) 2~ 2m~ω en de hermitisch geconjugeerd a† , waarvoor geldt r p mω † . a ≡ x − i√ 2~ 2m~ω (65) We berekenen a† a = a† a = ~ω a† a = mω 2 p2 i x + + (xp − px) , 2~ 2m~ω 2~ p2 i mω 2 x + − [p, x] , 2~ 2m~ω 2~ p2 1 1 + mω 2 x2 − ~ω, 2m 2 2 (66) en vinden dan 1 H = ~ω a a + 2 † . (67) We gebruiken de commutatoren van a, a† en H op het probleem op te lossen. Er geldt i mω h 1 i i i i a, a† = [x, x] + [p, p] − [x, p] + [p, x] = (− [x, p] + [p, x]) = [p, x] = 1. 2~ 2m~ω 2~ 2~ 2~ ~ (68) We kunnen de andere commutatoren eenvoudig uitrekenen door H in termen van a en a† te gebruiken, en vinden h i h i h i [H, a] = ~ω a† a, a = ~ a† , a = −~ωa, en H, a† = ~ωa† . (69) We kunnen de commutatoren gebruiken om de energieën van de harmonische oscillator te bepalen. We passen [H, a] toe op energie-eigenfunctie un . [H, a] un = −~ωaun Haun − aHun = −~ωaun H (aun ) − En (aun ) = −~ωaun → H (aun ) = (En − ~ω) (aun ) . (70) Deze vergelijking toont dat aun een eigenfunctie is van H met eigenwaarde En − ~ω. We zien dat de operator a de energie verlaagt met ~ω. We noemen het daarom ook wel een annihilatieoperator. 3 INTERMEZZO: DE QUANTUMMECHANISCHE HARMONISCHE OSCILATOR 14 Vervolgens passen we H, a† toe op energie-eigenfunctie un . h i H, a† un = ~ωa† un Ha† un − a† Hun = ~ωa† un H a† un − En a† un = ~ωa† un → H a† un = (En + ~ω) a† un . (71) Nu is a† un een eigenfunctie van H met eigenwaarde En + ~ω. We zien dat de operator a† de energie verhoogt met ~ω. We noemen het daarom ook wel een creatie-operator. We kunnen de energie niet blijven verlagen, omdat de energie van de harmonische oscillator niet lager dan nul kan worden. Er dient dus te gelden dat au0 = 0. We kunnen de energie van de grondtoestand eenvoudig uitrekenen en vinden 1 1 † u0 = ~ωu0 . Hu0 = ~ω a a + 2 2 (72) (73) De energie van de grondtoestand is E0 = 21 ~ω. In het algemeen hebben de toestanden de energie 1 E = n+ ~ω. (74) 2 Het is interessant dat we ook een zogenaamde "number operator" Nop kunnen vinden. Er geldt 1 1 † ~ω = Nop + ~ω, (75) H = a a+ 2 2 en dus Nop = a† a en deze operator geeft het aantal quanta met energie ~ω. 4 RELATIVISTISCHE QUANTUMVELDEN 4 15 Relativistische quantumvelden De scalaire klassieke veldentheorie beschrijft trillingen en velden van scalaire grootheden in een medium, bijvoorbeeld trillingen (geluidsgolven) in een kristal. In het vervolg gaan we kijken naar de beschrijving van gequantiseerde scalaire vibraties (bijvoorbeeld fononen in een kristal). 4.1 Het Klein-Gordon veld Toen we een puntdeeltje quantiseerden in de quantummechanica, hebben we de gegeneraliseerde coördinaten q (dat zijn in het meest eenvoudige geval de cartesische coördinaten xi ) en impulsen pi behandeld als operatoren. Zij voldoen aan de quantummechanische commutatierelaties [xi , pj ] = i~δij , (76) en de golffunctie Ψ is een weergave van de toestandvector waarop deze operatoren werken. De Klein-Gordon vergelijking is een golfvergelijking en heeft vlakke-golf oplossingen. We kunnen ons voorstellen dat ons systeem is opgesloten in een grote doos met volume V , en dat we periodieke randvoorwaarden opleggen (later nemen we dan natuurlijk de limiet V → ∞). We kunnen het reële scalaire veld ϕ op tijdstip t dan schrijven in termen van vlakke golven als ϕ (r, t) = X k √ i 1 h ak e−i(ωtk·r) + a∗k ei(ωtk·r) , 2V ω (77) √ waar we 1/ 2V ω gebruiken als een handige normalisatie. Als we bovenstaande vergelijking p invullen in de Klein-Gordon vergelijking, dan vinden we dat ω = ω(k) = µ2 + k2 , hetgeen de energie beschrijft van een relativistisch deeltje met massa µ en impuls k. We kunnen de factoren in de exponenten dus schrijven als kx ≡ kµ xµ met k0 = ω. Het Klein-Gordon veld hebben we beschreven als een som van onafhankelijke componenten die allemaal aan een golfvergelijking voldoen. Ze voeren allemaal een harmonische beweging uit. Het is dan ook natuurlijk om elke mode op dezelfde manier te quantiseren, zoals we dat ook bij de harmonische oscillator hebben gedaan. Door vergelijking (77) in te vullen in vergelijking (62) voor de Hamiltoniaanse dichtheid, en vervolgens over het hele volume te integreren, vinden we X (78) H= ~ω(k)a∗k ak , k waar we (tijdelijk) de factor ~ hebben toegevoegd om te laten zien dat deze uitdrukking gelijkenis vertoont met uitdrukking (67) voor de energie van een quantummechanische harmonische oscillator. Inderdaad, als we ak en a∗k → a†k interpreteren als annihilatie en creatie-operatoren, die voldoen aan de commutatie-relaties h i ak , a†k0 = δkk0 , (79) dan voldoen ϕ en π aan de commutatie-relaties (76). We gebruiken bovenstaande relaties en berekenen weer de Hamiltoniaan. Dit levert X 1 H= ~ω(k) a∗k ak + . (80) 2 k Meestal kunnen we de constante bijdrage van de sommatie over de nul-modes (dat zijn de termen 1 2 ~ω) verwaarlozen. Er zijn echter gevallen, waarbij we dat niet mogen doen. 4 RELATIVISTISCHE QUANTUMVELDEN 16 We kunnen nu het hele wiskundige apparaat van de quantummechanische harmonische oscillator gebruiken. We definiëren de grondtoestand als de toestand die door alle ak geannihileerd wordt; dus als ak |0 >= 0 (81) voor alle k. Een genormaliseerde toestand met nk excitaties in de mode k wordt gegeven door [ak ]nk |nk >= √ |0 > . nk ! (82) Omdat H een som is van niet-wisselwerkende harmonische oscillatoren, zijn de eigentoestanden het directe product |..., nki , ..., nkj , ... >= Πki |nki > . (83) De enorme Hilbertruimte die wordt opgespannen door al deze basistoestanden wordt de Fockruimte genoemd. Om te komen tot een fysische interpretatie, merken we op dat bovenstaande toestanden voldoen aan X nk (k)|..., nki , ..., nkj , ... >, (84) H|..., nki , ..., nkj , ... >= k met (k) = ~ω(k). We kunnen toestand (83) interpreteren als een toestand met veel deeltjes, elk met een massa m, waarbij nk1 deeltjes een impuls k1 hebben, nk2 deeltjes een impuls k2 , etc. Dit is ook de reden dat de operatoren a†k en ak creatie en annihilatie operatoren genoemd worden: wanneer a†k werkt op de vacuümtoestand, dan wordt er een deeltje met golfgetal k gecreëerd. Met dit formalisme zijn we in staat om processen te beschrijven waarbij deeltjes met bepaalde impulsen worden gecreëerd of geannihileerd, bijvoorbeeld botsingsprocessen. 4.2 Het elektromagnetische veld De methode die we gebruikt hebben om het reële scalaire veld te quantiseren is heel algemeen. We kunnen het met kleine aanpassingen gebruiken om het elektromagnetische veld Aµ (r, t) te quantiseren. We beschrijven het veld van de klassieke viervector potentiaal in de zogenaamde stralingsijk, waarvoor geldt k·A = 0, A0 = 0. Het veld bevat slechts twee fysische vrijheidsgraden voor een gegeven viervector k µ . We voeren polarisatievectoren µ1,2 in, die loodrecht op elkaar staan en op de voorplantingsrichting k. De Fourierexpansie van Aµ kan dus worden geschreven als i XX 1 h µ ∗ i(ωtk·r) √ Aµ (r, t) = , (85) i ai,k e−i(ωtk·r) + µ∗ a e i,k i 2V ω i=1,2 k We stellen vervolgens dat de Fouriercoëfficiënten annihilatie en creatie-operatoren worden, die voldoen aan h i ai,k , a†j,k0 = δkk0 δij . (86) De fysische interpretatie is dat a†i,k0 een foton creëert met polarisatie vector µ1 en golfvector k. De Fock toestanden kunnen op dezelfde manier worden opgebouwd als we gedaan hebben voor het scalaire veld. 4.3 Het geladen scalaire veld Het blijkt dat we elektrisch geladen deeltjes niet met reële scalaire velden kunnen beschrijven. Om dat te doen hebben we een complex scalair veld nodig. De berekeningen gaan op dezelfde manier. Een geschikte klassiek Lagrangiaandichtheid wordt gegeven door L = (∂µ ϕ∗ ) (∂ µ ϕ) − µ2 |ϕ|2 . (87) 4 RELATIVISTISCHE QUANTUMVELDEN 17 Als we ϕ en ϕ∗ als onafhankelijke velden behandelen, dan vinden we de Euler-Lagrange vergelijkingen + µ2 ϕ(x) en + µ2 ϕ∗ (x). (88) De Fourierexpansie moet nu een niet-hermitisch veld beschrijven en neemt de vorm aan van ϕ (x) = X k √ i 1 h ak e−ikx + b†k eikx , 2V ω (89) en van de kanonieke commutatierelaties voor de klassieke velden ϕ en ϕ∗ kan men afleiden dat h i h i ak , a†k0 = bk , b†k0 = δkk0 . (90) Het blijkt dus dat we twee soorten "deeltjes" hebben, met dezelfde massa µ, die gecreëerd worden door a† en b† . Als we deze a-deeltjes en b-deeltjes koppelen aan de elektromagnetische wisselwerking, dan blijken ze tegenovergestelde elektrische lading te hebben. Dit formalisme kan dus omgaan met deeltjes en antideeltjes. 4.4 Afleiding van de Klein-Gordon vergelijking In het voorgaande hebben we gezien dat we een klassieke bewegingsvergelijking kunnen veranderen in een quantummechanische versie door de grootheden E en p~ te vervangen door afgeleides, en wel via de regel ~ p~ → −i∇, E → i∂0 . (91) 2 p ~ , leverde deze handeling de SchrödinIn het geval van de klassieke energievergelijking, E = 2m gervergelijking op. De prijs die we hiervoor moesten betalen, is dat de energie en de impuls niet meer gegeven worden als getallen, maar als operatoren, werkend op een nieuw object, de Schrödinger golffunctie ψ. Deze nieuwe interpretatie leidde, inter alia, tot het moeten verlaten van het idee dat energie en impuls gegeven worden door vaste waarden in een gegeven systeem. In plaats daarvan was de golffunctie Ψ nu een wiskundig object geworden waar, met behulp van eigenwaardevergelijkingen en het construct |Ψ|2 = Ψ∗ Ψ, ten beste een kansverdeling berekend kan worden die het gedrag van een quantummechanisch deeltje beschrijft. De Schrodingervergelijking bleek uiterst succesvol in het voorspellen van het gedrag van eenvoudige quantummechanische systemen: het waterstofatoom en de chemische bindingen van atomen kunnen, tot op zekere hoogte, met goede nauwkeurigheid worden verklaard door het oplossen van de betreffende Schrodingervergelijking. Echter, het feit dat de vergelijking is gebaseerd op de klassieke relatie tussen impuls en energie maakt dat de quantummechanica niet in staat is om ook in rekening te nemen dat deeltjes met hoge snelheid kunnen bewegen. Om zulke effecten in rekening te nemen moet de speciale relativiteitstheorie worden ingebouwd in het raamwerk van de quantummechanica. De meest voor de hand liggende methode daartoe is door niet de klassieke relatie tussen energie en impuls te nemen als startpunt van de afleiding van een quantummechanische vergelijking, maar de relativistische energievergelijking, die al was afgeleid in een eerder Hoofdstuk (en in het volgende Hoofdstuk nog eens herleid zal worden, met behulp van het formalisme van Lagrange), E 2 = p~ 2 + m2 . (92) −E 2 + p~ 2 + m2 = 0. (93) Deze kan worden geschreven als 4 RELATIVISTISCHE QUANTUMVELDEN 18 Als we hierin de quantummechanische operatoren van Eq.(91) introduceren en het geheel laten werken op een functie φ, vinden we daarvoor de differentiaalvergelijking ~ 2 + m2 φ(t, ~x) = 0, ∂02 − ∇ (94) ~ 2 = ∂ µ ∂µ ≡ 22 (hierin wordt 22 de l’Ambertiaan of, als contractie geschreven via ∂02 − ∇ genoemd), vinden we 22 + m2 φ(t, ~x) = 0. (95) Deze vergelijking heet de Klein-Gordon vergelijking, en de oplossing φ heet de Klein-Gordon golffunctie, of het Klein-Gordon veld. Beide spelen een hoofdrol in de relativistische quantummechanica. Hiermee zijn we erin geslaagd om een quantummechanische vergelijking te vinden die voldoet aan de regels van de speciale relativiteitstheorie. (Dit is nog eens expliciet te zien omdat elke term in de Klein-Gordonvergelijking een scalar is: 22 is immers een contractie van twee 4-vectoren, en m is een invariant.) De vraag dringt zich vervolgens op wat de fysische betekenis is van de oplossing φ. Het ligt voor de hand te denken dat het, net als de oplossing ψ(t, ~x) van de Schrodingervergelijking, een maat is voor de kans dat er een deeltje wordt gevonden op positie ~x en op tijdstip t. We zullen echter later zien dat dit niet het geval is. Om dit expliciet te maken, is het eerst nodig om de algemene oplossing van de Klein-Gordonvergelijking te vinden. 4.5 Oplossingen van de Klein-Gordon vergelijking De Klein-Gordon vergelijking dicteert dat een som van tweede afgeleides van de oplossing φ naar de tijd- en ruimtecöordinaten gelijk moet zijn aan (m2 maal) de oplossing zelf. Dit suggereert dat de oplossing de vorm aan zal nemen van een e-macht. Het feit dat de tijd-en ruimteafgeleiden een relatief minteken kennen geeft aan dat de tijd-en ruimteafhankelijkheden in de exponent van de e-macht eveneens een onderling relatief minteken hebben. Het ligt dan ook voor de hand om de exponent te schrijven als een contractie van xµ met een andere 4-vector, en een natuurlijke keuze is voor deze de energie-impuls vector pµ te nemen. We proberen dan ook dat de oplossing φ(t, ~x) gegeven wordt door µ φ(t, ~x) = u(p) e±ipµ x , (96) waarin u(p) een, tot zover, onbekende scalaire functie is. Wanneer deze aanname wordt ingevuld in de Klein-Gordon vergelijking wordt gevonden µ 22 + m2 φ = u(p) − E 2 + p~ 2 + m2 e±ipµ x = 0, (97) waaruit volgt dat er zou moeten gelden dat E 2 = p~ 2 + m2 , wil Eq.(96) een oplossing zijn. Hier is, uiteraard, altijd aan voldaan, en wel voor elke keuze van de scalaire functie u(p), en voor elk van de twee mogelijke waarden van het ± in de exponent. Hiermee hebben we aangetoond dat de Klein-Gordon vergelijking twee oplossingen kent, die elk voldoen aan de klassieke relativistische energievergelijking. Het is eenvoudig om in te zien dat deze oplossingen geen veelvoud van elkaar zijn, en daarom lineair onafhankelijk. De algemene oplossing van de Klein-Gordon vergelijking is een lineaire combinatie van deze twee oplossingen: µ µ φ(t, ~x) = u(p) e−ipµ x + v(p) eipµ x . (98) 4 RELATIVISTISCHE QUANTUMVELDEN 4.6 19 Problematische interpretatie Nu de oplossingen van de Klein-Gordon vergelijking bekend zijn, kan de vraag worden gesteld wat de oplossingen betekenen: wat is de fysische interpretatie van het Klein-Gordonveld φ? In de niet-relativistische quantummechanica had de Schrödinger-golffunctie de betekenis van een kansdichtheid, wat betekent dat het kwadraat |ψ(t, ~x)|2 = ψ ∗ (t, ~x) ψ(t, ~x) de kans geeft dat het beschreven deeltje zich op tijdstip t op de positie ~x bevindt. Het ligt daarom voor de hand om aan te nemen dat een soortgelijke interpretatie van de Klein-Gordon golffunctie ook zal gelden in de relativistische quantummechanica. Deze gedachte wordt kracht bijgezet door het feit dat de Klein-Gordongolffunctie φ over zal moeten gaan in de Schrodingergolffunctie ψ, wanneer we de klassieke, niet-relativistische limiet nemen. We zouden daarom kunnen postuleren dat de kansdichtheid van het Klein-Gordonveld gegeven wordt door de uitdrukking |φ|2 = φ∗ φ. We lopen dan echter tegen twee fundamentele problemen aan. Ten eerste kan de uitdrukking φ∗ φ negatief worden, zoals blijkt wanneer we de algemene oplossing Eq.(98) invullen: µ µ µ µ φ∗ φ = u∗ (p)e−ipµ x + v ∗ (p)eipµ x u(p) eipµ x + v(p) e−ipµ x µ = |u(p)|2 + |v(p)|2 + 2u∗ (p)v(p) e−2ipµ x + c.c. = |u(p)|2 + |v(p)|2 − 2 C(p) cos(2pµ xµ ), (99) waarin voor notationeel gemak is geschreven C(p) = Re(u(p))Re(v(p))+Im(u(p))Im(v(p)). Deze uitdrukking kan inderdaad, bij bepaalde keuzes voor de constanten u(p) en v(p), negatief worden. Dat diskwalificeert φ∗ φ als een kansdichtheid. Ten tweede is deze uitdrukking niet in lijn met de essentie van de speciale relativiteitstheorie. In die theorie geldt immers dat tijd-en ruimtecomponenten van een 4-vector aan elkaar gerelateerd moeten zijn via Lorentz-transformaties. De ruimtecomponenten ~j van de kansdichtheid waren in het geval van de Schrodingergolffunctie Ψ gegeven door ~ − Ψ∇Ψ ~ ∗ , ~j = − i Ψ∗ ∇Ψ (100) 2m en het is duidelijk dat onze aanname voor de relativistische kansdichtheid niet in dezelfde 4-vector thuishoort als de ruimtelijke componenten. Dit laatste probleem zou kunnen worden opgelost door de kansdichtheid opnieuw te definieren, en wel volgens een definitie van dezelfde vorm als die van ~j: ρ∝ i (φ ∂0 φ∗ − φ∗ ∂0 φ) . 2m (101) Helaas blijkt ook dan weer dat deze uitdrukking negatief kan worden, hetgeen direkt volgt door de algemene oplossing Eq.(98) in te vullen: i E µ µ µ µ (φ ∂0 φ∗ − φ∗ ∂0 φ) = u(p) eipµ x + v(p) e−ipµ x u∗ (p) e−ipµ x − v ∗ (p) eipµ x 2m 2m −c.c. E µ µ |u(p)|2 − u(p) v ∗ (p) e2ipµ x + v(p) u∗ (p) e−2ipµ x − |v(p)|2 = 2m −c.c. E |u(p)|2 − |v(p)|2 , (102) = 2m wat, inderdaad, negatief kan worden voor bepaalde keuzes van de constanten u(p) en v(p). Bovendien zou deze keuze voor de kansdichtheid ons afdwingen dat het Klein-Gordonveld louter 4 RELATIVISTISCHE QUANTUMVELDEN 20 complex mag zijn, omdat reële uitkomsten van de Klein-Gordonvergelijking een ρ van nul opleveren. Al met al voldoet dus ook de uitdrukking Eq.(101) niet als kansdichtheid van het KleinGordonveld. We staan nu voor een keuze: verlaten we oude interpretatie van de golffunctie φ door op zoek te gaan naar een nieuwe fysische betekenis va deze grootheid, of zullen we proberen φ te blijven zien als een maat voor de kansdichtheid maar passen we de onderliggende relativistische quantummechanica aan die ons de golffunctie oplevert? De pioniers van de quantumtheorie kozen voor de laatste aanpak, en hoopten de Klein-Gordonvergelijking te vervangen door een andere relativistische quantummechanische golfvergelijking, die, zo was de hoop, wel degelijk toestaat dat de oplossing een maat is voor de kansdichtheid. Deze aanpak leidde tot een nieuwe vergelijking, genaamd de Dirac vergelijking, die we niet zullen behandelen in dit college. De Dirac-vergelijking is, zo zal blijken, uiterst succesvol in het beschrijven van fermionen en leidt tot allerlei wonderlijke en diepzinnige voorspellingen over de aard van materie (waaronder de beroemdste het bestaan van antideeltjes is). Helaas staat ook de oplossing van Dirac-vergelijking, net als die van de Klein-Gordonvergelijking, niet onze oude interpretatie van kansdichtheden toe. Dit betekent dat we, geen andere keus hebben dan alsnog een geheel nieuwe fysische interpretatie te bedenken voor de betekenis van de oplossingen van beide vergelijkingen. Dit kan met de quantumveldentheorie. We zullen dan, met behulp van die nieuwe fysische interpretatie, zien dat de oplossingen van zowel de Klein-Gordon vergelijking als de Dirac-vergelijking een uiterst succesvolle beschrijving geven van de fysica van de kleinste deeltjes. 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 5 21 Behouden grootheden en het Noether Theorema Nu de regels voor het beschrijven van velden bekend zijn, kunnen we onze eerdere inzichten over het Klein-Gordon veld in dit nieuwe formalisme uitdrukken. Hiertoe introduceren we de Lagrangiaan L = (∂µ φ)(∂ µ φ∗ ) − m2 |φ|2 (103) voor het Klein-Gordon veld φ. Dat deze Lagrangiaan inderdaad de bekende bewegingsvergelijking voor quantumvelden oplevert zullen we nu demonstreren voor de Klein-Gordon Lagrangiaan. Hiertoe vullen we de bovenstaande Lagrangiaan in de Euler-Lagrange vergelijking ∂L ∂L (104) = ∂µ ∂Φ ∂(∂µ Φ) in, en werken we beide zijden uit. Het is direct duidelijk dat de afgeleides van de rechterzijde alleen zal werken op de eerste term van de Klein-Gordon Lagrangiaan. De rechterzijde van de Euler-Lagrange vergelijking geeft de uitdrukking ∂µ ∂ αβ ∗ µβ η (∂ φ )(∂ φ) = ∂ η ∂ φ = η µβ ∂µ ∂β φ α µ β β ∂µ φ∗ = 22 φ. (105) De linkerzijde van de Euler-Lagrange vergelijking werkt alleen op de tweede term van de KleinGordon Lagrangiaan, en geeft 1 2 2 ∂ − m φ = −m2 φ. (106) ∂φ 2 De beide zijdes aan elkaar gelijkgesteld geeft ons dan inderdaad de Klein-Gordon vergelijking 22 + m2 φ = 0. (107) Het is interessant om op te merken dat als we de gevonden bewegingsvergelijking terug substitueren in de Lagrangiaan, we vinden dat die gelijk is aan nul. Dit geldt dan ook voor de actie S. (De extreme waarde van de actie is blijkbaar nul.) Zoals bekend is er een aantal grootheden die tijdens fysische processen niet van waarde (en richting, in het geval van vectoren) zullen veranderen in de tijd. Zulke grootheden worden behouden genoemd. Bekende behouden grootheden uit de klassieke mechanica zijn energie E, impuls p~, en impulsmoment L van een verzameling deeltjes die met elkaar in interactie zijn. Een specifiek voorbeeld is de beweging van de planeten rond de zon: ondanks het feit dat de positie, snelheid, en afstand tot de zon van elke planeet op zijn baan rond de zon op elk moment anders is, wordt zijn energie op elk moment in de baan door hetzelfde getalletje gegeven. In hetzelfde voorbeeld geldt dit ook voor het impulsmoment. Het bestaan van behouden grootheden levert vaak enorm rekenkundig voordeel op bij het oplossen van de bewegingsvergelijkingen, omdat we in staat zijn een heel deel van de mogelijke oplossingen uit te sluiten. Immers, alleen die oplossingen die de behouden grootheden inderdaad constant houden, zijn toegestaan. Ook maakt het gebruik van behouden grootheden het mogelijk om conclusies te trekken over het beschouwde proces zonder ook maar de bewegingsvergelijkingen te hoeven oplossen. Zo kan de omlooptijd van een planeet om de zon worden uitgedrukt als functie van de afstand tot de zon3 , zonder daarbij de details van de omloopbaan te kennen. Ook in andere takken van de klassieke natuurkunde zijn er behouden grootheden bekend. Een voorbeeld uit de klassieke elektrodynamica is de elektrische lading van deeltjes, en voorbeelden 3 De uitkomst is de zogenaamde Derde Wet van Kepler. 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 22 uit de deeltjesfysica zijn in de eerdere hoofdstukken van dit dictaat geïntroduceerd: leptongetal, baryongetal, kleurlading, en, in het geval dat de zwakke interactie wordt genegeerd, vreemdheid. Een vraag die dan gesteld kan worden is de volgende: wat is de oorsprong van een gegeven behouden grootheid? In het geval van de klassieke mechanica kunnen het behoud van (mechanische) energie, impuls en impulsmoment rigoreus worden bewezen met behulp van de Wetten van Newton, maar veelal wordt het bestaan van behouden grootheden gepostuleerd, en dan meestal naar aanleiding van experimentele gegevens. Het formalisme van Lagrange stelt ons echter in staat om te bewijzen dat er behouden grootheden bestaan, en door welke uitdrukkingen ze worden gegeven. Het blijkt dat het bestaan van behouden grootheden een diepe connectie kent met de zogenaamde symmetrieen van een fysisch systeem. Dit uiterst belangrijke feit staat bekend als het Theorema van Noether, en kan als volgt worden geformuleerd: Voor elke symmetrie van de Lagrangiaan van een fysisch systeem kent dit systeem een hiermee corresponderende behouden grootheid. In wat volgt zullen we het Noether Theorema bewijzen en de consequenties ervan voor de deeltjesfysica onderzoeken. 5.1 Bewijs van het Noether Theorema Hiertoe beschouwen we een Lagrangiaan L van een quantummechanisch systeem. We zullen bewust geen uitspraken doen over de vorm van de Lagrangiaan, zodat onze conclusies zo algemeen mogelijk zullen zijn. Het enige dat we zullen aannemen is dat de Lagrangiaan een functie is van een gegeven quantumveld Φ(x), en van de tijdruimteafgeleides, ∂µ Φ(x), van het veld. Dus L = L (Φ, ∂µ Φ). (108) Deze aanname is erg algemeen, en wordt hieraan wordt voldaan door de Lagrangianen van het Klein-Gordon veld en het Dirac veld. We zullen vervolgens een verstoring δΦ op het veld aanbrengen, Φ → Φ + δΦ. (109) In tegenstelling tot eerder zullen we deze keer niet aannemen dat de verstoring δΦ nul is op de rand van het volume. Fysisch betekent dit simpelweg dat de eindwaarden van Φ niet meer vastliggen: we doen geen uitspraak meer over begin of eindtoestand van het beschouwde fysische proces. Ten gevolge van de verstoring van het veld zal de Lagrangiaan van het systeem ook veranderen, L → L 0 ≡ L + δL , (110) met een hoeveelheid δL waarvan de precieze details afhangen van de oorspronkelijke Lagrangiaan en van de aard van de verstoring δΦ. Voor bepaalde verstoringen δΦ, echter, zal de nieuwe Lagrangiaan L 0 er uitzien als L 0 = L + ∂α F α , (111) voor een bepaalde set functies F α (Φ). Als de verandering δΦ van het veld deze verandering van de Lagrangiaan tot gevolg heeft, noemen we de operatie Φ → Φ + δΦ een symmetrieoperatie van de Lagrangiaan. De reden voor deze naam is simpelweg dat de oorspronkelijke Lagrangiaan, L , en de nieuwe, L 0 , dezelfde actie S tot gevolg hebben. Immers, als we vergelijking (111) integreren over de ruimtetijd vinden we de actie Z S0 = {L + ∂α F α } d4 x. (112) 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 23 De tweede term in de integrand is de divergentie van de functies F α , en dus kan deze term worden geschreven als de oppervlakteintegraal van F α . Als we aannemen dat de functies F α naar nul gaan op oneindig grote afstand, dan is de bijdrage van de tweede term in de integrand van vergelijking (112) gelijk aan nul, en is er gevolgd dat beide Lagrangianen dezelfde actie tot gevolg hebben: S = S 0 . Fysisch betekent dit dat de natuur zich op precies dezelfde manier gedraagt voor beide Lagrangianen. Immers, als de acties hetzelfde zijn, moet gelden dat ze hetzelfde pad Φ kennen dat ze minimaliseert, zodat de beweging van het veld Φ(x) in beide gevallen dezelfde is. De naam ’symmetrieoperatie’ is dan ook correct gekozen. Het is nu eenvoudig aan te tonen dat voor elke symmetrieoperatie Φ → Φ + δΦ van een Lagrangiaan het systeem een behouden grootheid kent. Hiertoe hoeven we alleen te bepalen wat de vorm van de verstoring δL is ten gevolge van de operatie, en die gelijk te stellen aan ∂µ F µ . De verstoring δL is al eens voorgerekend in de vorige sectie: ∂L ∂L ∂L δL = δΦ + ∂µ − ∂µ δΦ (113) ∂Φ ∂(∂µ Φ) ∂(∂µ Φ) Eerder dicteerde het principe van Minimale Actie dat de integraal hiervan, die daar δS heette, gelijk moest zijn aan nul, en dit voorschrift gaf ons dan vervolgens de Euler-Lagrange vergelijkingen onder de voorwaarde dat de begin en eindwaarden van δΦ gelijk waren aan nul. Deze keer hadden we deze aanname echter niet gedaan. Als het veld alsnog aan de Euler-Lagrange vergelijkingen voldoet, is de eerste term gelijk aan nul, en volgt er ∂L δL = ∂µ δΦ (114) ∂(∂µ Φ) Omdat de verstoring van het veld Φ een symmetrieoperatie was, geldt per definitie dat deze uitdrukking gelijk moet zijn aan ∂µ F µ . Er volgt dan ook ∂L µ δΦ − F = 0, (115) ∂µ ∂(∂µ Φ) oftewel ∂L µ ∂µ j = 0, j ≡ δΦ − F . (116) ∂(∂µ Φ) De gevonden vergelijking is een zogenaamde continuiteitsvergelijking: een wiskundige uitdrukking die zegt dat de tijdsafgeleide gelijk is aan de som van de plaatsafgeleides. Fysisch betekent dit dat een grootheid niet zomaar kan veranderen in de tijd: hoeveel er van de grootheid verdwijnt van een gegeven positie moet door een volume heen zijn gegaan. Veel fysisch meetbare grootheden voldoen aan een continuiteitsvergelijking; voorbeelden zijn energie, elektrische stroom. Uitzonderingen zijn er ook; massa is er een van. µ µ We hebben nu gevonden dat een systeem dat beschreven wordt door een Lagrangiaan met een symmetrie gegeven in vergelijking (111) een grootheid j µ kent die voldoet aan de continuiteitsvergelijking. De grootheid j µ wordt de Noetherstroom genoemd. We kunnen vervolgens aantonen dat de ruimteintegraal van de nulde component j 0 van de Noetherstroom een behouden grootheid is, oftewel dat dit een getalswaarde kent die niet verandert. Hiertoe integreren we ∂0 j 0 en gebruiken we de continuiteitsvergelijking Z Z ∂L ∂0 j 0 d3 x = ∂i δΦ − F µ d3 x. (117) ∂(∂µ Φ) De rechterzijde van deze vergelijking is een divergentie van een ruimteintegraal, zodat de Stelling van Gauss zegt dat dit gelijk is aan een oppervlakteintegraal Z Z ∂L ∂L ∂i δΦ − F µ d3 x = δΦ − F µ dA. (118) ∂(∂µ Φ) ∂(∂µ Φ) 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 24 Onder de gebruikelijke aanname dat de integrand naar nul gaat in het ruimtelijk oneindige, volgt dat deze integraal gelijk is aan nul. In de linkerzijde van vergelijking (117) kunnen de ruimteintegraal en de tijdsafgeleide worden verwisseld, zodat deze gelijk is aan Z Z ∂0 j 0 d3 x = ∂0 j 0 d3 x , (119) en vergelijking (117) is dit gelijk aan nul. Hiermee is aangetoond dat de uitdrukking R 0volgens 3 j d x niet verandert in de tijd, en dus een behouden grootheid is. Dit bewijst het Theorema van Noether. 5.2 Voorbeeld: behoud van impuls en energie Een van de gevolgen van het Theorema van Noether is dat aangetoond kan worden onder welke symmetrieoperatie de energie en de impuls van een systeem behouden zijn. Het blijkt de operatie van het verschuiven van de ruimte en tijdcoordinaten te zijn. Om dit aan te tonen, beschouwen we de volgende verstoring van de coordinaten: xµ → xµ + µ (120) Als gevolg hiervan wordt het veld Φ(x) ook verstoord, en wel als volgt: Φ(x) → Φ(x + ) ≈ Φ(x) + (∂µ Φ(x)) µ (121) waar een eerste orde Taylor-benadering is gebruikt. Op dezelfde manier kan de verstoring van de Lagrangiaan worden berekend: L (x) → L (x + ) ≈ L (x) + (∂µ L (x)) µ . (122) Hieruit volgt direct de uitdrukking voor de verstoring van de Lagrangiaan: δL = (∂µ L (x)) µ . Aangezien de verstoring µ van de coordinaten constant is, mag µ binnen de afgeleide worden genomen, en volgt zo dat de verstoring van de Lagrangiaan precies van de vorm van vergelijking (111) is, met F µ = µ L . We hebben dan ook gevonden dat de Lagrangiaan de constante verschuiving van de tijdruimtecoordinaten als symmetrieoperatie heeft. Volgens het Theorema van Noether volgt dan direct dat de volgende uitdrukking voldoet aan de continuiteitsvergelijking ∂µ J µ = 0: Jµ = = ∂L δΦ − F µ ∂(∂µ Φ) ∂L (∂α Φ) α − µ L ∂(∂µ Φ) (123) waarin de gevonden uitdrukkingen voor δΦ en F µ zijn ingevuld. Er geldt dus ∂µ J µ = 0, en dat de uitdrukking R (124) J 0 d3 x behouden is in de tijd. Dit is een volkomen correcte uidtrukking van de behouden grootheid ten gevolge van de symmetrie onder verschuiving van tijdruimtecoordinaten. Echter, de gevonden uitdrukking zegt meer dan louter dit: door de tweede dezelfde index α te geven als de eerste, µ = δαµ α , kan de uitdrukking ook worden geschreven als ∂L Jµ = (∂α Φ) − δαµ L α ≡ Tαµ α . (125) ∂(∂µ Φ) 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 25 waarin een tensor Tαµ is gedefinieerd. Het feit dat J µ een behouden grootheid is wil zeggen dat ∂µ J µ = 0, zodat ∂µ J µ = ∂µ (Tαµ α ) = (∂µ Tαµ )α = 0 (126) waar is gebruikt dat de verschuiving α constant is en daarom buiten de afgeleide kan worden genomen. Het feit dat de verschuivingen t , x , y , z ieder willekeurig te kiezen zijn betekent dat uitdrukking tussen haakjes nul moet zijn. We vinden dan ook dat de tensor Tαµ aan de continuiteitsvergelijking voldoet: ∂µ Tνµ = 0. (127) en dat het de volgende uitdrukking is die constant is in de tijd: Z Tν0 d3 x = constant. (128) Merk op dat dit vier verschillende behouden grootheden zijn: voor elke waarde van de index ν één. Dit was te verwachten: immers, we hadden aangetoond dat de Lagrangiaan symmetrisch was onder vier operaties xµ → xµ + µ , zodat we op basis van Noether’s Theorema evenzoveel behoudswetten mochten verwachten. De eerder gevonden enkele behoudswet gegeven door vergelijking (124) was dan ook nog niet scherp genoeg. Nu de vier behouden grootheden zijn gevonden, rest ons alleen nog aan te tonen dat ze overeenkomen met de Wet van Behoud van Energie en de Wet ven Behoud van Impuls. Hiertoe bekijken we de elk van de componenten ν per stuk. Als ν = 0 (wat overeenkomt met een verschuiving van de coordinaat x0 , oftewel de tijdcoordinaat t), is de behouden grootheid gegeven door Z Z ∂L 0 3 T0 d x = (∂0 Φ) − L d3 x (129) ∂(∂0 Φ) Deze uitdrukking oogt van dezelfde vorm als de Hamiltoniaan, H= ∂L (∂0 x) − L, ∂(∂0 x) (130) die we kennen uit de klassieke mechanica; zie vergelijking (??). De verschillen zijn dat, hier, de afgeleides naar het veld Φ zijn en dat het geheel geintegeerd wordt over de ruimte. Dit is volkomen in lijn met het feit dat in quantummechanische processen de dynamische variabelen gegeven zijn door velden (in plaats van plaatscoordinaten) en met het feit dat we in quantummechanische processen gebruik maken van Lagrangiaan-dichtheden L (in plaats van Lagrangianen L). Het ligt dan ook voor de hand om de gevonden behouden grootheid te identificeren als de energie van het quantumveld Φ. We hebben gevonden dat de Wet van Behoud van Enegie het gevolg is van het feit dat de verschuiving van de tijdcoordinaat een symmetrieoperatie van de Lagrangiaan is. Op dezelfde manier kunnen we aantonen dat de overige drie componenten van de behouden grootheid gegeven in vergelijking (127) overeenkomen met de impuls van het quantumveld. Als ν = i, is de behouden grootheid gegeven door Z Z ∂L 0 3 Ti d x = (∂i Φ) d3 x. (131) ∂(∂0 Φ) wat, in vergelijking met de klassieke uitdrukking (??), suggereert dat deze uitdrukking de impuls in de ruimtelijke richting xi beschrijft. Het ligt dan ook voor de hand om deze grootheid te identificeren als de impuls pi van het quantumveld Φ. We hebben gevonden dat de Wet van 5 BEHOUDEN GROOTHEDEN EN HET NOETHER THEOREMA 26 Behoud van Impuls het gevolg is van het feit dat de verschuiving van de ruimtecoordinaten symmetrieoperaties van de Lagrangiaan zijn. We zullen als afsluiting de uitdrukkingen geven voor energie en impuls van het Klein-Gordonveld. Hiertoe vullen we de Lagrangiaan in van het respectievelijke veld en vinden dan voor de Hamiltoniaan H en de impuls P van het Klein-Gordonveld: Z Z 3 1 1 2 2 2 2 H= (∂0 φ) + (∇φ) + m φ d x, Pi = {∂0 (φ)∂i φ} d3 x. (132) 2 2 De uitdrukkingen voor de energie en impuls van het Klein-Gordon veld zijn duidelijk reëel, en zijn bovendien positief (ze bestaan immers uit een integraal van de som van kwadraten). 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 6 6.1 27 IJkinvariantie: het bestaan van fotonen Globale ijkinvariantie van het Klein-Gordon veld Het complexe Klein-Gordon veld φ is een complexe functie: het kan, zoals elke complexe functie, worden beschreven door een fase θ en een modulus R (die beide reëele functies zijn) als φ = Reiθ . Een complex veld klinkt niet erg fysisch, maar is toegestaan omdat we nooit het veld zelf meten, maar alleen de kansdichtheid. Zoals besproken bij de afleiding van de Klein-Gordonvergelijking is het niet erg duidelijk wat de betekenis is van de ’kansdichtheid’ ρ gegeven door vergelijking (101). In Hoofdstuk ?? zullen we zien dat deze uitdrukking wel degelijk een meetbare betekenis kent, en we mogen daarom eisen dat het een reële waarde heeft. Het is eenvoudig om te laten zien dat het in principe toegestaan is om het veld te vermenigvuldigen met een complexe functie e−iλ met modulus 1, omdat deze vermenigvuldiging de waarde van ρ niet verandert. Met andere woorden, het complexe Klein-Gordon veld φ en het veld e−iλ φ voorspellen dezelfde uitkomsten van experimenten. Het ligt daarom voor de hand dat de Lagrangiaan van het complexe KleinGordon veld, vergelijking (??), deze verstoring van het veld zou moeten toestaan. Het is eenvoudig te checken dat dit inderdaad het geval is mits de faseverschuiving λ een constante is. Voor de verstoring van het veld δφ geldt dan φ → e−iλ φ ≈ (1 − iλ)φ = φ + δφ waarin δφ ≡ −iλφ, (133) en waarin de eerste orde Taylorbenadering is gebruikt om te schrijven e−iλ ≈ 1 − iλ. De verstoring van het veld ingevuld in de Lagrangiaan van vergelijking (??) laat dan direct zien dat de Lagrangiaan inderdaad niet verandert: L → η µν ∂µ (φ + δφ)∂ν (φ + δφ)∗ − m2 (φ + δφ)∗ (φ + δφ) = η µν (∂µ φ)(∂ν φ)∗ − m2 φ∗ φ + η µν {(∂µ φ)(∂ν δφ∗ ) + (∂µ φ∗ )(∂ν δφ)} − m2 (φδφ∗ + φ∗ δφ) = L + δL , (134) waarin δL ≡ η µν {(∂µ φ)(∂ν δφ∗ ) + (∂µ φ∗ )(∂ν δφ)} − m2 (φδφ∗ + φ∗ δφ). (135) Wanneer we de uitdrukking voor δφ invullen, vinden we dat δL gelijk is aan nul. De Lagrangiaan voldoet dus aan onze eis dat het voor de fysica niet uit zou moeten maken of het veld een faseverschuiving e−iλ kent. Merk op dat hierbij expliciet gebruik is gemaakt van het feit dat λ een constante is (hierdoor mocht deze in de uitwerking van L buiten de afgeleides worden geplaatst). Fysisch betekent dit dat de verandering van de fase van het complexe Klein-Gordon veld op elk punt van het veld dezelfde waarde heeft. Zulke faseveranderingen worden aangeduid als globale ijktransformaties. De waarde van de constante λ is irrelevant: bovenstaande afleiding is onafhankelijk van de waarde van λ. Hiermee aangetoond dat de globale ijktransformatie een symmetrieoperatie is van het complexe Klein-Gordon veld (met F µ = 0) en dat daarom, aldus het Noether Theorema, er een Noetherstroom j µ bestaat, gegeven door vergelijking X. Dit levert de uitdrukking jµ = ∂L δφ = −i(∂µ φ∗ )λφ. ∂(∂µ φ) (136) De complexe Klein-Gordon Lagrangiaan beschrijft het veld φ en zijn complex geconjugeerde φ∗ gelijkwaardig, en er is daarom ook een Noetherstroom j ∗µ op te schrijven voor het complex geconjugeerde veld: ∂L j ∗µ = δφ∗ = i(∂µ φ)λφ∗ . (137) ∂(∂µ φ∗ ) 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 28 De totale Noetherstroom J µ = j µ + j ∗µ is de som van de twee deelstromen, en is gedefinieerd als J µ ≡ −i(∂ µ φ∗ )φ + i(∂ µ φ)φ∗ (138) Een aantal opmerkingen: ten eerste moge het duidelijk zijn dat deze som voldoet aan ∂µ J µ = 0, aangezien elk van de deelstromen dat doet. Verder wordt de constante factor λ conventioneel niet meegenomen in de definitie van J µ . De waarde is immers irrelevant voor de fysica die door het veld beschreven wordt, en wordt daarom weggelaten. Tenslotte kan worden opgemerkt dat de Noetherstroom J µ , als som van een term en zijn complex geconjugeerde, een reële functie is. De fysische betekenis van de Noetherstroom kan op dit moment nog niet worden vastgesteld. Hiertoe zal eerst een uitbreiding van de ijktransformaties moeten worden behandeld. Dit is het onderwerp van de volgende Sectie. 6.2 Lokale ijkinvariantie van het Klein-Gordon veld In de vorige sectie hadden we gezien dat de Lagrangiaan van het complexe Klein-Gordon veld de globale ijktransformatie als symmetrieoperatie heeft, en hadden we beargumenteerd dat dit te verwachten was op basis van het feit dat, wat de meetbare grootheid φ∗ φ betreft, de fase van het veld irrelevant is. Hetzelfde argument zou moeten gelden voor het geval de faseverschuiving λ geen constante is, maar op elke plek in het veld een andere waarde mag aannemen: λ = λ(x). Ook dan geldt immers dat de meetwaarde φ∗ φ niet verandert als φ → e−iλ(x) φ, zoals eenvoudig kan worden aangetoond: (e−iλ(x) φ)∗ (e−iλ(x) φ) = ei(λ(x) e−iλx φ∗ φ = φ∗ φ. Zulke plaatsafhankelijke veranderingen van de fase van het quantumveld worden lokale ijktransformaties genoemd. Er is nog een tweede reden waarom we zouden verwachten dat een Lagrangiaan invariant is onder lokale ijktransformaties. De globale ijktransformaties van de vorige sectie suggereren dat de faseverschuiving van het quantumveld op elke plek en op elk moment plaatsvindt, maar dit suggereert dat er informatie instantaan overgedragen wordt tussen alle punten van het veld. Dit is in strijd met het experimentele feit dat er een maximale snelheid bestaat. Een lokale ijktransformatie, daarentegen, breekt deze regel niet. Het ligt daarom voor de hand om te eisen dat een Lagrangiaan invariant is onder lokale ijktransformaties. Het is eenvoudig aan te tonen dat de Lagrangiaan van het complexe Klein-Gordon veld niet aan deze eis voldoet. Wanneer we het quantumveld een faseverschuiving geven, geldt voor de verstoring van het veld weer vergelijking (133), φ → eiλ(x) φ = φ + δφ waarin δφ ≡ −iλ(x)φ, (139) en de resulterende verstoring van de Lagrangiaan wordt weer gegeven door vergelijking (134), L → L + δL , (140) waarin δL ≡ η µν {(∂µ φ)(∂ν δφ∗ ) + (∂µ φ∗ )(∂ν δφ)} − m2 (φδφ∗ + φ∗ δφ). (141) In tegenstelling tot het geval van globale ijktransformaties, is δL deze keer niet gelijk aan nul: wanneer we de uitdrukking voor δL invullen en in rekening nemen dat λ een plaatsafhankelijke functie is, volgt dat δL kan worden uitgedrukt in de Noetherstroom van vergelijking X, δL = i η µν (∂µ λ)Jν , (142) waarin de afgeleide ∂µ λ ongelijk is aan nul. Deze uitdrukking is niet van de vorm gegeven door vergelijking (112), en dus zijn lokale ijktransformaties geen symmetrieoperaties van de 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 29 Lagrangiaan van het complexe Klein-Gordon veld. De Lagrangiaan voldoet daarom niet, en zal moeten worden aangepast. Hoe dit te doen? Het is duidelijk dat een term toegevoegd moet worden aan de Lagrangiaan, en wel een die, wanneer het veld φ wordt verstoord volgens vergelijking (133), een extra bijdrage aan levert die precies de eerdere verstoring δL uitwist. Het is echter niet mogelijk dit te doen door de extra bijdrage aan de Lagrangiaan te construeren uit het veld φ en/of zijn complex geconjugeerde (en/of hun afgeleides). We hebben daarom geen keus een nieuw veld te introduceren. Een voor de hand liggende keuze is een extra bijdrage L1 aan de Lagrangiaan van de vorm L1 = −qηµν J µ Aν , (143) waarin Aµ het nieuwe veld is en q een constante. Deze keuze wordt afgedwongen, omdat zijn verstoring, δL1 = −q ηµν J µ δ(Aν ) − q ηµν (δJ µ )Aν , (144) een eerste term oplevert van de vorm van vergelijking (142), die daarom gebruikt kan worden om de eerdere δL uit te wissen. Merk op dat het feit dat een Lagrangiaan een scalair dient te zijn, ons verplicht om het nieuwe veld Aµ te contraheren met de stroom J µ . Dit dwingt af dat Aµ een vectorveld is. Verder zijn we verplicht aan te nemen dat δAµ = 1q (∂ µ λ), oftewel dat het veld Aµ als volgt wordt verstoord: Aµ → Aµ + δAµ , met 1 δAµ = ∂ µ λ. q (145) Onder deze aannames volgt dat de eerste term van de verstoring gegeven door vergelijking (144) gebruikt kan worden om vergelijking (142) uit te wissen. De nieuwe Lagrangiaan L + L1 is dan helaas nog altijd niet invariant onder lokale ijktransformaties: de verstoring van de nieuwe bijdrage L1 levert namelijk ook nog de tweede term in vergelijking (144), en ook die zal moeten verdwijnen wil de Lagrangiaan invariant zijn. Deze term heeft de volgende vorm: −q ηµν (δJ µ )Aν = −2q(φ∗ φ)ηµν (∂ µ λ)Aν . (146) We moeten daarom nóg een bijdrage L2 toevoegen aan de Lagrangiaan, en wel een waarvan de verstoring δL2 de term 2q(φ∗ φ)ηµν (∂ µ λ)Aν uitwist. Ook hier geldt weer dat het feit dat een Lagrangiaan een scalair is ons verplicht een bijdrage te bedenken die een contractie is, en wel een die op zijn minst het vectorveld Aµ bevat. De keuze ηµν Aµ J ν valt af (deze hadden we al gebruikt), evenals een combinatie van ∂ µ φ en Aµ (deze levert geen verstoring met daarin φ∗ φ), en de enige andere mogelijkheid voor een contractie is daarom ηµν Aµ Aν . Ook zal L2 een scalaire bijdrage van het veld φ en zijn complex geconjugeerde moeten bevatten, aangezien vergelijking (146) dat ook doet. De voor de hand liggende keuze is daarom L2 ∝ ηµν Aµ Aν (φ∗ φ). (147) Het is eenvoudig om aan te tonen dat de verstoring δL2 van deze keuze inderdaad de bijdrage gegeven door vergelijking (146) uitwist. Immers: δL2 ∝ ηµν δ(Aµ Aν )(φ∗ φ) + ηµν (Aµ Aν )δ(φ∗ φ) 2 = ηµν (∂ µ λ)(Aν )(φ∗ φ) q (148) waarin via (145) gebruikt is dat δ(φ∗ φ) = 0 en ηµν δ(Aµ Aν ) = 2q ηµν (∂ µ λ)(Aν ). We zien dat bijdrage L2 inderdaad een verstoring δL2 oplevert die precies vergelijking (146) uitwist, en dat we de waarde van de evenredigheidsconstante moeten kiezen als q 2 . 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 30 Resumerend hebben we nu de oorspronkelijke Lagrangiaan L aangevuld met twee extra termen L1 en L2 en wel zodanig, dat het eindresultaat invariant is onder lokale ijktransformaties. Er kan nog één laatste bijdrage L3 worden toegevoegd, te weten die van de contractie van de afgeleides ∂ν Aµ met zichzelf. De reden een bijdrage als deze toe te voegen is simpelweg compleetheid, de wens de Lagrangiaan zo algemeen mogelijk te maken zonder de invariantie onder lokale ijktransformaties in gevaar te brengen. De volgende bijdrage voldoet daaraan: 1 L3 = − ηµν ηαβ F µα F νβ , 4 waarin F µν ≡ ∂ µ Aν − ∂ ν Aµ . (149) (de waarde van evenredigheidsconstante −1/4 is conventie; de reden dat deze keuze wordt gemaakt volgt dadelijk.) Immers, de verstoring van L3 ten gevolge van lokale ijktransformaties is gelijk aan nul: δL3 ∝ ηµν ηαβ δ(F µα F νβ ) = 2ηµν ηαβ δ(F µα )F νβ = 2ηµν ηαβ (∂ µ δAα − ∂ α δAµ )F νβ 2 ηµν ηαβ (∂ µ ∂ α λ − ∂ α ∂ µ λ)F νβ = 0, = q (150) waar in de laatste stap vergelijking (145) is gebruikt. Alles samengenomen, L +L1 +L2 +L3 , hebben we een Lagrangiaan gevonden die het complexe Klein Gordon veld beschrijft op een manier die invariant is onder lokale ijktransformaties: 1 L = η µν (∂µ φ)(∂ν φ) − m2 φ∗ φ − q ηµν J µ Aν + q 2 ηµν Aµ Aν (φ∗ φ) − ηµν ηαβ F µα F νβ . 4 (151) Vanaf nu zullen we met het symbool L deze ijkinvariante Lagrangiaan bedoelen, en niet meer de oorspronkelijke, niet-ijkinvariante versie. Het is gebruikelijk om deze Lagrangiaan eenvoudiger op te schrijven met behulp van wat nieuwe notatie. Als we de covariante afgeleide definieren als Dµ φ ≡ ∂µ φ + iq Aµ φ, (152) kan de Lagrangiaan versimpeld worden opgeschreven als 1 L = ηµν (Dµ φ)(Dν φ)∗ − m2 φ∗ φ − ηµν ηαβ F µα F νβ . 4 (153) De prijs die we moesten betalen voor het invariant maken van de Lagrangiaan is de introductie van een nieuw vectorveld Aµ . De fysische betekenis van de nieuwe Lagrangiaan zal nu worden bestudeerd. 6.3 Betekenis van Aµ : het Maxwell veld De lokaal ijkinvariante Lagrangiaan L van een ingewikkelder vorm dan de oorspronkelijke, globaal-ijkinvariante, versie, en zal daarom andere fysica voorspellen. Ten eerste zal de Lagrangiaan nu drie afzonderlijke bewegingsvergelijkingen opleveren voor het Klein-Gordon veld φ, zijn complex geconjugeerde φ∗ , en het vectorveld Aµ . Ten tweede zullen de velden, ten gevolge van de termen in de Lagrangiaan die zowel (de afgeleide van) het veld Aµ als (de afgeleide van) de velden φ en φ∗ bevatten, hun opwachting maken in elkaars bewegingsvergelijking! Dit vertelt ons dat de velden een interactie met elkaar hebben: ze beinvloeden elkaars gedrag. We zullen dat nu onderzoeken, en daardoor een fysische interpretatie kunnen toekennen aan het veld Aµ . 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 31 De bewegingsvergelijkingen voor de velden φ, φ∗ , en Aµ worden, zoals altijd, afgeleid met behulp van de Euler-Lagrange vergelijking, vergelijking (104). Voor het Klein-Gordon veld en zijn complex geconjugeerde gelden de Euler-Lagrange vergelijkingen ∂L ∂L ∂L ∂L = ∂ν , = ∂ν , (154) ∂φ ∂(∂ν φ) ∂φ∗ ∂(∂ν φ∗ ) en voor het vectorveld Aµ geldt de Euler-Lagrange vergelijking ∂L ∂L . = ∂ν ∂Aµ ∂(∂ν Aµ ) (155) Wanneer de Lagrangiaan wordt ingevuld, worden de volgende bewegingsvergelijkingen gevonden voor φ en φ∗ : (22 + m2 )φ + 2iq Aµ ∂µ φ + iq (∂µ Aµ ) φ − q 2 ηµν Aµ Aν φ = 0, (156) (22 + m2 )φ∗ − 2iq Aµ ∂µ φ∗ − iq (∂µ Aµ ) φ∗ − q 2 ηµν Aµ Aν φ∗ = 0. (157) Dit zijn de oude Klein-Gordon bewegingsvergelijkingen, met extra bijdragen ten gevolge van de interactie met het vectorveld. Merk op dat de twee bewegingsvergelijkingen elkaars complex geconjugeerden zijn. Voor het vectorveld geeft de linkerkant van vergelijking (155): ∂L ∂Aλ = iqφ (∂λ φ∗ − iqAλ φ∗ ) − iqφ∗ (∂λ φ + iqAλ φ) = iqφ∂λ φ∗ − iqφ∗ ∂λ φ + 2q 2 |φ|2 Aλ = −qJλ , (158) waarin we hebben gedefinieerd J λ ≡ i φ∗ Dλ φ − φDλ φ∗ . (159) De rechterkant van de Euler-Lagrangevergelijking voor het vector veld Aµ wordt als volgt uitgewerkt: ∂L 1 ∂ αµ νβ ∂κ ∂ (η η F F ) = − κ µν αβ 4 ∂(∂κ Aλ ) ∂(∂κ Aλ ) 1 = − ∂κ ((∂ κ Aλ − ∂λ Aκ ) − (∂λ Aκ − ∂ κ Aλ ) 4 + (∂ κ Aλ − ∂λ Aκ ) − (∂λ Aκ − ∂ κ Aλ )) = −∂κ (∂ κ Aλ + ∂λ Aκ ) = −∂κ F κλ . (160) Linker- en rechterzijde samengenomen geeft dan de volgende bewegingsvergelijking voor het vectorveld: ∂µ F µν = qJ ν . (161) Hiermee zijn de drie bewegingsvergelijkingen voor de velden φ, φ∗ en Aµ gevonden. Zoals al aangekondigd was, is te zien dat het complexe Klein-Gordonveld gekoppeld is aan het vectorveld. Het vectorveld heeft daarom fysische betekenis: haar aanwezigheid beinvloedt direct het gedrag van de deeltjes die beschreven worden door het Klein-Gordonveld. Omgekeerd geldt hetzelfde: 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 32 de bewegingvergelijking van het vectorveld wordt bepaald door de aanwezigheid van de KleinGordondeeltjes. Met andere woorden: er vindt een fysisch meetbare interactie plaats tussen het Klein-Gordonveld en het vectorveld. We zullen nu aantonen dat deze interactie de elektromagnetische interactie is, en dat het vectorveld Aµ de beschrijving is van het elektromagnetische veld. Hiertoe wordt allereerst de observatie gemaakt dat de tensor F µν , zoals die gedefinieerd is in vergelijking (149), antisymmetrisch is: er geldt F µν = −F νµ . (Deze definitie was geen keuze; het was noodzakelijk om de Lagrangiaan lokaal ijkinvariant te maken.) De tensor F µν heeft twee indices en daarom 16 elementen, maar de antisymmetrie dicteert dat vier ervan, F 00 , F 11 , F 22 , F 33 , gelijk zijn aan nul en dat van de overgebleven twaalf elementen, er maar zes onafhankelijk zijn. Het is daarom mogelijk om de tensor zonder verlies van algemeenheid als volgt te schrijven 0 −E 1 −E 2 −E 3 E1 0 −B 3 B 2 . F µν = (162) 2 3 E B 0 −B 1 E 3 −B 2 B 1 0 Hierin zijn de E i en B i de namen van de zes onafhankelijke elementen; de plaatsing in de tensor is in principe vrij, maar we hebben zo zodanig geplaatst dat de latere resultaten overeen zullen komen met onze fysische interpretatie. Deze notatie kan compacter worden opgeschreven als: F 0i = −E i , F ij = ijk B k . (163) De bewegingsvergelijking (161) dicteert vervolgens aan welke regels de elementen E i en B i voldoen. Zo zegt de vergelijking, met ν = 0, dat er geldt ~ · E~ ∂µ F 0µ = ∂i E i = ∇ = qJ 0 , (164) oftewel ~ · E~ = qJ 0 . ∇ (165) Dit heeft precies de vorm van de eerste vergelijking van Maxwell. De drie ν = i componenten van de bewegingsvergelijking (161) leveren ∂µ F µ1 = −∂0 E 1 + ∂y B 2 − ∂z B y , ∂µ F µ2 = −∂0 E 2 + ∂x B z − ∂z B x , ∂µ F µ3 = −∂0 E 3 + ∂x B y − ∂y B x . (166) oftewel dE~ ~ ~ = q J~ . +∇×B dt Dit heeft precies de vorm van de vierde vergelijking van Maxwell. − (167) De bewegingsvergelijking voor het vectorveld levert vergelijkingen op die precies de vorm aannemen van twee van Maxwells vergelijkingen voor elektrische velden E~ en magnetische velden ~ Dit is nog niet genoeg om te mogen concluderen dat de elementen E i en B i van de tensor B. F µν daadwerkelijk de fysische betekenis van de elektrische- en magnetische velden hebben: de elementen dienen daartoe ook nog te voldoen aan de twee resterende Maxwell-vergelijkingen, ~ = 0 en ∇ ~ ·B ~ × E~ = −∂0 B. ∇ 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 33 Dat ze dat doen, volgt echter direct uit puur wiskundige overwegingen. Uit de eerdere vergelijkingen F ij = ∂ i Aj − ∂ j Ai en F ij = ijk B k volgen B x = F zy = ∂ z Ay − ∂ y Az , B y = F xz = ∂ x Az − ∂ z Ax , B z = F yx = ∂ y Ax − ∂ x Ay , (168) ~ =∇ ~ × A. ~ B (169) oftewel ~ = 0, wat direct volgt na ~ ·B Deze vergelijking voldoet aan de tweede Maxwellvergelijking ∇ ~ ∇× ~ A) ~ = invulling. Er geldt namelijk dat de divergentie van een rotatie altijd gelijk is aan nul: ∇·( ~ Op deze manier is aangetoond dat aan de tweede 0 is een wiskundige identiteit voor elke vector A. Maxwellvergelijking is voldaan door de elementen B i . ~ Door ~ × E~ = −∂0 B. Ook voldoen de elementen E i en B i aan de laatste Maxwellvergelijking, ∇ vergelijking (169) in deze vergelijking in te vullen vinden we namelijk ~ × E~ + ∂0 A ~ =∇ ~ × (∇A ~ 0) ∇ (170) waarin de definitie van F µν is gebruikt om te schrijven ∂0 Ai = F0i + ∂i A0 , en dat F 0i = −E i . De resterende uitdrukking is gelijk aan nul omdat de rotatie van een gradient altijd gelijk is aan ~ × (∇A ~ 0 ) = 0 is een wiskundige identiteit voor elke scalarfunctie A0 . Op deze manier is nul: ∇ aangetoond dat aan de derde Maxwellvergelijking is voldaan door de elementen E i en B i . Samenvattend hebben we nu gezien dat de elementen van de tensor F µν , vergelijking (162), voldoen aan allevier de Maxwellvergelijkingen, en dus dat deze tensor en zijn bewegingsvergelijking een volledige beschrijving vormen van de gehele leer van de Elektrodynamica! Het vectorveld Aµ wordt dan ook het Maxwellveld genoemd. Deze conclusie kan extra kracht worden bijgezet door het deel van de Lagrangiaan te beschouwen dat het vrije Maxwell-veld beschrijft, L = − 14 ηµν ηαβ F µα F νβ , en hiervan de energie te berekenen volgens het Noether-theorema. Hiertoe vullen we de vrije Lagrangiaan in in vergelijking X, Z Z ∂L λ T00 d3 x = ∂ A − L d3 x ν ∂ 0 Aλ Z 1 µν 0 λ (171) = −F λ∂0 A + F Fµν d3 x. 4 Hierin is de eerste term gelijk aan: Fλ0 ∂0 Aλ = F 00 ∂0 A0 − F 0i ∂0 Ai = −F 0i ∂0 Ai = −F 0i F 0i − ∂i A0 = −(F 0i )2 = −E~ 2 . (172) waarin is gebruikt dat F 00 = 0, F 0i = E i en dat in de Lorentz-gauge geldt dat ∂i A0 = 0. In de tweede term geldt F µν Fµν = ηαµ ηβν F µν F αβ = ηβν F 0ν F 0β − ηβν F iν F iβ = (F 00 )2 − (F 0i )2 − (F i0 )2 + (F ij )2 = −2(F 0i )2 + (F ij )2 = −2E~ 2 + (F ij )2 , (173) 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 34 waarin is gebruikt dat F 00 = 0 en F 0i = E i . De overgebleven term kan worden uitgeschreven door gebruik te maken van het feit dat F ij = −ijk B k : (F ij )2 = ijk ijl B k B l = (2δ 3k δ 3l + 2δ 2k δ 2l + 2δ 1k δ 1l )B k B l = 2B 3 + 2B 2 + 2B 1 ~ 2. = 2B (174) Zo is gevolgd dat ~ 2. F µν Fµν = −2E~ 2 + 2B De energie van het Maxwell veld is nu gevonden: Z Z 1 ~2 0 3 2 2 ~ ~ T0 d x = E + d3 x −2E + 2B 4 Z o 1 n ~2 2 ~ = E + B d3 x. 2 (175) (176) Deze uitdrukking is precies de uitdrukking voor de elektromagnetische energie zoals die ook gevonden wordt in de gebruikelijke (dit wil zeggen, niet-Lagrangiaanse) beschrijving van de elektrodynamica. Dit komt volkomen overeen met onze eerdere conclusie dat het vector-veld Aµ het electromagnetische veld beschrijft. 6.4 Minimale substitutie Het is op dit punt goed om even pas op de plaats te maken om in woorden samen te vatten wat er is gebeurd. Het startpunt was de Lagrangiaan van het complexe Klein-Gordonveld. Dit leek in eerste instantie louter een herformulering, via de regels van de Lagrangiaanse mechanica, van de Klein-Gordonvergelijking die ons al bekend was uit Hoofdstuk ??. Echter, deze formulering stelde ons in staat om te eisen dat de fysica van het veld onafhankelijk moest zijn van een verschuiving van de complexe fase van het veld, en dat deze onafhankelijkheid ook moet gelden wanneer de faseverschuiving op elke plaats een andere waarde had. Immers, het veld moet voldoen aan de eis dat de faseverschuiving niet op elke plaats op hetzelfde moment mag plaatsvinden, omdat dit de regel zou breken dat er in de natuur een maximale snelheid bestaat. Deze eis dicteerde vervolens een aanpassing van de Lagrangiaan, en dwong ons om een nieuw vectorveld in te voeren dat aangetoond kon worden een volledige beschrijving te zijn van de elektrodynamica. Er is dus gebleken dat de eis van lokale ijkinvariantie van het Klein-Gordonveld leidt tot de noodzakelijkheid van het bestaan van elektromagnerische velden. In het bijzonder volgt dat licht bestaat, en, aangezien dit is ingebouwd in de Maxwellvergelijkingen, daarmee de gehele speciale relativiteitstheorie! Dit is een verstrekkende conclusie, volgend uit de simpele eis4 dat quantumvelden lokaal ijkinvariant dienen te zijn. 6.5 Het complexe Klein-Gordonveld en haar interacties Nu de betekenis van het Maxwellveld is vastgesteld, kan worden teruggekeerd naar de bewegingsvergelijkingen (157) van het complexe Klein-Gordonveld, en kan nu een fysische betekenis 4 Bovenstaande argumentatie zou kunnen worden opgevat als een cirkelredenering. Immers, de eis van lokale ijkinvariantie werd gemotiveerd door de aanname dat er een eindige snelheid bestaat in de natuur; allicht is dat dan ook wat er uit onze nieuwe Lagrangiaan zal volgen? Echter, merk op dat de eis veel milder is dan de uiteindelijke conclusie. Immers, de aanname is louter dat er een maximale snelheid bestaat, maar zegt niets over het moeten bestaan van elektrische of magnetische velden, de manier waarop die interactie hebben met elkaar en/of (zoals zal worden besproken in de volgende sectie) met materie, of de speciale relativiteitstheorie met al haar verstrekkende gevolgen over tijd en ruimte. 6 IJKINVARIANTIE: HET BESTAAN VAN FOTONEN 35 worden toegekend aan de termen die er automatisch bijkwamen nadat de Lagrangiaan invariant was gemaakt onder lokale ijktransformaties. Zoals eerder besproken stellen de termen met daarin zowel (de afgeleides van) φ of φ∗ en (afgeleides van) het veld Aµ een interactie voor; het is nu duidelijk dat het de elektromagnetische interactie betreft. Nu kunnen deeltjes alleen een interactie aangaan met elektromagnetische velden wanneer zij een lading hebben. Op deze manier volgt dat het het complexe Klein-Gordonveld elektrisch geladen deeltjes beschrijft. Verder is aan de vorm van de resulterende Maxwellvergelijkingen, vergelijkingen (165) en (167), af te lezen dat qJ 0 de ladingsdichtheid ρ voorstelt, en q J~ de elektrische stroom. De Noetherstroom J ν van vergelijking X is blijkbaar de 4-vector die de elektrische stroom beschrijft; de constante q is dan de lading van de deeltjes beschreven door het Klein-Gordonveld. (Deze laatste observatie wordt versterkt door het feit dat alle interactie met het Maxwellveld verdwijnt wanneer de constante gelijk wordt gekozen aan nul.) Bovendien volgt uit het feit dat de bewegingsvergelijkingen Eqs.(157) louter van elkaar verschillen in het teken voor de constante q, dat zij deeltjes met precies tegenovergestelde lading beschrijven: waar φ deeltjes beschrijft met lading q, beschrijft φ∗ deeltjes met lading −q. De twee bewegingsvergelijkingen bevatten wel dezelfde waarde voor de massa m: de beschreven deeltjes zijn elkaars antideeltjes! Beide deeltjes worden, tezamen met het Maxwell veld en alle onderlinge interacties, beschreven door slechts één enkele Lagrangiaan. 7 DE HIGGS-LAGRANGIAAN 7 36 De Higgs-Lagrangiaan We beschouwen Lagrangiaan 2 1 1 1 1 1 L = (∂µ φ1 )(∂ µ φ1 ) + (∂µ φ2 )(∂ µ φ2 ) + µ2 φ21 + µ2 φ21 − λ φ21 + φ22 . 2 2 2 2 4 (177) Deze Lagrangiaan beschrijft twee scalarvelden φ1 , φ2 tegelijkertijd: de eerste twee termen zijn het kinetische deel van de velden, de twee termen erna de inherente eigenschap ’µ’ van de velden, en de laatste term is de interactie tussen φ1 en φ2 . Een aantal eigenschappen van de twee velden kan snel worden geconcludeerd: wanneer we deze Lagrangiaan vergelijken met die van een Klein-Gordon-deeltje, zien we direkt dat de twee velden een spin hebben van nul. Daaruit volgt dat deze deeltjes voldoen aan Bose-Einstein statistiek, oftewel dat het Pauli Principe niet geldt en er dus een willekeurig aantal φ1 en φ2 deeltjes tegelijkertijd in dezelfde quantumtoestand kunnen zijn. Tenslotte laat de laatste term in de Lagrangiaan zien dat de twee deeltjes een fysische interactie met elkaar aangaan: deze term zal immers, via de Euler-Lagrange vergelijking, termen opleveren in de bewegingsvergelijking van elk deeltje waarin het andere deeltje een rol speelt. Het is eenvoudig om dit expliciet te maken: volgens de Euler-Lagrangevergelijking zijn de bewegingsvergelijkingen van de twee deeltes 22 − µ2 φ1 = −λ φ21 + φ22 φ1 , en 22 − µ2 φ2 = −λ φ21 + φ22 φ2 . Twee verdere conclusies kunnen nog worden getrokken. Ten eerste is duidelijk de ’massa-termen’ µ2 φ1 en µ2 φ2 met het verkeerde minteken uitkomen, en ten tweede is te zien dat de rollen van de twee typen deeltjes geheel symmetrisch zijn: het onderling gelijk verwisselen van de velden φ1 met φ2 levert precies dezelfde Lagrangiaan en bewegingsvergelijkingen op. Deze laatste twee observaties hebben een nauwe verwantschap door middel van het begrip Spontane Symmetriebreking, en zullen cruciaal blijken te zijn voor het Higgs-mechanisme. 7.1 Spontane Symmetriebreking De beschouwde Lagrangiaan heeft een Hamiltoniaandichtheid H die kan worden berekend met de gebruikelijke uitdrukking uit het Noether Theorema H = ∂L ∂L ∂0 φ1 + ∂0 φ2 − L . ∂(∂0 φ1 ) ∂(∂0 φ2 ) (178) Uitgewerkt voor de huidige Lagrangiaan levert dit de volgende uitdrukking op: 1 1 1 1 H = (∂0 φ1 )2 + (∂0 φ2 )2 − µ2 (φ21 + φ22 ) + λ2 (φ21 + φ22 )2 . 2 2 2 4 (179) De ruimteintegraal van deze uitdrukking levert dan de energie op van het fysische systeem, en volgens het Noether Theorema is deze uitdrukking constant in de tijd. Duidelijk is dat de oplossing φ1 = 0, φ2 = 0 niet de minimale energie oplevert voor dit systeem: door (even) te schrijven (φ21 + φ22 ) = x en de afgeleide te nemen van het ’potentiele’ deel van de Hamiltoniaan en die gelijk te stellen aan nul, volgt dat de laagste energietoestand van het systeem voldoet aan µ2 1 2 − λ x=0 2 2 (180) oftewel wanneer er voor de velden geldt φ21 + φ22 = µ 2 λ . (181) 7 DE HIGGS-LAGRANGIAAN 37 Zoals is te zien is er een continuüm aan oplossingen voor deze toestand van laagste energie. Elke keuze is, wat de fysica van het systeem betreft, identiek aan elke andere; immers, de Lagrangiaan is symmetrisch onder elke onderling gelijke verwisseling van de twee velden. We zullen als toestand van laagste energie de volgende kiezen: µ (φ1 )0 = , en (φ2 )0 = 0. (182) λ (waarbij het onderschrift ’0’ aangeeft dat we met de waarde van het veld te maken hebben waarin de energie de laagste waarde heeft). Het wiskundig apparaat van de quantumveldentheorie gaat uit van het principe dat de natuur de laagste energietoestand aan probeert te houden; elke afwijking van de laagste energietoestand (bijvoorbeeld door deeltjes op elkaar te laten botsen in een versneller) moet gezien worden als een verstoring van die laagste energietoestand. Het is daarom handig om de oorspronkelijke Lagrangiaan te herschrijven in een (wiskundig identieke!) vorm waarin het duidelijk is welke bijdragen de laagste energietoestand beschrijven en welke bijdragen de verstoring van de laagste energietoestand. Hiertoe schrijven we de twee velden als φ1 = (φ1 )0 + η, φ2 = (φ2 )0 + ξ, (183) oftewel als een (constante) term (dat zijn (φ1 )0 voor φ1 en (φ2 )0 voor φ2 ) overeenkomend met de laagste energietoestand en een (dynamische) verstoring van die laagste energietoestand (η voor φ1 en ξ voor φ2 ). Voor onze gemaakte keuze levert dit µ φ1 = + η, en φ2 = ξ. (184) λ Door deze herschrijving in te vullen in de Lagrangiaan wordt een (wiskundig identieke!) uitdrukking gevonden die, deze keer, de dynamica van de fysica beschrijft in termen van de afwijkingen η en ξ van de laagste energietoestand van het systeem. Er wordt dan gevonden dat de Lagrangiaan gegeven wordt door ! ! 1 1 L = (∂µ η)(∂ µ η) − µ2 η 2 + (∂µ ξ)(∂ µ ξ) 2 2 ! µ4 1 4 4 2 2 3 2 + µλη + µληξ − λ(η + ξ + 2η ξ ) + 2 . (185) 4 2λ De eerste set haakjes bevat de Klein-Gordon vergelijking voor een deeltje η met massa µ, en de tweede set haakjes de Klein-Gordon vergelijking voor een deeltje ξ met massa nul. Daarna volgen er een aantal interacties van de twee deeltjes met elkaar, en tenslotte is er een constante term (die geen fysische betekenis heeft; hij wordt immers altijd weggedifferentieerd wanneer de Lagrangiaan wordt ingevuld in de Euler-Lagrange vergelijking). Zo is gevolgd dat de Lagrangiaan wel degelijk fysisch acceptabele (dit wil zeggen: met reële massa) deeltjes beschrijft, mits we maar het systeem beschrijven vanuit de toestand met laagste energie. Een deeltjesinterpretatie blijkt pas mogelijk wanneer we velden identificeren die de afwijkingen zijn van de laagste energietoestand. De werkelijke deeltjes worden dus beschreven door de velden η en ξ, en niet door de velden φ1 en φ2 . Het herschrijven van de Lagrangiaan in termen van de afwijkingen van de laagste energietoestand is ten koste gegaan van de symmetrie van de Lagrangiaan: waar de oorspronkelijke versie nog invariant was onder een onderling gelijke verwisseling van de twee velden, is de nieuwe versie dat niet. Met zegt dan dat de symmetrie is gebroken. De algemene regel is dit: na het breken van de symmetrie van een Lagrangiaan door over te gaan op velden die de afwijkingen van de laagste energietoestand beschrijven, worden imaginaire massa’s reëel en zal één van de velden een scalair deeltje beschrijven dat geen massa heeft. Dit feit staat bekend als het Theorema van Goldstone. 7 DE HIGGS-LAGRANGIAAN 7.2 38 Het Higgs-mechanisme In wat volgt zullen we ons verder verdiepen in de symmetrie die de oorspronkelijke Lagrangiaan had. Zoals is besproken is de oorspronkelijke Lagrangiaan invariant onder onderlinge verwisseling van de twee oorspronkelijke velden φ1 en φ2 . Hiermee wordt niet louter bedoeld dat de twee velden door elkaar vervangen mogen worden, maar ook dat de verwisseling zodanig mag zijn dat er net zoveel ’φ1 -heid’ als 0 φ2 -heid’ is voor als na de verwisseling. De velden φ1 en φ2 zijn niet complex maar reëel, waardoor een orthogonale matrix volstaat (een orthogonale matrix O is een matrix waarvan de getransponeerde gelijk is aan de inverse, oftewel een matrix waarvoor geldt dat OT O gelijk is aan de eenheidsmatrix). We zouden daarom de verwisselingstransformatie als een orthogonale matrix kunnen schrijven en dan kunnen uitzoeken wat de consequentie van de invariantie onder deze verwisseling is. Dit is een wiskundig volkomen correcte aanpak, maar het is iets eenvoudiger om de symmetrie als volgt te onderzoeken: de huidige Lagrangiaan staat toe om de twee reële velden φ1 en φ2 te schrijven als een enkel complex veld, Φ. De velden φ1 en φ2 spelen dan de rol van de componenten dit complexe veld Φ. We definieren Φ = φ1 + i φ2 . (186) Hieruit volgt direkt dat we kunnen schrijven: φ21 + φ22 = Φ∗ Φ, (187) en 1 1 1 (∂µ φ1 )(∂ µ φ1 ) + (∂µ φ2 )(∂ µ φ2 ) = (∂µ Φ)(∂ µ Φ)∗ . (188) 2 2 2 Hiermee kan de oorspronkelijke Lagrangiaan geschreven worden in de wiskundig equivalente vorm 1 1 1 L = (∂µ Φ)(∂ µ Φ)∗ + µ2 (Φ∗ Φ) + λ(Φ∗ Φ)2 . 2 2 4 (189) Zoals gezegd is deze omschrijving gedaan om makkelijker de symmetrie van de Lagrangiaan onder verwisseling van de velden φ1 en φ2 te kunnen onderzoeken. Immers, aangezien deze velden nu de componenten zijn van het veld Φ en de componenten van elk complex getal in elkaar kunnen worden overgeschreven door middel van een complexe faseverschuiving, is de nieuwe vorm van de Lagrangiaan invariant onder de transformatie Φ → eiθ Φ. (190) Dit is precies het type transformatie en invariantie dat we al hebben onderzocht in het hoofdstuk over ijkinvariantie, en wat leidde tot het bestaan van fotonen en het Maxwellveld. Precies dezelfde wiskunde kan hier nu direkt worden toegepast om lokale ijkinvariantie te bereiken. In direkte navolging van eerder behandelde stof doen we de stap van de minimale substitutie, ∂µ → ∂µ + iqAµ (191) voor een zeker ijkveld Aµ , gevolgd door de toevoeging aan de Lagrangiaan van een term F µν Fµν die de bijdrage van het vrije Aµ -veld beschrijft. De nieuwe Lagrangiaan is dan ook L = 1 1 1 ∂µ Φ + iAµ Φ ∂ µ Φ∗ − iqAµ Φ∗ − µ2 (Φ∗ Φ) + λ2 (Φ∗ Φ)2 − F µν Fµν , 2 2 4 (192) en deze is lokaal invariant onder de complexe verschuiving eiθ(x) , voor elke functie θ(x). De symmetrie is op dit moment dus nog geheel behouden. Echter, zoals al aangetoond is een goede 7 DE HIGGS-LAGRANGIAAN 39 deeltjesinterpretatie alleen mogelijk wanneer de Lagrangiaan wordt omgeschreven naar de velden die de afwijking zijn van de laagste energietoestand, η en ξ. Hiertoe schrijven we wederom µ φ1 = + η, en φ2 = ξ, (193) λ en werken we de Lagrangiaan uit. We volgende uitdrukking ! 1 µ 2 2 L = (∂µ η)(∂ η) − µ η + 2 vinden dan, na triviale (maar wat lange) algebra de 1 (∂µ ξ)(∂ µ ξ) 2 ! ! 1 qµ µ A Aµ 2 λ + − F µν Fµν + − 2i qµ (∂µ ξ)Aµ + λ qη(∂µ ξ)Aµ − qξ(∂µ η)Aµ + µ 2 λ ! 2 1 µ2 . − λµ(η 3 + ηξ 2 ) − λ2 (η 4 + 2η 2 ξ 2 + ξ 4 ) + 4 2λ 1 ηAµ Aµ + q 2 (ξ 2 + η 2 )Aµ Aµ 2 (194) Hiermee is de symmetrie gebroken: door over te zijn gegaan op de afwijkingen η en ξ van de laagste energietoestand is de symmetrie van de oorspronkelijke Lagrangiaan verloren gegaan. Als gevolg hiervan is, net zoals in het globaal ijkinvariante geval, er een correcte deeltjesinterpretatie van de velden η en ξ voor teruggekomen: in de eerste regel beschrijft de eerste set haakjes een scalair deeltje met reële massa en de tweede set haakjes een massaloos scalardeeltje (het Goldstone boson). Uiteraard zijn er vele extra termen bijgekomen die, net als in onze eerdere behandeling van het lokaal ijkinvariant maken van Klein-Gordon velden, de interactie van het Maxwellveld Aµ met de velden η en ξ beschrijven. Deze interacties, beschreven door de gehele derde regel, is een stuk ingewikkelder dan voorheen, als direkt gevolg van het breken van de symmetrie. Bovendien blijkt dat de twee componenten η en ξ van het veld Φ ook interactie met elkaar hebben, en wel via de gehele vierde regel. Deze zelf-interactie is het direkte gevolg van de aanwezigheid van de term ∝ (Φ∗ Φ)2 in de Lagrangiaan. In de zo resulterende theorie is het Maxwell-veld dus niet louter het elektromagnetische veld dat de interactie tussen fotonen en Klein-Gordondeeltjes beschrijft, maar tevens het veld dat de interactie beschrijft tussen de twee typen Klein-Gordondeeltjes zelf. De enige regel die we nog niet hebben beschouwd is de tweede, en het is hier dat het beroemde Higgs-mechanisme zich presenteert. In deze regel staat de bijdrage van de Lagrangiaan die het vrije Maxwell-veld beschrijft: F µν Fµν ; deze bijdrage is nog in complete overeenkomst met de eerdere behandeling van het lokaal ijkinvariant maken van het Klein-Gordonveld. Deze keer, echter, heeft de Lagrangiaan van het vrije Maxwell-veld een extra bijdrage, ∝ Aµ Aµ . Deze bijdrage is kwadratisch in het Maxwell-veld zelf, en stelt daarom een massa-term voor: wanneer de Lagrangiaan van het vrije Maxwell-veld in de betreffende Euler-Lagrangevergelijking wordt gesubstitueerd om zo de bewegingsvergelijking te vinden voor de fotonen, dan volgt een KleinGordon-achtige vergelijking5 waarin het veld Aµ zelf voorkomt. Deze term heeft, net zoals in het geval van een Klein-Gordon vergelijking, de fysische betekenis van een massa. Dit betekent dat in deze theorie fotonen massa hebben gekregen! Het is op dit punt goed om even pas op de plaats te maken: we zijn begonnen met een Lagrangiaan waarin twee deeltjes en hun onderlinge interactie werden beschreven. De Lagrangiaan was van 5 Het is officieel geen Klein-Gordon vergelijking, omdat de oplossing geen scalair deeltje is. In plaats daarvan heet de bewegingsvergelijking de Proca-vergelijking, en deze heeft veelal dezelfde eigenschappen als de KleinGordon vergelijking. Met name geldt óók in de Proca-vergelijking dat elke term evenredig met de oplossing zelf een massa-term voorstelt. 7 DE HIGGS-LAGRANGIAAN 40 een type dat toeliet dat de twee velden onderling met elkaar worden verwisseld, en we zijn in staat gebleken deze Lagrangiaan te schrijven als die van één enkel, complex veld, waarin de verwisselingssymmetrie zich presenteerde als de vrijheid om het complexe veld een willekeurige globale complexe fase te geven. Door vervolgens op te leggen dat deze symmetrie ook lokaal moet gelden werd minimale substitutie toegepast, en werd een lokaal ijkinvariante versie van de Lagrangiaan gevonden. Deze draagt, zoals we al eerder hadden gezien, een Maxwellveld mee, waarmee de interactie tussen de velden en het Maxwellveld werd vastgelegd. Tenslotte werd er gebruik gemaakt van het feit dat de velden niet de laagste energietoestand beschrijven van het systeem; door tenslotte over te gaan op nieuwe velden als verstoringen van de laagste energietoestand. werd de theorie herschreven in een vorm die een massaloos scalardeeltje ξ beschrijft, een massief scalardeeltje η, en kreeg het Maxwell-veld een massa. Deze procedure heet het Higgs-mechanisme. Tenslotte kan een laatste herschrijving worden gedaan. Door expliciete constructie is de theorie invariant gemaakt onder verschuiving van de complexe fase, wat er fysisch op neerkomt dat de velden φ1 en φ2 op elke plek en op elk tijdstip naar willekeur onderling verwisseld mogen worden. In termen van de velden η en ξ bestaat die vrijheid nog altijd: door een geschikte keuze te maken voor de faseverschuiving θ(x) mogen op elke plek en op elk tijdstip de velden η en ξ in elkaar worden overgeschreven zonder dat dat de fysica beschreven door de Lagrangiaan verandert. Het is dan eenvoudig om aan te tonen dat er een keuze voor θ(x) mogelijk is die het Goldstone boson ξ en zijn afgeleiden gelijk maakt aan nul, zodat er volgt ξ = 0, en ∂µ ξ = 0. Voor deze specifieke keuze van de ijking reduceert de Lagrangiaan, tenslotte, tot ! ! qµ 1 1 L = (∂µ η)(∂ µ η) − µ2 η 2 + − F µν Fµν + Aµ Aµ 2 2 λ ! 2 µ 2 1 µ2 1 . − ηAµ Aµ + q 2 η 2 Aµ Aµ − λµη 3 − λ2 η 4 + λ 2 4 2λ (195) (196) Deze Lagrangiaan, uiteindelijk, beschrijft één enkel massief scalair deeltje η, en zijn interactie met een massief Maxwellveld Aµ . Het is op deze manier dat massieve krachtvelden worden gerealiseerd in de natuur: de Z- en W -bosonen van de zwakke interactie.