Kapitel 5
Quanten und Relativität

3  Wechselwirkungen und das Eichprinzip

Zusammenfassung des Buchkapitels:

Die Quantenfeldtheorie der elektromagnetischen Wechselwirkung (Quantenelektrodynamik, QED) haben wir im vorherigen Kapitel kennengelernt. Wie sieht nun die entsprechende Quantenfeldtheorie der starken Wechselwirkung aus (man nennt sie Quantenchromodynamik, QCD)?

Problem: Es gibt keine makroskopischen Kraftfelder der starken Wechselwirkung in der Natur, da die starke Wechselwirkung im Inneren der Hadronen gleichsam eingeschlossen ist. Daher können wir auch die klassischen Feldgleichungen (das Gegenstück zu den Maxwellgleichungen) nicht experimentell ermitteln. Wir müssen sie erraten. Es gibt zum Glück einige Prinzipien und Ideen, die dabei helfen:

Die fundamentale Idee von Eichtheorien liegt in einem verallgemeinerten geometrischen Prinzip begründet. Man startet beispielsweise mit einem Fermion und beschreibt dieses Fermion durch ein Fermionfeld (Zeigerfeld), das sich durch Raum und Zeit erstreckt. Pro Ladungsart, die dieses Fermion annehmen kann, hat man ein Fermionfeld zu berücksichtigen, wobei Antiladungen nicht separat gezählt werden. Für ein Elektron hätte man demnach beispielsweise nur ein Fermionfeld für die negative elektrische Ladung zu berücksichtigen.

Die Forderung lautet nun: Wenn man die Fermion-Zeigerfelder lokal unterschiedlich verdreht und mischt, so soll sich dies physikalisch nicht auswirken (man spricht von einer lokalen Eichtransformation -- Details dazu findet man im Buchkapitel sowie unten in den Zusatzinfos). Diese Forderung erzwingt die Existenz weiterer Felder, die sich ebenfalls lokal unterschiedlich mitändern und so die Änderungen der Fermionfelder auffangen und neutralisieren. Diese zusätzlichen Felder (Eichfelder oder Eichpotentiale genannt) repräsentieren dann die Wechselwirkung zwischen den Fermionen. In der Elektrodynamik sind diese zusätzlichen Felder die sogenannten elektromagnetischen Potentiale, aus denen sich das elektrische und magnetische Feld direkt berechnen lässt. Die entsprechende Eichtransformation in der Elektrodynamik eines Elektrons wäre das Verdrehen des Elektron-Zeigerfeldes (man spricht von einer U(1)-Eichtransformation), das durch eine entsprechende Eichtransformation der elektromagnetischen Potentiale aufgefangen wird. Diese Transformation der elektromagnetischen Potentiale verändert nicht die elektrischen und magnetischen Felder, die sich aus den Potentialen ergeben, wirkt sich also wie gefordert physikalisch nicht aus (siehe auch unten)! Die so generierte Feldtheorie ist gerade die Theorie der elektromagnetischen Wechselwirkung.

Bei der starken Wechselwirkung hätten wir es mit Zeigerfeldern für Quarks zu tun. Dabei kann ein Quark die drei Farbladungen rot, gelb oder blau annehmen, und entsprechend hätten wir drei Zeigerfelder (eines für jede Farbladung). Die entsprechende Eichtransformation zum Mischen und Verdrehen dieser drei Felder ist eine sogenannte SU(3)-Eichtransformation. Die Eichfelder, die man einführen muss, um die Quarkfeld-Änderungen aufzufangen, müssten dann die starke Wechselwirkung zwischen den Quarks ergeben. Man erhält auf diese Weise klassische Feldgleichungen für die starke Wechselwirkung, analog zu den Maxwellgleichungen. Dabei ergibt sich, dass sich die starken Eichfelder gegenseitig beeinflussen, so wie wir das früher bereits erwartet haben. Ein erster Teilerfolg!

Auf dieser Basis können wir nun mit Hilfe der bekannten Quantisierungsverfahren zu einer Quantentheorie der starken Wechselwirkung übergehen: der Quantenchromodynamik (QCD). Die QCD stellt uns dabei den folgenden Satz von Bausteinen für Feynmangraphen zur Verfügung:



Die grundlegenden Bausteine für Feynmangraphen in der QCD.

Es ergeben sich also wieder Linien für Quarks und Gluonen sowie ein Quark-Gluon-Vertex, analog zur QED. Neu sind zwei weitere Vertices: ein Drei-Gluon-Vertex und sogar ein Vier-Gluon-Vertex. Sie bewirken, dass Gluonen direkt miteinander wechselwirken können. Damit erhält die QCD eine Struktur, die sie stark von der Struktur der QED unterscheidet.

Da Gluonen direkt miteinander wechselwirken können, kann man ihnen eine starke Farbladung zuordnen. Gluonen transportieren gewissermaßen Farbladungen zwischen den Quarks hin und her, und zwar pro Gluon eine Farbladung in die eine Richtung und zugleich eine andere Farbladung in die Gegenrichtung:



Transport der starken Farbladungen innerhalb eines Baryons bzw. Mesons durch die Gluonen (dargestellt durch die horizontalen Rechtecke; die Quarks laufen senkrecht nach oben).

Leider sind Feynmangraphen bei der starken Wechselwirkung nur sehr begrenzt einsetzbar, da die starke Farbladung zu größeren Abständen hin anwächst und so schnell zu groß für die Störungstheorie wird (d.h. Graphen mit vielen Vertices können nicht mehr vernachlässigt werden). Mehr dazu in den nächsten Kapiteln.



Zusatzinformationen:

a) Eichsymmetrie bei der elektromagnetischen Wechselwirkung
b) Eichsymmetrie bei allgemeineren Eichgruppen, z.B. SU(3) für die starke Wechselwirkung
c) Eichsymmetrie, verborgene Zusatzdimensionen und allgemeine Relativitätstheorie
d) Eichsymmetrie und die Quantenfeldtheorie masseloser Teilchen mit Spin 1
e) Der Zusammenhang zwischen Impuls und Geschwindigkeit im Vektorpotential


a) Eichsymmetrie bei der elektromagnetischen Wechselwirkung

(für Leser mit mathematisch-physikalischem Hintergrundwissen gedacht)

Wie kommt es zu der Eichsymmetrie in den Quantentheorien des Standardmodells? Versuchen wir zunächst, am einfachsten Beispiel (der elektromagnetischen Wechselwirkung) eine Erklärung dafür zu finden:

In der klassischen Theorie des elektromagnetischen Feldes startet man zunächst mit dem elektrischen Feld E und dem Magnetfeld B. Das reicht dort aus, um mit Hilfe der Maxwellgleichungen alle klassischen elektromagnetischen Phänomene zu beschreiben. Insbesondere wirken diese Felder immer lokal auf elektrisch geladene Teilchen, d.h. die Kraft auf ein solches Teilchen, das sich am Ort x befindet, wird vollständig durch die elektromagnetischen Felder E(x) und B(x) an diesem Ort x beschrieben. Genau das war auch ursprünglich die Motivation dafür, diese Felder überhaupt zu definieren.

Sobald man jedoch zur Quantentheorie übergeht, findet man Phänomene, die nicht lokal durch die elektromagnetischen Felder beschrieben werden können. Ein Beispiel dafür ist der bekannte Aharonov-Bohm-Effekt (siehe Wikipedia-Links unten), bei dem man das Doppelspalt-Interferenzexperiment aus Kapitel 2.3 leicht abwandelt: Man lässt Elektronen durch einen Doppelspalt fliegen und integriert in die Wand zwischen den beiden Spalten eine sehr lange dünne Magnetspule, in die die Elektronen nicht eindringen können. Die Elektronen fliegen also entweder durch den linken oder rechten Spalt und damit links oder rechts an der Magnetspule vorbei. siehe folgendes Bild:



Der Aharanov-Bohm-Effekt. In der Wand zwischen dem Doppelspalt befindet sich eine Spule (grün), die in ihrem Inneren ein Magnetfeld B erzeugt, das senkrecht aus der Bildebene heraus zeigt. In rot sind zwei mögliche Wege für Elektronen dargestellt, die von der Quelle zu einem Punkt auf dem Leuchtschirm hinter dem Doppelspalt führen. Die beiden roten Wege umschließen eine Fläche F, die von dem Magnetfeld durchstoßen wird, so dass man den Fluss des Magnetfeldes durch die Fläche F angeben kann.


Die Wellenfunktionspfeile dieser beiden ununterscheidbaren Möglichkeiten müssen nun addiert werden und ergeben zusammen die Wahrscheinlichkeitsamplitude dafür, dass das Elektron an einer bestimmten Stelle auf dem Leuchtschirm hinter dem Doppelspalt auftrifft. Man stellt nun fest, dass die beiden Pfeile und damit das Interferenzmuster auf dem Leuchtschirm davon abhängen, wie stark das Magnetfeld in der Spule ist. Außerhalb der Spule gibt es aber praktisch kein Magnetfeld, da die Spule sehr lang sein soll. Die Elektronen werden also von dem Magnetfeld in der Spule beeinflusst, obwohl sie gar nicht durch das Magnetfeld fliegen können. Die lokale Beschreibung, bei der nur die elektromagnetischen Felder am Ort des Teilchens dieses beeinflussen können, funktioniert in der Quantentheorie nicht mehr. In der klassischen Physik hatte man den elektromagnetischen Feldbegriff aber gerade deshalb eingeführt, um solche Fernwirkungen zu vermeiden und eine lokale Beschreibung der elektromagnetischen Kräfte zwischen Ladungen zu ermöglichen. In der Quantentheorie kann das elektromagnetische Feld diesen Anspruch nicht mehr erfüllen (siehe dazu auch Feynmans Vorlesungen über Physik, Band 2, Kapitel 15-4 und 15-5).

In der genauen Analyse stellt man fest, dass durch das Magnetfeld in der Spule der Winkel (die Phase) zwischen den beiden Wellenfunktionspfeilen verändert wird, und zwar proportional zum magnetischen Fluss, der die Fläche F zwischen den beiden Wegmöglichkeiten des Elektrons durchstößt, also anschaulich proportional zur Anzahl Feldlinien, die von den beiden Elektronwegen umfasst werden. Die genaue Formel für die Winkelveränderung α lautet:

  α   =   q/hq   ∫F B df

Dabei ist q die Teilchenladung und hq das Plancksche Wirkungsquantum (durch 2π). Den magnetischen Fluss   ∫F B df   durch die Fläche F kann man nach dem Satz von Stokes in ein Linienintegral über den Rand δF dieser Fläche umwandeln, also in ein Linienintegral über den geschlossenen Weg, den die beide Elektronwege zusammen bilden. Dazu verwendet man, dass das Magnetfeld quellenfrei ist ( div B = 0 ) und daher als Wirbelstärke eines Feldes A geschrieben werden kann, das man als Vektorpotential bezeichnet (siehe Zusatzinfos zu Kapitel 1.4 ):

  B   =   rot A  

Damit ist nach Stokes

  ∫F B df   =   ∫F (rot A) df   =   ∫δF A ds

Der magnetische Fluss kann also durch ein Linienintegral ausgedrückt werden, mit dem das Vektorpotential entlang der beiden möglichen Elektronwege aufsummiert wird, wobei der obere Weg rückwärts durchlaufen wird. Mit Hilfe des Vektorpotentials A lässt sich also die lokale Beschreibung retten, nach der ein Feld nur am (möglichen) Teilchenort auf das Teilchen einwirkt. Dies ist der Grund dafür, warum es in der Quantentheorie viel natürlicher und einfacher ist, statt dem Magnetfeld B das Vektorpotential A zu verwenden, denn dann können die entsprechenden Quantengleichungen (z.B. die Schrödingergleichung) weiterhin lokal formuliert werden.

Es ist recht einfach, im obigen Beispiel die konkrete Formel für A anzugeben. Dazu legen wir den Koordinatenursprung in den Mittelpunkt der Spule, verwenden in der Ebene Polarkoordinaten r und φ und bezeichnen den Radius der Spule mit R. Im Inneren der Spule (also im Abstand r vom Ursprung mit r < R) ist dann   A   =   1/2 B r eφ   , wobei eφ der Einheitsvektor in Winkelrichtung ist. Im Außenraum der Spule (also r > R) ist dagegen   A   =   1/2 B R2/r eφ   . Das Vektorpotential windet sich also kreisförmig um die Mittelachse der Spule und nimmt innen proportional zu r zu, außen dagegen proportional zu 1/r ab. Also ist das Vektorpotential auch außerhalb der Spule ungleich Null, wobei allerdings seine Rotation und damit das Magnetfeld außen Null sind. Wegintegrale von A über geschlossene Wege ergeben im Außenraum nur dann Werte ungleich Null, wenn sie die Spule umlaufen und damit den magnetischen Fluss in der Spule umschließen.

Analog zum Magnetfeld stellt man fest, dass man in der Quantentheorie statt dem elektrischen Feld E besser das elektrische Potential Φ verwendet, so dass gilt:

  E   =   − grad Φ − dA/dt  

(siehe Zusatzinfos zu Kapitel 1.4 ).

Nun sind die beiden Potentiale Φ und A nicht eindeutig. Man kann sie verändern, ohne dass dadurch das elektrische oder magnetische Feld geändert werden oder beispielsweise der magnetische Fluss. Diese Veränderung der Potentiale nennt man Eichtransformation. Es bietet sich an, dazu zur Vierervektor-Schreibweise der speziellen Relativitätstheorie überzugehen, also die Felder E und B zu einer 4-mal-4-Matrix (Feldstärketensor) F mit Komponenten Fμν zusammenzufassen und die Potentiale Φ und A zu einem Vierervektor (Viererpotential oder Eichpotential oder auch Eichfelder) A mit Komponenten Aμ und

  A   =   (Φ/c, A)

(siehe Zusatzinfos zu Kapitel 1.4 ). Die obigen Gleichungen für die elektromagnetischen Felder lassen sich dann in der Form

  Fμν   =   δμ Aν   −   δν Aμ  

schreiben. Dabei sind   δμ   die Ableitungen nach Raum und Zeit, d.h.   δ0 = δ0 = d/dx0 = 1/c d/dt   und   δk = − δk = − d/dxk   mit k = 1, 2, 3. Eine Eichtransformation wandelt dann die Potentiale Aμ in neue Potentiale A'μ um nach der Formel

  A'μ   =   Aμ   +   δμ χ

mit einer beliebigen skalaren Funktion χ. In der üblichen Vektorschreibweise lautet diese Gleichung

  Φ'   =   Φ   +   dχ/dt
  A'   =   A   −   grad χ

Alle physikalisch beobachtbaren Größen dürfen sich durch eine solche Eichtransformation nicht ändern. Sie müssen eichinvariant sein. So ergeben A und A' dieselben elektromagnetischen Felder F, denn wegen der Vertauschbarkeit von partiellen Ableitungen (bei hinreichend gutartigem χ) ist
  δμ δν χ   −   δν δμ χ   =   δμ δν χ   −   δμ δν χ   =   0

Fassen wir zusammen:

Bedeutung der Eichpotentiale:

  • Elektrische und magnetische Felder lassen sich als geeignete Raum-Zeit-Ableitungen von Eichpotentialen schreiben.

  • In der klassischen Physik wirken die elektromagnetischen Felder lokal auf geladene Teilchen, d.h. die Felder am Teilchenort bestimmen die darauf wirkende Kraft.

  • In der Quantenphysik wirken die elektromagnetischen Felder nichtlokal auf geladene Teilchen, d.h. auch wenn die möglichen Teilchenwege nicht durch ein solches Feld führen, so hat der von diesen Wegen umschlossene Fluss des Feldes Einfluss auf das Interferenzergebnis dieser Wege (Aharonov-Bohm-Effekt). Man kann dies lokal durch die Eichpotentiale entlang der möglichen Teilchenwege beschreiben. Eichpotentiale bieten also die Möglichkeit, den Einfluss elektromagnetischer Felder auch in der Quantentheorie weiterhin lokal zu beschreiben. Daher stellen Eichpotentiale die einfachste und natürlichste Möglichkeit dar, den Einfluss elektromagnetischer Felder in der Quantentheorie zu beschreiben.

  • Verschiedene Eichpotentiale, die man über Eichtransformationen ineinander umrechnen kann, sind physikalisch gleichwertig, denn sie führen zu denselben elektromagnetischen Feldern. Physikalisch beobachtbare Größen dürfen sich also bei solchen Veränderungen der Eichpotentiale nicht ändern -- sie müssen eichinvariant sein, auch wenn man sie mit Hilfe von Eichpotentialen formuliert.

Aus Kapitel 2.4 wissen wir: Beim Übergang von der klassischen Theorie zur Quantentheorie verlieren Kraft und Geschwindigkeit an Bedeutung und Energie und Impuls werden zu den zentralen Größen, da sie direkt mit der Frequenz und der Wellenlänge von Quantenwellen zusammenhängen. In der klassischen Theorie sind die elektromagnetischen Felder mit dem Kraftbegriff verbunden, während die elektromagnetischen Potentiale Φ und A, mit Energie und Impuls eng verknüpft sind. Es ist daher nicht ganz überaschend, dass diese Potentiale in der Quantentheorie nun die Felder verdrängen und zu den dominierenden Größen werden.

Wie baut man nun die Eichpotentiale in eine quantenmechanische Gleichung ein, die zuvor freie Fermionen beschrieben hat und die nun Fermionen der Ladung q in einem elektromagnetischen Potential beschreiben soll? Der Aharanov-Bohm-Effekt zeigt die Richtung. Die entsprechende allgemeine Regel lautet folgendermaßen:

Ein elektromagnetisches Potential ändert die Phase der Wahrscheinlichkeitsamplitude dafür, dass ein geladenes Teilchen mit Ladung q einen Weg γ beschreitet, um den Wert

  α   =   − q/hq   ( ∫γ Φ dt   −   ∫γ A ds )   =   − q/hq   ∫γ Aμ dxμ

(mit Einsteinscher Summenkonvention, also Summe über μ)

Dieses Gesetz ersetzt in der Quantentheorie das klassische elektromagnetische Kraftgesetz. Man kann nachweisen, dass man im klassischen Grenzfall (sehr kleine Wellenlänge im Vergleich zu Potentialänderungen etc.) das klassische Kraftgesetz zurückgewinnt, denn über die Interferenz eng benachbarter Wege kommen die Ableitungen der Potentiale und damit die elektromagnetischen Felder wieder ins Spiel (siehe z.B. Feynman Vorlesungen über Physik, Band 2, Kap. 15-5).

Es ist nun wie folgt leicht zu sehen, dass dieses Gesetz unser Ergebnis für den Aharanov-Bohm-Effekt von oben reproduziert:

Das elektrische Potential Φ ist im obigen Doppelspaltexperiment gleich Null und das Vektorpotential A ist zeitlich konstant. Jeder Weg γ1 von der Quelle durch den oberen Spalt zu einem festen Punkt x auf dem Leuchtschirm ergibt dieselbe Zusatzphase   α1(x)   =   q/hq   ∫γ1 A ds   im Vergleich zur Situation ohne Magnetfeld. Dabei hängt   α1(x)   nicht von der genauen Form des Weges ab, denn außerhalb der Spule ist   rot A = 0   . Analog ist es mit jedem Weg γ2 durch den unteren Spalt zum selben Punkt x auf dem Leuchtschirm.

Wir bezeichnen mit   ψ1(x)   die Wellenfunktion am Leuchtschirmpunkt x, die sich durch Überlagerung aller Wegamplituden von der Quelle zum Ort x ergibt, sofern der Weg durch den oberen Spalt führt und das Magnetfeld noch ausgeschaltet ist. Analog entsteht   ψ2(x)   durch die Wege durch den unteren Spalt bei ausgeschaltetem Magnetfeld. Die Überlagerung   ψ1(x)   +   ψ2(x)   ergibt dann das bekannte Doppelspalt-Interferenzmuster. Nach dem Einschalten des Magnetfeldes in der Spule erhalten alle Wegamplituden durch den oberen bzw. unteren Spalt ihre Zusatzphase, so dass auch die beiden Wellenfunktionen diese Phase erhalten. Sie überlagern sich dann zu

  ψ1(x) ei α1(x)   +   ψ2(x) ei α2(x)   =   ei α1(x)   [ ψ1(x)   +   ψ2(x) ei (α2(x) − α1(x)) ]

Der vorgezogene Term   ei α1(x)   spielt für das Betragsquadrat der Summe keine Rolle. Es verändert sich aber die relative Phase zwischen den beiden Wellenfunktionen um den Wert

  α(x)   =   α2(x) − α1(x)   =   q/hq   ( ∫γ2 A ds   − ∫γ1 A ds )   =   q/hq   ∫δF A ds   =   q/hq   ∫F B df

wobei γ2 und der umgedrehte Weg (− γ1) zusammen den geschlossenen Weg δF bilden, der die Fläche F umschließt. Das war genau unser Ergebnis von oben für den Aharanov-Bohm-Effekt.

Nun hatten wir ja oben bereits festgestellt, dass das elektromagnetische Potential A(x) nicht eindeutig ist, sondern durch eine Eichtransformation verändert werden kann, wobei sich das physikalisch nicht auswirken darf. Andererseits verändert eine Eichtransformation aber normalerweise den Wert der Zusatzphase   α   =   − q/hq   ∫γ Aμ dxμ   . Auch diese Phase ist demnach nicht eindeutig, wobei sich dies physikalisch nicht auswirken darf. Und das tut es auch glücklicherweise nicht, denn der Eich-Zusatzterm zur Phase lässt sich für Wege γ, die in einem einfach zusammenhängenden Gebiet von der Quelle a zum Zielpunkt x führen, schreiben als

  ∫γμ χ) dxμ   =   χ(x) − χ(a)

mit impliziter Summe über μ. Dabei bedeutet einfach zusammenhängend, dass das Gebiet keine Löcher haben darf, in die die Wege nicht eindringen dürfen. Alle Wege innerhalb eines einfach zusammenhängenden Gebietes von einem Quellpunkt a zu einem Punkt x erhalten also durch eine Eichtransformation des Potentials dieselbe Phasenänderung, so dass sich das Betragsquadrat der zugehörigen Amplituden-Summe nicht ändert. Physikalisch wirkt sich diese Phasenänderung also nicht aus, da sie nur Orts-abhängig ist, aber Weg-unaghängig für Wege aus dem einfach zusammenhängenden Gebiet.

Das kennen wir auch schon vom Aharanov-Bohm-Effekt: Alle Amplituden zu Wegen γ1 von der Quelle durch den oberen Spalt zum Punkt x erfahren durch das Vektorpotential dieselbe wegunabhängige Phasenänderung α1(x), so dass die daraus entstehende Wellenfunktion ψ1(x) dort zu   ψ1(x) ei α1(x)   wird. Das sieht genauso aus wie die wegunabhängige Phasenänderung aufgrund einer Eichtransformation, und tatsächlich kann man in dem einfach zusammenhängenden Gebiet, durch das die Wege γ1 laufen dürfen, das Vektorpotential in der Form   A = − grad χ   schreiben, also als Ableitung einer skalaren Funktion (nämlich der Funktion   χ = − 1/2 B R2 φ   mit dem Polarkoordinatenwinkel φ um die Spulen-Achse herum, wobei wie oben R der Spulenradius und B das Magnetfeld in der Spule sind). Das Vektorpotential lässt sich also in diesem Gebiet aus dem Potential   A = 0   durch eine reine Eichtransformation gewinnen -- man sagt auch, es ist eine reine Eichung. Entsprechend darf sich auch die Phase α1(x) physikalisch nicht auswirken, solange wir nur Wege vom Typ γ1 betrachten (also z.B. den unteren Spalt schließen). Analog ist es mit der wegunabhängigen Phasenänderung α2(x) bei ausschließlicher Berücksichtigung der unteren Wege.

Sobald wir jedoch obere und untere Wegen zugleich zulassen, entsteht ein Gebiet mit einem Loch, durch das die Wege nicht hindurch dürfen. Das Loch ist dabei das Spuleninnere, also der Bereich, in dem ein Magnetfeld existiert. Nun lässt sich das Vektorpotential A nicht mehr im gesamten Gebiet als reine Eichung schreiben, denn die Funktion   χ = − 1/2 B R2 φ   macht bei irgendeinem Wert von φ einen Sprung um 2π. Wege oben und unten herum ergeben nicht mehr dieselbe Phase, und der Phasenunterschied zwischen diesen beiden Weg-Typen ist eichinvariant (denn er entspricht dem magnetischen Fluss durch das Loch). Daher tritt ein physikalischer Effekt auf -- der Aharanov-Bohm-Effekt.

Zurück zur allgemeinen Diskussion: Die oben dargestellte Regel zur Amplitudenveränderung durch ein Potential bezieht sich auf alle möglichen Wege, die ein geladenes Teilchen zurücklegen kann. Die Summe aller möglichen Wege ergeben zusammen ein sogenanntes Pfadintegral (eine Idee, die auf Richard Feynman zurückgeht). Wir gehen hier nicht näher darauf ein -- mehr dazu siehe unter Die Grenzen der Berechenbarkeit, Kap. 5.4.3 Die Quantisierung der klassischen Mechanik.

Man kann die obige Regel für Weg-Amplituden in eine Regel für Differentialgleichungen wie die Schrödinger- oder die Dirac-Gleichung übersetzen. Dazu muss man sich anschauen, wie sich das Pfadintegral für sehr kleine Zeitintervalle ε verhält, und kann dann aus der ersten Ordnung in ε die entsprechende Differentialgleichung ableiten. Dabei findet man, dass sich das Potential A in der folgenden Weise in den Differentialgleichungen niederschlägt (verglichen mit dem Fall ohne Potential A):

Prinzip der minimalen Kopplung:

Ersetze die Energie-Impuls-Operatoren   Pμ   durch

  Pμ   −   q Aμ

mit dem Vierer-Potential   A = (Aμ) = (Φ/c, A)   . Herunterziehen der Indices über die übliche Minkowskimetrik ergibt mit   Pμ   =   i hq δμ   (mit   δμ = d/dxμ   ) die Regel: Ersetze   i hq δμ   durch   i hq δμ   −   q Aμ   , was nach Division durch   i hq   die folgende gleichwertige Regel ergibt:

Ersetze die Raum-Zeit-Ableitungen   δμ   durch die sogenannten kovarianten Ableitungen

  Dμ   :=   δμ   +   i q/hq Aμ

(wobei dies nicht die kovarianten Ableitungen aus der allgemeinen Relativitätstheorie sind, obwohl es viele Ähnlichkeiten mit diesen gibt -- daher die Bezeichnungsweise).

Aus   c δ0 = d/dt   wird also   c δ0   +   i q/hq c Aμ   =   d/dt   +   i q/hq Φ   und
aus   δk = d/dxk   mit k = 1, 2, 3 wird   δk   +   i q/hq Ak   =   d/dxk   −   i q/hq Ak   .

Ein Beispiel: Aus der freien Schrödingergleichung   i hq d/dt ψ   =   P2/(2m) Ψ   wird durch ein elektromagnetisches Potential   A = (Aμ) = (Φ/c, A)   die Gleichung   (i hq d/dt   −   q Φ) ψ   =   (P − q A)2 / (2m) ψ   oder umgestellt dann

  i hq d/dt   ψ   =   [ (P − q A)2 / (2m)   +   q Φ) ]   ψ  

Unter e) kann der daran interessierte Leser unten (in Anlehnung an Feynman) noch eine anschauliche Begründung dafür finden, warum die Schrödingergleichung in einem Magnetfeld gerade diese Form haben muss.

Was geschieht aber nun, wenn wir bei Aμ eine Eichtransformation vornehmen, also Aμ durch A'μ ersetzen? Das sollte physikalisch ja keinen Unterschied machen. Aber: die Differentialgleichung verändert sich, da sie nun A enthält! Von oben wissen wir aber auch, dass eine Eichtransformation von A zu einer zusätzlichen Phase der Form   − q/hq χ(x)   führt, wobei diese reine Eich-Phase keine physikalischen Auswirkungen hat (die Phase χ(a) vom Quellpunkt ist x-unabhängig und damit hier uninteressant). Wenn also ψ(x) eine Lösung der Differentialgleichung mit Potentialen Aμ ist, so sollte

  ψ'(x)   :=   e− i q/hq χ(x) ψ(x)

eine Lösung der Differentialgleichung mit eichtransformierten Potentialen Aμ' sein. Rechnen wir nach, wie die kovarianten Ableitungen nach einer Eichtransformation mit denen vor einer Eichtransformation zusammenhängen:

       (δμ   +   i q/hq A'μ) ψ'   =  
  =   (δμ   +   i q/hq (Aμ + δμχ) )   e− i q/hq χ ψ   =  
  =   e− i q/hq χ   (δμ   −   i q/hq δμχ   +   i q/hq (Aμ + δμχ) )   ψ   =  
  =   e− i q/hq χ   (δμ   +   i q/hq Aμ)   ψ

Auf diese Weise ist beispielsweise die Diracgleichung lokal eichinvariant, denn die eichtransformierte Diracgleichung

  (i γμμ   +   i q/hq A'μ)   −   m) ψ'   =   0

ergibt nach dieser Regel die Gleichung

  e− i q/hq χ   (i γμμ   +   i q/hq Aμ)   −   m) ψ   =   0

was nach Division durch   e− i q/hq χ   die ursprüngliche Diracgleichung

  (i γμμ   +   i q/hq Aμ)   −   m) ψ   =   0  

vor der Eichtransformation ergibt. Analog ist es bei der Schrödingergleichung. Halten wir fest:

Lokale Eichinvarianz einer Gleichung bedeutet:
Wenn ψ eine Lösung der Gleichung mit Potential Aμ ist, so muss ψ' eine Lösung der Gleichung mit Potential A'μ sein.

Das Prinzip der minimalen Kopplung ist also mit unserem Ergebnis von weiter oben verträglich, dass eine lokale (d.h. Raum-Zeit-abhängige) Eichtransformation des Viererpotentials zu einer Raum-Zeit-abhängigen Phase in ψ führt, wobei diese Phase sich physikalisch nicht auswirkt.

Umgekehrt gilt: Da wir von oben wissen, dass eine Eichtransformation der Viererpotentiale Aμ zu einer Raum-Zeit-abhängigen Phase in ψ führt (die sich physikalisch nicht auswirkt), müssen diese Viererpotentiale so in die Gleichung eingebaut sein, dass die Gleichung im obigen Sinn lokal eichinvariant ist, denn dann ergibt eine Eichtransformation von Aμ in der Gleichung genau die richtige Eichphase für ψ. Genau das erreichen wir, wenn wir die Potentiale Aμ nach dem Prinzip der minimalen Kopplung in die Gleichung einbauen.

Man kann es kurz so ausdrücken: Eine Raum-Zeit-abhängige Phase in ψ muss sich durch eine Eichtransformation in Aμ erzwingen bzw. kompensieren lassen. Das wird im Buchkapitel als Prinzip der lokalen Eichinvarianz bezeichnet, wobei wir bisher nur den speziellen Fall der Eichgruppe U(1) dargestellt haben, die eine Phasenänderung in ψ bewirkt.



b) Eichsymmetrie bei allgemeineren Eichgruppen, z.B. SU(3) für die starke Wechselwirkung

(für Leser mit mathematisch-physikalischem Hintergrundwissen gedacht)

In den Eichtheorien des Standardmodells weitet man dieses Prinzip nun auf größere Eichgruppen aus. Nicht nur die Veränderung der Phase soll sich physikalisch nicht auswirken, sondern beispielsweise auch die lokale Re-Definition der Ladungen rot, grün und blau. Man hat es also statt mit nur einem ψ(x) mit mit einem Vektor   ψ(x) = ( ψj(x) )   mit mehreren Komponenten   ψj(x)   zu tun, wobei der Index j beispielsweise für die drei Farbladungsarten stehen kann. Wie man bei diesen allgemeineren Eichgruppen vorgeht, um allgemeine Eichtheorien aufzubauen, wird in Die Grenzen der Berechenbarkeit, Kapitel 5.4.6: Eichtheorien im Detail beschrieben. Hier die wesentlichen Punkte in etwas vereinfachter und abgewandelter Schreibweise (die zugehörigen Rechnungen findet man im gerade genannten Kapitel; anders als dort schreiben wir hier   i A   statt   A   , damit A hermitesch ist, sowie   i F   statt   F   , und unterscheiden nicht zwischen der Eichgruppe und ihrer Darstellung):

Eine Eichtransformation der Potentiale Aμ soll diesmal die folgende physikalisch nicht relevante Veränderung in   ψ   bewirken:

  ψ'(x)   =   U(x) ψ(x)

Dabei wirkt die ortsabhängige Matrix U(x) auf den Index j von ψ. In der QCD ist beispielsweise U(x) eine SU(3)-Matrix, welche die Farbladungen mischt und vertauscht (siehe Zusatzinfos zu Kapitel 4.3). Das Prinzip der minimalen Kopplung zum Einbau der Potentiale lautet hier analog zu oben: Ersetze die Raum-Zeit-Ableitungen   δμ   durch die kovarianten Ableitungen

  Dμ   :=   δμ − i Aμ

(die jeweilige Ladung und ein Vorzeichen habe wir im Vergleich zu oben direkt in Aμ integriert). Dabei ist jedes der vier Aμ(x) analog zu U eine Matrix, also in der QCD eine komplexe 3-mal-3-Matrix, die auf den j-Index von ψ wirkt. Genauer muss jedes der vier   i Aμ(x)   eine Matrix aus dem Tangentialraum am 1-Element der Gruppe sein, aus der U(x) stammt, also z.B. SU(3) -- Begründung siehe unten. Das bedeutet, dass man jedes der vier Potentiale schreiben kann als   i Aμ   =   dV(t)/dt|t = 0   mit einem jeweils geeigneten Eichgruppenelement V(t), für das V(0) = 1 gilt (für jedes μ braucht man natürlich i.A. ein anderes V(t); den Index μ haben wir bei V(t) einfach weggelassen). Umgekehrt lässt sich dann zumindest für kleine t das Gruppenelement V(t) schreiben als   V(t) = ei t Aμ   . In der QCD ist also   ei t Aμ   aus SU(3) und damit unitär, so dass Aμ hermitesch sein muss, und da für V(t) aus SU(3) die Determinante gleich 1 ist, muss zusätzlich die Spur von Aμ Null sein (siehe Zusatzinfos zu Kapitel 4.3 -- dort hatten wir daraus gefolgert, dass es nur 8 verschiedene Gluonen gibt).

Die Eichtransformation, die das obige U hervorruft, lautet:

  i Aμ'   =   i U Aμ U −1   +   (δμU) U −1

denn dann erfüllt die kovariante Ableitung wieder die Beziehung

  (δμ − i A'μ)   U ψ   =   U   (δμ − i Aμ)   ψ

was dann wie oben die Eichinvarianz sichert. Hier die kurze Rechnung dazu:

  (δμ − i A'μ)   U ψ   =  
  =   ((δμU)   +   U δμ   −   [i U Aμ U −1   +   (δμU) U −1] U )   ψ   =  
  =   ((δμU)   +   U δμ   −   i U Aμ   −   (δμU) )   ψ   =  
  =   U   (δμ − i Aμ)   ψ

An der Eichtransformations-Formel für Aμ sieht man nun auch, dass   i Aμ   aus dem Tangentialraum der Gruppe am Einselement sein muss, denn der Eich-Zusatzterm ist ebenfalls aus diesem Tangentialraum; er lässt sich nämlich schreiben als
  (δμU) U −1   =   d/dt [ U(x + t eμ) U −1(x) ]t = 0
wobei das Produkt in der eckigen Klammer für jedes t ein Element der Eichgruppe ist, das bei t = 0 gleich dem Einselement wird, und wobei eμ der Einheitsvektor in der Raum-Zeit-Richtung μ ist.
Auch der andere Term   i U Aμ U −1   ist aus diesem Tangentialraum, denn aus   i Aμ   =   dV(t)/dt|t = 0   mit einem geeigneten Gruppenelement V(t) und V(0) = 1 folgt   i U Aμ U −1   =   U dV(t)/dt|t = 0 U −1   =   d/dt [U V(t) U −1]t = 0   und wieder ist das Produkt in der eckigen Klammer für jedes t ein Element der Eichgruppe, das bei t = 0 gleich dem Einselement wird.

Im Fall der Gruppe U(1) erhalten wir mit   U = ei χ   unsere Formeln von weiter oben wieder zurück (bis auf die Vorfaktoren, die wir noch aus A und χ passend herausziehen müssen). Im Fall der Gruppe SU(3) erhalten wir die Formel   A'   =   U A U+   aus den Zusatzinfos zu Kapitel 4.3 zurück, wenn wir die Ortsabhängigkeit von A vernachlässigen und   U −1 = U+   verwenden. Die Eichpotentiale Aμ hatten wir dort noch als Gluonmatrix oder auch als Gluon-Farbladungs-Wellenfunktion bezeichnet und aufgrund Transformationsformel in   Aμij   den zweiten Index j als Farbladung, den ersten Index i als Farb-Antiladung interpretiert -- ein Gluon transportiert ja eine Farbladung und eine Anti-Farbladung, oder anders ausgedrückt: eine Farbladung in die eine und eine Farbladung in die andere Richtung (siehe Bilder oben).

Man kann aber auch zum Feldstärketensor

  i Fμν   :=   i δμ Aν − i δν Aμ − [i Aμ , i Aν]

mit   [Aμ , Aν]   :=   Aμ Aν − Aν Aμ   übergehen und diesen als Gluonmatrix bezeichnen, denn dieser transformiert sich bei Eichtransformationen von A folgendermaßen:

  Fμν'   =   U Fμν U −1

Wenn   Fμν = 0   ist, so ist das Eichpotential Aμ in einem einfach zusammenhängenden Gebiet eine reine Eichung und lässt sich wegeichen.



c) Eichsymmetrie, verborgene Zusatzdimensionen und allgemeine Relativitätstheorie

Was ist der tiefere Hintergrund für das Prinzip der lokalen Eichinvarianz? Warum funktioniert es?

Im Fall der elektromagnetischen Wechselwirkung folgte es oben aus unserer Regel, dass sich die Phase für eine Weg-Amplitude proportional zu   ∫γ Aμ dxμ   ändert, so wie es beispielsweise aus dem Aharanov-Bohm-Effekt folgt. Eine Eichtransformation von Aμ führt dann zu einer wegunabhängigen (aber Raum-Zeit-abhängigen) Phase für ψ, die physikalisch nicht relevant ist. Will man diese Phase in Differentialgleichungen für ψ reproduzieren, muss man dort Aμ über das Prinzip der minimalen Kopplung einbauen. Eine Eichtransformation von Aμ ergibt dann die korrekte Phase für ψ, was man auch als lokale Eichinvarianz der Gleichung bezeichnet.

Man kann sich aber fragen, ob es nicht noch weitere Hinweise gibt, die nahelegen, dass sich eine solche lokale Phase oder sogar eine komplexere Eichtransformation   ψ'(x)   =   U(x) ψ(x)   physikalisch nicht auswirken sollte, was dann zum Einbau der entsprechenden Eichpotentiale Aμ über die minimale Kopplung führt.

Einen Hinweis gibt beispielsweise die sogenannte Kaluza-Klein-Theorie (siehe auch Buchkapitel 8.1). In dieser Theorie nimmt man eine Raumdimension hinzu, betrachtet also vier Raumdimensionen und eine Zeitdimension (also eine fünfdimensionale Raumzeit). Man kann nun Einsteins allgemeine Relativitätstheorie der Gravitation (siehe Buchkapitel 7.1) leicht auf diese Raumzeit übertragen. Dabei hat die allgemeine Relativitätstheorie ein anschaulich sehr naheliegendes Fundament, nämlich das Äquivalenzprinzip, nach dem Gravitation lokal einem beschleunigten Bezugssystem entspricht und in jedem lokalen frei fallenden Bezugssystem die Gesetze der speziellen (gravitationsfreien) Relativitätstheorie gelten. Großräumig bedeutet Gravitation, dass man nicht global ein einziges frei fallendes Bezugssystem hat, sondern nur lokal, was mathematisch auf den Begriff der Raumkrümmung führt.

Wenn man nun die zusätzliche Raumdimension sehr klein einrollt, so entsteht aus der fünfdimensionalen Gravitationstheorie in guter Näherung in den vier nicht-eingerollten Dimensionen die übliche vierdimensionale Gravitationstheorie plus die elektromagnetische Wechselwirkung. Es ist daher naheliegend, dass sich die Drehfreiheit in der fünften winzigen kreisförmigen Dimension in die Drehfreiheit des ψ-Pfeils verwandelt. Eichtransformationen von ψ entsprechen dann irrelevanten Veränderungen in der eingerollten Raumdimension. Das wäre eine schöne Begründung für das Prinzip der lokalen Eichinvarianz! Ähnlich kommt man in der Stringtheorie von mehreren eingerollten Raumdimensionen zu den Eichtheorien des Standardmodells.

Tatsächlich kann man viele Parallelen zwischen Eichtheorien und der allgemeinen Relativitätstheorie ziehen:

Mehr zu den Begriffen aus der allgemeinen Relativitätstheorie siehe in Die Symmetrie der Naturgesetze, Kapitel 5: Die allgemeine Relativitätstheorie.



d) Eichsymmetrie und die Quantenfeldtheorie masseloser Teilchen mit Spin 1

(für Leser mit mathematisch-physikalischem Hintergrundwissen gedacht)

Bisher haben wir oben die elektromagnetischen (und andere) Eichpotentiale rein klassisch behandelt, also ohne Quanteneffekte. Lediglich die Bewegung anderer Teilchen wie beispielsweise Elektronen in diesem Potential haben wir quantenmechanisch beschrieben. Für langsam veränderliche, nicht zu starke Potentiale ist das auch ausreichend. Im allgemeinen Fall muss man jedoch in einem zweiten Schritt auch diese Potentiale quantisieren, ihnen also Teilchen und Wellenfunktionen zuordnen -- man spricht hier etwas unglücklich auch von zweiter Quantisierung.

Man kann jedoch auch den umgekehrten Weg beschreiten und mit den Teilchen beginnen, die zu den Wechselwirkungen von Eichtheorien gehören. Diesen Weg beschreitet Steven Weinberg in seinem Standardwerk The Quantum Theory of Fields (Vol. 1) (eine kurze Zusammenfassung des Buches habe ich unter Die Symmetrie der Naturgesetze, Kap. 4.15 Aufbau der Quantenfeldtheorie nach Steven Weinberg zur Verfügung gestellt).

Alle Wechselwirkungsteilchen des Standardmodells sind zunächst masselos und tragen Spin 1. Nach der spontanen Symmetriebrechung bleiben Photonen und Gluonen weiterhin masselos, während W- und Z-Bosonen durch ihre Wechselwirkung mit dem Higgs-Feld eine effektive Masse erhalten (siehe Kapitel 6.1). In der ursprünglichen ungebrochenen Eichtheorie sind jedoch auch sie masselos, und bei sehr hohen Energien verhalten sie sich auch wieder wie masselose Teilchen, was letztlich die Renormierbarkeit der Theorie sicherstellt.

Betrachten wir konkret Photonen: Dabei stellt man fest, dass die Spinkomponente des Photons in Bewegungsrichtung nur die beiden Werte   + 1   und   − 1   aufweisen kann -- man spricht auch von der Helizität des Photons. Die Spinkomponente Null in Bewegungsrichtung kommt dagegen nicht vor, anders als bei massiven Spin-1-Teilchen. Der Spin zeigt also entweder in oder gegen die Bewegungsrichtung, d.h. das Photon dreht sich in der klassischen Analogie entweder links oder rechts um die Bewegungsrichtung (von vorne gesehen). Dadurch ergeben sich insgesamt die verschiedenen Polarisationsmöglichkeiten von Licht, wobei das Fehlen der Helizität Null bedeutet, dass das elektrische und magnetische Feld bei ebenen Lichtwellen immer senkrecht zur Ausbreitungsrichtung orientiert sind. Man sagt, Licht ist immer transversal polarisiert, nie longitudinal.

Photonen kann man quantenmechanisch durch eine relativistische Impulsraum-Wellenfunktion beschreiben, die jeder Kombination aus Photonimpuls und Helizität eine Wahrscheinlichkeitsamplitude zuordnet. Dazu kommt eine Regel, wie bei einem Wechsel des Raum-Zeit-Bezugssystems (Lorentz-Transformation oder allgemeiner Poincare-Transformation) diese Amplituden in das neue Bezugssystem umgerechnet werden müssen (siehe Die Symmetrie der Naturgesetze, Kapitel 4.10 Darstellungen der Poincaregruppe, Stichwort: "Die kleine Gruppe für masselose Teilchen"). Wenn beispielsweise die Amplitude nur für eine bestimmte Impuls-Helizitäts-Kombination ungleich Null ist, so wird der Impuls in das neue Bezugssystem umgerechnet, während die Helizität unverändert bleibt. Die Helizität kann bei masselosen Teilchen nicht durch Lorentz-Transformationen (ohne Spiegelungen) verändert werden, da man solche Teilchen nicht überholen kann -- sie bewegen sich immer mit Lichtgeschwindigkeit.

Nun ist dieses Transformationsverhalten der Wahrscheinlichkeitsamplituden mathematisch ungünstig, um sie zu Wechselwirkungstermen zu verkoppeln, die ihrerseits wiederum ein einfaches Transformationsverhalten haben (z.B. unverändert bleiben). Für Wechselwirkungsterme braucht man Felder mit einfachem Transformationsverhalten, beispielsweise Vierervektoren (die sich analog zum Viererimpuls pμ transformieren). Dies ist der Grund dafür, warum man zunächst aus den Wahrscheinlichkeitsamplituden sogenannte Quantenfelder konstruiert, die dieses einfachere Transformationsverhalten aufweisen.

Was für Quantenfelder braucht man für die elektromagnetische Wechselwirkung? Man könnte beispielsweise den Feldstärketensor Fμν konstruieren, was auch problemlos möglich ist. Solche Theorien sind jedoch nicht allgemein genug, denn es stellt sich heraus, dass man so keine langreichweitigen Kräfte erhält. Man braucht Vierervektorfelder wie Aμ , wie wir auch oben beim Aharaonov-Bohm-Effekt bereits gesehen haben.

Wenn man nun aus den Amplituden freier masseloser Spin-1-Teilchen ein Vierervektorfeld Aμ konstruieren will, so gerät man in Probleme: es geht nicht! Der Grund dafür liegt darin, dass ein Vierervektorfeld Aμ zu viele Freiheitsgrade besitzt, nämlich 4 Komponenten an jedem Raum-Zeit-Punkt, während es für jeden Photon-Viererimpuls nur zwei mögliche Helizitäten gibt. Man muss die Freiheitsgrade von Aμ weiter einschränken. Das kann man beispielsweise durch die beiden Zusatzbedingungen   δμ Aμ = 0   (Lorentzeichung) sowie   A0 = 0   erreichen, woraus   div A = 0   folgt. Man spricht dabei von der Coulomb-Eichung (auch Strahlungseichung genannt, wobei aus   div A = 0   für eine ebene A-Welle mit Wellenvektor k folgt, dass A und k senkrecht aufeinander stehen, d.h. die elektromagnetische Welle ist transversal polarisiert, wie es sein muss). Nur ist jetzt Aμ in der Coulomb-Eichung leider kein Vierervektorfeld mehr, das ein einfaches Transformationsverhalten aufweist. Details dazu siehe Die Grenzen der Berechenbarkeit, Kapitel 5.4.4: Die Maxwellgleichungen (Stichwort: Strahlungseichung).

Wie kann man nun Aμ dennoch zum Aufbau von Wechselwirkungstermen nutzen? Man tut zunächst einfach so, als wäre Aμ ein Vierervektorfeld (Viererpotential), d.h. man ignoriert, dass nur zwei der vier Aμ -Komponenten unabhängig sind. Bei einer Lorentz-Transformation soll sich Aμ also wie ein Vierervektor verhalten, so dass sich damit beispielsweise Lorentz-invariante Wechselwirkungs-Terme konstruieren lassen. Allerdings erfüllen nach einer Lorentz-Transformation die Aμ -Komponenten i.A. die beiden Zusatzbedingungen nicht mehr. Daher führt man nach jeder Lorentz-Transformation zusätzlich eine Eichtransformation
  A'μ   =   Aμ   +   δμ χ
durch, mit der sich die beiden Zusatzbedingungen für Aμ wiederherstellen lassen. Die Wechselwirkungsterme, die man mit Aμ zusammenbaut, müssen dabei eichinvariant sein, d.h. sie dürfen sich durch die obige Eichtransformation nicht ändern, so dass das Wiederherstellen der beiden Zusatzbedingungen sich nicht auf physikalische Messgrößen auswirkt.

Lisa Randall beschreibt diese Vorgehensweise in ihrem Buch Verborgene Universen (Kap. III.10, S.232) sinngemäß so (Auslassungen und eigene Anmerkungen in eckigen Klammern):

Das einfachste Beispiel für einen solchen eichinvarianten Wechselwirkungsterm ist   ∫V   d4x   jμ(x) Aμ(x)   (mit Summe über μ und Integration über ein großes Raum-Zeit-Gebiet V), wie er im sogenannten Wirkungsfunktional der elektromagnetischen Wechselwirkung auftritt (siehe Die Grenzen der Berechenbarkeit, Kapitel 5.4.4: Die Maxwellgleichungen ). Dabei steht   jμ(x)   für die elektrische Vierer-Stromdichte   j(x)   =   (jμ(x))   =   (c ρ(x), j(x))   . Führt man in diesem Wechselwirkungsterm eine Eichtransformation durch, so entsteht ein Eich-Zusatzterm, den man durch partielle Integration folgendermaßen umschreiben kann:

  ∫V   d4x   jμ(x) (δμ χ(x))   =  
  =   ∫V   d4x   δμ (jμ(x) χ(x))   −   ∫V   d4x   (δμ jμ(x)) χ(x)   =  
  =   ∫δV   d3x   jμ(x) χ(x)   −   ∫V   d4x   (δμ jμ(x)) χ(x)

Im ersten Term integriert man über den Rand des Raum-Zeit-Gebietes V. Wir setzen voraus, dass bei extrem großem Raum-Zeit-Gebiet die Stromdichte auf dessen Rand δV Null wird, so dass der erste Term wegfällt. Der zweite Term wird Null, wenn wir die Stromerhaltung

  δμ jμ(x)   =   0

fordern. Mit dieser Zusatzforderung der Stromerhaltung und hinreichend schnell abfallender Stromdichte im Unendlichen (Rand δV) fällt der Eich-Zusatzterm oben weg, so dass der Wechselwirkungsterm wie gefordert eichinvariant ist.

Man sieht, dass die quantenmechanische Beschreibung masseloser Spin-1-Wechselwirkungsteilchen fast unvermeidlich auf Eichpotentiale Aμ und damit auf Eichtheorien hinausläuft. Details dazu findet man in Steven Weinberg: The Quantum Theory of Fields, Vol 1, Kapitel 5.9. Auf Seite 253 in diesem Kapitel macht Weinberg noch einige sehr interessante Bemerkungen: Für masselose Wechselwirkungs-Teilchen mit Spin 2 kann man langreichweitige Kräfte in einer Quantenfeldtheorie nur dann erreichen, wenn man analog zur Eichinvarianz bei Spin 1 so etwas wie die allgemeine Koordinaten-Kovarianz hat -- in der allgemeinen Relativitätstheorie ist dies die Gleichwertigkeit aller Koordinatensysteme und damit die lokale Gleichwertigkeit aller frei fallenden Inertialsysteme (siehe die oben dargestellten Parallelen zwischen Eichtheorien und der allgemeinen Relativitätstheorie ). Masselose Spin-2-Teilchen führen also direkt in Richtung allgemeine Relativitätstheorie, d.h. diese Teilchen entsprechen den Gravitonen. Für Spin 3 und höher kann man dagegen überhaupt keine Quantenfeldtheorie mit langreichweitigen Kräften mehr erreichen. Kein Wunder also, dass wir solche langreichweitigen Kräfte in der Natur auch nicht finden!

In diesem Zusammenhang existiert ein interessantes Theorem, bewiesen von Steven Weinberg and Edward Witten im Jahr 1980 (siehe Wikipedia: Weinberg–Witten theorem ):

Entsprechend weisen alle Wechselwirkungsteilchen im renormierbaren Standardmodell Spin 1 auf, aber keines Spin 2 (die Masse aufgrund der spontanen Symmetriebrechung ist dabei egal, da sich bei sehr hohen Energien auch W- und Z-Bosonen wieder wie masselose Teilchen verhalten). Spin 2 ist bei der nicht-renormierbaren Gravitation dagegen erlaubt.



e) Der Zusammenhang zwischen Impuls und Geschwindigkeit im Vektorpotential

In Feynmans Vorlesungen über Physik, Band 3: Quantenmechanik findet sich in Kapitel 21-3 eine interessante anschauliche Begründung dafür, warum die Schrödingergleichung in einem elektromagnetischen Feld so aussehen muss wie oben angegeben, also

Schrödingergleichung in einem elektromagnetischen Feld:

  i hq d/dt   ψ   =   [ (P − q A)2 / (2m)   +   q Φ) ]   ψ  

Feynmans Gedankengang sieht dabei sinngemäß so aus: Wir betrachtet wieder das Beispiel einer sehr langen geraden Spule in z-Richtung, in deren Inneren man ein Magnetfeld B in z-Richtung parallel zur Spule erzeugen kann, während im Außenraum kein Magnetfeld entsteht, wohl aber ein Vektorpotential A, das sich kreisförmig um die Spulenachse windet, proportional zum Magnetfeld B ist und mit 1/r (r = Abstand von der Spulen-Zentralachse) abnimmt (Formeln siehe oben bzw. etwas weiter unten). Wir kennen diesen Aufbau bereits oben vom Aharanov-Bohm-Effekt, wobei wir den Doppelspalt hier weglassen und nur die Spule behalten.

Wir betrachten nun ein kleines Wellenpaket im Außenraum der Spule, das sich für gewisse Zeit annähernd wie ein klassisches Teilchen benehmen sollte, d.h. die Messwerte für Ort und Geschwindigkeit weisen nur eine kleine statistische Streuung auf und die Mittelwerte (Erwartungswerte) entsprechen annähernd den Werten für ein klassisches Teilchen. Wir schreiben im Folgenden   <P>   für den Erwartungswert des Impulsoperators   P   =   (hq/i) d/dx   und   <v>   für den Erwartungswert der Geschwindigkeit.

Zunächst starten wir mit einer Spule ohne Magnetfeld und fahren dann in einem winzigen Zeitintervall den Strom in der Spule hoch, so dass gleichsam sofort ein Magnetfeld in der Spule und damit ein Vektorpotential A im Außenraum entsteht. Vor diesem Zeitpunkt ist die zeitliche Änderung   d/dt ψ   des Wellenpaketes also durch die obige Schrödingergleichung ohne Vektorpotential A gegeben, anschließend mit Vektorpotential A. Die zeitliche Änderung   d/dt ψ   ändert sich beim schnellen Einschalten des Magnetfeldes also fast sprunghaft. Die Wellenfunktion ψ selbst ändert sich dagegen nicht sprunghaft, sondern stetig -- lediglich ihre zeitliche Fortentwicklung ist nach dem Einschalten eine andere als vorher. Also kann sich auch der Erwartungswert   <P>   beim Einschalten nicht sprunghaft ändern, denn der zugehörige Impulsoperator   P   =   (hq/i) d/dx   misst ja die räumliche Veränderung (den Gradienten) der Wellenfunktion, und die ändert sich genausowenig sprunghaft wie die Wellenfunktion selbst.

Daraus folgt aber, dass der Erwartungswert   P   des Impulsoperators und der Erwartungswert   <v>   der Geschwindigkeit nicht analog zur klassischen Formel   p = m v   zusammenhängen können, denn klassisch muss sich die Teilchengeschwindigkeit v eines Teilchens beim Einschalten sprunghaft ändern, und zwar aus folgendem Grund:

Da sich beim Einschalten des Stroms in sehr kurzer Zeit in der Spule ein magnetischer Fluss aufbaut, muss gemäß den Maxwellgleichungen für diese kurze Zeit im Außenraum ein sehr starkes ringförmiges elektrisches Feld E entstehen, dessen Stärke proportional zur Änderung des magnetischen Flusses ist. Oben hatten wir diesen Zusammenhang durch die Formel   E   =   − grad Φ − dA/dt   ausgedrückt. Da wir das elektrische Potential Φ hier gleich Null annehmen können (keine unausgeglichenen elektrischen Ladungen in der Spule), folgt

  E   =   − dA/dt

Dieses elektrische Feld verändert die Geschwindigkeit eines klassischen elektrischen Teilchens, da es einen kurzzeitigen Kraftstoß auf dieses Teilchen ausübt. Übrigens haben wir mit der Annahme   Φ = 0   indirekt eine teilweise Eichfixierung von Φ und A vorgenommen, denn nun sind nur noch zeitunabhängige Umeichungen der Form   A' = A − grad χ   mit   dχ/dt = 0   erlaubt. Eine solche zeitunabhängige Umeichung verändert das E -Feld in der obigen Formel nicht, das dieses ja von der zeitlichen Änderung von A abhängt.



Eine Spule mit einem darin eingeschlossenen magnetischen Feld B in z-Richtung erzeugt in ihrem Außenbereich ein ringförmiges Vektorpotential A. Ändert sich der magnetische Fluss in der Spule und damit das Vektorpotential A im Außenbereich, so entsteht dort ein ringförmiges elektrisches Feld der Stärke   E   =   − dA/dt   .


Nehmen wir an, das Zeitintervall des Einschaltens dauert von t = 0 bis t = ε , und nach diesem Zeitintervall haben wir das Vektorpotential   A(ε) =: A   . Dann gewinnt ein elektrisches Teilchen der Ladung q durch die Änderung des magnetischen Flusses und damit durch die Änderung des Vektorpotentials den klassischen Impuls

  Δp   =   m Δv   =   ∫0ε   F dt   =   ∫0ε   q E dt   =   − ∫0ε q (dA/dt) dt   =   − q ( A(ε) − A(0) )   =   − q A

Der klassische Term   p   +   q A   ändert sich also beim Einschalten des Magnetfeldes nicht, denn die Impulsänderung wird durch die A-Änderung ausgeglichen. Das passt zu der Tatsache, dass sich beim Wellenpaket der Erwartungswert von   <P>   beim Einschalten nicht ändert, wie wir oben gesehen haben. Umgekehrt wissen wir, dass sich ohne Vektorpotential der Erwartungswert von   <P>   wie der klassische Impuls   p = m v   verhalten muss. Also muss

  <P>   =   p   +   q A

gelten, oder umgestellt   p   =   <P> − q A   . Mit   <A> = A   und   p = m v   folgt:

  v   =   < (P − q A) > / m  

In diesem Sinn können wir also den Operator   (P − q A) / m   als quantenmechanischen Geschwindigkeitsoperator verstehen, dessen Erwartungswert sich im klassischen Grenzfall wie die Teilchengeschwindigkeit verhält. Der Operator   P = (hq/i) d/dx   selbst hat in der klassischen Hamilton-Mechanik als Analogon den sogenannten kanonischen Impuls, während man   p = m v   als kinetischen Impuls bezeichnet. In der Schrödignergleichung führt also das Prinzip der minimalen Kopplung letztlich dazu, dass der Term   (P − q A)2 / (2m)   im klassischen Grenzfall die kinetische Energie   m/2 v2   des Teilchens ergibt. Es ist schon erstaunlich, wie wieder einmal alles wunderbar zusammenpasst und wie es Richard Feynman gelingt, diesen Punkt herauszuarbeiten.

An einem Punkt hat mich bei seiner Argumentation allerdings etwas beunruhigt: Ändert sich die Wellenfunktion wirklich nicht sprunghaft, wenn man das Magnetfeld einschaltet? Immerhin haben wir oben ja gelernt, dass ein Vektorpotential zu einer Phase in den Wegamplituden führt, und beim Aharanov-Bohm-Effekt führte dies zu einer Phase in den beiden Wellenfunktions-Anteilen, die durch Spalt 1 oder 2 gehen. Müsste das Vektorpotential dann nicht auch zu einer Phase in der Wellenfunktion führen, also zu einer sprunghaften Änderung der Wellenfunktion? Schauen wir uns das etwas genauer an:

Die konkrete Formel für A hatten wir oben bereits angegeben. Sie lautet in Polarkoordinaten:

  A   =   1/2 B R2/r eφ   =   − grad χ     mit     χ   =   − 1/2 B R2 φ

Dabei ist R der Spulenradius, B ist das Magnetfeld in der Spule in z-Richtung, r ist der Abstand von der Spulenachse in der Spulenmitte, φ ist der Drehwinkel um diese Spulenachse herum und eφ ist der Einheitsvektor in φ-Richtung. Lokal lässt sich A also als reine Eichung schreiben (aber nicht global, da χ keine global stetige Funktion ist, sondern bei irgendeinem φ-Wert einen Sprung macht).

Von oben wissen wir nun: Wenn   ψ(x)   eine Lösung der Schrödingergleichung ohne A-Potential ist, so ist   ψ'(x)   :=   e− i q/hq χ(x) ψ(x)   eine Lösung der Schrödingergleichung mit   A   =   − grad χ   (kann man auch konkret nochmal nachrechnen).

Der entscheidende Punkt ist nun: Die Wellenfunktion   ψ(x)   geht beim Anschalten des Magnetfeldes nicht in die obige Wellenfunktion   ψ'(x)   über! Beides sind mögliche Lösungen der Schrödingergleichung (einmal ohne und einmal mit Vektorpotential), aber sie gehen wegen dem Phasenfaktor nicht beim Einschalten stetig ineinander über. Feynman fordert vollkommen zu Recht, dass dieser Übergang einer Lösung ohne Vektorpotential in eine Lösung mit Vektorpotential beim Einschalten stetig erfolgen muss, so wie es die Schrödingergleichung auch vorgibt. Was bedeutet das nun konkret?

Da sich klassisch durch das Anschalten des Magnetfeldes letztlich der Drehimpuls des Teilchens um die Spulenachse ändert, ist es naheliegend, sich auch in der Quantentheorie Wellenfunktionen anzusehen, die einen eindeutigen Wert   m hq   für die Drehimpulskomponente in z-Richtung (Richtung der Spulenachse) haben (dabei ist m eine ganze Zahl, siehe Kapitel ??). Aus der Quantentheorie weiß man, dass solche Wellenfunktionen im Fall ohne Vektorpotential die Form

  ψm(t,r,z,φ)   =   fm(t,r,z)   ei m φ

haben, d.h. die Winkelabhängigkeit um die Spulenachse herum ist durch den Faktor   ei m φ   festgelegt. Durch Anschalten des Magnetfeldes kommt der Zusatzfaktor   e− i q/hq χ(x)   hinzu, d.h. aus   ei m φ   wird

    ei m φ   e− i q/hq χ(x)   =   ei m φ   ei q/hq 1/2 B R2 φ   =   ei ( m   +   q/hq 1/2 B R2 ) φ

Die Funktionen

  ψm''(t,r,z,φ)   =   fm'(t,r,z)   ei ( m'   +   q/hq 1/2 B R2 ) φ

sind also Lösungen der Schrödingergleichung mit dem obigen Vektorpotential mit Drehimpuls   m' hq   in z-Richtung (wir schreiben m' statt m, um die beiden Indices gleich unterscheiden zu können). Beim plötzlichen Anschalten des Magnetfeldes zur Zeit t = 0 (wir lassen die Intervallänge ε also gegen Null gehen) müssen die Lösungen stetig ineinander übergehen:

  ψm(0,r,z,φ)   =   ψm''(0,r,z,φ)

Wegen der φ-Abhängigkeit muss also

  ei m φ   =   ei ( m'   +   q/hq 1/2 B R2 ) φ

gelten, d.h. wir haben die Bedingung   m   =   m'   +   q/hq 1/2 B R2   , die wir auch in der Form

Änderung des Drehimpulses durch das Anschalten des Magnetfeldes:

  m' hq   =   m hq   −   q/2 B R2

schreiben können. Durch das Anschalten des Magnetfeldes ist also der Drehimpuls   − q/2 B R2   hinzugekommen. Das entspricht genau dem klassischen Ergebnis, denn dort kommt durch das kurzzeitige starke E -Feld folgender Drehimpuls hinzu (siehe Rechnung zu Δp oben):

  ΔL   =   r Δp   =   − r q 1/2 B R2/r   =   − q/2 B R2

Es passt also wieder alles zusammen! Übrigens folgt aus   ψm(0,r,z,φ)   =   ψm''(0,r,z,φ)   zusammen mit der obigen Bedingung für m und m' zusätzlich, dass die Funktion   fm(0,r,z)   unabhängig von m sein muss, denn die Bedingung für m und m' gilt für (fast) beliebige Werte von B. Das hängt auch damit zusammen, dass die Schrödingergleichung im Außenraum bei verschwindendem B keinen Unterschied zwischen den verschiedenen m-Drehimpulswerten macht (es fehlt z.B. ein Term wie   L B   , wobei   L = r × P   der Drehimpulsoperator ist).

Die Diskussion enthüllt zudem noch ein weiteres interessantes Phänomen: Da die Funktion   ψm''(t,r,z,φ)   für   φ   und   φ + 2π   denselben Wert haben muss (ist ja derselbe Ort), muss im Phasenfaktor der Ausdruck   q/hq 1/2 B R2   analog zu m' eine ganze Zahl sein, die wir n nennen:   q/hq 1/2 B R2   =   n   oder nach dem Magnetfluss   π R2 B   freigestellt (mit   hq = h / (2π)   ):

Flussquantisierung:

  π R2 B   =   n   h/q  

Der Magnetfluss in der Spule kann also nicht jeden beliebigen Wert aufweisen, sondern er muss ein ganzzahliges Vielfaches des Flussquantes   h/q   sein, sofern er von einer Wellenfunktion umgeben ist, die zu einem Teilchen der Ladung q gehört. Das bezeichnet man auch als Flussquantisiserung (siehe z.B. Wikipedia: Flussquantisierung ). Bei makroskopischen Spulen spielt dieser Effekt keine praktische Rolle, da das Flussquant   h/q   vergleichsweise klein ist, wohl aber bei Supraleitern, bei denen eine makroskopische Wellenfunktion aus Elektron-Paaren (Cooper-Paaren) einen winzigen Magnet-Flussschlauch umfließt.



Literatur:


zurück zum Inhaltsverzeichnis

last modified on 05 October 2010