Quantenfeldtheorie basieren auf zwei Grundpfeilern: der speziellen Relativitätstheorie und der Quantentheorie. Schauen wir uns also zunächst die spezielle Relativitätstheorie genauer an (eine detailliertere Einführung dazu finden Sie in Das Unteilbare, Kapitel 4.2: Die spezielle Relativitätstheorie; die mathematischen Grundlagen sind in Die Symmetrie der Naturgesetze, Kapitel 3: Die spezielle Relativitätstheorie beschrieben).
Die spezielle Relativitätstheorie wurde im Jahr 1905 von Albert Einstein formuliert – Einsteins berühmtes Wunderjahr.
Sie basiert auf zwei grundlegenden Annahmen:
Die physikalischen Gesetze gelten in allen Inertialsystemen in der gleichen Form.
Es gibt eine endliche maximale Ausbreitungsgeschwindigkeit für physikalische Wirkungen.
Ein Inertialsystem ist dabei ein Bezugssystem, in dem ein sich frei bewegender Körper, also einer, der keinen äußeren Kräften unterliegt, eine konstante Geschwindigkeit besitzt. Ein Beispiel für ein Inertialsystem ist ein Raumschiff, das ohne Antrieb schwerelos durch den Weltraum gleitet, weit entfernt von allen Sternen oder Planeten. Unter physikalischen Wirkungen verstehen wir jede Art von Kraftausbreitung, Informationsübermittlung oder auch jede physikalische Bewegung. Die maximale Ausbreitungsgeschwindigkeit ist gleich der Lichtgeschwindigkeit, die mit dem Buchstaben \(c\) abgekürzt wird.
Wie sicher ist man, dass diese beiden Annahmen in der Natur erfüllt sind?
Da ist man sich sehr sicher. Diese beiden Annahmen gehören zu den bestgesicherten physikalischen Gesetzen überhaupt. Es gibt bis heute kein einziges Experiment, das ihnen widersprechen würde. Im Gegenteil: unzählige Experimente bestätigen immer wieder ihre Gültigkeit. Und auch jede ihrer Auswirkungen wurde im Experiment nachgewiesen. Mehr kann man von physikalischen Gesetzen kaum verlangen.
Die beiden Einsteinschen Postulate haben eine ganze Reihe von Auswirkungen. So folgt aus ihnen für Teilchen mit einer relativistischen Gesamtenergie \(E\), Impulsvektor \(\boldsymbol{p}\) (als Vektor fett geschrieben mit Betrag \(|\boldsymbol{p}| = p\)) und Masse \(m\) die grundlegende Beziehungen \[ E = \sqrt{(pc)^2 + (mc^2)^2} \] (der Impulsvektor \(\boldsymbol{p}\) eines Teilchens ist dabei so etwas wie ein gespeicherter Kraftstoß). Diese Beziehung gilt nicht nur für massebehaftete Teilchen mit \(m > 0\). Auch masselose Teilchen mit \(m = 0\) sind denkbar, was in der nichtrelativistischen Mechanik unmöglich wäre. Und tatsächlich gibt es solche Teilchen in der Natur, z.B. das Teilchen des Lichts, Photon genannt. Masselose Teilchen bewegen sich generell mit der maximal möglichen Geschwindigkeit, also mit Lichtgeschwindigkeit.
Für massebehaftete Teilchen kann man eine Beziehung zwischen Impuls \(\boldsymbol{p}\) bzw. Energie \(E\) mit der Geschwindigkeit \(\boldsymbol{v}\) herstellen: \begin{align} E &= m \gamma c^2 \\ \boldsymbol{p} &= m \gamma \boldsymbol{v} \end{align} mit dem Lorentzfaktor \[ \gamma = \frac{1}{\sqrt{1 - (v/c)^2}} \] Dabei ist \(c\) wie immer die Lichtgeschwindigkeit.
Die spezielle Relativitätstheorie führt zu zwei zentralen Erhaltungsgrößen:
Nicht konstant ist dagegen die Summe der Massen \(m\) aller beteiligten Teilchen. So kann sich ein massebehaftetes Teilchen in zwei masselose Teilchen verwandeln, die zusammen dieselbe relativistische Gesamtenergien \(E\) und denselben Gesamtimpuls \(\boldsymbol{p}\) wie das ursprüngliche Teilchen aufweisen. Man spricht hier auch von der Umwandlung von Masse in Energie. Dieser Prozess kommt in der Natur tatsächlich vor: das neutrale Pion zerfällt nach sehr kurzer Zeit bevorzugt in zwei masselose Photonen, d.h. die Masse des Pions verwandelt sich in die Energie elektromagnetischer Gammastrahlen.
Es gibt noch weitere Auswirkungen, z.B. die Zeitdilatation und die Raumkontraktion. Das bedeutet, dass die Messung von Zeitintervallen und Raumdistanzen von dem Inertialsystem abhängt, in dem die Messung durchgeführt wird. Details dazu findet man in den oben erwähnten Texten.
Mathematisch beschreibt man die spezielle Relativitätstheorie, indem man angibt, wie man von einem Inertialsystem (z.B. dem Bezugssystem Bahnhof) in ein anderes Inertialsystem (z.B. durchfahrender Zug) wechselt, das sich relativ zu dem ersten System geradlinig-gleichförmig bewegen darf. Dabei müssen die Raumkoordinaten \(\boldsymbol{x} = (x^1, x^2, x^3)\) (den Index schreibt man hier üblicherweise oben hin) sowie die Zeitangaben \(t\) von dem einen Bezugssystem in die des anderen Bezugssystems (dargestellt durch den Raumvektor \(\boldsymbol{x}'\) und die Zeitangabe \(t'\) ) umgerechnet werden.
Es zeigt sich, dass man Raumkoordinaten und Zeitkoordinaten nicht getrennt ineinander umrechnen kann, wenn man die Einsteinschen Annahmen erfüllen will. Man fasst daher die drei Raumkoordinaten \(\boldsymbol{x}\) und die Zeit \(t\) zu einem vierkomponentigen Vektor (Vierervektor) \[ x := \begin{pmatrix} x^0 \\ \boldsymbol{x} \end{pmatrix} := \begin{pmatrix} ct \\ \boldsymbol{x} \end{pmatrix} \] zusammen, wobei man die Zeit noch mit der Lichtgeschwindigkeit \(c\) multipliziert und so die nullte Komponente \(x^0 := ct\) des Vierervektors bildet (ja, man zählt hier die vier Komponenten von \(0\) bis \(3\)). Damit weisen alle vier Komponenten die physikalische Dimension einer Länge auf. Die allgemeine Koordinatenumrechnung lautet dann in Matrixschreibweise \[ x' = \Lambda x \] wobei \(x'\) die Raum- und Zeit-Koordinaten im neuen Bezugssystem sind. \(Lambda\) ist dabei eine reelle 4 x 4 -Matrix. Aus den Einsteinschen Annahmen folgt nun, dass diese Matrix eine bestimmte Form haben muss: sie muss die Beziehung \[ g(x,y) = g(\Lambda x, \Lambda y) \] erfüllen, wobei \(x\) und \(y\) zwei beliebige vierkomponentige reelle Vektoren sind und \[ g(x,y) := x^0 y^0 - \boldsymbol{x y} \] mit dem Skalarprodukt \(\boldsymbol{x y}\). Man sagt, \(g\) definiert eine (nicht positiv definite) Metrik im vierdimensionalen reellen Raum (man bezeichnet sie auch als Minkowski-Metrik). Die Matrix \(\Lambda\) muss also die Minkowski-Metrik invariant lassen. Oft schreibt man übrigens auch einfach \(x y\) statt \(g(x,y)\).
Allgemein bezeichnet man die Transformationen \[ x' = \Lambda x + d \] mit \(g(x,y) = g(\Lambda x, \Lambda y)\) und einem Raum-Zeit-Vierer-Verschiebevektor \(d\) als Poincare-Transformationen Die Menge dieser Transformationen bildet die Poincare-Gruppe , wobei sich die Gruppenstruktur auf das Hintereinanderausführen mehrerer Poincare-Transformationen bezieht. Die Poincare-Transformationen umfassen Verschiebungen (Translationen) in Raum und Zeit (gegeben durch den Vierervektor \(d\)) sowie spezielle lineare Transformation der Raum- und Zeitkoordinaten (gegeben durch die Matrix \(\Lambda\)), die die Metrik \(g\) invariant lassen.
Die Poincare-Transformationen, die keine Verschiebung in Raum und Zeit bewirken (\(d = 0\)), werden auch als Lorentz-Transformationen bezeichnet. Dazu gehören die Drehungen im dreidimensionalen Raum sowie die sogenannten Boosts, die einen Wechsel der Geschwindigkeit des Inertialsystems bewirken (man setzt sich z.B. in einen gleichförmig fahrenden Zug). Jede Poincare-Transformation lässt sich aus Verschiebungen in Raum und Zeit, Drehungen und Boosts zusammensetzen. Hinzu kommen noch die speziellen Transformationen Zeitumkehr, Raumspiegelung sowie Raum-Zeit-Spiegelung.
Wechselt man das Bezugssystem, so ändern sich nicht nur Raum- und Zeitkoordinaten, sondern z.B. auch Geschwindigkeiten, Energien und Impulse von Objekten. Beispielsweise bewegt sich ein Fahrgast, der gemütlich in einem fahrenden Zug sitzt, vom Bezugssystem Bahnhof aus betrachtet, denn sein Zug bewegt sich ja. Also er besitzt vom Bahnhof aus gesehen Bewegungsenergie. Vom Bezugssystem Zug aus betrachtet ruht er dagegen, denn er sitzt brav in seinem Sitz – also besitzt er im Bezugssystem Zug keine Bewegungsenergie.
Wie die Umrechnung physikalischer Größen beim Wechsel des Bezugssystems erfolgen muss, hängt von den jeweiligen Größen ab. Energien und Impulse werden anders umgerechnet als elektrische und magnetische Felder oder als quantenmechanische Wellen. Mathematisch entspricht diese Umrechnung einer Darstellung der Poincare-Gruppe auf den entsprechenden mathematischen Objekten, die zu den betrachteten physikalischen Größen gehören. Das bedeutet folgendes:
Nehmen wir an, wir führen erst eine Poincare-Transformation \(A\) und anschließend eine Poincaretransformation \(B\) aus. Dies entspricht zusammen einer Poincaretransformation \(C\). Die betrachtete physikalische Größe (z.B. ein elektromagnetisches Feld) wird bei der Poincare-Transformation \(A\) mit einer Umrechnungsvorschrift \(T_A\) umgerechnet. Bei der anschließenden Poincaretransformation \(B\) erfolgt eine Umrechnung nach der Umrechnungsvorschrift \(T_B\) Beide Umrechnungsvorschriften hintereinander ausgeführt müssen einer Umrechnungsvorschrift \(T_C\) entsprechen, wie sie bei einer Poincaretransformation \(C\) ausgeführt werden muss. Umrechnungsvorschriften mit dieser Eigenschaft bezeichnet man als Darstellung der Poincaregruppe auf den entsprechend umgerechneten Objekten (z.B. el.magn. Felder).
Nach diesem sicher etwas schwer verdaulichen Crashkurs durch die spezielle Relativitätstheorie kommen wir nun zur Quantentheorie, dem zweiten Eckpfeiler jeder grundlegenden physikalischen Naturbeschreibung.
Auch die Quantentheorie basiert – wie die spezielle Relativitätstheorie – auf einigen einfachen Grundsätzen, die zwar leicht aufzuschreiben, aber nur schwer zu akzeptieren sind (für eine anschauliche Einführung siehe Das Unteilbare, Kapitel 3: Seltsame Quantenwelt; die mathematischen Grundlagen findet man in Die Symmetrie der Naturgesetze, Kapitel 4: Die Quantentheorie ):
Nur Wahrscheinlichkeitsaussagen sind möglich:
Das Ergebnis physikalischer Experimente kann im Allgemeinen nicht exakt vorhergesagt werden. In der Natur existiert die Information, die eine solche Vorhersage ermöglichen würde, einfach nicht. Daher kann jede grundlegende physikalische Theorie prinzipiell nur Wahrscheinlichkeitsaussagen über den Ausgang physikalischer Prozesse machen.
Beobachtbare Größen (Observable):
Es gibt verschiedene Sätze gleichzeitig beobachtbarer physikalischer Größen, z.B. Energie, Impuls und Spin eines Teilchens, oder alternativ Zeit, Ort und Spin eines Teilchens (wobei z.B. der Ort gewissen Beobachtungs-Einschränkungen unterliegt). Nicht alle prinzipiell beobachtbaren Größen lassen sich zugleich beobachten. So lassen sich Ort und Impuls eines Teilchens nicht gleichzeitig beliebig genau bestimmen. Zugleich beobachtbare Größen nennt man verträglich.
Ein Ereignis ist ein physikalischer Vorgang (ein Experiment, eine Messung), bei dem wir einen vollständigen Satz miteinander verträglicher Messwerte über ein vollständig bekanntes quantenmechanisches System gewinnen. Das bedeutet, dass wir nicht noch mehr Informationen über den physikalischen Vorgang gewinnen können, oder aber dass solche zusätzlichen Informationen (z.B. der innere Aufbau eines Elementarteilchens) für das betrachtete Experiment nicht relevant sind, da die damit zusammenhängenden physikalischen Freiheitsgrade nicht berührt werden (beispielsweise ist die innere Struktur des Atomkerns bei chemischen Experimenten nicht relevant, da die chemischen Energien viel zu niedrig sind, um den Atomkern zu beeinflussen). Ein Ereignis muss also alle relevanten Informationen umfassen, die in der Natur vorliegen.
Die Messung muss an einem vollständig bekannten quantenmechanischen System vorgenommen werden, d.h. es muss bereits vor der Messung ein (ggf. anderer) vollständiger Satz miteinander verträglicher Messwerte über das System bekannt sein (z.B. Spin und Impuls eines Elektrons). Man sagt dann, das System befindet sich in einem (reinen) quantenmechanischen Zustand. Dazu ist ggf. eine erste Messung notwendig, mit der man das System entsprechend präpariert und so einen solchen reinen Zustand herstellt. Erst dann kann man die eigentliche Messung an diesem Zustand vornehmen.
In einem Experiment ist die Wahrscheinlichkeit \(P\) eines Ereignisses durch das Quadrat des Absolutbetrages einer komplexen Zahl \(C\) gegeben, die Wahrscheinlichkeitsamplitude genannt wird, also \(P = |C|^2\). Dieses Ereignis muss dabei alle Informationen umfassen, die in der Natur vorliegen.
Wenn ein Ereignis auf mehrere verschiedene ununterscheidbare Weisen auftreten kann, ist die Wahrscheinlichkeitsamplitude \(C\) für das Ereignis die Summe der Wahrscheinlichkeitsamplituden jeder einzeln betrachteten Möglichkeit. Es gibt Interferenz. Dabei ist es sehr wichtig, dass die verschiedenen Möglichkeiten im betrachteten Experiment ununterscheidbar sind, also keine messbaren Spuren in ihrer makroskopischen Umgebung hinterlassen, die man im Prinzip messen könnte.
Wenn ein Experiment durchgeführt wird, bei dem (zumindest im Prinzip) unterschieden werden kann, ob die eine oder die andere Alternative wirklich gewählt wurde, dann ist die Wahrscheinlichkeit für das betrachtete experimentelle Ergebnis die Summe der Wahrscheinlichkeiten für jede der Alternativen. Die beiden Alternativen sind als verschiedene Ereignisse zu betrachten, die in diesem Experiment nicht unterschieden werden sollen, obwohl sie unterscheidbar wären. Kurzum: Man darf niemals die Amplituden für verschiedene Ereignisse addieren, sondern muss die Wahrscheinlichkeiten addieren! Als Ergebnis geht die Interferenz verloren.
Anders ausgedrückt:
Dort, wo man in der normalen Wahrscheinlichkeitsrechnung
einzelne Wahrscheinlichkeiten zu einer Gesamtwahrscheinlichkeit addiert
(z.B. die Wahrscheinlichkeit, eine 1 oder eine 2 zu würfeln),
addiert man in der Quantentheorie einzelne Wahrscheinlichkeitsamplituden zu einer Gesamtamplitude,
vorausgesetzt, die einzelnen Amplituden gehören zu experimentell ununterscheidbaren
Alternativen. Bei unterscheidbaren Alternativen ändert sich dagegen nichts gegenüber
der normalen Wahrscheinlichkeitsrechnung.
Wenn man ein Ereignis in mehrere Teilschritte zerlegen kann, so ist die Amplitude für das Ereignis gleich dem Produkt der Amplituden zu jedem Teilschritt.
Anders ausgedrückt:
Dort, wo man in der normalen Wahrscheinlichkeitsrechnung
einzelne Wahrscheinlichkeiten zu einer Gesamtwahrscheinlichkeit multipliziert
(z.B. die Wahrscheinlichkeit, erst eine 1 und dann eine 2 zu würfeln),
multipliziert man in der Quantentheorie einzelne Wahrscheinlichkeitsamplituden
zu einer Gesamtamplitude.
Die Gültigkeit dieser Grundsätzen ist immer wieder in vielen ausgeklügelten Experimenten bestätigt worden, so dass man heute keinen Grund hat, an ihrer universellen Gültigkeit zu zweifeln. Warum sich die Natur aber gerade so verhält, wissen wir nicht. Eine tiefere Begründung dieser Grundsätze ist nicht bekannt.
Ein geeignetes mathematisches Modell, mit dem sich die obigen quantenmechanischen Grundsätze erfassen lassen, bilden die komplexen Hilberträume.
Hilberträume sind (etwas vereinfacht gesagt) endlich- oder unendlichdimensionale Vektorräume über den komplexen Zahlen. In der Quantentheorie benötigt man die unendlichdimensionalen Hilberträume. Ein quantenmechanisches System, das sich in einem reinen Zustand befindet, wird mathematisch durch einen Vektor in diesem Raum dargestellt. Dabei gehören alle Vektoren, die sich nur durch einen komplexen Phasenfaktor (also durch Multiplikation mit einer komplexen Zahl vom Betrag Eins) unterscheiden, zum selben Zustand. Ein Zustand entspricht also genau genommen einer solchen Äquivalenzklasse von Vektoren, die man auch als Strahl im Hilbertraum bezeichnet.
Hilberträume weisen ein Skalarprodukt auf, mit dem man aus zwei Vektoren eine komplexe Zahl machen kann. Dieses quantenmechanische Skalarprodukt zwischen zwei Vektoren \( | \psi \rangle \) und \( | \phi \rangle \) (wir benutzen hier die praktische Dirac-Bra-Ket-Schreibweise) schreibt man meist in der Form \[ C = \langle \phi | \psi \rangle \] Man identifiziert diese komplexe Zahl mit der Wahrscheinlichkeitsamplitude dafür, bei einem quantenmechanischen System, das sich im Zustand \( | \psi \rangle \) befindet, die Messwerte zu messen, die den Zustand \( | \phi \rangle \) kennzeichnen. Bei dieser Messung geht das System vom Zustand \( | \psi \rangle \) in den neuen Zustand \( | \phi \rangle \) über.
Die genaue Form des Hilbertraums hängt vom quantenmechanischen System ab, das wir beschreiben wollen. In der nichtrelativistischen Quantenmechanik eines Teilchens ohne Spin ist dieser Hilbertraum einfach der Raum aller differenzierbaren komplexwertigen quadratintegrierbaren Funktionen im dreidimensionalen reellen Raum. Man kann z.B. bestimmte Funktionen in diesem Raum als Basis wählen und jede Funktion als unendliche Summe in diesen Funktionen darstellen. Das Skalarprodukt ist dabei gegeben durch das dreidimensionale Raumintegral \[ \langle \phi | \psi \rangle = \int \phi^*(\boldsymbol{x}) \, \psi(\boldsymbol{x}) \, d^3x \] zwischen den Funktionen \(\psi(\boldsymbol{x})\) und der Funktion \(\phi(\boldsymbol{x})\), wobei der hochgestellte Stern bedeutet, dass die komplex konjugierten Funktionswerte von \(\phi\) genommen werden müssen. Der Vektor \(\boldsymbol{x}\) bezeichnet wieder einen Punkt im Raum.
Das soll als Kurzeinführung in die Quantentheorie hier genügen. Für jemanden, der noch nie etwas über dieses Thema gehört hat, ist diese Kurzeinführung vermutlich unverdaulich. Den an Details interessierten Leser möchte ich daher noch einmal auf die folgenden Links verweisen, wo das Thema sehr viel ausführlicher dargestellt ist: Das Unteilbare, Kapitel 3: Seltsame Quantenwelt und Die Symmetrie der Naturgesetze, Kapitel 4: Die Quantentheorie.
Die relativistische Quantenfeldtheorie fasst nun die Forderungen der speziellen Relativitätstheorie und der Quantentheorie in einem gemeinsamen Rahmen zusammen.
Quantentheorie bedeutet, dass wir jedes physikalische System mit Wahrscheinlichkeiten für Messungen beschreiben müssen, die über Wahrscheinlichkeitsamplituden berechnet werden können. Dazu können wir mathematisch Hilberträume verwenden. Ein physikalisches System, das sich in einem bestimmten Zustand befindet, entspricht (bis auf Phasenfaktoren) einem Vektor im Hilbertraum, und Wahrscheinlichkeitsamplituden für Messungen an diesem Zustand sind durch entsprechende Skalarprodukte gegeben.
Die Einbeziehung der speziellen Relativitätstheorie bedeutet zunächst, dass wir angeben müssen, wie sich Wahrscheinlichkeitsamplituden ändern, wenn wir einen Wechsel des Bezugssystems über eine Poincaretransformation durchführen. Das bedeutet: Wir suchen eine Darstellung der Poincaregruppe auf den Vektoren des Hilbertraums (genauer: auf den Strahlen im Hilbertraum, die durch Vektoren gegeben sind, die sich nur durch einen Phasenfaktor unterscheiden), also eine Umrechnungsformel, mit der sich Vektoren und damit Skalarprodukte und Wahrscheinlichkeitsamplituden umrechnen lassen, wenn wir das Bezugssystem im Sinne Einsteins wechseln. Die Umrechnungsformel muss dabei berücksichtigen, dass zwei hintereinander ausgeführte Poincaretransformationen einer dritten Poincaretransformation entsprechen. Dies muss (bis auf einen Phasenfaktor) auch für die zugehörigen Umrechnungsformeln gelten – genau dies bedeutet das Wort Darstellung (siehe oben).
Bei dieser Umrechnung müssen wir sicherstellen dass die physikalischen Gesetze in allen Inertialsystemen in der gleichen Form gelten. Das bedeutet, dass die Wahrscheinlichkeit für bestimmte Messwerte nicht davon abhängen darf, in welchem Inertialsystem wir das physikalische System beschreiben.
Was bedeutet diese Bedingung mathematisch?
Betrachten wir dazu ein physikalisches Objekt, bei dem wir einen vollständigen Satz verträglicher Messwerte kennen. Das Objekt befindet sich also in einem reinen quantenmechanischen Zustand und kann (bis auf den üblichen Phasenfaktor) durch einen Hilbertraumvektor \( | \psi \rangle \) beschrieben werden. Wir messen nun an diesem Objekt einen anderen vollständigen Satz verträglicher Messgrößen. Als Ergebnis finden wir beispielsweise einen Satz Messwerte, so wie sie ein Zustand \( | \phi \rangle \) aufweisen wurde. Das System befindet sich also nach der Messung im Zustand \( | \phi \rangle \). Die komplexe Wahrscheinlichkeitsamplitude für diesen Ausgang der Messung ist durch das Skalarprodukt \(\langle \phi | \psi \rangle \) gegeben, und die Wahrscheinlichkeit ist das Betragsquadrat dieser Amplitude.
Nun führen wir eine eine Poincaretransformation durch, d.h. wir wechseln zur Beschreibung dieses Experiments das Bezugssystem von Raum und Zeit nach der allgemeinen Formel \[ x' = \Lambda x + d \] Anschaulich bedeutet das beispielsweise, dass wir den ganzen experimentellen Aufbau in einen fahrenden Zug einbauen, anstatt in ein ruhendes Labor (im Sinne einer aktiven Interpretation der Poincare-Transformation).
Die Zustandsvektoren in diesem neuen Bezugssystem sind nicht identisch mit den alten Zustandsvektoren, sondern sie müssen über eine Umrechnungsformel (nennen wir sie \(T_{\Lambda, d} \)) aus den alten Vektoren berechnet werden: \begin{align} | \psi' \rangle &= T_{\Lambda, d} \, | \psi \rangle \\ | \phi' \rangle &= T_{\Lambda, d} \, | \phi \rangle \end{align} Man sagt auch, \(T_{\Lambda, d} \) ist ein Operator im Hilbertraum, der Vektoren ineinander umwandelt.
Die Wahrscheinlichkeit für das Eintreten des betrachteten Messergebnisses muss im neuen Bezugssystem genauso groß sein wie im alten Bezugssystem, denn physikalische Gesetze dürfen nicht vom Bezugssystem abhängen. Also muss gelten: \begin{align} |\langle \phi | \psi \rangle|^2 &= |\langle \phi' | \psi' \rangle|^2 \\ &= |\langle T_{\Lambda, d} \, \phi | T_{\Lambda, d} \, \psi \rangle|^2 \end{align} Man kann zeigen, dass dies mathematisch bedeutet, dass der Operator \(T_{\Lambda, d} \) bis auf einen Phasenfaktor unitär oder antiunitär sein muss (Wigner-Theorem; auf die genaue Definition dieser Begriffe wollen wir hier verzichten).
Was nun folgt, ist eine genaue Analyse der Möglichkeiten, wie die unitären oder antiunitären Operatoren \(T_{\Lambda, d} \) und die Hilberträume, auf denen sie wirken, aussehen können. Man nennt dieses mathematische Gebiet die Darstellungstheorie der Poincaregruppe. Auf diese Weise erhält man eine Übersicht über alle Hilberträume, die mit der speziellen Relativitätstheorie verträglich sind.
Diese Übersicht der Hilberträume zeigt:
Bleiben wir bei dem Fall \(m > 0\). Einen Zustand mit Masse \(m\), Viererimpuls \(p := (E/c, \, \boldsymbol{p})\), Spin \(s\) und Spinkomponente \(m_s\) wollen wir mit \[ | m, p, s, m_s \rangle \] abkürzen. Alle diese Eigenschaften \( p, m, s, m_s \) werden allein dadurch definiert, dass nur sie festlegen, wie der Zustand durch den Operator \( T_{\Lambda, d} \) umgerechnet werden muss, wenn man einen Bezugssystemwechsel durch eine Poincaretransformation durchführt. Die Existenz dieser Eigenschaften ist also das Ergebnis der Darstellungstheorie der Poincaregruppe auf Hilberträumen und folgt damit aus der speziellen Relativitätstheorie.
Wie kann man einen solchen quantenmechanischen Zustand interpretieren? Die Experimente sowie theoretische Überlegungen zeigen, dass ein solcher Zustand eine geeignete quantenmechanische Beschreibung für frei dahinfliegende Objekte (z.B. Teilchen) liefert, die eben Masse \(m\), Vierer-Impuls \(p\), Spin \(s\) und Spinkomponente \(m_s\) besitzen. Dabei entsprechen Masse \(m\) und Vierer-Impuls \(p\) den klassisch definierten Größen, wie man sie auch in der klassischen Mechanik (mit spezieller Relativitätstheorie) kennt. Es gilt beispielsweise die Erhaltung des Gesamtimpulses und der Gesamtenergie bei Stoßprozessen.
Für den Spin und die Spinkomponente gibt es dagegen kein klassisches Analogon. Man sieht nur, dass man für sehr große Spinwerte Überlagerungen von Zuständen konstruieren kann, die sich annähernd wie ein klassisches rotierendes Objekt mit Drehimpuls \(s \cdot (s+1)\) verhalten. Daher spricht man beim Spin auch oft von einer Eigenrotation des Objektes, was aber nur eine grobe Vorstellung vom Spin vermitteln kann. In der klassischen Physik gibt es eben keinen Spin.
Bei nicht zu großen Impulsen kann man versuchen, die Wahrscheinlichkeiten für den Aufenthaltsort eines Objektes zu einer bestimmten Zeit zu messen, wobei das Objekt durch einen Zustand \( | m, p, s, m_s \rangle \) beschrieben werden soll. Genau genommen führt man Interferenzexperimente mit vielen solcher Objekte durch, z.B. den berühmten Doppelspaltversuch. Bei den zugehörigen quantenmechanischen Berechnungen kommen Wahrscheinlichkeitsamplituden ins Spiel, die Ort und Zeit enthalten, also Amplituden der Form \(A(t, \boldsymbol{x}, E, \boldsymbol{p}, \, ...)\), wobei man wie oben gezeigt oft Zeit und Ort zu einem Vierervektor \( x = ( ct, \boldsymbol{x} ) \) zusammenfasst. Die Experimente zeigen, dass die Orts-Zeit-Abhängigkeit diese Amplituden durch einen Faktor \[ e^{-i/\hbar \cdot g(p,x)} = e^{-i/\hbar \cdot (E t - \boldsymbol{p x})} \] gegeben ist, also durch ebene Wellen, deren Vierer-Wellenvektor \(k = (\omega/c, \, \boldsymbol{k} )\) über \( p = \hbar k \) mit dem Viererimpuls \(p := (E/c, \, \boldsymbol{p})\) zusammenhängt. Dabei kommt eine neue Naturkonstante ins Spiel, die charakteristisch für die Quantenmechanik ist: das Planck'sche Wirkungsquantum (Planck-Konstante) \(h\). Die oben verwendete reduzierte Planck-Konstante ist dann \(\hbar = h/(2\pi)\). Ausgeschrieben bedeutet \( p = \hbar k \) folgendes: \[ p = \begin{pmatrix} E/c \\ \boldsymbol{p} \end{pmatrix} = \hbar k = \hbar \begin{pmatrix} \omega/c \\ \boldsymbol{k} \end{pmatrix} \] Da die Kreisfrequenz \(\omega\) über \(\omega = 2 \pi f\) mit der Frequenz \(f\) der Welle verbunden ist und der Wellenvektor \( \boldsymbol{k} \) über \( |\boldsymbol{k}|= 2 \pi / \lambda \) mit der Wellenlänge verknüft ist, ergeben sich mit \(\hbar = h/(2\pi)\) die beiden berühmten Formeln der Quantenmechanik: \begin{align} E &= \hbar \omega = h f \\ |\boldsymbol{p}| &= \hbar |\boldsymbol{k}| = \frac{h}{\lambda} \end{align} Die Naturkonstante \(h\) bestimmt also, welche Impulse mit welchen Wellenlängen zusammenhängen, und welche Energien mit welchen Frequenzen. Die Tatsache, dass frei fliegende Objekte mit gegebenem Impuls etwas mit ebenen Wellen zu tun haben, bezeichnet man auch als Welle-Teilchen-Dualismus. Dieser Zusammenhang zwischen Welleneigenschaften (Wellenlänge und Frequenz) und Teilcheneigenschaften (Energie und Impuls) erzwingt die Existenz der Naturkonstanten \(h\), die diesen Zusammenhang quantitativ festlegt.
Bei mehreren Teilchen wird die Quantenmechanik kompliziert, denn: das Ganze ist hier mehr als die Summe seiner Teile.
Betrachtet man ein System aus mehreren identischen Teilchen (z.B. die Elektronen in der Hülle eines Atoms), so sind diese Teilchen prinzipiell ununterscheidbar. Man kann nicht eines dieser Teilchen irgendwie physikalisch markieren und es später wieder identifizieren.
Was für Folgen hat das für die quantenmechanische Beschreibung von mehreren identischen Teilchen?
Betrachten wir als Beispiel zwei frei dahinfliegende Elektronen, die beide Spinkomponente \(1/2\) haben sollen (so dass wir uns um die Spinkomponente hier nicht zu kümmern brauchen). Eines dieser Elektronen soll Impuls \( \boldsymbol{p} \), das andere Impuls \( -\boldsymbol{p} \) haben, d.h. die beiden Elektronen fliegen in entgegengesetzte Richtung. Welches Elektron aber in welche Richtung fliegt, wissen wir prinzipiell nicht. Wir können experimentell immer nur nachweisen, dass eines in der einen und eines in der anderen Richtung fliegt. Bahnkurven, die eine Unterscheidung der Elektronen zuließen, gibt es in der Quantentheorie ja nicht.
Wie lautet nun der quantenmechanische Zustandsvektor, der diesen Quantenzustand beschreibt? Er setzt sich aus zwei Zustandsvektoren zusammen: dem Vektor \[ | \boldsymbol{p}, 1/2 \rangle \otimes | -\boldsymbol{p}, 1/2 \rangle \] (Bedeutung: das erste Elektron hat Impuls \( \boldsymbol{p} \) und Spinkomponente \(1/2\), das zweite Elektron hat Impuls -p und ebenfalls Spinkomponente 1/2) und dem Vektor \[ | - \boldsymbol{p}, 1/2 \rangle \otimes | \boldsymbol{p}, 1/2 \rangle \] (Bedeutung: das erste Elektron hat Impuls \( -\boldsymbol{p} \) und Spinkomponente \(1/2\), das zweite Elektron hat Impuls \( \boldsymbol{p} \) und ebenfalls Spinkomponente \(1/2\)).
Diese beiden Vektoren entsprechen zwei ununterscheidbaren Möglichkeiten. Mathematisch ist jeder dieser Vektoren das Tensorprodukt zweier Ein-Teilchen-Vektoren (deshalb das Symbol \( \otimes \)). Bei Funktionen ist dieses Tensorprodukt einfach gleich dem Produkt der Funktionen.
Nach den obigen Regeln für Amplituden müssten diese beiden Vektoren nun eigentlich addiert werden, so dass daraus per Skalarprodukt gebildete Amplituden sich ebenfalls addieren – sie entsprechen ja zwei ununterscheidbaren Möglichkeiten zum selben Ereignis. Allerdings erfährt diese Regel hier eine Abänderung:
Diese Regel ist verträglich damit, dass das Betragsquadrat der Gesamtamplitude sich beim Vertauschen der beiden Teilchen nicht ändert. So muss es auch sein, damit die Teilchen ununterscheidbar sind.
Warum das Pauli-Prinzip gilt, kann man nicht unmittelbar einsehen. Die Begründung für diese einfache Regel liegt tief in den Details der Quantenfeldtheorie verborgen – ein Beispiel dafür, dass eine einfache Regel nicht zwangsläufig eine einfache Begründung haben muss! Letztlich hängt es damit zusammen, dass man neben einer Vertauschung zweier Teilchen noch eine Drehung eines dieser Teilchen um 360 Grad benötigt, um die ursprüngliche Situation vollkommen wiederherzustellen. Man erkennt das, wenn man die Enden eines durchhängenden Papierstreifens vertauscht: ein Ende muss man nach der Vertauschung der Enden drehen, damit der Streifen wieder glatt durchhängt. Eine Drehung um 360 Grad bewirkt bei Fermionen aber einen Vorzeichenwechsel der Amplitude, wie man aus der Darstellungstheorie der Drehgruppe auf Strahlen im Hilbertraum mathematisch ermitteln kann.
Das Pauli-Prinzip bewirkt, dass man auch die beiden obigen Vektoren mit umgekehrtem Vorzeichen addieren muss, um den Gesamtvektor zu erhalten, der die beiden Fermionen korrekt beschreibt (die Spinkomponente 1/2 haben wir zur Vereinfachung weggelassen): \[ | \boldsymbol{p} \rangle \otimes | -\boldsymbol{p} \rangle \, - \, | -\boldsymbol{p} \rangle \otimes | \boldsymbol{p} \rangle \] Ganz allgemein muss man mehrere identische Fermionen durch einen Zustandsvektor beschreiben, der vollkommen antisymmetrisch beim Vertauschen zweier Teilchen ist. Bei Teilchen mit ganzzahligem Spin (sogenannten Bosonen) muss man dagegen einen vollkommen symmetrischen Zustandsvektor verwenden.
Welche beobachtbaren Größen gibt es in der relativistischen Quantenfeldtheorie?
Beobachtbar sind im Wesentlichen freie (d.h. nicht oder kaum wechselwirkende) Teilchen und ihre Eigenschaften wie Masse, Energie, Impuls und Spin. Diese Eigenschaften entsprechen gerade den Größen, wie sie sich aus der Darstellungstheorie der Poincaregruppe ergeben. Hinzu kommt noch die elektrische Ladung, die immer messbar ist, da sie mit einem sich weit ausbreitenden elektrischen Feld verknüpft ist, sowie ggf. weitere Quantenzahlen wie z.B. Strangeness etc., die von den Details der jeweiligen Quantenfeldtheorie abhängen und die beispielsweise für die Buchhaltung bei physikalisch möglichen Prozessen notwendig sind.
Nicht beobachtbar sind normalerweise die Details bei einer Wechselwirkung zwischen den Teilchen. Stattdessen lässt man bestimmte Teilchen miteinander kollidieren und misst die Wahrscheinlichkeiten dafür, was für Teilchen mit welchen Eigenschaften nach der Kollision auseinanderfliegen.
Beobachtbare Größen kennzeichnen im Hilbertraum-Formalismus der Quantentheorie die verschiedenen Zustandsvektoren, denn erst ein vollständig bekannter Satz gleichzeitig messbarer Größen definiert einen Zustand.
Betrachten wir irgendeine beobachtbare Größe (z.B. den Impuls oder den Spin), wobei wir zur Vereinfachung annehmen wollen, dass diese Größe nur diskrete reelle Messwerte \(a_n\) annehmen kann (\(n\) ist dabei eine natürliche Zahl und nummeriert die möglichen Messwerte durch). Dies können auch unendlich viele Werte sein. Bei Größen wie dem Impuls sind sogar kontinuierlich viele Werte möglich (d.h. diese Werte sind nicht abzählbar) – in diesem Fall wird der Formalismus etwas aufwendiger, da Summen durch Integrale ersetzt werden. Wir wollen diese Feinheit hier noch nicht berücksichtigen.
Zu der beobachtbare Größe gibt es nun Zustandsvektoren im Hilbertraum, die durch den Wert von \(a_n\) sowie weiterer damit verträglicher Messwerte festgelegt sind. Wir wollen diese Vektoren mit \[ | n, \, ... \rangle \] bezeichnen, wobei die Punkte andeuten, dass noch weitere Messwerte anderer Größen notwendig sein können, um den Zustandsvektor eindeutig festzulegen. Die Vektoren bilden eine Orthonormalbasis im Hilbertraum, d.h. es ist \[ \langle n, \, ... | n', \, ... \rangle \] ist \(1\) wenn \(n = n'\) und Null sonst, entsprechend der Interpretation des Skalarproduktes als Wahrscheinlichkeitsamplitude.
Wir können der beobachtbaren Größe nun den folgenden Operator im Hilbertraum eindeutig zuordnen: \[ A = \sum_n \, | n \rangle \, a_n \, \langle n| \] (die Punkte lasssen wir vereinfacht weg) wobei \(n\) über alle möglichen Messwert-Indices läuft. Dabei ist der Operator \( \langle n| \) dadurch definiert, dass er angewendet auf den Zustand \( | \phi \rangle \) das Skalarprodukt \[ \langle n|\phi \rangle \] ergibt. \( \langle n| \) ist also gleichsam der linke Teil des Skalarproduktes (oder für Mathematiker: er ist ein Element des Dualraums). Daher auch die Schreibweise.
Da die Messwerte \(a_n\) reelle Zahlen sind, ist \(A\) ein hermitescher Operator, d.h. er besitzt für beliebige Hilbertraumvektoren die Eigenschaft \[ \langle \psi | A \phi \rangle = \langle A \psi | \phi \rangle \] Weiterhin sind die Zusdtandsvektoren \( | n \rangle \) Eigenvektoren von \(A\) mit Eigenwert \(a_n\), d.h. \[ A \, | n \rangle = a_n \, | n \rangle \] Und schließlich gibt \[ \langle \psi | A \psi \rangle \] den Erwartungswert für die mit \(A\) verbundene beobachtbare Größe bei Messungen an, wenn man diese an einem quantenmechanischen System vornimmt, das durch den Zustand \( | \psi \rangle \) beschrieben wird, d.h. der Ausdruck gibt den Mittelwert für die Messwerte \(a_n\) an, den man bei einer sehr großen Zahl von Messungen an dem System (bzw. an vielen dazu identischen Systemen) erhält.
Halten wir also fest:
Auch jede Veränderung eines quantenmechanischen Zustandes muss durch einen Operator im Hilbertraum dargestellt werden, denn ein solcher Operator führt ja zu einer Veränderung (Umrechnung) der Zustandsvektoren, die die physikalische Veränderung der Wahrscheinlichkeitsamplituden widerspiegelt. Schauen wir uns speziell an, wie die zeitliche Veränderung von Zuständen aussieht:
Die zeitliche Entwicklung eines physikalischen Systems, das sich in einem vollständig bekannten quantenmechanischen Zustand befindet, wird in der Quantentheorie durch die zeitliche Veränderung des zugehörigen Hilbertraumvektors beschrieben. Dabei macht man die Annahme, dass die zeitliche Veränderung des Vektors zur Zeit \(t\) sich vollständig aus dem Vektor zu diesem Zeitpunkt ergibt. Man benötigt nur eine Rechenvorschrift, die es einem erlaubt, aus dem Vektor zur Zeit \(t\) seine zeitliche Veränderung (also mathematisch seine erste zeitliche Ableitung) zu bestimmen. Diese Rechenvorschrift bezeichnet man als Hamiltonoperator (abgekürzt durch den Buchstaben \(H\)). Zusätzlich verwendet man noch das Plancksche Wirkungsquantum \(\hbar\), so dass der Hamiltonoperator die physikalische Dimension einer Energie erhält. Damit ist die zeitliche Entwicklung von Zustandsvektoren in der Quantentheorie gegeben durch die Gleichung \[ i \hbar \frac{d}{dt} | \psi (t) \rangle = H \, | \psi (t) \rangle \] In der nichtrelativistischen Quantenmechanik bezeichnet man diese Gleichung als Schrödingergleichung. Aber eine Gleichung dieser Form gilt auch in der relativistischen Quantenfeldtheorie – es treten allerdings gewisse Probleme auf (Stichwort Renormierung). Außerdem hat diese Gleichung kein einfaches Transformationsverhalten unter Poincaretransformationen (also beim Wechsel des Bezugssystems).
Die obige Gleichung hat die formale Lösung \[ | \psi (t) \rangle = e^{-i/\hbar \, H t} \, | \psi (0) \rangle \] mit dem Anfangsvektor \( | \psi (0) \rangle \), der den Zustand zum willkürlich gewählten Zeitpunkt \(t = 0\) beschreibt. Die Exponentialfunktion des Hamiltonoperators ist dabei als Reihenentwicklung zu verstehen, analog zu \( e^x = 1 + x + x^2/2 + \, ... \). Über Konvergenzprobleme wollen wir uns an dieser Stelle noch keine Gedanken machen.
Der Hamiltonoperator muss ein hermitescher Operator sein, so dass \( e^{-i/\hbar \, H t} \) ein unitärer Operator ist (so dass die Gesamtwahrscheinlichkeit dafür, dass überhaupt etwas bei einer Messung gemessen wird, gleich Eins bleibt – die Norm von Zustandsvektoren ändert sich also nicht).
Da der Hamiltonoperator \(H\) hermitesch ist, kann man ihn analog zum Operator \(A\) oben darstellen. Er gehört also zu einer beobachtbaren Größe, wobei die möglichen Messwerte (nennen wir sie \(E_n\)) Eigenwerte und die dazugehörenden Zustandsvektoren (nennen wir sie wieder \(| n \rangle \) ) Eigenvektoren von \(H\) sind: \[ H \, | n \rangle = E_n \, | n \rangle \] Es ist also \[ H = \sum_n \, | n \rangle \, E_n \, \langle n| \] Aber welche physikalische Interpretation haben nun die Messwerte \(E_n\)?
Schauen wir uns dazu die Zeitentwicklungsgleichung für einen Eigenvektor von \(H\) an: \begin{align} | n (t) \rangle &= e^{-i/\hbar \, H t} \, | n (0) \rangle = \\ &= e^{-i/\hbar \, E_n t} \, | n (0) \rangle \end{align} Zum Vergleich: Oben hatten wir gesehen, dass Zustände mit Impuls \( \boldsymbol{p} \) und Energie \(E\) zu Wahrscheinlichkeitsamplituden führen, deren Raum-Zeit-Abhängigkeit durch den Faktor \[ e^{-i/\hbar \cdot g(p,x)} = e^{-i/\hbar \cdot (E t - \boldsymbol{p x})} \] gegeben ist, wobei \(E\) die Energie des Zustandes ist. Die zeitliche Entwicklung ist also durch \( e^{-i/\hbar \cdot E t } \) bestimmt. Vergleichen wir dies mit der zeitlichen Entwicklung von \( | n (t) \rangle \), so sehen wir, dass \(E_n\) die Energie dieses Zustands sein muss. Der Hamiltonoperator gehört also zur beobachtbaren Größe Energie.
Nach diesem Crash-Kurs in spezieller Relativitätstheorie und Quantentheorie sind wir nun halbwegs gerüstet, uns konkrete Quantentheorien anzusehen. Beginnen wollen wir im nächsten Kapitel mit der Quantentheorie der klassichen Mechanik, die auch nichtrelativistische Quantenmechanik genannt wird.
© Jörg Resag, www.joerg-resag.de
last modified on 28 April 2023