Kapitel 4
Was sind Masse und Impuls?

Von Trägheit und Schwung zu Masse und Impuls
Impulserhaltung und Relativitätsprinzip
Der nichtrelativistische Impuls
Impuls und Trägheit in der Relativitätstheorie
Auch Felder besitzen Trägheit und Impuls



Von Trägheit und Schwung zu Masse und Impuls

Die beiden Begriffe Masse und Impuls sind uns im letzten Kapitel bereits begegnet, denn sie sind untrennbar mit dem Kraftbegriff verbunden. Isac Newton hatte es als Erster erkannt: Wirkt eine Kraft auf einen Körper, so ändert sich dessen Bewegung (Aktionsprinzip), während ohne Krafteinwirkung die Bewegung des Körpers geradlinig-gleichförmig oder ruhend bleibt (Trägheitsprinzip). Präzise ausgedrückt bedeutet das, dass die zeitliche Änderung des Impulses gleich der wirkenden Kraft ist:

  F = dp/dt

Hinzu kommt das Wechselwirkungsprinzip, nach dem innere Kräfte (beispielsweise zwischen zwei Sternen in einem Doppelsternsystem) den Gesamtimpuls des Systems nicht ändern (Impulserhaltung).

Man könnte die Formel   F = dp/dt   für eine reine Definition halten, doch damit wäre überhaupt nichts gewonnen, wie wir im letzten Kapitel bereits gesehen haben. Wir müssen der Formel vielmehr physikalisches Leben einhauchen, indem wir einerseits mehr über die Kräfte herausfinden, die in der Natur zwischen verschiedenen Objekten wirken, und indem wir andererseits den Impuls in Bezug zur Bewegung des Objekts setzen -- letzteres soll Thema dieses Kapitels sein: Wieviel Impuls hat ein Körper, der sich mit einer bestimmten Geschwindigkeit   v   bewegt?

Die entsprechenden Formeln sind im letzten Kapitel gewissermaßen vom Himmel gefallen: Der Impuls ist gleich der Masse mal der Geschwindigkeit des Körpers, also   p = m v   -- so lernt man es in der Schule. Doch warum ist das so? Muss das so sein? Keineswegs muss das so sein, wie wir bereits gesehen haben, denn die Trägheit eines Körpers nimmt in Wirklichkeit zu, wenn er schneller wird, sodass ein Korrekurfaktor   γ   (der Lorentzfaktor) hinzukommt:   p = m γ v   . Diese Zunahme der Trägheit macht sich allerdings erst bei sehr großen Geschwindigkeiten bemerkbar, die in der Nähe der Lichtgeschwindigkeit liegen. Für kleine Geschwindigkeiten ist daher γ kaum größer als 1, während in Richtung Lichtgeschwindigkeit γ und damit die Trägheit gegen Unendlich strebt.

Wie Impuls und Geschwindigkeit zusammenhängen, ist natürlich letztlich eine experimentelle Frage, denn was immer wir uns auch ausdenken -- es muss Vorhersagen über die Bewegung von Körpern ermöglichen, die mit der Realität übereinstimmen. Also könnte man sagen: Zusammen mit dem Lorentzfaktor haben wir die richtige Impulsformel gefunden, denn sie wird durch das Experiment bestätigt. Doch irgendwie ist das unbefriedigend: Wir wollen verstehen, welche Grundprinzipien zu diesem Gesetz führen. Wo kommen diese Formeln letztlich her?

Es gibt tatsächlich ein Grundprinzip, das uns hier weiterhilft: Das Relativitätsprinzip, das wir bereits in den beiden Kapiteln zu Raum und Zeit kennengelernt haben. Es besagt, dass die Natur in jedem sich gleichförmig bewegenden Bezugssystem (Inertialsystem) durch dieselben Naturgesetze beschrieben wird (zumindest wenn wir die Komplikationen durch Einsteins Gravitationstheorie außen vor lassen). Befindet man sich beispielsweise in einem gleichmäßig dahinfliegenden Raumschiff und sieht ein anderes Raumschiff vorbeigleiten, so kann man nicht sagen, welches Raumschiff ruht und welches sich bewegt. Innerhalb jedes der beiden Raumschiffe merkt man von einer gleichförmigen Eigenbewegung des Raumschiffs rein gar nichts. Es könnte genauso gut stillstehen.

Wie kann uns dieses Prinzip weiterhelfen? Schauen wir uns dazu irgendein ruhendes Objekt im leeren Weltraum an, das in zwei gleichartige Objekte auseinanderfällt, die anschließend in entgegengesetzte Richtungen wegfliegen. Es könnte sich bei dem ruhenden Objekt beispielsweise um zwei kleine identische Metallkugeln handeln, die zunächst irgendwie miteinander verriegelt sind und die sich außerdem gegenseitig abstoßen. Sobald die Verriegelung gelöst wird, fliegen sie auseinander. Oder aber es könnte sich aber um irgendein Elementarteilchen handeln, das spontan in zwei andere einander gleiche Teilchen zerfällt. Wir brauchen hier nicht zu wissen, um was für ein Objekt es sich handelt. Alles was wir brauchen ist die Tatsache, dass wir zunächst ein ruhendes Objekt vor uns haben, aus dem irgendwie zwei andere einander gleiche Objekte werden, die auseinanderfliegen.

Wie muss nun eine Größe aussehen, die eine Art inneren Schwung dieser Objekte repräsentiert -- genau das soll der Impuls ja darstellen? Wir erwarten, dass dieser Schwung umso größer ist, je schneller das Objekt ist. Und noch eine zweite Erfahrung lassen wir einfließen: Wir erwarten, dass der Schwung umso größer ist, je massiver bzw. träger ein Objekt ist, d.h. je weniger gut es sich bei gleicher Kraftwirkung aus seiner Bahn ablenken lässt. Mit diesen Annahmen lassen wir gewissermaßen unsere experimentellen Beobachtungen zur Physik bewegter Objekte einfließen, denn nur so können wir einen geeigneten physikalischen Startpunkt zur Begriffsbildung finden.

Unser betrachtetes Startobjekt von oben sollte also gar keinen Schwung bzw. Impuls besitzen, denn es bewegt sich ja nicht. Nach dem Auseinanderfallen erwarten wir, dass die beiden entandenen Einzelobjekte genau mit derselben Geschwindigkeit v in entgegengesetzte Richtungen auseinanderfliegen, denn sie sind einander vollkommen gleichwertig, sodass es keine Bevorzugung für eines der beiden Objekte geben sollte. Tatsächlich bestätigt das Experiment diese Erwartung: die beiden Objekte fliegen wirklich mit entgegengesetzt-gleichen Geschwindigkeiten v und −v auseinander. Nach Newtons Wechselwirkungsprinzip muss es auch so sein, wenn wir beispielsweise die beiden Metallkugeln betrachten, die durch eine Abstoßungskraft zwischen den beiden Kugeln auseinandergetrieben werden, sodass der Gesamtimpuls erhalten bleiben muss. Vor dem Auseinanderfallen ist der Impuls Null, und er muss es auch nachher noch sein, d.h. die beiden Impulse der auseinanderfliegenden Objekte müssen entgegengesetzt gleich sein.

Wir wollen nun davon ausgehen, dass wenn das Gesetz der Impulserhaltung in irgendeinem Inertialsystem (gleichförmig bewegtem oder ruhendem Bezugssystem) gilt, dass es dann auch in allen anderen Inertialsystemen gilt, die sich relativ dazu geradlinig-gleichförmig bewegen. Genau so muss es sein, wenn die Impulserhaltung ein Naturgesetz ist und wenn wir das Relativitätsprinzip voraussetzen, nach dem ein Naturgesetz in allen Inertialsystemen gelten muss. Wir können uns dieselbe Situation also auch aus einem gleichmäßig dahingleitenden Raumschiff heraus ansehen. Seine Geschwindigkeit soll so gewählt sein, das das linke der beiden auseinanderfliegende Objekte vom Raumschiff aus gesehen ruht.

Wir erwarten nun, dass wir folgendes sehen: Vor dem Zerfall bewegt sich das ursprüngliche Objekt mit der Geschwindigkeit v, denn wir selbst bewegen uns ja nun mit der Geschwindigkeit −v relativ zu diesem Objekt. Nach dem Zerfall ruht das linke neu entstandene Objekt, während das rechte Objekt sich mit der Geschwindigkeit 2v bewegt -- unser Raumschiff bewegt sich ja mit −v in die Gegenrichtung.



Zerfall eines Objektes (blau) in zwei gleichartige Objekte (rot) aus zwei verschiedenen Bezugssystemen heraus gesehen. Im ersten Bezugssystem ruht das zerfallende Objekt (blau), im zweiten Bezugssystem (Raumschiff) bewegt sich der Beobachter so nach links, dass das neu entstandene, nach links fliegende Objekt (rot) für ihn ruht. Beide Sichtweisen sind physikalisch vollkommen gleichwertig, d.h. beide Beobachter bestätigen die Erhaltung des Gesamtimpulses beim Zerfall. Das Bild stellt den nichtrelativistischen Fall dar, d.h. die Geschwindigkeit v des Raumschiffs muss deutlich kleiner als die Lichtgeschwindigkeit sein. Im relativistischen Fall -- also für größere Geschwindigkeiten -- ist im unteren Bild die Geschwindigkeit des nach rechts fliegenden roten Objekts kleiner als 2v, da die Uhr des Raumschiffs nicht synchron zur Uhr des ruhenden Beobachters tickt -- mehr dazu weiter unten.


Die Trägheit der Objekte wollen wir nun durch eine Masse charakterisieren, die für jedes Objekt charakteristisch und unveränderlich sein soll. Falls die Trägheit mit zunehmender Geschwindigkeit größer werden sollte, so wollen wir dies ggf. durch einen Korrekturfaktor berücksichtigen, sodass sich die Masse selbst nicht ändert. Die Masse stellt also die Trägheit eines noch ruhenden Objekts dar, sodass man auch von der Ruhemasse spricht.

Die Masse der beiden auseinanderfliegenden Objekte soll jeweils   m   sein, die Masse des Objektes vor dem Zerfall soll   M   sein. Wenn wir nun für alle Impulse den Ansatz Impuls gleich Masse mal Geschwindigkeit machen, so passt alles wunderbar zusammen: Der Impuls ist wie verlangt umso größer, je massiver (träger) und je schneller ein Objekt ist, und außerdem gilt die Impulserhaltung in beiden Bezugssystemen:

Bei ruhendem Anfangsobjekt ist vor dem Zerfall der Impuls   P = 0   und nach dem Zerfall haben wir die beiden Impulse   p1 = − m v   und   p2 = m v   , die sich zu Null aufaddieren, sodass die Impulserhaltung   P = p1 + p2   erfüllt ist.

Aus dem Raumschiff betrachtet ist vor dem Zerfall der Impuls   P = M v   und nach dem Zerfall haben wir die beiden Impulse   p1 = 0   und   p2 = 2 m v   . Auch hier gilt die Impulserhaltung   P = p1 + p2   , wenn wir eines voraussetzen: Die Masse M des zerfallenden Objekts muss gleich der Massensumme der beiden daraus entstehenden Objekte sein:   M = 2 m   . Massen müssen also additiv sein, damit hier die Impulserhaltung gilt! Das erscheint uns selbstverständlich zu sein, aber es ergibt sich auch zwangsläufig aus unseren Überlegungen. Weiter unten werden wir jedoch sehen, dass diese scheinbare Selbstverständlichkeit gar nicht selbstverständlich ist: Bei großen Geschwindigkeiten ist sie sogar falsch!

Natürlich ist das alles noch kein vollständiger Beweis dafür, dass "Impuls gleich Masse mal Geschwindigkeit" sein muss, aber es zeigt, wie gut dieser Ansatz zu unseren Voraussetzungen Impulserhaltung und Relativitätsprinzip passt. Und dennoch sollten wir an dieser Stelle stutzig werden: Hatten wir nicht gesagt, dass genau genommen noch ein Korrekturfaktor γ auftauchen sollte, der bei größeren Geschwindigkeiten zum Tragen kommt? Aber wie um Himmels Willen passt das zu unserer obigen Überlegung, in der dieser Faktor gar nicht notwendig war? Irgendwo haben wir bei unserer Überlegung eine Zusatzannahme hineingesteckt, die nicht haltbar ist, wenn wir sie experimentell überprüfen.

Wir werden sehen, dass es die Geschwindigkeit der wegfliegenden Kugel ist, die wir aus dem Raumschiff heraus sehen. Wie selbstverständlich haben wir angenommen, dass die mit v fliegende Kugel aus dem mit −v fliegenden Raumschiff betrachtet so aussieht, als flöge sie mit 2v. Bei Geschwindigkeiten deutlich unterhalb der Lichtgeschwindigkeit stimmt das auch recht gut. Ein sorgfältiges Experiment würde aber zeigen, dass diese Annahme nicht genau stimmt, wobei der Fehler erst bei sehr großen Geschwindigkeiten auffällt. Wenn wir uns Einsteins Relativitätstheorie ins Gedächtis rufen, nach der nichts schneller als mit Lichtgeschwindigkeit fliegen kann, so wird unser Denkfehler sichtbar: Wäre v beispielsweise 75 % der Lichtgeschwindigkeit, so würden wir vom Raumschiff aus die zweite Kugel mit Überlichtgeschwindigkeit davonfliegen sehen. Das kann aber nach Einstein nicht sein, denn in jedem gleichförmig bewegten Bezugssystem bewegt sich nichts schneller als das Licht!



Impulserhaltung und Relativitätsprinzip

Wir müssen unsere obige Überlegung zum Impuls also überarbeiten und verallgemeinern, damit wir die richtigen Schlüsse daraus ziehen können. Dieser Abschnitt ist daher zwangsläufig etwas mathematischer orientiert -- aber es lohnt sich!

Um das Relativitätsprinzip besser formulieren zu können, wollen wir zunächst eine allgemeine Beschreibung für den Wechsel zwischen gleichförmig bewegten Bezugssystemen (Inertialsystemen) aufstellen. Dazu ist es sehr nützlich, Raum und Zeit formal zu einer vierdimensionalen Raumzeit zusammenzufassen, wobei wir die Zeit t noch mit der Lichtgeschwindigkeit c multiplizieren, sodass sie ebenfalls die Dimension einer Länge erhält. Hermann Minkowski, den wir im letzten Kapitel schon kennengelernt haben, war seinerzeit auf diese geniale Idee gekommen! Ein Ereignis (ein Punkt) in dieser Raumzeit wird nun also durch einen vierkomponentigen Vektor (Vierervektor)

  x   =   (x0, x1, x2, x3)   =   ( c t, x )

dargestellt, dessen Komponenten   xμ   wir mit dem griechischen Index μ von 0 bis 3 durchnummerieren wollen, wobei wir den Index oben schreiben statt unten (dies ist zumindest in der Relativitätstheorie weiter unten so üblich). Dabei soll die nullte Komponente die Zeit des Ereignisses (mal Lichtgeschwindigkeit c) sein, während die anderen drei Komponenten zum räumlichen Vektor   x = (x1, x2, x3)   gehören, der den Ort des Ereignisses kennzeichnet.

Wenn sich nun ein Objekt im Lauf der Zeit durch den Raum bewegt, so beschreibt es dabei eine Bahnkurve x(t) im Raum. Zu jedem Zeitpunkt t gehört dabei ein Ort x(t). In unserer vierdimensionalen Raumzeit entsteht so ebenfalls eine Kurve (eine Bahn), die durch die Vierervektoren   ( c t, x(t) )   charakterisiert ist. Hier haben wir nun aber die Möglichkeit, an Stelle der Zeit t irgendeinen anderen Kurvenparameter   λ   zu verwenden, mit dem wir nacheinander alle Raumzeitpunkte der Kurve abfahren können:

  x(λ)   =     ( c t(λ), x(λ) )  

Genau genommen hätten wir   x(t(λ))   schreiben müssen, denn für die einzelnen λ-Werte ergeben sich natürlich wieder die verschiedenen Zeitwerte und die zugehörigen Orte auf der Bahnkurve. Ich möchte hier aber nicht zu aufwändige Bezeichnungsweisen einführen.



Die Bahnkurve eines Objekts lässt sich in der vierdimensionalen Raumzeit durch eine Kurve x(λ) darstellen, die wir mit irgendeinem beliebigen Kurvenparameter λ durchlaufen können.


Wozu ist das nun gut? Es hilft, Zeit und Ort bei einem Bezugssystemwechsel in gleicher Weise sehr übersichtlich zu behandeln. Wenn wir nämlich dieselbe Bewegung aus einem dahingleitenden Raumschiff heraus betrachten, so verändert sich die Bahnkurve x(λ). Ein vormals ruhendes Objekt erscheint beispielsweise nun bewegt. Also wird man für die Bewegung vom Raumschiff aus gesehen andere Ortskoordinaten ermitteln, welche die Bewegung relativ zum Raumschiff beschreiben. Außerdem könnte es sein, dass die Uhr, die im Raumschiff verwendet wird, grundsätzlich nicht synchron mit einer außenstehenden Uhr läuft -- es könnte sich also auch die Zeitkoordinate ändern, mit der man in verschiedenen Bezugssystemen die Zeitpunkte bezeichnet. Newton wäre das noch absurd erschienen, aber Einstein würde hier weise nicken. Vom Raumschiff aus gesehen wird die Bewegung also durch eine Bahnkurve

  x'(λ)   =     ( c t'(λ), x'(λ) )  

in der Raumzeit beschrieben, bezogen auf das Raumschiff-Koordinatensystem und die mitgeführte Raumschiff-Uhr..

Wie hängen nun die beiden Beschreibungen x(λ) und x'(λ) derselben Bewegung, gesehen aus den beiden verschiedenen Inertialsystemen, miteinander zusammen? Die Details schauen wir uns etwas später an; an dieser Stelle genügt zunächst eine ganz allgemeine Bemerkung: Eine kräftefreie, also geradlinig-gleichförmige Bewegung muss aus allen Inertialsystemen heraus geradlinig-gleichförmig aussehen, denn diese Bezugssysteme entsprechen ja Beobachtern, die sich relativ zueinander geradlinig-gleichförmig bewegen. Um beim Bezugsystemwechsel die neuen Raumzeit-Koordinaten aus den alten zu berechnen, darf man letztere daher zwar mit Zahlen multiplizieren und diese Produkte auch aufaddieren, aber man darf die Koordinaten beispielsweise nicht quadrieren. Mathematisch bedeutet das, dass die neuen Koordinaten aus den alten durch eine lineare Abbildung hervorgehen (Verschiebungen in Raum und Zeit lassen wir hier zur Vereinfachung weg, da wir ja nur die Nullpunkte passend wählen müssen).

Lineare Abbildungen lassen sich allgemein durch Matrizen darstellen. Die entsprechende Koordinaten-Transformationsmatrix wollen wir mit dem Buchstaben   Λ   bezeichnen. Sie hat 4 Zeilen und 4 Spalten und enthält die Zahlen (Matrixelemente)   Λμν   mit den Indices μ und ν von 0 bis 3. Die Indices sind hier oben und unten geschrieben analog zu den Konventionen in der Relativitätstheorie. Dabei steht μ für die Zeilennummer und ν für die Spaltennummer des Matrixelementes. Mit diesen Zahlen müssen die alten Koordinaten multipliziert und anschließend aufsummiert werden, um die neuen Koordinaten zu erhalten:

Kurzschreibweise:

  x'   =   Λ x

Bedeutung:

  x'μ   =   ∑ν=0 bis 3 Λμν xν

wobei   ∑   das Summenzeichen ist, also beispielsweise   x'0   =   Λ00 x0 + Λ01 x1 + Λ02 x2 + Λ03 x3   . Damit ist garantiert, dass eine geradlinig-gleichförmige Bewegung x(λ) aus dem anderen Bezugssystem heraus gesehen wieder eine geradlinig-gleichförmige Bewegung x'(λ) ergibt. Wie das in ganz konkreten Fällen aussieht, sehen wir weiter unten.

Eine allgemeine Bahnkurve   x(λ)   in der Raumzeit wird also nach dem Bezugssystemwechsel durch die Bahnkurve   x'(λ)   =   Λ x(λ)   beschrieben. Der Kurvenparameter selbst ändert sich dabei nicht -- genau darin liegt der Vorteil, wenn man nicht die Zeit als Kurvenparameter verwendet, denn diese könnte sich beim Bezugssystemwechsel ja verändern. Da wir die Zeit jedoch als nullte Koordinate der Bahnkurve in der Raumzeit mitführen, können wir ihre Veränderung ganz analog zur Veränderung der räumlichen Koordinaten behandeln.

Um einen weiteren Schritt in Richtung Impuls voranzukommen, brauchen wir nun so etwas wie eine Geschwindigkeit. Wieder ist es sinnvoll, nicht direkt die Geschwindigkeit   v = dx(t)/dt   zu verwenden, denn diese ist die zeitliche Veränderungsrate des Ortes und unterliegt damit wieder komplizierten Regeln, wenn sich die Zeit beim Bezugssystemwechsel ändert. Statt dessen wollen wir die Veränderungsrate

  uμ(λ)   :=   dxμ(λ)/dλ

der vier Raumzeit-Kurvenkoordinaten mit anwachsendem Kurvenparameter λ betrachten, denn λ bleibt beim Bezugssystemwechsel unverändert. Zusammen bilden diese Koordinaten an jedem Punkt x(λ) der Kurve einen vierkomponentigen Vektor

  u(λ)   =   dx(λ)/dλ   =   ( c dt/dλ , dx/dλ )

Dieser Vektor liegt an jedem Punkt der Kurve x(λ) tangential an der Kurve an, ist also ein vierkomponentiger Tangentialvektor (so wie analog der räumliche Geschwindigkeitsvektor   v(t) = dx(t)/dt   tangential an der Bahnkurve x(t) anliegt und in Bewegungsrichtung zeigt). Man nennt   u(λ)   auch die Vierergeschwindigkeit.



Der Tangentialvektor u(λ) in der Raumzeit.


Den Zusammenhang von u mit der Geschwindigkeit v im dreidimensionalen Raum können wir leicht herstellen, denn nach der Kettenregel ist   dx/dλ   =   dx/dt · dt/dλ   =   v dt/dλ   und somit

  u   =   ( c dt/dλ , dx/dλ )   =   dt/dλ · (c, v)

(wir schreiben vereinfacht   u   für   u(λ)   ). Der vierkomponentige Vektor   (c, v)   aus Lichtgeschwindigkeit c und räumlicher Geschwindigkeit v muss also nur noch mit der Rate   dt/dλ   multipliziert werden, mit der die Raumzeitkurve x(λ) bei wachsendem Kurvenparameter λ durch die Zeit t eilt, und wir erhalten die Vierergeschwindigkeit u.

Nun sind wir gerüstet, einen Impulsvektor zu definieren. Wir werden aber diesmal nicht   p = m v   versuchen, sondern wir werden den vierkomponentigen Impulsvektor (Viererimpuls)

  p   :=   m u

aus konstanter Masse   m   und Vierergeschwindigkeit   u  : bilden. Die drei räumlichen Komponenten 1 bis 3 bilden dabei unseren räumlichen Impulsvektor   p   . Für ihn ergibt sich nach den obigen Formeln

  p   =   m · dt/dλ · v

d.h. es taucht im Vergleich zur gewohnten Formel von oben noch der Zusatzfaktor   dt/dλ   darin auf. Ansonsten erfüllt dieser räumliche Impulsvektor aber unsere Erwartungen: Er wächst mit der Trägheit eines Körpers, die wir in Form der konstanten Masse   m   dargestellt haben, und er wächst mit zunehmender Geschwindigkeit v.

Für die nullte Komponente p0 des Viererimpulses ergibt sich

  p0   =   m · dt/dλ · c

(die hochgestellt Null ist wie immer hier ein Index, also nicht als "hoch Null" zu lesen). Diese Komponente ist also einfach nur die Masse des Objektes, multipliziert mit der Lichtgeschwindigkeit und dem Faktor dt/dλ. Was es damit auf sich hat, werden wir noch sehen.

Hier ist nun etwas Vorsicht geboten, damit der Zusatzfaktor   dt/dλ   nicht zu einer unsinnigen Impulsdefinition führt. Wir müssen die erlaubten Parametrisierungen für unsere Kurve   x(λ)   durch die Raumzeit so einschränken, dass sie die tatsächliche Bewegung   x(t)   widerspiegeln. Wenn wir beispielsweise eine geradlinig-gleichförmige Bewegung betrachten, so wird diese durch eine Gerade in der Raumzeit dargestellt. Dennoch könnten wir im Prinzip den Kurvenparameter λ so wählen, dass diese Gerade an verschiedenen Stellen unterschiedlich schnell mit wachsendem λ durchlaufen wird. Die Kurvenparametrisierung durch λ führt damit eine zusätzliche Freiheit ein, die sich in der tatsächlichen Bewegung nicht widerspiegelt. Diese unphysikalische Freiheit wollen wir wieder einfangen, indem wir verlangen, dass   dt/dλ   entweder konstant ist oder nur von dem Betrag der tatsächlichen räumlichen Geschwindigkeit   v = |v|   abhängt. Bei einer Bewegung mit konstanter Geschwindigkeit wird damit auch unsere Raumzeitkurve x(λ) gleichmäßig mit wachsendem λ durchlaufen. Damit ist gesichert, dass die Vierergeschwindigkeit   u   ebenfalls nur von der räumlichen Geschwindigkeit   v   abhängt und damit nur diese Geschwindigkeit in einer anderen Form darstellt. Außerdem ist sichergestellt, dass der Impuls nur von Masse und Geschwindigkeit abhängt, so wie wir das aufgrund unserer Erfahrung ja vermuten.

Man fragt sich natürlich: Was bringt uns diese etwas absonderliche Definition einer Vierergeschwindigkeit und eines Viererimpulses? Ganz einfach: Sie erschafft ein Objekt, dessen Veränderung bei einem Bezugssystemwechsel wir sofort angeben können: Da sich die Raumzeitkoordinaten der Bahnkurve nach der Formel   x'(λ)   =   Λ x(λ)   verändern, verändert sich die Vierergeschwindigkeit   u   nach der Formel

  u'   =   dx'(λ)/dλ   =   [d (Λ x(λ)) / dλ]   =   Λ dx(λ)/dλ   =   Λ u

Damit haben wir mit der Vierergeschwindigkeit u ein Werkzeug in der Hand, mit dem wir die Veränderung der Geschwindigkeit v eines Objektes bei einem Wechsel des Bezugssystems leicht nachrechnen können. Im Rahmen der Relativitätstheorie würde sich dabei beispielsweise zeigen, dass sich die Eigengeschwindigkeit des Bezugssystem nicht einfach zur Geschwindigkeit des Objekts hinzuaddiert -- anders als wir es oben anschaulich angenommen haben (wir führen die konkrete Rechnung weiter unten allerdings nicht explizit durch, um den Rahmen dieses Kapitels nicht zu sprengen).

Da nun   p = m u   und   p' = m u'   mit konstanter Masse m ist, gilt analog   p'   =   Λ p   . Das war der Sinn der ganzen Sache! Vierergeschwindigkeit u und Viererimpuls p verändern sich genauso wie die Koordinaten der Bahnkurve! Und damit ist sofort klar: Wenn beispielsweise unser Objekt von oben in zwei Teilobjekte zerfällt und für die Viererimpulse vor und nach dem Auseinanderfallen die Impulserhaltung

  P   =   p1 + p2

gilt, so gilt sie auch nach einem Bezugssystemwechsel in ein anderes gleichförmig bewegtes Bezugssystem. Wir können nämlich die obige Gleichung einfach mit der Matrix Λ multiplizieren und erhalten   Λ P   =   Λ p1 + Λ p2   und somit

  P'   =   p1' + p2'   .

Wenn die Impulserhaltung für Viererimpulse in irgendeinem Inertialsystem gilt, so gilt sie in jedem gleichförmig bewegten Bezugssystem! Das Relativitätsprinzip ist also erfüllt, so wie wir es ebenfalls gefordert haben.

Das Relativitätsprinzip legt damit nahe, dass wir nicht nur die Impulserhaltung für die gewohnten räumlichen Impulse betrachten sollten, sondern dass wir sie auf unsere neuen Viererimpulse ausweiten sollten. Tatsächlich haben wir zu Beginn des Kapitels gesehen, dass die Impulserhaltung die Erhaltung einer weiteren Größe einschließt. Dort war es die Gesamtmasse, die ebenfalls erhalten ist, wenn wir vom Ansatz Impuls gleich Masse mal Geschwindigkeit ausgehen. Ob dies womöglich mit der Null-Komponente des Viererimpulses zusammenhängt? Wir werden sehen ...

Impulserhaltung und Relativitätsprinzip haben uns also dahin geführt, einen Viererimpulsvektor p zu definieren, der sich aus konstanter Masse m und Vierergeschwindigkeit u zusammensetzt. Sind wir damit schon am Ziel? Fast, aber nicht ganz! Wir wissen immer noch nicht, was der ominöse Faktor   dt/dλ   in den Formeln bedeuten soll, mit dem unsere Bahnkurve x(λ) in der Raumzeit die Zeitkoordinate durchschreitet. Hier kommen wir nur weiter, wenn wir uns Gedanken über die Umrechnungsmatrix Λ machen, die für die Umrechnung zwischen verschiedenen Bezugssystemen verantwortlich ist. Mit anderen Worten: Wie muss Λ aussehen, um den Wechsel zwischen zwei Bezugssystemen zu beschreiben, die sich beide geradlinig-gleichförmig bewegen, aber mit unterschiedlichen Geschwindigkeiten?



Der nichtrelativistische Impuls

Wie würden wir uns normalerweise den Übergang von einem "ruhenden" Bezugssystem in ein Bezugssystem vorstellen, das sich mit der Geschwindigkeit −v bewegt? Was hätten Newton und Galilei dazu gesagt?

Sie hätten ohne zu zögern die folgende Formel an die Tafel geschrieben:

  x'   =   x + v t



Übergang von einem ruhenden (blau) in ein gleichförmig bewegtes Bezugssystem (rot). Man sieht, wie die horizontale rote Raum-Koordinatenachse sich mit zunehmender Zeit nach links bewegt, parallel zum Raumschiff, an dem sie befestigt ist.


Ein im Nullpunkt ruhendes Objekt mit Bahnkurve   x(t) = 0   würde sich dann nämlich vom Raumschiff aus gesehen mit der Geschwindigkeit v bewegen, denn es hätte von dort betrachtet die Bahnkurve   x'(t)   =   x(t) + v t   =   v t   . Wir kennen das im Grunde schon vom Anfang des Kapitels.

Die Zeit t ändert sich bei diesem Bezugssystemwechsel nicht, d.h. eine ruhende Uhr und eine Uhr im Raumschiff laufen völlig synchron:

  t'   =   t

Für Newton war das selbstverständlich, wie wir aus dem ersten Kapitel über die Zeit wissen, und es entspricht vollkommen unserer eigenen Anschauung darüber, wie sich Zeit verhalten sollte.

Wenn wir diese Umrechnungsformeln mithilfe unserer Matrix Λ ausdrücken, so ergibt sich für die Matrixelemente:

  Λμμ   =   1       mit   μ = 0, 1, 2, 3
  Λk0   =   vk/c   mit   k = 1, 2, 3

Alle anderen Matrixelemente sind Null. Die Matrix Λ enthält also in ihrer Diagonalen nur Einsen und zusätzlich in ihrer ersten Spalte (zweiter Index Null) unter der Eins die Geschwindigkeitskomponenten relativ zur Lichtgeschwindigkeit.

Wie sieht nun der Impuls konkret aus? Dafür müssen wir den Kurvenparameter λ festlegen. Das muss nach unseren Überlegungen von oben so geschehen, dass der Faktor   dt/dλ   entweder konstant ist oder nur vom Betrag v der räumlichen Geschwindigkeit abhängt. Außerdem muss die Funktion t(λ), über die unsere Raumzeitkurve x(λ) die Zeitkoordinate t abfährt, so gestaltet sein, dass sich der Kurvenparameter λ nicht ändert, wenn wir das Bezugssystem wechseln und aus der Zeitkoordinate t die neue Zeitkoordinate t' wird.

Die Konstruktion eines passenden Kurvenparameters   λ   mithilfe der Zeit   t   und -- falls notwendig -- der Geschwindigkeit   v   ist hier nun überhaupt kein Problem: Da sich beim Bezugssystemwechsel die Zeit t nicht ändert (t' = t), können wir uns das Leben einfach machen und einfach die Zeitkoordinate t mit der konstanten Kurvengeschwindigkeit 1 abfahren, also   t(λ) = λ   und damit   dt/dλ = 1   wählen. Die obigen Formeln ergeben dann

  p   =   m v

Das ist der bekannte nichtrelativistische Impuls, wie man ihn in der Schule kennenlernt und wie wir ihn zu Beginn des Kapitels bereits gesehen haben. Außerdem erhalten wir für die Null-Komponente des Viererimpulses

  p0   =   m c

d.h. diese Komponente ist gleich der Teilchenmasse, multipliziert mit der Lichtgeschwindigkeit c.

Damit unsere Überlegung konsistent ist, muss neben der Impulserhaltung für den Impulsvektor   p   auch die Impulserhaltung für die Nullkomponente p0 des Viererimpulses p gelten, denn wir haben die Impulserhaltung ja für den Viererimpuls p vorausgesetzt und nicht nur für den üblichen Impuls   p   . Daraus folgt, dass neben der Impulssumme auch die Massensumme vor und nach einen Ereignis (z.B. einem Zerfall) gleich bleiben muss. Nichtrelativistische Impulserhaltung schließt also automatisch auch die Massenerhaltung mit ein. Masse kann durch Kräfte demnach nicht erschaffen oder zerstört werden.

Wie verändern sich Impuls und Masse eines Objektes, wenn wir von einem "ruhenden" Bezugssystem in das Bezugssystem des Raumschiffs wechseln, dass sich mit der Geschwindigkeit −v bewegt? Da wir von oben wissen, dass sich der Viererimpuls genauso wie die Raumzeitkoordinaten ändert, ist die Antwort sofort klar:

  m'   =   m     analog zu     t'   =   t
  p'   =   p + m v     analog zu     x'   =   x + t v

Zum alten Impuls kommt aufgrund der Geschwindigkeitsänderung also noch der Zusatzimpuls   m v   hinzu, während die Masse m sich überhaupt nicht ändert -- die Trägheit ist konstant.

Das entspricht alles unserer Anschauung, und dennoch erweist es sich letztlich als falsch, denn unsere Überlegungen zum Relativitätsprinzip stimmen nur dann näherungsweise, wenn die Geschwindigkeiten klein gegenüber der Lichtgeschwindigkeit sind. Schauen wir uns also nun an, wie die Natur in Wirklichkeit funktioniert -- auch wenn die Geschwindigkeiten mal groß werden.



Impuls und Trägheit in der Relativitätstheorie

Wir haben oben den Übergang von einem "ruhenden" Bezugssystem in ein mit der Geschwindigkeit −v bewegtes Bezugssystem offenbar nicht mit den korrekten Formeln dargestellt, denn die Geschwindigkeit v unterliegt hier keinen Beschränkungen. Unser Raumschiff kann beliebig schnell sein. Nach Einsteins spezieller Relativitätstheorie kann aber nichts schneller als das Licht sein. Außerdem fliegt ein Lichtblitz immer gleich schnell, auch wenn wir zwischendurch das Bezugssystem wechseln und ihm mit einem Raumschiff hinterherfliegen.

Wie also sehen die richtigen Transformationsformeln für einen Wechsel des Bezugssystems aus. Wie lautet unsere Matrix Λ ?

Wir wollen uns die entsprechende Herleitung hier ersparen -- man findet sie beispielsweise in Wikipedia: Lorentz-Transformation. Statt dessen wollen wir einfach nur überprüfen, dass die gleichsam vom Himmel gefallene Matrix Λ genau das tut, was wir von ihr erwarten. Hier also ist sie -- man nennt sie Lorentztransformation:

  Λμμ   =   γ
  Λk0   =     Λ0k   =   γ vk/c   mit   k = 1, 2, 3

Für Zeit- und Ortskoordinaten ausgeschrieben ergibt das:

  c t'   =   γ · (c t   +   v/c x )
  x'     =   γ · (v t   +   x )

Die untere Formel entspricht bis auf den Faktor γ genau unserer nichtrelativistischen Formel   x'   =   v t   +   x   von etwas weiter oben, wie sie Newton und Galilei hingeschrieben hätten. Wir erwarten also, dass bei kleinen Geschwindigkeiten der neu hinzugekommene Faktor γ nahezu Eins werden wird -- kein Zufall, denn natürlich wird sich γ als der uns bereits bekannte Lorentzfaktor erweisen, was wir aber hier noch herausarbeiten wollen. In der Formel ist γ dann für die Lorentzkontraktion von Längen zuständig, die uns im Kapitel über den Raum begegnet ist.

Die Umwandlungsformel für die Zeit ist wesentlich komplizierter als die einfache Formel   t' = t   von weiter oben. Hier sorgt der Vorfaktor γ für die Zeitdilatation, die bewegte Uhren langsamer laufen lässt. Etwas überaschend erscheint noch ein Zusatzterm   v/c x   , der zu einer Verschiebung von Ereignissen in der Zeit führt. Hier spiegelt sich wider, dass verschiedene Beobachter die Gleichzeitigkeit von Ereignissen unterschiedlich beurteilen -- siehe unser Kapitel über die Zeit.



Übergang von einem ruhenden (blau) in ein gleichförmig bewegtes Bezugssystem (rot) in der speziellen Relativitätstheorie. Man sieht wieder, wie analog zum nichtrelativistischen Fall sich die rote Raum-Koordinatenachse mit zunehmender Zeit parallel zum Raumschiff nach links bewegt. Zugleich kippt sie aber auch symmetrisch zu den Zeitachsen. Dieses Kippen der Raumachsen nach rechts unten ist notwendig, damit ein Lichtblitz (orange) in beiden Koordinatensystemen diagonal nach rechts oben läuft (d.h. aus   |x| = ct   folgt   |x'| = ct'   ). Nun stellt eine rote Raumachse Ereignisse in der Raumzeit dar, die vom Raumschiff aus gesehen als gleichzeitig beurteilt werden (Linien mit konstantem t'). Das bedeutet, dass die Beurteilung der Gleichzeitigkeit von Ereignissen vom Bezugssystem abhängt, wie wir aus dem Kapitel über die Zeit wissen.


In den Formeln stecken also jede Menge physikalische Phänomene, über die man ganze Bücher schreiben könnte. Wir wollen hier nicht soweit gehen, sondern nur zwei Spezialfälle untersuchen: Was geschieht, wenn wir ein ruhendes Objekt aus unserem bewegten Raumschiff heraus betrachten, und was geschieht, wenn wir dasselbe mit einem Lichtblitz tun?

Ein im Koordinatenursprung ruhendes Objekt können wir durch die Bahnkurve   x(t) = 0   beschreiben. Setzen wir dies in den obigen Formeln ein, so erhalten wir

  c t'     =   γ c t  
  x'(t)   =   γ v t

Die obere Formel können wir nun dazu verwenden, um in der unteren Formel rechts das Produkt   γ t   durch   t'   ersetzen:

  x'(t')     =   v t'

Genau so muss es sein! Das ruhende Objekt bewegt sich vom Raumschiff aus gesehen mit der Geschwindigkeit v, wobei wir den Zeitmaßstab berücksichtigen müssen, den eine mitgeführte Uhr im Raumschiff liefert.

Nun zu unserem Lichtblitz, der sich mit Lichtgeschwindigkeit c in Richtung des Einheitsvektors e (mit Betrag 1) bewegen soll, sodass wir seine Bahnkurve durch   x(t)   =   c t e   darstellen können. Außerdem wollen wir uns das Leben hier einfach machen und annehmen, dass sich das Raumschiff parallel zum Lichtblitz bewegt, sodass v und e in dieselbe Richtung zeigen (d.h. v = v e). Setzen wir x(t) oben in die Formeln ein, so wird aus dem Raumschiff heraus gesehen diese Bewegung des Lichtblitzes durch folgende Koordinaten beschrieben:

  c t'     =   γ (c + v) t
  x'(t)   =   γ (v + c) t e

und somit

  x'(t)   =   c t' e

Auch vom Raumschiff aus gesehen bewegt sich der Lichtblitz also mit Lichtgeschwindigkeit. Man sieht hier, wie wichtig der merkwürdige zweite Summand in der Formel für   c t'   ist, denn ohne ihn würde die Rechnung nicht aufgehen.

Bisher ist also alles in schönster Ordnung mit unseren Transformationsformeln in die Koordinaten des Raumschiffs. Sie tun genau das, was wir erwarten. Allerdings haben wir bisher noch keinerlei Aussage über den Vorfaktor γ erhalten, der sich ja als der bekannte Lorentzfaktor herausstellen soll. Die obigen Rechnungen hätten mit jedem beliebigen Wert für γ funktioniert, sogar mit dem trivialen Wert Eins. Was also legt γ fest?

Man muss einen weiteren Gedanken hinzunehmen, um γ festzulegen. Mathematisch würde man sagen: Man muss die Gruppenstruktur berücksichtigen, die unsere Transformation haben soll, insbesondere die Tatsache, dass eine entgegengesetzte Geschwindigkeit beim Bezugssystemwechsel zur inversen Transformationsmatrix führen muss. Physikalisch bedeutet das: Wenn ich von einem Bezugssystem mit Raumzeit-Koordinaten x zu einem mit −v relativ dazu bewegten Bezugssystem mit Koordinaten   x' = Λv x   übergehe und anschließend zu einem weiteren Bezugssystem mit Koordinaten   x'' = Λv x'   wechsle, das sich relativ zu x' mit der umgekehrten Geschwindigkeit v bewegt, so sollte ich mich wieder im ursprünglichen Bezugssystem befinden, sodass   x'' = x   gilt. Es muss also für das Matrixprodukt   Λv Λv   =   1   gelten, wobei 1 für die Einheitsmatrix steht (man kann es auch "zu Fuß" mit x und t und den obigen Formeln rechnen, aber die elegante Matrixmultiplikation ist einfacher). Rechnet man dieses Produkt aus, so ergibt sich aber vor der Einheitsmatrix der Vorfaktor   γ2 · (1 − (v/c)2 )   . Dieser muss also gleich Eins sein, sodass

  γ   =   √ [ 1 / (1 − (v/c)2 ) ]

gelten muss (wir wählen das Vorzeichen von γ per Konvention positiv, da wir uns momentan nicht für Raumzeit-Spiegelungen interessieren wollen). Das ist genau der Lorentzfaktor, den wir bereits in den vorhergehenden Kapiteln kennengelernt haben!

Damit haben wir uns mit der etwas ungewohnten Art, wie sich Raum und Zeit bei einem Bezugssystemwechsel richtig verhalten, einigermaßen vertraut gemacht. Nun sind wir gerüstet, uns der Vierergeschwindigkeit und schließlich dem Impuls zuzuwenden.

Dafür müssen wir wieder den Kurvenparameter   λ   für unsere Raumzeitkurve   x(λ)   als Funktion der Zeit   t   und ggf. der Geschwindigkeit   v   festlegen, sodass der Faktor   dt/dλ   entweder konstant ist oder vom Betrag   v   der räumlichen Geschwindigkeit abhängt und außerdem   λ   sich bei einem Wechsel des Bezugssystems nicht ändert. Die einfache Wahl   λ = t   wie im nichtrelativistischen Fall scheidet hier aus, denn   t   verändert sich beim Bezugssystemwechel.

Wir kennen jedoch aus dem Kapitel über die Zeit bereits einen Parameter, der eng mit der Zeit verwandt ist und der nicht von irgendeinem Bezugssystem abhängt: Es ist die Eigenzeit   τ   , wie sie auf einer mitgeführten Uhr entlang unserer Bahnkurve   x(λ)   durch Raum und Zeit angezeigt wird. Erinnern wir uns, was wir im ersten Kapitel über die Eigenzeit τ erfahren haben: Legt ein Körper auf der Bahnkurve   x(λ)   während des sehr kurzen (infinitesimalen) Zeitintervalls dt die ebenfalls sehr kurze Wegstrecke   ds = |dx|  zurück, so vergeht für ihn die Eigenzeit dτ. Dabei gilt für deren Quadrat:

  dτ2   =   dt2 − (ds/c)2   =   dt2 − (v dt/c)2   =   dt2 (1 − (v/c)2)   =   (dt / γ)2

also   dτ = dt / γ   mit dem Lorentzfaktor γ. Bei einem Wechsel des Bezugssystems verändert sich nun zwar nach den obigen Formeln das Zeitintervall dt zu dt' (Zeitdilatation) und die kurze Wegsterecke   ds = |dx|  zu   ds' = |dx'|  (Lorentzkontraktion), aber wir können leicht nachrechnen, dass

  (c dt)2 − (ds)2   =   (c dt')2 − (ds')2  

gilt und dass sich entsprechend auch dτ nicht ändert. Wenn wir nun die kleinen Eigenzeitintervalle dτ entlang der Raumzeit-Bahnkurve aufintegrieren, so erhalten wir damit unseren gewünschten Bahnparameter

  λ = τ   mit     dt/dλ = dt/dτ = γ  

Unser Vorfaktor   dt/dλ   hängt also wie gewünscht nur vom Betrag der räumlichen Geschwindigkeit ab, denn dies gilt auch für den Lorentzfaktor γ.

Damit haben wir nun alle Zutaten für den Impuls zusammen: Er sieht fast genauso aus wie der nichtrelativistische Impuls von oben, nur dass wegen   dt/dλ   als Zusatzfaktor der Lorentzfaktor γ hinzukommt:

  p0   =   m γ c
  p    =   m γ v

Wenn die Impulserhaltung für diese Vierervektoren in einem Bezugssystem gilt, so gilt sie auch in jedem anderen Bezugssystem, das sich relativ dazu geradlinig-gleichförmig bewegt. Das ist nicht trivial, denn   p0   und   p   verändern sich sehr wohl, wenn wir das Bezugssystem wechseln. Sie tun dies aber gerade so, dass die Impulserhaltung für alle beteiligten Impulse p und zusätzlich für alle beteiligten Null-Komponenten p0 dadurch in Summe nicht zerstört wird, wie wir nachgewiesen haben.

Im nichtrelativistischen Fall hatte die Impulserhaltung für die Null-Komponente p0 dazu geführt, dass sich die Summe aller beteiligten Massen bei einem Prozess nicht ändernt. Masse konnte dort weder erzeugt noch vernichtet werden. Außerdem veränderte sich die Masse bei einem Wechsel des Bezugssystems nicht.

Das ist nun anders! Die Masse m eines Teilchens ändert sich zwar nach wie vor nicht, wenn wir das Bezugssystem wechseln, denn genau so hatten wir die Masse oben festgelegt: als unveränderliche Eigenschaft eines Teilchens. Was sich aber sehr wohl ändert, ist die Trägheit eines Teilchens, denn diese ist durch das Produkt   m γ   gegeben -- wir hatten das im letzten Kapitel bereits diskutiert. Die Trägheit wird umso größer, je schneller sich das Teilchen bewegt! So lässt sich ein sehr schnelles Teilchen kaum noch weiter beschleunigen, denn seine Trägheit wird unendlich groß, wenn sich seine Geschwindigkeit v der Lichtgeschwindigkeit c nähert. Daher kann die Lichtgeschwindigkeit für ein massives Teilchen nie erreicht oder gar überschritten werden.

Außerdem bleibt nicht die Massensumme, sondern die Summe aller Teilchen-Trägheiten   m γ   bei einem Prozess erhalten! So kann ein massives ruhendes Teilchen mit Masse M beispielsweise in zwei sehr viel leichtere Teilchen mit identischen Massen m zerfallen, wobei dann

  M   =   2 m γ

gelten muss. Wenn die Masse m der entstandenen Teilchen sehr viel kleiner ist als die Masse M des zerfallenen Teilchens, so muss der Lorentzfaktor γ entsprechend groß sein, damit die obige Bilanz aufgeht. Das bedeutet, dass die beiden Teilchen mit entsprechend hoher Geschwindigkeit auseinanderfliegen müssen. Diese Geschwindigkeit ist vollständig durch die Differenz der Teilchenmassen vor und nach dem Zerfall festgelegt. Man kann das so interpretieren, dass ihre Bewegungsenergie aus der Masse des zerfallenen Teilchens stammt! Es wird sich daher im nächsten Kapitel als sinnvoll erweisen, die Null-Komponente p0 (per Konvention multipliziert mit der Lichtgeschwindigkeit c) als Energie E des Teilchens zu interpretieren:

  E   =   p0 c   =   m γ c2

Energie, Masse und Trägheit eines Teilchens hängen damit eng miteinander zusammen. Die Erhaltung der Summe aller Null-Komponenten der Viererimpulse entspricht damit der Erhaltung der Gesamtenergie. Sie ersetzt die Erhaltung der Gesamtmasse aus der nichtrelativistischen Physik. Mehr dazu im nächsten Kapitel!

Wie klein kann die Masse m der Teilchen werden, die bei dem obigen Teilchenzerfall entstehen? Tatsächlich können wir in der Gleichung   M   =   2 m γ   die Masse m beliebig klein werden lassen, solange wir dies durch einen entsprechend großen Lorentzfaktor γ wieder ausgleichen. Wir können uns sogar vorstellen, dass wir die Masse m gegen Null gehen lassen, wobei die Geschwindigkeit v der beiden Teilchen jeweils gegen die Lichtgeschwindigkeit c geht, sodass   m γ = p0/c   konstant bleibt. Der Viererimpuls geht dann gegen   p = (p0, p0 e)   mit konstantem p0, wobei e = c/c der Einheitsvektor in Bewegungsrichtung ist.

Können wir die Masse m tatsächlich sogar gleich Null setzen? Gibt es masselose Teilchen?

Ohne die spezielle Relativitätstheorie wäre die Antwort ein klares NEIN, denn der Impuls eines solchen Teilchens wäre immer Null. Unsere obige Überlegung hat aber gezeigt, dass es in der speziellen Relativitätstheorie durchaus solche Teilchen geben könnte, denn wir können wie gerade gesehen in der Definition   p = m u   des Viererimpulses den Grenzübergang m gegen Null durchführen, indem wir fordern, dass dabei   p0 = m γ c   konstant bleibt so wie in unserem Zerfallsbeispiel. Der Impuls eines masselosen Teilchens ist dann   p = (p0, p0 e)   . Anders als im nichtrelativistischen Fall bleibt die Geschwindigkeit bei diesem Grenzübergang endlich -- sie wird gleich der Lichtgeschwindigkeit.

Und tatsächlich macht die Natur Gebrauch von dieser Möglichkeit, denn das Photon ist ein solches masselose Teilchen! Ein massives ruhendes Teilchen könnte also durchaus in zwei masselose Photonen zerfallen, und das neutrale Pion tut genau dies! Die Masse des Pions geht dabei vollständig verloren und findet sich in den p0-Komponenten der beiden Photonen wieder, also in der Energie der Photonen.

Dass masselose Teilchen möglich sind, zeigt auch die folgende Überlegung: Ganz allgemein gilt für jeden Vierervektor, der beim Bezugssystemwechsel mit der Matrix Λ multipliziert wird, dass die Differenz aus quadrierter Null-Komponente minus quadrierter räumlicher Vektorkomponente sich dabei nicht ändert, auch wenn sich die Terme einzeln sehr wohl ändern. Genau so hatten wir ja beispielsweise die Eigenzeit dτ konstruiert. Diese Eigenschaft ist charakteristisch für die Lorentzmatrix Λ. Sie gilt auch für unsere Vierergeschwindigkeit u und den daraus abgeleiteten Viererimpuls p, da beide ebenfalls beim Bezugssystemwechsel mit der Matrix Λ multipliziert werden. Also muss   (p0)2p2   in jedem Bezugssystem denselben Wert haben (die hochgestellte 0 ist dabei ein Index, während die hochgestellte 2 das Quadrieren bezeichnet). Setzen wir hier unsere Formeln   p0   =   m γ c   und   p   =   m γ v   ein, so finden wir als Ergebnis

  (p0)2p2   =   (mc)2

Das passt, denn die Teilchenmasse m ist unabhängig vom Bezugssystem. Außerdem sehen wir, dass wir in dieser Formel die Teilchenmasse m problemlos gleich Null setzen können, d.h. die Formel gilt auch für masselose Teilchen wie Photonen. Es ist schon erstaunlich, was man alles ableiten kann, wenn man die Impulserhaltung, das Relativitätsprinzip und die Konstanz der Lichtgeschwindigkeit voraussetzt und einen dazu passenden Ansatz für den Impulsbegriff, bestehend aus Trägheit und Geschwindigkeit, hineinsteckt!



Auch Felder besitzen Trägheit und Impuls

Im letzten Kapitel hatten wir bereits angesprochen, dass Newtons Wechselwirkungsprinzip Actio gleich Reactio dem Impulserhaltungssatz entspricht. Innere Kräfte können den Gesamtimpuls nicht ändern. Allerdings stimmt das Wechselwirkungsprinzip nur dann, wenn die Zeit, die eine Kraftübertragung zwischen zwei Körpern benötigt, vernachlässigt werden kann.

Im allgemeinen Fall muss man die Zeit für eine Kraftübertragung zwischen zwei Körpern jedoch berücksichtigen. Der Gesamtimpuls zweier Körper ist dann scheinbar für eine gewisse Zeit nicht erhalten. Wenn wir jedoch davon ausgehen, dass die Impulserhaltung ein ganz allgemeines Naturgesetz ist, so müssen wir uns fragen: Wo steckt der fehlende Impuls in der Zwischenzeit?

Schaut man sich die Gleichungen für ein elektromagnetisches Feld -- die Maxwellgleichungen -- genauer an, so stellt man fest, dass sich der fehlende Impuls im elektromagnetischen Feld versteckt. Auch elektromagnetische Felder haben demnach einen Impuls oder genauer: eine Impulsdichte (Impuls pro Raumvolumen)! Wenn wir an die oben angesprochenen Photonen denken, so überrascht uns das nicht: Photonen entsprechen ja den Quantenteilchen des Lichts, und da Photonen einen Impuls besitzen, so muss auch der zugehörige Lichtstrahl einen Impuls tragen. Die Impulsdichte S (auch Pointing-Vektor genannt) lässt sich nun durch das elektrische Feld E und das Magnetfeld B ausdrücken:

  S   ∼   E × B

wobei   ×   für das Vektor-Kreuzprodukt steht (Achtung: E ist hier das elektrische Feld und nicht die Energie, die wir auch mit dem Buchstaben E bezeichnet hatten).



Ein schwingender elektrischer Dipol strahlt elektromagnetische Wellen ab. Der Impulsdichte-Vektor (Pointing-Vektor) ist durch die kleinen schwarzen Pfeile dargestellt.
Quelle: Wikimedia Commons File:DipoleRadiation.gif von Geoemyda. Lizenz: Creative Commons Attribution-Share Alike 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license.


Damit nicht genug: Ein elektromagnetisches Feld besitzt sogar eine Trägheit, ähnlich wie ein massives Teilchen. Wieder überrascht das nicht, denn auch zwei Photonen, die man in einer masselosen Kiste einsperrt, sodass sie ständig darin entgegengesetzt zueinander hin- und herpendeln, verleihen der Kiste dadurch eine Trägheit wie eine Masse -- der Gesamt-Viererimpuls der beiden Photonen in der ruhenden Kiste beträgt nämlich

  pges   =   (p0, p0 e)   +   (p0, − p0 e)   =   (2 p0, 0)  

und verhält sich damit wegen dem Relativitätsprinzip genau wie der Viererimpuls eines ruhenden Teilchens mit Masse   M = 2 p0/c . Anders ausgedrückt: Die eingeschlossene Gesamtenergie   Eges = p0ges c = 2 p0 c = M c2   der beiden Photonen verleiht dem Kasten dieselbe Trägheit wie ein ruhendes Teilchen mit Masse M. Masse ist von eingeschlossener bzw. lokalisierter Energie nicht zu unterscheiden, und es spricht vieles dafür, dass letztlich jede Teilchenmasse nichts anderes als eingeschlossene Energie ist. So hat ein großer Teil der Masse eines Protons und eines Neutrons seine Ursache nicht in den Massen der drei Quarks, aus denen sie bestehen, sondern sie stammt aus der Feldenergie des starken Gluonenfeldes, das die Quarks zusammenhält.

Kann man anschaulich verstehen, wieso ein elektromagnetisches Feld eine Trägheit aufweisen kann? Letztlich liegt es an der endlichen Ausbreitungsgeschwindigkeit von elektrischen Kräften. Schauen wir uns als Beispiel eine gleichmäßig elektrisch geladene Kugel im leeren Weltraum an. Solange die Kugel ruht oder sich gleichmäßig bewegt, sind die elektrischen Kräfte mit den Kräften, die die Kugelform aufrecht erhalten, im Gleichgewicht, und die Gesamtkraft auf die Kugel ist nach Newtons Wechselwirkungsprinzip (Actio gleich reactio) Null. Wird die Kugel jedoch beschleunigt, so macht sich die endliche Ausbreitungsgeschwindigkeit von Kräften bemerkbar. Die Einflüsse der verschiedenen geladenen Teile der Kugel aufeinander verändern sich, und das Kraftgleichgewicht wird gestört. Man kann nachrechnen, dass eine resultierende Gesamtkraft übrig bleibt, die der Beschleunigung entgegen wirkt und sich wie die Trägheit einer Masse m auswirkt, die sich nach der Formel   E = m c2   aus der Gesamtenergie E des elektromagnetischen Feldes und der Felder der inneren Kugelkräfte zusammensetzt.

Felder besitzen also Energie und Impuls, wobei sich die Energie als Trägheit äußert. Wie bei einem Teilchen hängen auch Energie und Impuls bei einem Feld eng miteinander zusammen. Da ein Feld aber nicht punktförmig wie ein idealisiertes Teilchen ist, bilden beide zusammen nicht einfach einen Vierer-Impulsvektor. Statt dessen treten Energie- und Impulsdichten auf, die von Raum und Zeit abhängen. Wie hängen diese nun miteinander zusammen?

Man kann das erlativ leicht erraten, indem man statt eines einzelnen Teilchens eine große Ansammlung von Teilchen mit gleicher Masse m, gleicher Energie E und gleichem Impuls p betrachtet, die sich mit einer konstanten Teilchendichte   n   im Raum verteilen (n gibt dabei die Teilchenanzahl pro Volumen an). Energiedichte ω und Impulsdichte S dieser Teilchen ist dann gleich

  ω   =   n E   =   n m γ c2
  S   =   n p    =   n m γ v

und somit

  S   =   ω/c2 v

Hier spielt die Masse m wieder keine Rolle, d.h. dieser Zusammenhang zwischen Energiedichte ω und Impulsdichte S gilt auch für masselose Teilchen. Man kann die obige Überlegung auch auf andere Teilchenansammlungen verallgemeinern, und sie gilt auch für Felder. Ganz allgemein gilt:

Dabei zählen wir für einen massiven Teilchenschwarm die Masse mit zur Energie hinzu, d.h. die gesamte Trägheit   m γ   bestimmt nach Multiplikation mit c2 die Energie der Teilchen. Das macht Sinn, denn umgekehrt bedeutet ja auch eine lokalisierte Feldenergie eine Trägheit. Man könnte daher auch sagen: Immer wenn sich etwas mit Trägheit bewegt, entsteht ein Impuls. Das entspricht sogar ganz anschaulich unserem intuitiven Impulsverständnis -- das Überaschende dabei ist höchstens, dass wir nicht damit gerechnet hätten, dass auch eine Feldenergie eine Trägheit besitzt.

Bei einer Materieverteilung, die Felder und Teilchenverteilungen umfassen kann, haben wir es also mit Energie- und Impulsdichten zu tun. War es das schon?

Nicht ganz, denn anders als bei nur einem einzigen Teilchen kann es bei einer Materieverteilung zum Austausch von Energie und Impuls zwischen den einzelnen Raumbereichen kommen. Es können Energieströme auftreten, wobei wir gerade gesehen haben, dass ein Energiestrom zu einer Impulsdichte führt. Wenn wir Einflüsse von außen ausschließen, so kann dabei Energie weder erzeugt werden noch verloren gehen. Man drückt dies mathematisch durch eine Kontinuitätsgleichung aus, die inhaltlich besagt: Wenn die Energie in einem Raumbereich sich ändert, so muss es einen dazu passenden Energiestrom durch den Rand dieses Raumbereichs geben. Energiedichte und Energiestrom (und zugehörige Impulsdichte) hängen also eng miteinander zusammen.

Dasselbe gilt auch für die Impulsdichte: Wenn der Impuls in einem Raumbereich sich ändert, so muss es einen dazu passenden Impulsstrom durch den Rand dieses Raumbereichs geben. Einen solchen Impulsstrom können wir auch als Kraft-Flächendichte (Spannung) interpretieren, denn er führt ja zu einer Änderung des Impulses der Materie im betrachteten Raumbereich, und Impulsänderungen entstehen nach Newtons Aktionsprinzip durch Kräfte.

Es entsteht also ein Geflecht aus mehreren Größen, die alle miteinander zusammenhängen: Energiedichten, Energiedichteflüssen = Impulsdichten und Impulsdichteflüssen = Kraftdichten. Außerdem werden sich diese Größen bei einem Wechsel von einem ruhenden in ein gleichförmig bewegtes Bezugsystem ändern. Mathematisch kann man all dies recht elegant im Rahmen des sogenannten Energie-Impuls-Tensors zusammenführen -- er ist bei einer allgemeinen Materie-Feld-Verteilung das Gegenstück zum Viererimpuls eines einzelnen Teilchens. Während jedoch der Viererimpuls nur 4 Komponenten besitzt, weist der Energie-Impuls-Tensor 4-mal-4 = 16 Komponenten auf, von denen wegen Symmetrie aber nur 7 unabhängig sind. Die 0-0-Komponente ist dabei die Energiedichte, die 0-k-Komponenten = k-0-Komponenten (mit k = 1, 2, 3) sind die Energiedichteflüsse = Impulsdichten und die k-k-Komponenten sind die Impulsdichteflüsse = Kraftdichten.

In Einsteins Allgemeiner Relativitätstheorie der Gravitation ist nun dieser gesamte Energie-Impuls-Tensor die Quelle des Gravitationsfeldes. Das bedeutet beispielsweise: Nicht nur Massen- und Energiedichten, sondern auch Drücke (isotrope Kraftdichten) sind Quellen des Gravitationsfeldes -- wobei, wie wir wissen, negative Drücke (innere Zugkräfte) gravitativ abstoßend wirken. Das ist der Grund dafür, warum bestimmte Materieformen wie beispielsweise ein Inflatonfeld oder die geheimnisvolle Dunkle Energie, die beide einen starken negativen Druck besitzen, zu einer beschleunigten Expansion des Universums führen können. Bei einem Neutronenstern, der sich mit stark positivem (also normalem) Druck gegen den gravitativen Kollaps wehrt, ist es dagegen umgekehrt: Der starke Druck bewirkt eine zusätzliche anziehende Gravitation, die den Neutronenstern bedrängt. Bei zuviel Sternenmasse reicht daher auch ein noch so starker Druck nicht mehr aus, den Kollaps abzuwenden, und ein schwarzes Loch entsteht.

Es ist wie so oft in der Physik: Erst wenn man alles konsistent zusammenfügt, dann ergibt sich das korrekte Bild von der Natur, und das stimmt nicht immer mit dem Bild überein, das wir intuitiv erwarten würden.



Literatur:


zurück zum Inhaltsverzeichnis

last modified on 11 January 2014