Grundlagen der Mechanik und Elektrodynamik

Transcription

Grundlagen der Mechanik und Elektrodynamik
Grundlagen der
Mechanik und Elektrodynamik
Teil 1: Mechanik
Vorlesung an der Ruhruniversität Bochum
K.–U. Riemann
Inhaltsverzeichnis
1.
Mechanik freier Massenpunkte
1.1
1.10
Newtons Axiome
Maßsysteme
Impuls, Energie und Drehimpuls
Konservative Kräfte, Zentralkräfte
Mathematische Gesichtspunkte
Die Bewegung im konstanten Schwerefeld
Der harmonische Oszillator
Bahn, Hodograph und Phasenbahn
Zentralkraft– und Keplerproblem
Geometrie der Ellipse
Coulombwechselwirkung
Die Bewegung im konstanten elektrischen und magnetischen Feld
Beschleunigte Koordinatensysteme und Scheinkräfte
Drehungen
Rotierende Koordinatensysteme, Zentrifugal– und Corioliskraft
Systeme von Massenpunkten
Schwerpunkts– und Relativbewegung
Zerlegung der kinetischen Energie
Zerlegung der potentiellen Energie
Zerlegung des Drehimpulses
Das Zweikörperproblem
2.
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskräfte
Klassifikation von Zwangsbedingungen
Das Selbstkonsistenzproblem
Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip
Modell der glatten Führungen
Virtuelle Verrückungen und Bewegungsablauf
Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip
Beispiele: Zentripetalkraft und schiefe Ebene
Generalisierte Koordinaten und Lagrangesche Gleichungen
Generalisierte Koordinaten und Kräfte
Lagrangesche Gleichungen (zweiter Art)
Beispiele
Spiralbewegung in der Ebene
Das ebene Pendel
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.2
2.3
2.4
i
1
5
9
11
12
14
19
22
27
32
35
37
41
46
2.5
2.6
2.7
2.8
2.9
Das Zykloidenpendel
Geschwindigkeitsabhängige Kräfte
Generalisierte Potentiale
Lagrangefunktion für elektromagnetische Kräfte
Reibung und Dissipationsfunktion
Die Methode der Lagrangeschen Multiplikatoren
Lagrange–Multiplikatoren und Zwangskräfte
Lagrangesche Gleichungen mit Nebenbedingungen
Lagrangesche Gleichungen erster Art
Beispiel: Die schiefe Ebene
Berechnung von Zwangskräften (ohne Multiplikatoren)
Zyklische Koordinaten, Symmetrien und Erhaltungssätze
Generalisierte Impulse
Impulserhaltung und Homogenität des Raumes
Drehimpulserhaltung und Isotropie des Raumes
Energieerhaltung und Homogenität des Zeit
Die Hamiltonfunktion
Die Hamiltonfunktion rheonomer Systeme
Routhsches Verfahren und kanonische Gleichungen
Eliminierung zyklischer Variablen aus den Bewegungsgleichungen
Eliminierung zyklischer Variablen aus der Lagrangefunktion
Legendretransformationen
Kanonische Gleichungen
Beispiel: Zentralkraftproblem
Hamiltonfunktion und generalisierter Impuls im Magnetfeld
3.
Dynamik des starren Körpers
3.1
Modell und Koordinaten des starren Körpers
Orientierung des starren Körpers
Richtungskosinus und orthogonale Matrizen
Eulersche Winkel 70
Das Eulersche Theorem
Die Drehachse als Eigenvektor
Das Eigenwertproblem orthogonaler Matrizen
Eulersches Theorem und Satz von Cashle
Der Trägheitstensor
Drehimpus und kinetische Energie des starren Körpers
Das Trägheitsmoment um eine feste Drehachse
Der Satz von Steiner
Beispiel: Physikalisches Pendel
Trägheitshauptachsen
Das Eigenwertproblem selbstadjungierter Matrizen
Hauptachsentransformationen
3.2
3.3
3.4
ii
48
51
54
56
62
69
74
78
82
3.9
Beispiel
Trägheitsellipsoid und Poinsotsche Konstruktion
Geometrische Beschreibung des kräftefreien Kreisels
Die Eulerschen Kreiselgleichungen
Die kräftefreie Bewegung des starren Körpers
Stabile Drehachsen des starren Körpers
Der kräftefreie symmetrische Kreisel
Der Lagrangeformalismus für den Kreisel
Lagrangefunktion und zyklische Koordinaten des symmetrischen Kreisels
Der kräftefreie symmetrische Kreisel
Der schwere symmetrische Kreisel
Zum elementaren Verständnis des Kreisels
4.
Stabilität und kleine Schwingungen
4.1
4.4
4.5
Gleichgewichte und kleine Abweichungen
Quadratische Formen
Eigenfrequenzen und Stabilität
Transformation auf Normalkoordinaten
Gleichzeitige Diagonalisierung von T und V
Die formale Durchführung
Gekoppelte Pendel
5.
Spezielle Relativitätstheorie
5.1
Galileiisches und Einsteinsches Relativitätsprinzip
Das Problem der Lichtgeschwingkeit
Das Michelson–Experiment
Die Lorentztransformationen
Minkowskiraum und orthogonale Transformationen
Spezielle und allgemeine Lorentztransformationen
Elementare Herleitung aus den physikalischen Postulaten
Die Zeitdilatation
Symmetrie des Uhrenvergleichs und Zwillingsparadoxon
Die Lorentzkontraktion
Zusammenhang mit der Zeitdilatation
Unsichtbarkeit der Lorentzkontraktion
Die Gruppeneigenschaft der Lorentztransformation
Einsteinsches Additionstheorem der Geschwindigkeiten
Kovariante Formulierung einer Theorie
Vierer–Vektoren und Lorentz–Skalare
Raumartige und zeitartige Vektoren, der Lichtkegel
Vergangenheit, Gegenwart und Zukunft; kausale Ereignisse
Bahn im Minkowskiraum und Eigenzeit
Vierer–Geschwindigkeit und –Impuls
3.5
3.6
3.7
3.8
4.2
4.3
5.2
5.3
5.4
5.5
5.6
5.7
iii
87
90
92
94
100
103
105
106
110
112
116
117
119
125
126
128
131
5.8
5.11
Relativistische Mechanik
Die Minkowski–Kraft und Bewegungsgleichung
Der Energie–Impuls–Vektor
Die Einheit von Impuls– und Energiesatz
Die Äquivalenz von Masse und Energie
Die relativistische Bewegungsgleichung
Beispiel: Elektron im konstanten elektrischen Feld
Longitudinale und transversale Beschleunigung
Die Transformation von Kräften
Relativistischer Lagrangeformalismus
Die relativistische Lagrange– und Hamiltonfunktion (nicht kovariant)
Probleme: Instantane Fernwirkung, Zwangsbedingungen
und Nicht–Inertial–Systeme
Grundgedanken der allgemeinen Relativitätstheorie
Vom Zwillingparadoxon zum Hamiltonprinzip
6.
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip
Grundaufgabe der Variationsrechnung
Bahnvariationen im Konfigurationsraum
Das Wirkungintegral und die Quantenmechanik
Das Hamiltonsche Prinzip im Phasenraum
Die erweiterte Konkurrenz der Bahnen im Phasenraum
Hamiltonsches Prinzip und kanonische Gleichungen
Kanonische Transformationen
Tabelle: Erzeugende und Transformationsgleichungen
Beispiele kanonischer Transformationen
Die Hamiltonsche partielle Differentialgleichung
Das Wirkungsintegral als Erzeugende
Klassische Mechanik und geometrische Optik
Separation und Hamiltonsche charakteristische Funktion
Der harmonische Oszillator als Beispiel
Ergänzende Bemerkungen
Infinitesimale kanonische Transformationen
Liouvillescher Satz
Poissonklammern
5.9
5.10
6.2
6.3
6.4
6.5
6.6
6.7
Literaturhinweise
136
140
142
144
147
149
151
154
156
159
162
164
iv
1
Mechanik freier Massenpunkte
1.1
Newtons Axiome
Die Entwicklung der Grundlagen der Mechanik in der Renaissance ist als Geburtsstunde der Naturwissenschaft im heutigen Sinn anzusehen. Sie ist durch präzise
Begriffsbildungen und eine Mathematisierung gekennzeichnet. Dadurch wurden
Verallgemeinerungen möglich, die durch weitere Beobachtungen bestätigt oder
falsifiziert werden konnten. Diesem Umstand ist es zu verdanken, daß kontroverse
Auffassungen der Begründer nicht zu widerstreitenden Schulen führten, sondern
in eine allgemein akzeptierte Mechanik mündeten. Wir können den gewaltigen
Umbruch des Denkens in jener Zeit nicht hier im Detail verfolgen, sondern charakterisieren den historischen Hintergrund durch wenige Meilensteine:
• Nicolaus Copernicus (1473–1543) propagierte das heliozentrische System.
• Tycho Brahe (1546–1601) lehnte das heliozentrische System ab und führte sehr genaue Beobachtungen durch — in der Absicht, das geozentrische
System des Ptolemäus zu stützen.
• Johannes Kepler (1571–1630) leitete aus den Beobachtungen T. Brahes seine Planetengesetze (1609–1618) her. Diese Gesetze sind rein kinematisch zu
verstehen und nicht dynamisch begründet.
• Galileo Galilei (1564–1642) ist als entschiedener Verfechter des heliozentrischen Systems bekannt. Dabei glaubte er jedoch an vollkommene Kreisbahnen und lehnte Keplers Ergebnisse ab. Er führte “Fallversuche” an der
schiefen Ebene durch und kam für den Spezialfall verschwindender Neigung
zu einer Vorform des Trägheitsprinzips.
• Isaac Newton (1643–1727) veröffentlichte 1687 die Abhandlung “Philosophiae naturalis principia mathematica”. Darin formulierte er die “Newtonschen Gesetze” als Grundlage der Dynamik.
Vor der Aufstellung dieser Gesetze formulierte Newton zwei grundlegende Vorausetzungen:
• Die absolute Zeit
Tempus absolutum, verum, et mathematicum, in se et natura sua sine relatione ad externum quodvis, aequabiliter fluit, alioque nomine dicitur duratio.
Die absolute, wahre und mathematische Zeit verfließt an sich und vermöge
ihrer Natur gleichförmig und ohne Beziehung zu irgendeinem äußeren Geschehen. Sie wird auch mit dem Namen Dauer belegt.
1
• Der absolute Raum
Spatium absolutum, natura sua sine relatione ad externum quodvis, semper
manet similare et immobile.
Der absolute Raum bleibt vermöge seiner Natur und ohne Beziehung zu
irgendeinem äußeren Geschehen stets gleich und unbeweglich.
Wir verzichten hier auf eine Kritik dieser aus der intuitiver Vorstellung gewonnenen Definitionen und verweisen auf die Diskussion von Uhren und Maßstäben
im 5. Kapitel. Bemerkenswert ist, daß Newton die Notwendigkeit erkannte, sich
diese Voraussetzngen bewußt zu machen.
LEX PRIMA (Trägheitsgesetz)
Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in directum, nisi quatenus illud a viribus impressis cogitur statum suum mutare.
Jeder Körper beharrt in seinem Zustand der Ruhe oder der gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen Zustand
zu ändern.
Die Lex prima stellt eigentlich einen Spezialfall der Lex secunda dar (vgl. Gl. (6).
Wegen seiner für die damalige Zeit revolutioniernden Aussage stellt Newton
dieses Gesetz aber bewußt an die Spitze seines Systems. Widerspricht es doch der
alltäglichen Erfahrung, daß jede Bewegung zum Stillstand kommt. (I. Kant 1747:
Es gibt zweierlei Art von Bewegungen, solche, die nach einiger Zeit aufgehört
haben, und solche, welche andauern. [Gegenstände, die getragen oder geschoben
werden und Geschoßkugeln.]) Die Äquivalenz von Ruhe und von gleichförmiger
Bewegung (wogegen?) drängt schon fast eine Diskussion von Bezugssystemen und
Relativität auf. Wir verweisen dazu auf das 5. Kapitel.
Der Formulierung seiner Lex secunda stellt Newton zunächst zwei Definitionen
voran:
Definitio I: Quantitas materiae est mensura eiusdem orta ex illius densitate et
magnitudine coniunctim.
Die Menge der Materie (Masse m) wird durch ihre Dichte und ihr Volumen vereint
gemessen.
Definitio II: Quantitas motus est mensura eiusdem orta ex velocitate et et quantitate materiae conjunctim.
Die Größe der Bewegung (Bewegungsgröße, Impuls p) wird durch die Geschwindigkeit und die Menge der Materie vereint gemessen:
p = mv .
2
(1)
Es ist bemerkenswert, daß Newton die Notwendigkeit erkannte, den aus der alltäglichen Erfahrung scheinbar so vertrauten Begriff der Masse (Materiemenge)
zu definieren1 . Seine Definitio I ist aber offensichtlich nur eine Scheindefinition:
Man kann die Grundgröße “Masse” nicht durch die abgeleitete Größe “Dichte”
definieren.
Im Gegensatz zur Masse m ist die Geschwindigkeit v = dr/dt nach der Einführung
von Raum und Zeit eine abgeleitete Größe und benötigt keine eigene Definition.
Newton nennt mv die “Bewegungsgröße”, das heute übliche Wort Impuls vertauscht im Grunde Ursache und Wirkung [vgl. Gl. (5)]. Mit der Definitio II kann
die Lex prima auch als Satz der Erhaltung des Impulses formuliert werden [vgl. Gl.
(6)].
Eigentlich erfordert die folgende lex secunda noch eine weitere vorbereitende
Erläuterung: Sie bezieht sich auf das Modell eines Massenpunktes, eines massebehafteten Objekts ohne räumliche Ausdehnung. Da alle Körper endlich ausgedehnt sind, ist die Tragfähigkeit dieses Modells keineswegs von vornherein klar.
Wir begnügen uns im Augenblick mit dem Hinweis, daß der Schwerpunkt eines
ausgedehnten Körpers in vielen Aspekten dem Massenpunkt entspricht.
LEX SECUNDA (Bewegungsgesetz)
Mutationem motus proportionalem esse vi motrici impressae, et fieri secundum
lineam rectam qua vis illa imprimitur.
Die Änderung der Bewegung ist der Einwirkung der bewegenden Kraft proportional und geschieht nach der Richtung derjenigen geraden Linie, nach welcher
jene Kraft wirkt:
ṗ = F .
(2)
Dieses zentrale Gesetz der Newtonschen Mechanik wirft eine ganz fundamentale
Frage auf: Handelt es sich wirklich um ein Naturgesetz oder bloß um die Definition
der Kraft? Diese Frage ist typisch für grundlegende Beziehungen der Physik, die
sich durch die inhaltliche Deutung eben doch von mathematische Axiomen unterscheiden. Wir können Kräfte durch die Änderung des Bewegungszustandes messen, besitzen durch unsere Muskeln aber auch eine intuitive a priori-Erfahrung.
Für eine Gesetzmäßigkeit sprechen auch Experimente mit verschiedenen Massen
bei gleicher Kraft und verschiedenen Kräften bei gleicher Masse (wenn man Unabhängigkeit und ggf. ungestörte Superposition veraussetzt; vgl. auch die Schwierigkeit, die (träge) Masse zu definieren.)
Phänomenologisch unterscheiden wir Kräfte bei der Berührung verschiedener Körper (Druck, Zug, Reibung . . . ) und Fernwirkungen (besser: Felder) wie Gravitation oder Magnetismus. Von einem systematischen Standpunkt aus beruhen alle
makroskopischen Kräfte auf elektromagnetischen Kräften oder der Gravitation.
1
Zur Problematik des Begriffs “Masse” vgl. die Diskussion um “schwere Masse” und “träge
Masse” beim Aufbau der allgemeinen Relativittstheorie.
3
(Auf die starke und schwache Wechselwirkung ist das klassische Konzept nicht
anwendbar.)
Newtons Lex secunda ändert sich nicht, wenn man von einem Bezugssystem
S zu einem gleichförmig dagegen bewegten Bezugssystem S 0 übergeht (Galileitransformation): Die Lex secunda gilt in allen Inertialsystemen. In NichtInertialsystemen (z. B. rotierende Erde) treten neben den oben diskutireten Kräften auch Scheinkräfte (z. B. Zentrifugalkraft und Corioliskraft) auf. Was aber
unterscheidet “wahre” Kräfte und Scheinkräfte? Wir spüren hier wieder die Notwendigkeit, Bezugssysteme und Relativität zu diskutieren und verweisen auf das
5. Kapitel.
Abschließend erwähnen wir die prophetische Sicherheit (Sommerfeld), mit der
sich die Newtonsche Formulierung (2.) gegenüber der späteren Formulierung
“Kraft=Masse mal Beschleunigung” in der Relativitätstheorie bewährt hat. Bei
der Interpretation des Unterschiedes ist allerdings Vorsicht geboten. Zum kritischen Verständnis stellen wir die Frage, was an der folgenden Beschreibung einer
Rakete falsch ist:
d
(mv) = F = 0,
dt
mv = m0 v0 ,
v=
m0
v0 .
m
LEX TERTIA (Reaktionsprinzip, “actio = reactio”)
Actioni contrariam semper et aequalem esse reactionem: sive corporum duorum
actiones in se mutuo semper esse aequales et in partes contrarias dirigi.
Die Gegenwirkung ist der Wirkung stets entgegengesetzt und gleich, oder die
Wirkungen zweier Körper aufeinander sind stets gleich und von entgegengesetzter
Richtung:
Fij = −Fji .
(3)
Dieses Gesetz schafft die Grundlage zum Übergang zur Mechanik eines Systems
von Massenpunkten. Die Gültigkeit ist allerdings eingeschränkt: Gl. (3) gilt bei
elektromagnetischer Wechselwirkug nur, wenn die Abstrahlung vernachlässigt
werden kann. (Spielt die Strahlungsdämpfung eine Rolle, läßt sich die Bewegungsgleichung nicht mehr durch die erste Ableitung v̇ formulieren!)
Häufig (Zentralkräfte) läßt sich die Lex tertia durch den Zusatz “Die Kräfte liegen
in der Richtung der Verbindungslinie der Körper ” verschärfen. Diese Verschärfung wird aber bereits durch die Lorentzkraft verletzt.
CORROLARIUM (“Lex quarta”, Parallelogramm der Kräfte)
Corpus viribus coniunctis diagonalem parallelogrammi eodem tempore describere,
quo latera separatis.
4
Bei vereinten Kräften wird ein Körper durch die Diagonale des Parallelogramms
beschrieben, dessen Seiten zur gleichen Zeit den getrennten Kräften entsprechen,
d. h. Kräfte addieren sich wie Vektoren:
F=
X
Fi .
(4)
i
Dieses Gesetz ist keineswegs trivial, sondern fordert die Unabhängigkeit der einzelnen Kraftwirkungen. Newton formulierte die Aussage nicht als “Gesetz”, sondern als Corollarium (Zusatz) zu den Bewegungsgesetzen.
Ergänzung: Maße und Maßsysteme
Newtons Grundvoraussetzungen und die Lex secunda erforden Meßvorschriften
und Maßeinheiten für die Länge, die Masse und die Zeit.
Das internationale Maßsystem (SI) legt hierzu das Meter (m), das Kilogramm
(kg) und die Sekunde (s) fest. (MKS–System). Daneben wird häufig auch (noch)
das CGS–System mit den Grundeinheiten Zentimeter (cm), Gramm (g) und
Sekunde verwendet.
Grundsätzlich könnte für die Kraft eine vierte Grundeinheit — etwa das Kilopond
(kp) — festgelegt werden. Mit der Verfügung der Proportionalitätskonstante 1 in
der Lex secunda wird die Kraft jedoch eine abhängige Größe und erhält im SI die
Maßeinheit 1N = 1 kg m s−2 (1 Newton). Die entsprechende Maßeinheit des
CGS–Systems ist 1 dyn = 1 g cm s−2 = 10−5 N. Daneben sind veraltete Bezeichnungen und Maßeinheiten wie 1 Dyn = 1 N und 1 kp = 9.81 N in Gebrauch.
Auf abgeleitete Größen wie 1 J = 1 Nm = 1 kg m2 s−2 (Joule) für Arbeit und
Energie oder 1 W = 1 J s−1 (Watt) für Leistung weisen wir nur am Rande hin.
Im folgenden wollen wir Folgerungen aus den Newtonschen Gesetzen diskutiern
und einfache Anwendungsbeispiele geben. Dabei beschränken wir uns zunächst
auf die Mechanik eines Massenpunktes.
1.2
Grundbegriffe: Impuls, Energie und Drehimpuls
Wir integrieren die Lex secunda:
∆p = p2 − p1 =
Zt2
F dt,
(5)
t1
also Änderung der Bewegungsgröße = Kraftstoß oder Impuls. Von hier aus ist der
Begriff Impuls (eigentlich etwas ungenau!) auf die Bewegungsgröße übertragen
worden. Wir schließen uns trotzdem diesem allgemeinen Sprachgebrauch an.
5
Für die kräftefreie Bewegung formulieren wir den Impulserhaltungssatz
p = const
(6)
und erhalten so die Lex prima als Spezialfall.
Zur Einführung der Begriffe Energie2 und Arbeit multiplizieren wir die Lex secunda vor der Integration skalar mit v:
Zt2
t1
mv · v̇ dt =
Zt2
F · ṙ dt =
t1
Zr2
F· dr
r1
Das Integral auf der linken Seite können wir in der Form
Zt2
t1
mv · v̇ dt =
Zt2
t1
d m 2
v dt = T2 − T1
dt 2
schreiben, wenn wir durch
T =
m 2
v
2
(7)
die kinetische Energie eines Massenpunktes definieren. Durch das Integral
A12 =
Zr2
F· dr
(8)
r1
auf der rechten Seite definieren wir die Arbeit, die von der Kraft F geleistet
wird, wenn unser Massenpunkt von r1 nach r2 bewegt wird. Damit erhalten wir
den Satz
A12 = T2 − T1 ,
(9)
der die Änderung der kinetischen Energie mit der am Massenpunkt geleisteten
Arbeit in Beziehung bringt.
Das Kunstwort Energie bedeutet so etwas wie ein Arbeitsvermögen. Kinetische
Energie deutet also auf ein Arbeitsvermögen, das in der Bewegung steckt. Die
Begriffe Energie und Kraft wurden lange Zeit nicht sauber getrennt. Bei Leibnitz
wird die kinetische Energie vis viva genannt.
2
griech. ν (en) = in, griech. ργoν (ergon) = “Werk” (gleiche indogerm. Wurzel!), Arbeit
6
Von besonderer Bedeutung sind Kraftfelder F = F(r), bei denen das Integral (8)
vom Weg unabhängig ist. Solche Kraftfelder heißen konservativ. Für konservative
Kraftfelder gilt also
I
F·dr = 0
und wir können eine bis auf eine additive Konstante eindeutige Ortsfunktion
V (r) = −
Zr
F(r0 )· dr0
(10)
definieren, die wir als Potential oder potentielle Energie bezeichnen. Für konservative Kräfte haben wir [vgl. Gl. (8)]
A12 = V1 − V2 ,
(11)
und können [vgl. Gl. (9)] den Energieerhaltungssatz (daher der Name konservativ)
V1 − V 2 = T 2 − T 1
oder E = T + V = const
(12)
formulieren. E = T + V wird als Gesamtenergie oder kurz Energie bezeichnet.
Nach Gl. (10) läßt sich eine konservative Kraft gemäß
F=−
dV
= −grad V
dr
(13)
aus ihrem Potential V berechnen. Aus der Vertauschbarkeit der zweiten Ableitungen von V folgt
∂2V
∂2V
∂Fj
∂Fi
=−
=−
=
.
∂xj
∂xi ∂xj
∂xj ∂xi
∂xi
Damit erhalten wir die Beziehung
∂Fj
∂Fi
=
∂xj
∂xi
oder rot F = 0
als notwendige Bedingung dafür, daß die Kraft F ein Potential besitzt. Sie ist
aber auch hinreichend, wie wir am Stokeschen Satz erkennen.
Beispiel für konservative Kräfte:
7
Betrachten wir eine beliebige Zentralkraft
F(r) = f (r)r,
(14)
also Fi = f (r)xi . Dann wird
∂xi
∂r
∂Fi
= f (r)
+ f 0 (r)
xi
∂xj
∂xj
∂xj
Dazu rechnen wir ∂r/∂xj = xj /r, und für i 6= j haben wir ∂xi /∂xj = 0, also
∂Fi
f 0 (r)
∂Fj
=
xi xj =
.
∂xj
r
∂xi
Alle Zentralkräfte sind folglich konservativ. Für ihr Potential gilt
dV
= −f (r)r,
dr
d.h. V (r) = −
Zr
f (r 0 )r 0 dr 0 .
(15)
Als Spezialfälle erwähnen wir
(i) die elastische Kraft
F(r) = −kr
=⇒
V (r) =
k 2
r
2
und
(16)
(ii) die Coulomb– und Gravitationskraft
F(r) = −
c
r
r3
=⇒
c
V (r) = − .
r
(17)
Natürlich sind die Potentiale nur bis auf eine additive Konstante bestimmt. Bei
(i) haben wir V (0) = 0 gewählt, d.h. wir haben bei “gespannter Feder” eine
positive potentielle Energie. Im Fall (ii) haben wir dagegen V (∞) = 0 gesetzt.
Für anziehende Kraftzentren wird daher die potentielle Energie negativ: Dies ist
der Energiebetrag, der nötig ist, um einen Massenpunkt aus dem Einflußbereich
des Kraftfeldes zu “befreien”. Beachte, daß V (∞) im Fall (i) und V (0) im Fall
(ii) singulär werden.
Als ein letztes triviales Beispiel erwähnen wir das Potential
V = mg·r = mgz
des konstanten Schwerefeldes F = −mg = −mgez .
8
(18)
Auf einen weiteren fundamentalen Grundbegriff werden wir geführt, wenn wir die
Lex secunda vektoriell mit r multiplizieren:
r × ṗ = r × F.
Zur Interpretation der linken Seite führen wir den Drall oder Drehimpuls
l=r×p
(19)
ein. Für seine zeitliche Ableitung erhalten wir
d
l = r × ṗ + ṙ × p = r × ṗ,
dt
da ṙ × p = mv × v = 0 gilt. Mit der analogen Definition des Drehmoments
M=r×F
(20)
erhalten wir also die grundlegende Beziehung
l̇ = M
(21)
zwischen der Drehimpulsänderung und dem einwirkenden Drehmoment. Sie spielt
in der Dynamik des starren Körpers eine ähnliche Rolle wie Newtons Lex secunda für den Massenpunkt.
Hinweise:
1. Drehimpuls wie Drehmoment hängen nach ihrer Definition von der Lage des
gewählten Koordinatenursprungs ab und sind keine galileiinvarianten Begriffe.
(Natürlich gilt Gl. (21) jedoch in jedem Inertialsystem). Bei der physikalischen
Interpretation des Drehimpulses wird man sich also stets auf ein dem Problem
natürlich angepaßtes Koordinatensystem beziehen müssen.
2. Man beachte die Reihenfolge der Faktoren in den Gln. (19, 20).
3. Zum Namen Drehimpuls gilt entsprechendes wie beim Impuls. Trotz des Namens ist die Bedeutung nicht auf Drehbewegungen beschränkt.
Von besonderer Wichtigkeit ist der Spezialfall eines verschwindenden Drehmoments. In diesem Fall gilt der Drehimpulserhaltungssatz
l = const.
(22)
Wegen r × r = 0 treffen wir diesen Speziallfall für alle Zentralkräfte an, wenn
wir — was ja naheliegt — das Kraftzentrum als Koordinatenursprung wählen.
Als wichtige Folgerung aus Gln. (19, 22) bemerken wir, daß die Bewegung bei
Drehimpulserhaltung in einer Ebene — nämlich in der Ebene r · l = 0 — abläuft.
9
1.3
Mathematische Gesichtspunkte
Das Bewegungsproblem eines Massenpunktes wird durch drei gekoppelte gewöhnliche Differentialgleichungen
mẍi = Fi (xj , ẋj , t) (i, j = 1, 2, 3)
(23)
zweiter Ordnung oder durch sechs Differentialgleichungen
ẋi = pi /m,
ṗi = Fi (xj , pj , t) (i, j = 1, 2, 3)
(24)
erster Ordnung beschrieben und stellt damit ein Problem sechster Ordnung dar.
(Wir werden für allgemeine Betrachtungen die zweite Form bevorzugen). Eine
vollständige Lösung
xi = ξi (t, ck ),
pi = πi (t, ck )
(25)
hängt also von sechs Integrationskonstanten c1 , . . . c6 ab. Als Integrationskonstanten können insbesondere die Anfangsbedingungen
r(t = 0) = r0
und p(t = 0) = p0
(26)
(bzw. v(t = 0) = v0 ) gewählt werden. Mit diesen Differentialgleichungen
(Newtons Lex secunda) und den zugehörigen Anfangsbedingungen ist die
Bewegung eindeutig festgelegt. (Kausalität, physikalisches Geschehen als Uhrwerk!).
Die Ordnung des Problems läßt sich reduzieren, wenn es gelingt, einzelne Variable
zu eliminieren. Hierzu können Beziehungen der Form
φ(xj , pj , t, C) = 0,
(27)
die eine Integrationskonstante C enthalten, dienen. Solche Beziehungen nennen
wir Integrale. Als Beispiele erwähnen wir insbesondere den Energiesatz T + V −
E = 0 (1 Integral), den Impulssatz p = p0 (3 Integrale) und den Drehimpulssatz
r × p = j (3 Integrale).
Mit jedem Integral wird die Ordnung um eins reduziert und durch sechs Integrale
wird das Problem vollständig gelöst. Dabei ist allerdings folgendes zu beachten:
1. Die verwendeten Integrale müssen voneinander unabhängig sein. Für die kräftefreie Bewegung sind beispielsweise Impulssatz v = v0 und Energiesatz v 2 = v02
trivialerweise nicht unabhängig.
10
2. Eine Beziehung der Form
φ(xj , C1 , C2 ) = 0,
die zwei Integrationskonstanten enthält, zählt doppelt, da sich aus ihr durch Differentiation ein weiteres Integral gewinnen läßt.
Wir werden im folgenden einige grundlegende Bewegungsprobleme explizit lösen
und auf diese Gesichtspunkte zurückkommen.
1.4
Die Bewegung im konstanten Schwerefeld
Mit der Kraft F = −mg lautet die Bewegungsgleichung
r̈ = v̇ = −g .
(28)
An Integralen steht zunächst (nur) der Energie–Erhaltungssatz zur Verfügung.
Es ist in diesem Fall allerdings nicht sinnvoll, mit seiner Hilfe eine Variable zu
eliminieren. Denn die Bewegungsgleichungen sind ungekoppelt, und die bequemste
Lösung besteht in der direkten zweifachen Integration:
ṙ = v = v0 − gt,
1
r = r0 + v0 t − gt2 .
2
(29)
Als Integrationskonstanten haben wir den Anfangsort r0 und die Anfangsgeschwindigkeit v0 benutzt. Damit ist das Problem bereits vollständig gelöst.
Den Energieerhaltungssatz finden wir aus der Lösung, wenn wir Gl. (29) skalar
mit mg multiplizieren:
mg·(r − r0 ) =
m 2 m
v0 − (v0 − gt)2 .
2
2
Unter Beachtung von v = v0 − gt und V = mg · r [vgl. Gl. (18)] geht dies in
T + V = T 0 + V0
oder v 2 − v02 = 2g·(r0 − r)
über.
Zur anschaulichen Beschreibung der Bewegung wählt man zweckmäßigerweise in
ein kartesisches Koordinatensystem mit g in z–Richtung und vy0 = 0. Dann erhält
man
11
vx = vx0 ,
x = x0 + vx0 t
g
z = z0 + vz0 t − t2
2
vz = vz0 − gt,
und erkennt die Wurfparabel in der x–z–Ebene (d.h. in der durch v0 und g
aufgespannten Ebene). Man beachte, daß sich wegen der Unabhängigkeit der
Koordinaten neben dem vollen Energiesatz auch ein separater Energiesatz
2
vz2 − vz0
= 2g(z0 − z)
formulieren läßt. Aus dem selben Grund gilt auch ein Teil–Impulssatz
mvx = const.
Erhaltungssätze müssen also nicht immer in der im Abschnitt 1.3 angegebenen
Form auftreten, sondern können sich auch auf einzelne Koordinaten beziehen. Wir
werden später sehen, daß dieser Aspekt sogar wesentlich verallgemeinert werden
kann.
1.5
Der harmonische Oszillator
Für das Bewegungsproblem der linearen elastischen Kraft
F = −kr
(30)
haben wir mit dem Energie– und Drehimpuls–Erhaltungssatz vier Integrale (vgl.
Abschnitte 1.3 und 1.6). Aber auch hier sind die drei Komponenten der Bewegungsgleichung
r̈ + ω 2 r = 0 mit ω 2 =
k
m
(31)
ungekoppelt und man erhält die Lösung am bequemsten direkt in der Form
r = a cos ωt + b sin ωt .
(32)
Alle drei Ortskoordinaten führen also unabhängig harmonische Schwingungen der
selben Frequenz ω aus. Offensichtlich gilt
a = r0
und b =
12
1
v0 ,
ω
und die Bewegung verläuft — was wir auch aus der Drehimpulserhaltung schließen
können — in der durch a und b (bzw. in der durch r0 und v0 ) aufgespannten
Ebene.
Diese Ebene wählen wir zweckmäßig als x–y–Ebene (z = 0) eines speziell angepaßten Koordinatensystems. Offenbar ist die Bewegung beschränkt (r 2 ≤ a2 + b2 )
und es gibt eine maximale Auslenkung rm (“Amplitude”). Wir wollen — was
keine Einschränkung bedeutet — den Zeitpunkt t = 0 in eine solche maximale
Auslenkung legen. Dann gilt zur Zeit t = 0
r · ṙ = 0 oder a ⊥ b.
Wählen wir nun x in a– und y in b–Richtung, so erhalten wir die Lösung in der
bequemen Form
x = a cos ωt,
y = b sin ωt
(33)
und erkennen als Bahnkurve eine Ellipse der Halbachsen a und b mit dem Ursprung im Zentrum.
Wir benutzen die Gelegenheit, um den Begriff der Bahngleichung f (x, y) = 0
einzuführen. Wir erhalten sie, indem wir die Zeit t aus den Lösungen x = x(t),
y = y(t) eliminieren. Die Bahngleichung erhält also die Information über die
Bahnkurve ohne Berücksichtigung des ’Fahrplans’. Im Fall des harmonischen Oszillators folgt aus cos2 + sin2 = 1 die Bahngleichung
x2 y 2
+ 2 − 1 = 0.
a2
b
Für manche Zwecke ist es auch nützlich, die “Bahn” im Geschwindigkeits– oder
Impulsraum zu betrachten. Die entsprechende “Bahngleichung” g(ẋ, ẏ) heißt Hodograph [griech. oδoς (hodos) = Weg, γραϕω (grapho) = schreiben, zeichnen].
Für den harmonischen Oszillator mit
ẋ = −aω sin ωt,
ẏ = bω cos ωt
beschreibt also der Hodograph
ẋ2 ẏ 2
+ 2 − ω2 = 0
a2
b
bis auf einen Maßstabsfaktor ω 2 die gleiche Ellipse wie die Bahngleichung.
Als letzten Begriff dieser Art erwähnen wir die Phasenbahn hi (xi , pi ) = 0 in dem
aus Koordinate (xi ) und “zugehörigem” Impuls (pi ) aufgespannten Phasenraum
13
(Bedeutung: Statistische Mechanik, Bohr–Sommerfeldsche Quantentheorie).
Für den Harmonischen Oszillator erhalten wir die Ellipsen
x2 +
p2x
= a2
m2 ω 2
und y 2 +
p2y
= b2
m2 ω 2
als Phasenbahnen. Ihre Gleichungen lassen sich als separate (s.o.) Energiesätze
k 2 m 2
x + ẋ = const und
2
2
k 2 m 2
y + ẏ = const
2
2
deuten.
1.6
Zentralkraft– und Keplerproblem
Mit dem harmonischen Oszillator haben wir schon ein spezielles Zentralkraftproblem behandelt. Im Gegensatz zu diesem Spezialfall lassen sich die (kartesischen)
Bewegungsgleichungen bei allen übrigen Zentralkräften
F=−
dV(r) r
dr r
(34)
jedoch nicht separieren, da über r eine Kopplung besteht. Wir behandeln das
allgemeine Problem daher mit systematischen Methoden und gehen von den Erhaltungssätzen aus:
• Der Drehimpulssatz
l = mr × v = j
liefert uns drei Integrale und gestattet die Reduktion auf ein Problem dritter
Ordnung. Da die Bewegung in der Ebene r · j = 0 verläuft, kann die Koordinate
z = r · j/j senkrecht zu dieser Ebene (samt ihrer Ableitung!) entfallen. In dem
verbleibenden Problem vierter Ordnung behalten wir das Integral
l = mr 2 ϕ̇ = j,
(35)
wenn wir Polarkoordinaten r, ϕ in der Bewegungsebene benutzen. Dieses Integral
besagt, daß der ’Fahrstrahl’ (radius vector) die Bahnebene mit konstanter ’Flächengeschwindigkeit’ überstreicht.
• Als zweites (unabhängiges) Integral notieren wir den Energiesatz
T +V =
m 2 m 2 2
ṙ + r ϕ̇ + V (r) = E .
2
2
14
(36)
Das verbleibende Problem zweiter Ordnung besteht in der Lösung der beiden
gekoppelten Differentialgleichungen (35, 36) für r(t) und ϕ(t). Da ϕ nicht explizit
vorkommt, erreichen wir die Entkopplung, indem wir (35) nach ϕ̇ auflösen und
in (36) einsetzen:
ṙ 2 =
2
(E − V ) − r 2 ϕ̇2 ,
m
ṙ 2 =
mit ϕ̇ =
j
mr 2
=⇒
j2
2
(E − V ) − 2 2 .
m
m r
(37)
Damit ist das Problem im Prinzip bis auf Quadraturen gelöst. Wir bemerken
außerdem, daß Gl. (37) mit dem eindimensionalen Problem übereinstimmt, bei
dem das Potential V (r) durch ein zusätzliches Fliehkraftpotential (Diskussion!)
Ṽ (r) =
j2
2mr 2
(38)
ergänzt ist.
Für die weitere Diskussion wollen wir dem üblichen Weg folgen und mittels
dr/dϕ = ṙ/ϕ̇ = mr 2 ṙ/j von Gl. (37) zur Differentialgleichung
dr
dϕ
!2
mr 2
j
=
!2 "
2
j2
(E − V ) − 2 2
m
m r
#
der Bahngleichung übergehen. Mit der Substitution
s=
1
r
entsteht daraus die Differentialgleichung
ds
dϕ
!2
1
2m
= 2 E − V ( ) − s2 ,
j
s
(39)
Z1/r
(40)
die generell durch das Integral
ϕ = ϕ0 ±
1/r0
ds
n
2m
j2
h
E −V
gelöst wird.
15
( 1s )
i
−
s2
o1/2
Speziell für das Gravitations– oder Coulomb–Potential
V (r) = −
C
= −Cs
r
(41)
läßt sich die Integration (nach quadratischer Ergänzung des Nenners) analytisch
ausführen (und führt auf die arccos–Funktion). Wir folgen jedoch der eleganteren
Behandlung Sommerfelds (Bd. I, S. 37) und differenzieren Gl. (39) (mit V =
−Cs) nach ϕ:
ds d2 s
2mC ds
ds
2
=
−
2s
.
dϕ dϕ2
j 2 dϕ
dϕ
Für ds/dϕ 6= 0 ensteht daraus die einfache Differentialgleichung
mC
d2 s
+
s
=
dϕ2
j2
mit der allgemeinen Lösung3
s=
mC
+ α cos ϕ + β sin ϕ.
j2
Diese Lösung enthält zwei Integrationskonstanten α und β. Zur Festlegung einer
Konstanten bemerken wir, daß s offenbar beschränkt ist und verfügen ϕ = 0 für
das maximale s (minimale r, ’Perihel’). Dann haben wir β = 0 und α > 0.
Nun ist unsere Ausgangsgleichung (39) aber erster Ordnung und läßt gar keine
zwei Integrationskonstanten frei. Nach der Wahl von β muß α also durch Rückeinsetzen in (39) bestimmt werden. Dabei können wir uns allerdings auf einen
speziellen Punkt beschränken. Der Bequemlichkeit halber wählen wir dazu ϕ =
π/2 und erhalten
ds
mC
und
= −α.
s= 2
j
dϕ
Setzen wir das [mit (41)] in (39) ein, erhalten wir
α2 =
2mE 2mC mC m2 C 2
+ 2
−
,
j2
j
j2
j4
also
2j 2
m|C|
1+
E
α= 2
j
mC 2
!1/2
.
Damit lautet die Gleichung der Bahngkurve
3
Auf S. 35/36 (Bd. I) gibt Sommerfeld einen noch kürzeren Weg zu dieser Lösung an.
16
2j 2
mC m|C|
1+
E
s= 2 + 2
j
j
mC 2
!1/2
cos ϕ
oder
r=
j2
mit p =
m|C|
p
sgn C + ε cos ϕ
(42)
2j 2
und ε = 1 +
E
mC 2
!1/2
.
Für C > 0 und ε < 1 (also E < 0, Planetenbahnen) beschreibt Gl. (42) Ellipsen
mit dem Brennpunkt F1 im Zentrum. Wir wollen das kurz an einer kleinen Skizze
rekapitulieren:
y
r
q
F2
ψ
e
e
b
ϕ
p
F1
x
a
Die Ellipse ist definiert durch die Beziehung
q + r = 2a,
wobei r und q die Abstände zu den beiden Brennpunkten F1 und F2 sind und a
die große Halbachse der Ellipse bezeichnet. Nach dem Kosinussatz gilt
q 2 = r 2 + 4e2 − 4re cos ψ.
Setzen wir q = 2a − r und cos ψ = − cos ϕ ein, erhalten wir
4a2 − 4ar + r 2 = r 2 + 4e2 + 4er cos ϕ
r(a + e cos ϕ) = a2 − e2
17
oder
a2 − e 2
.
a + e cos ϕ
wird als Parameter p bezeichnet, für ihn gilt also
r=
Der Radius für ϕ =
π
2
p=
a2 − e 2
.
a
Damit erhalten wir schließlich
r=
p
1 + ε cos ϕ
mit ε =
e
.
a
(43)
Abschließend notieren wir noch (Symmetrie, Pythagoras) die Beziehung
b2 = a2 − e2 = ap
(44)
zur Berechnung der kleinen Halbachse b.
Kehren wir nach diesem Exkurs zu unserem physikalischen Problem zurück, so
folgt durch Vergleich der Gln. (42) und (43) für attraktive Potentiale (C > 0)
und gebundene Bahnen (E < 0, d.h. ε < 1)
1. Keplersches Gesetz: Der Planet beschreibt eine Ellipse, in deren einem
Brennpunkt die Sonne steht.
Das zweite Gesetz hatten wir schon bei Gl. (35) angesprochen. Es beruht allgemein auf der Drehimpulserhaltung und ist nicht auf 1/r–Potentiale beschränkt:
2. Keplersches Gesetz: Der radius vector von der Sonne nach dem Planeten
überstreicht in gleichen Zeiten gleiche Flächen.
Die konstante Flächengeschwindigkeit schreiben wir nach (35)
1
j
Ȧ = r 2 ϕ̇ =
.
2
2m
Wir wollen diese Beziehung benutzen, um mit der Fläche
A = πab = πa3/2 p1/2
der Ellipse [vgl. (44)] die Umlaufzeit T zu berechnen. Setzen wir [vgl. (42)] p =
j 2 /(mC) ein, so erhalten wir
A
j
2m
m
T = = πa3/2 1/2 1/2
= 2πa3/2
m C
j
C
Ȧ
1/2
.
Für die Gravitation haben wir
C = γmM,
18
(45)
wobei γ die Gravitationskonstante und M die Sonnenmasse bezeichnet. Das
Verhältnis m/C ist daher für alle Planeten gleich; also gilt
3. Keplersches Gesetz: Die Quadrate der Umlaufszeiten der Planeten verhalten
sich wie die dritten Potenzen der großen Achsen:
T2
4π 2
=
.
a3
γM
(46)
Bei den gebundenen Bahnen mit E < 0 bleibt der Planet im Einflußbereich der
Sonne ’eingefangen’. Für E > 0 öffnen sich die Bahnen (in unserer Darstellung auf
der linken Seite) und lassen den Massenpunkt nach r = ∞ ’entweichen’: Statt der
Planetenbahnen erhalten wir die Bahnen der Kometen, und das sind wieder Kegelschnitte. Wir könnten analoge Betrachtungen wie bei der Ellipse durchführen,
ersparen uns jedoch die Rechnung und notieren nur kurz das Ergebnis:
E < 0 ε < 1 Ellipse
E = 0 ε = 1 Parabel
E > 0 ε > 1 Hyperbel
Betrachten wir statt der Gravitation die Coulombkraft, so wird
C=−
e1 e2
.
4π0
(47)
Im attraktiven Fall (C > 0) erhalten wir die gleichen Bahnen wie für Planeten
und Kometen. Vom Wasserstoffatom wissen wir allerdings, daß die klassischen
Begriffe für ein Elektron–Proton–System nur noch sehr beschränkt und vorsichtig
angewendet werden dürfen.
Für gleichnamige Ladungen haben wir C < 0, und Lösungen existieren nur noch
für E > 0. Als Bahnen finden wir nun Hyperbeln, bei denen das Kraftzentrum
im äußeren Brennpunkt liegt (vgl. Skizze).
F2
F1
−
19
Eine Übersicht über weitere Kraftgesetze, für die das Zentralkraftproblem analytisch oder mittels elliptischer Integrale lösbar ist, findet sich im Lehrbuch von
Goldstein (S. 81f). Wegen der Konkurrenz zum Fliehkraftpotential Ṽ (r) [vgl. (38)]
stellt das Potential V (r) = Cr −2 einen (akademisch) interessanten Sonderfall dar
(→ Übungen).
1.7
Die Bewegung im konstanten elektrischen und magnetischen Feld
Als letztes Beispiel der Bewegung eines Massenpunktes im vorgegebenen Kraftfeld
betrachten wir Newtons Lex secunda
mv̇ = e (E + v × B)
(48)
für ein geladenes Teilchen (e, m) unter dem Einfluß einer stationären Lorentzkraft.
Obwohl sich die Lorentzkraft nicht aus einem Potential ableiten läßt, gilt hier
der Energiesatz
m 2
v + eVel = = const .
2
(49)
Mathematisch erkennen wir dies, wenn wir Gl. (48) skalar mit v multiplizieren.
Denn da sich ein statisches Feld E gemäß E = −∇Vel aus einem elektrostatischen
Potential Vel herleiten läßt, erhalten wir
mv· v̇ + e
dVel
· ṙ = 0,
dr
aus der Gl. (49) durch Integration folgt. Aus physikalischer Sicht gilt der Energiesatz, weil (i) die magnetische Lorentzkraft senkrecht auf der Geschwindigkeit
steht und nicht zum Wegintegral (8) der Arbeit beiträgt und (ii) im stationären
Fall keine Energie durch Induktion aus dem Magnetfeld zu– oder abgeführt wird.
Wir wollen speziell die Bewegung in konstanten Feldern
E = const und B = const
untersuchen. Wie bei unseren ersten Beispielen ist es vorteilhaft, die Lex secunda
direkt zu integrieren, ohne vom Energiesatz Gebrauch zu machen. Dazu spalten
wir die Bewegung (z.B. durch skalare oder vektorielle Multiplikation mit B) in
einen Anteil parallel und einen senkrecht zum Magnetfeld auf. Mit vk = v · B/B
und Ek = E · B/B erhalten wir für den parallelen Anteil mv̇k = eEk oder
vk = vk0 +
20
e
Ek t .
m
(50)
Die Bewegung parallel zum Magnetfeld (in z–Richtung) wird also (trivialerweise) gar nicht vom Magnetfeld beeinflußt und durch das Gesetz des freien Falls
beschrieben.
Zur Beschreibung der (interessanteren) Bewegung senkrecht zum Magnetfeld differenzieren wir Gl. (48) noch einmal nach der Zeit und erhalten
e
v̇ × B ,
m
v̈⊥ =
da v̈k = 0 ist. Auf der rechten Seite setzen wir das Kreuzprodukt [vgl. (48)]
v̇ × B =
e
e
(E × B − B × (v × B)) =
(E × B − B 2 v⊥ )
m
m
ein. Mit der Zyklotronfrequenz
ωc =
erhalten wir dann
v̈⊥ =
ωc2
e
B
m
E×B
− v⊥
B2
(51)
!
.
Diese linear inhomogene Gleichung besitzt offenbar die spezielle konstante Lösung
vD =
E×B
,
B2
(52)
bei der sich die elektrische Kraft eE⊥ und die magnetische Lorentzkraft v × B
gerade die Waage halten. (Eine Galileitransformation mit vD transformiert das
Feld E⊥ weg!)
Die homogene Gleichung beschreibt eine harmonische Schwingung, die allgemeine
Lösung der inhomogenen Gleichung lautet also
v⊥ = vD + a cos ωc t + b sin ωc t .
Wegen der Differentiation haben wir eine vektorielle Integrationskonstante (etwa
b) zuviel. Zu ihrer Festlegung setzen wir die Lösung speziell für t = 0 noch einmal
in die Ausgangsgleichung (48) ein und erhalten
ωc b =
e
(E⊥ + vD × B + a × B) .
m
Aus Gl. (52) erkennen wir vD × B = −E⊥ , also muß gelten
b=
a×B
.
B
21
Die Vektoren a und b sind also betragsgleich und stehen (in der Ebene senkrecht
zu B) senkrecht aufeinander. Die Geschwindigkeit
v⊥ = vD + a cos ωc t +
a×B
sin ωc t
B
(53)
beschreibt somit eine Kreisbewegung mit überlagerter konstanter Drift (’E × B–
Drift’). Die Integrationskonstante a ergibt sich aus der Anfangsbedingung
v⊥0 = vD + a.
1.8
Beschleunigte Koordinatensysteme und Scheinkräfte
Gehen wir von unserem Inertialsystem K zu einem Koordinatensystem K0 über,
das sich relativ zu K mit der Geschwindigkeit u bewegt, so messen wir in K0 die
Geschwindigkeit
v0 = v − u.
Aus Newtons Lex secunda folgern wir
mv̇0 = F − mu̇.
(54)
Für gleichförmig bewegte Koordinatensysteme u̇ = 0 haben wir damit explizit
die Galileiinvarianz der Newtonschen Grundgleichung angeschrieben.
In beschleunigten Koordinatensystemen glauben wir dagegen, zusätzlich zu F eine
Scheinkraft
Fs = −mu̇
(55)
zu beobachten. Alltägliche Beispiele sind aus der persönlichen Erfahrung in Fahrzeugen hinreichend bekannt. Die grundsätzliche Unterscheidung von “wahren”
und von Scheinkräften ist aber keineswegs trivial und unproblematisch.
Von besonderer Bedeutung für unsere Erfahrung auf der Erde – aber auch für die
spätere Behandlung des starren Körpers – sind die Scheinkräfte in rotierenden
Koordinatensystemen. Um sie zu behandeln, müssen wir uns zunächst mit der
Beschreibung von Drehungen befassen.
Es liegt zunächst nahe, Drehungen, die ja durch die Richtung der Drehachse
und durch den Betrag des Drehwinkels eindeutig festgelegt sind, als Vektoren zu
beschreiben. Das macht aber nur Sinn, wenn zusammengesetzte Drehungen den
Rechenregeln der Vektoraddition genügen. Das ist jedoch nicht der Fall, wie wir
22
an dem einfachen Beispiel den folgenden Skizzen erkennen (wir wollen ein Buch,
das im Regal liegt, richtig aufstellen):
z
y
Ausgangssituation
x
z
y
D1 = 90o – Drehung um die x–Achse
x
z
y
D2 = 90o – Drehung um die z–Achse
x
Die Hintereinanderausführung D2 D1 liefert also das gewünschte Resultat, nicht
dagegen die Drehung D1 D2 mit vertauschter Reihenfolge:
D2
z
D1D2
z
y
y
x
x
Drehungen sind also nicht kommutativ. Sie werden durch orthogonale Matrizen4
beschrieben, die Hintereinanderausführung entspricht der Matrizenmultiplikation.
Wir kommen jedoch zu der viel bequemeren Beschreibung durch Vektoren, wenn
wir uns zunächst auf infinitesimale Drehungen beschränken: Für kleine Drehwin4
Die 9 Koeffizienten einer orthogonalen Matrix sind durch 3 Orthogonalitätsrelationen und
3 Normierungen verknüpft, so daß 3 freie Parameter bleiben.
23
kel δ1 , δ2 schreiben wir
D1 = 1 + δ1 D10
D2 = 1 + δ2 D20
und erhalten im Limes δ1 δ2 → 0
D1 D2 = 1 + δ 1 D1 + δ 2 D2 = D 2 D1 .
Infinitesimale Drehungen sind also kommutativ und können mit der Vektoraddition beschrieben werden. Zur sinnvollen Definition eines geeigneten Drehvektors
legen wir die z–Achse in Richtung der Drehachse und betrachten die Änderung
δa eines Vektors a durch eine infinitesimale Drehung δϕ. Dazu zerlegen wir
a = ak + a⊥
mit ak = az ez . Dann bleibt ak bei der Drehung invariant, und wir erhalten
δa = δa⊥ =
δϕ
a⊥+δa
= |a⊥ |δϕ eϕ =
= δϕ ez × a⊥ =
ϕ
= δϕ ez × a .
a⊥
Die Änderung δa kann also durch vektorielle Multiplikation von a mit einem
infinitesimalen Drehvektor δϕ ez beschrieben werden. Für eine zeitliche Abfolge
infinitesimaler Drehungen des Vektors a erhalten wir entsprechend
da
= ω × a,
dt
(56)
wobei die Winkelgeschwindigkeit
ω = ϕ̇ ez
einen Vektor bezeichnet, dessen Richtung in die momentane Drehachse fällt und
dessen Betrag durch die momentane Drehgeschwindigkeit ϕ̇ gegeben ist.
Wir betrachten nun ein Koordinatensystem K0 , das mit konstanter Winkelgeschwindigkeit ω rotiert und wenden Gl. (56) auf seine Basisvektoren e0i an. Dann
gilt
ė0i = ω × e0i ,
und wir erhalten für die zeitliche Ableitung eines beliebigen Vektors x =
ẋ =
=
=
X
ẋi e0i +
X
ẋi e0i + ω × x
X
ẋi e0i +
24
X
X
xi ė0i
xi ω × e0i
P
xi e0i
Der linke Term auf der rechten Seite beschreibt die in K0 beobachtete (scheinbare)
Änderung (dx/dt)0 von x, wir haben also
dx
=
dt
dx
dt
!0
+ω×x
oder in kurzer symbolischer Schreibweise
d
=
dt
d
dt
!0
+ω× .
(57)
Um nach diesem Exkurs über Drehungen zu Newtons Lex secunda zurückzukehren, wenden wir diese Beziehung auf den Ortsvektor eines Massenpunktes an:
dr
=
dt
dr
dt
!0
+ ω × r oder
v = v0 + ω × r .
Nochmalige Anwendung von (57) führt auf
!0
+ω×v =
!0
+ ω × v0 + ω × (v0 + ω × r)
v̇ =
dv
dt
=
dv0
dt
dv0 d ω × r
+
dt
dt
!0
+ ω × (v0 + ω × r)
oder r̈ = (r̈)0 + 2 ω × v0 + ω × (ω × r)
Hier bezeichnet (r̈)0 die in K0 beobachtete (scheinbare) Beschleunigung. Mit der
Grundgleichung mr̈ = F folgt
m(r̈)0 = F + 2m v0 × ω + m ω × (r × ω) .
(58)
Neben der Kraft F treten auf der rechten Seite also zwei Scheinkräfte auf. Der
Term
Z = m ω × (r × ω) = mω 2 r⊥
(59)
beschreibt die Zentrifugal– oder Fliehkraft. Sie beruht auf der Normalbeschleunigung eines Massenpunktes, der im rotierenden Koordinatensystem ruht. Damit
der Massenpunkt in Ruhe bleiben kann, muß die Zentrifugalkraft durch die entgegengesetzt gleiche Zentripetalkraft (und das ist keine Scheinkraft!) kompensiert
werden.
Die Corioliskraft
25
C = 2m v0 × ω
(60)
beruht auf der scheinbaren seitlichen Ablenkung der Bahn eines bewegten Massenpunktes durch die Drehung des Koordinatensystems. Formal mathematisch
hat sie die gleiche Struktur wie die magnetische Lorentzkraft.
Auf der rotierenden Erde geht die Fliehkraft mit dem Cosinus der geographischen
Breite. Am größten ist sie am Äquator und macht dort ∼ 0.3 % der Erdbeschleunigung aus. Generell ergänzt sie ggrav zu dem beobachteten g = geff (Lot!). |g|
nimmt also zu den Polen hin zu, und dieser Effekt wird durch die Abplattung der
Erde – die selbst hierauf beruht! – verstärkt.
Unter Vernachlässigung der Erdkrümmung (aber nicht der Erddrehung!) wird der
freie Fall also durch die Gleichung
(r̈)0 = g(eff) + 2 v0 × ω
(61)
beschrieben, die in ihrer mathematischen Struktur exakt mit der im vorigen Abschnitt behandelten Bewegungsgleichung (48) im konstanten elektrischen und
magnetischen Feld übereinstimmt. Dabei können in dieser ebenen Näherung die
Gyrationen natürlich nicht voll ausgebildet sein, denn sie würden Fallzeiten von
mehreren Tagen voraussetzen.
Der Effekt der Corioliskraft hängt generell von der Flugzeit ab, denn er beschreibt, wie sich die Erde unter der geraden Bahn wegdreht5 . Bei Fallversuchen
ist dieser Effekt klein, er spielt aber bereits eine Rolle bei Geschoßbahnen und
kann bei langdauernden Bewegungen dominant werden. Hierzu gehört insbesondere das großräumige Wettergeschehen: Durch die Corioliskraft wird die Luft,
die auf der Nordhalbkugel in ein Tiefdrucksystem einströmt, im Gegenuhrzeigersinn abgelenkt, so daß ein rotierender Wirbel, ein Zyklon, entsteht (vgl. Skizze). Ebenso bilden sich um Hochdruckgebiete Antizyklone mit entgegengesetztem
Drehsinn aus.
H
T
Im reibungsfreien stationären Zustand halten sich Corioliskraft und Druckgradient sogar die Waage und die Windrichtung verläuft parallel zu den Isobaren.
5
Ein Teil der Corioliskraft läßt sich auch als Korrektur der Zentrifugalkraft interpretieren
(Zug, der längs des Äquators fährt).
26
Darauf beruht die hohe Lebensdauer großer Hoch– und Tiefdruckgebiete. (Aufgrund der Reibung weicht die Windrichtung tatsächlich um einen Winkel von
etwa 20 bis 300 von den Isobaren ab.)
1.9
Systeme von Massenpunkten
Wir erweitern nun die Mechanik des einzelnen Massenpunkts im vorgegebenen
Krafteld und betrachten ein System von n Massenpunkten, die miteinander wechselwirken6 . Dazu gehen wir wieder von der Lex secunda
ṗi = Fi = Fai +
X0
Fij
(i, j = 1 . . . n)
(62)
j
aus. Fai bezeichnet dabei eine äußere Kraft und Fij die Kraft, die der j–te Massenpunkt auf den i–ten ausübt. Dabei deutet der Apostroph an der Summe an,
daß wir eine Selbstwechselwirkung ausschließen, also
Fii = 0
verlangen. Diese Forderung fügt sich auch zwanglos in Newtons Lex tertia
Fij = −Fji
(63)
ein, von der wir von nun an Gebrauch machen werden.
Nach den Überlegungen in Abschnitt 1.3 wird die Dynamik eines Systems aus n
Massenpunkten durch eine Differentialgleichungssystem 6n-ter Ordnung beschrieben. Durch jedes Integral, also jede Erhaltungsgröße, wird die Ordnung um eins
reduziert. Wir folgen daher den Ausführungen des Abschnitts 1.2, um grundlegende Erhaltungsstze zu formulieren.
Zur Herleitung des Impulssatzes definieren wir den Gesamtimpuls
P=
X
pi
i
und erhalten für seine Ableitung
Ṗ =
X
Fai +
i
X0
Fij .
i,j
Da die Doppelsumme nach der Lex tertia verschwindet, verhält sich das System
als Ganzes, als wirke nur die äußere Gesamtkraft
Fa =
X
Fai .
i
6
Damit tun wir auch einen ersten Schritt zur Beschreibung der Dynamik ausgedehnter
Körper und kommen zur Begründung des Modells eines Massenpunktes.
27
Hierin liegt die eigentliche Begründung für das Modell des Massenpunktes. Besonders prägnant tritt dieses Modell in Erscheinung, wenn wir die Begriffe der
Gesamtmasse
X
M=
mi
(64)
i
und des Massenzentrums oder Schwerpunkts7
P
rS =
mi r i
M
(65)
einführen. Dann erhalten wir
P=
X
mi ṙi = M ṙS
i
und können die Lex secunda in der Form
Ṗ = Mr̈S = Fa
(66)
formulieren: Der Schwerpunkt eines Systems von Massenpunkten bewegt sich so,
als wäre die Gesamtmasse in ihm vereinigt und als griffe die Resultierende aller äußeren Kräfte in ihm an. (Anschauliches Beispiel: Feuerwerksrakete). Verschwindet insbesondere die äußere Kraft, so ist der Gesamtimpuls des Systems
konstant.
Auch bei der Herleitung des Energiesatzes verfahren wir analog der Rechnungung im Abschnitt 1.2, wir multiplizieren also die Lex secunda skalar mit vi und
summieren:
mi v̇i = Fi
=⇒
X
i
mi vi ·v̇i =
d X mi 2 X
Fi ·ṙi .
v =
dt i 2 i
i
Daraus folgt durch zeitliche Integration
(2)
T2 − T 1 =
XZ
i (1)
Fi ·dri = A12 ,
(67)
wenn wir die (gesamte) kinetische Energie
T =
X
i
7
mi 2
v
2 i
Diese übliche Bezeichnung ist offensichtlich unglücklich gewählt!
28
(68)
einführen und die Summe der Wegintegrale aller Kräfte wieder als Arbeit A
bezeichnen.
In dieser Form ist der Energiesatz (67) noch wenig hilfreich. Eine erste Verbesserung erreichen wir, wenn wir die kinetische Energie in einen inneren und äußeren
Anteil zerlegen. Dazu gehen wir wieder von der Definition (65) des Schwerpunkts
aus und schreiben
ri = r S + x i .
Damit folgt
1X
mi (ṙS + ẋi ) · (ṙS + ẋi )
2 i
X
1X
1
M ṙ2S + ṙS · mi ẋi +
=
mi ẋ2i .
2
2
i
i
T =
Nun ist nach der Definition des Schwerpunkts offenbar mi xi = 0, also auch
mi ẋi = 0. Damit verschwindet der mittlere Term der unteren Zeile, und die
kinetische Energie zerfällt gemäß
P
P
1
1X
T = M ṙ2S +
mi ẋ2i
2
2 i
(69)
in die kinetische Energie “des Massenzentrums” und in den “inneren” Anteil aus
der Relativbewegung. Dabei ist zu beachten, daß diese Zerlegung der kinetischen
Energie nur bezüglich des Schwerpunktes möglich ist!
Der entscheidende Nutzen des Energiesatzes kommt erst zum Tragen, wenn alle
Kräfte aus Potentialen herleitbar sind. Denn nur dann läßt sich das Wegintegral der Arbeit ohne vorherige Lösung des Bewegungsproblems berechnen. Wir
machen den Ansatz
Fai = −
d a
∂
Vi (ri ) und Fij = −
Vij (ri − rj )
dri
∂ri
(70)
und stellen mit der Zusatzforderung
Vij = Vji
die Gültigkeit der Lex tertia sicher:
Fij = −
∂
∂
Vij = +
Vij = −Fji .
∂ri
∂rj
Gleichzeitig weisen wir aber darauf hin, daß dieser naheliegende Ansatz keinesfalls
allgemein ist. Zunächst einmal impliziert er sofort die Verschärfung der lex tertia, nach der die Kräfte in der Verbindungslinie der Körper liegen. Darüber hinaus
29
aber setz er die Annahme(!) einer Unabhängigkeit der Zweiteilchen–Wechselwirkung
Vij vom Rest der Welt, insbesondere von den äußeren Kräften, voraus. Der Ansatz
ist für die Coulomb–Wechselwirkung geladener Teilchen und die Gravitation
von Punktmassen richtig, versagt aber schon bei der Wechselwirkung induzierter
Dipole (Nägel im Magnetfeld).
Mit der Annahme der Gl. (70) zerfällt nun auch das Arbeitsintegral in Gl. (67)
in zwei Anteile, nämlich den “äußeren” Anteil
(2)
Aa12
=−
XZ
i (1)
X
dVia
[Via (1) − Via (2)]
· dri =
dri
i
und den Wechselwirkungs–Anteil
(2)
AW
12
= −
X0 Z
i,j (1)
∂Vij
· dri
∂ri
(2)"
Z
1 X0
= −
2 i,j
(1)
∂Vij
∂Vi
· dri +
· drj
∂ri
∂rj
#
(2)
(2)
1 X 0 Z ∂Vij
1 X 0 Z dVij
= −
· (dri − drj ) = −
· drij ,
2 i,j
∂ri
2 i,j
drij
(1)
(1)
wobei wir die Bezeichnung
rij = ri − rj
für das Argument von Vij benutzt haben. Wir können nun die Integration ausführen
und erhalten.
1 X0
[Vij (1) − Vij (2)] .
AW
12 =
2 i,j
Definieren wir also die gesamte potentielle Energie durch
V (r1 , . . . , rn ) =
X
Via (ri ) +
i
1 X0
Vij (ri − rj ) ,
2 i,j
(71)
so erhalten wir
A12 = V1 − V2
(72)
und formulieren den Energiesatz T2 + V2 = T1 + V1 oder
T + V = E = const.
30
(73)
Anmerkungen:
1. Die potentielle Energie (71) setzt sich zusammen aus der potentiellen Energie aller Teilchen in den äußeren Feldern und aus der Wechselwirkungsenergie.
Letztere trägt den Faktor 12 , da die Wechselwirkungsenergie je zweier Teilchen i, j
bei der Summation doppelt gezählt wird. Eine häu benutzte alternative Anschrift
lautet
X
1 X0
Vij (ri − rj ) =
Vij (ri − rj ) .
2 i,j
i<j
2. Obwohl sowohl die kinetische als auch die potentielle Energie jeweils in einen
inneren und einen äußeren Anteil zerlegt werden können, gilt i.a. kein separater
Energiesatz für die innere und die äußere Gesamtenergie! Eine wichtige Ausnahme
bildet der Spezialfall verschwindender äußerer Kräfte.
In weiterer Anlehnung an die Darstellung in Abschnitt 1.2 wollen wir den Drehimpulssatz formulieren. Dazu multipliziern wir die Lex secunda
ṗi = Fi
vektoriell mit ri und summieren über i:
X
i
ri × ṗi =
X
i
ri × F i .
Da ṙi × pi = mi vi × vi = 0 gilt, steht auf der linken Seite die zeitliche Ableitung
des Drehimpulses
l :=
X
i
ri × p i .
(74)
Die Kräfte auf der rechten Seite zerlegen wir nach Gl. (62) in äußere Kräfte und
innere Wechselwirkung und erhalten
X
i
ri × F i =
X
ri × Fai +
X
ri × Fai +
i
X0
i,j
ri × Fij
1 X0
[ri × Fij + rj × Fji ]
2 i,j
i
X
1 X0
ri × Fai +
=
(ri −rj ) × Fij .
2 i,j
i
=
Hierbei haben wir bereits von der Lex tertia Fij = −Fji Gebrauch gemacht. Wir
setzen nun außerdem wieder die Verschärfung “Die Kräfte liegen in der Verbindungslinie der Körper” voraus. Diese Verschärfung gilt für Zentralkräfte. Dann
wird
(ri − rj ) × Fij = 0
31
und wir erhalten den Drehimpulssatz
l̇ = M
(75)
mit dem Gesamt–Drehmoment
M=
X
i
ri × Fai ,
(76)
das nur von den äußeren Kräften abhängt. Wirken insbesondere keine äußeren
Kräfte, so ist der Drehimpuls konstant.
Ähnlich wie die kinetische Energie läßt sich auch der gesamte Drehimpuls in einen
äußeren und einen innneren Anteil zerlegen. Wir schreiben dazu wieder
ri = r S + x i
und rechnen
l =
X
i
mi (rS + xi ) × (ṙS + ẋi )
= M rS × ṙS + rS ×
X
mi ẋi +
i
X
mi xi × ṙS +
X
i
mi xi × ẋi .
Wieder verschwinden wegen der Definition des Schwerpunkts die Summen
P
und mi ẋi und wir erhalten die gewünschte Zerlegung
l = M rS × ṙS +
X
i
mi xi × ẋi
P
mi xi
(77)
des gesamten Drehimpulses in den Drehimpuls rs ×P der Schwerpunktsbewegung
und in den inneren Drehimpuls. Dabei sind auch entsprechende Hinweise wie bei
der Energie zu beachten, nämlich
1. Die Zerlegung des Drehimpulses gilt nur bezüglich des Schwerpunkts.
2. Trotz der Zerlegung gilt i.a. kein separater Erhaltungssatz für den äußeren und
den inneren Drehimpuls. Eine wichtige Ausnahme bildet wieder der Spezialfall
verschwindender äußerer Kräfte.
Schließlich erinnern wir noch einmal an die Voraussetzung der verschärften Lex
tertia.
32
1.10
Das Zweikörperproblem
Wir haben gesehen, daß die Bewegung des Schwerpunkts eines Systems nur von
den äußeren Kräften abhängt. Wie wir beim Energie– und Drehimpulssatz gesehen haben, gelingt eine völlige Separation des Problems in Schwerpunkts– und
Relativbewegung aber nur, wenn gar keine äußeren Kräfte angreifen. In diesem
Fall wird die Schwerpunktsbewegung trivial. Die Gleichung
rS = rS0 + vS0 t
(78)
enthält sechs Integrationskonstanten und kann benutzt werden, um einen Satz der
6n Koordinaten und Impulse zu eliminieren: Das n–Körperproblem ohne äußere
Kräfte ist also mathematisch einem (n − 1)–Körperproblem (Ordnung 6(n − 1))
äquivalent. Damit muß es möglich sein, das Zweikörperproblem, das durch die
Gleichungen (beachte die Lex tertia)
m1 v̇1 = F12
m2 v̇2 = −F12
(79)
(80)
definiert ist, auf das ausführlich diskutierte Problem eines Massenpunktes zurückzuführen. Die Addition der beiden Gleichungen liefert den bereits besprochenen
Schwerpunktsatz. Multiplizieren wir die Gleichungen dagegen wechselseitig mit
m2 und m1 und subtrahieren, so erhalten wir
m1 m2 (v̇1 − v̇2 ) = (m1 + m2 )F12 ,
oder wenn wir die Relativkoordinaten
r12 = r1 − r2
u = ṙ12 = v1 − v2
(81)
(82)
und die reduzierte Masse
µ=
m1 m2
m1 m2
=
m1 + m 2
M
(83)
einführen,
µu̇ = F12 .
33
(84)
Damit ist die gesuchte Formulierung eines äquivalenten Einkörperproblems bereits gefunden.
Ausgehend von diesem Einkörperproblem können wir nun auch wieder eine kinetische Energie
Trel =
µ 2
u
2
(85)
und einen Drehimpuls
lrel = µu × u̇
(86)
im Relativsystem definieren und entsprechende Erhaltungssätze formulieren. Unter Ausnutzung der Beziehungen
m2
r12
M
m1
= rS −
r12
M
r1 = r S +
r2
und
(87)
(88)
rechnet man jedoch leicht nach, daß es sich hierbei um die bereits aus dem vorigen
Abschnitt bekannten inneren Anteile der kinetischen Energie bzw. des Drehimpulses handelt.
Nachträglich merken wir an, daß wir auf dieser Basis die Behandlung des Keplerproblems im Abschnitt 1.6 präzisieren können, indem wir die Planetenmasse
durch die reduzierte Masse ersetzen. Wir weisen aber nochmals darauf hin, daß die
einfache Reduktion des Zweikörperproblems nur möglich ist, wenn keine äußeren
Kräfte einwirken. Die Bewegung des Mondes um die Erde im (äußeren) Schwerefeld der Sonne ist also beispielsweise kein Zweikörperproblem und und folgt nur
in sehr grober Näherung den Keplerschen Gesetzen.
34
2
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskräfte
Bei unseren bisherigen Überlegungen waren die Kräfte als Funktion von Teilchenkoordinaten, Geschwindigkeiten und eventuell der Zeit vorgegeben, und unsere
Aufgabe bestand in der Lösung der Newtonschen Differentialgleichungen
mi r̈i = Fi (rj , ṙj , t)
(i, j = 1, . . . n) .
In vielen technischen Problemen ist aber die Bewegung durch Nebenbedingungen
oder Zwangsbedingungen eingeschränkt. Dabei treten Kräfte, die sogenannten
Zwangskräfte, auf, die nicht vonvornherein bekannt sind. Bevor wir uns mit
dem damit verbundenen Selbstkonsistenzproblem befassen, wollen wir einige Begriffe zur sprachlichen Klassifikation von Zwangsbedingungen einführen und an
einfachen Beispielen erläutern.
Zwangsbedingungen, die durch Beschränkungsgleichungen der Form
fk (r1 , . . . rn , t) = 0
(89)
formuliert werden können8 , heißen holonom [griech. oλoς (holos) = lat. integer
(“Integral!”), griech. νoµoς (nomos) = Gesetz], alle andern heißen anholonom
[griech. αν (an) = lat. in = dtsch. un]. Zur Erläuterung notieren wir einige Beispiele:
holonom
anholonom
Pendel an einer Stange
r2 − a 2 = 0
Pendel an einem Faden
r 2 − a2 ≤ 0
Bewegung auf der Erdoberfläche
r2 − a 2 = 0
Bewegung außerhalb der Erde
r 2 − a2 ≥ 0
Starrer Körper
(ri − rj )2 − a2ij = 0
System harter Kugeln
(ri − rj )2 − a2 ≥ 0
“Breite” Rolle
dx = adϕ (vgl. 5 )
“Scharfkantiges” Rad
dx = a cos ϑdϕ, dy = a sin ϑdϕ
Straßenbahn
Autobus
8
Hierzu gehören also auch integrable differentielle Bedingungen
35
P
∂fk/∂ri · dri = 0!
Abgesehen von bestimmten differentiellen Bedingungen (vgl. Abschnitt 2.5) ist
man bei der Behandlung anholonomer Beschränkungen auf individuelle Ansätze
für die speziellen Probleme angewiesen. So werden Bedingungen mit einem ≤–
Zeichen i.a. auf eine Fallunterscheidung mit entprechender Untersuchung von
Bahnstücken führen (Fadenpendel) und/oder genauere Spezifizierungen der Bedingungen im Fall des =–Zeichens verlangen (Stoß harter Kugeln).
Wie werden im folgenden, wenn nicht ausdrücklich etwas anderes gesagt wird,
stets holonome Zwangsbedingungen voraussetzen.
Eine weitere Unterscheidung trifft man bezüglich der Zeitabhängigkeit: Enthalten
Zwangsbedingungen die Zeit explizit, nennt man sie rheonom [griech. ρω (rheo)
= fließen], andernfall skleronom [griech. σκληρoς (skleros) = starr]. Skleronome
Bedingungen erscheinen zunächst einfacher, der Formalismus, den wir im folgenden entwickeln, läßt aber ohne nennenswerten Mehraufwand auch die Behandlung
rheonomer Bedingungen zu.
Wir kommen nun auf das Problem der Selbstkonsistenz zurück. Wir stehen nm̈lich
vor der grundsätzlichen Schwierigket, daß wir das Bewegungsproblem mit den
Newtonschen Gesetzen allein nicht lösen können, da die Zwangskräfte nicht
apriori vorgegeben sind. Sie stellen vielmehr Reaktionen des Systems dar, die
selbst vom Bewegungsablauf — also der Lösung des Bewegungsproblems — abhängen.
Um diesen Aspekt zu verdeutlichen, betrachten wir vergleichend das Problem influenzierter Oberflächenladungen in der Elektrostatik:
Elektrostatik
Mechanik
Grundproblem: Das Potential Φ ist mit
der Poissongleichung
Grundproblem: Die Bahnen ri (t) sind
mit Newtons Gesetz
Φ = −%/ε0
mi r̈i = Fi
aus den Ladungen % zu berrechnen.
aus den Kräften Fi zu berechnen.
Beschränkung: Φ ist auf den Leiteroberflächen vorgegeben.
Beschränkung: Die ri (t) unterliegen
Zwangsbedingungen.
Schwierigkeit: Die Ladungen auf den
Leiteroberflächen (Reaktionen des Systems!) sind nicht apriori bekannt.
Schwierigkeit: Die Zwangskräfte (Reaktionen des Systems!) sind nicht
apriori bekannt.
Lösungskonzept: Wir versuchen, die
unbekannten Oberflächenladungen aus
der Beschreibung zu eliminieren (z.B.
durch die Methode der Spiegelladungen).
Lösungskonzept: Wir versuchen, die
unbekannten Zwangskräfte aus der Beschreibung zu eliminieren. Hierzu postulieren wir ein neues Prinzip.
36
2.2
Prinzip der virtuellen Arbeit und d’Alembertsches
Prinzip
Da die Zerlegung von Kräften
Fi = Fei + Zi
(90)
in von außen angelegte oder “eingeprägte” Kräfte Fei und Zwangskräfte Zi nicht
aus den Newtonschen Axiomen gefolgert werden kann, benötigen wir ein neues,
zusätzliches Postulat. In Analogie zum Modell des idealen Leiters in der Elektrostatik benutzen wir hierzu das Modell der glatten Führungen. Dabei denken wir
z.B. an reibungsfreie Schienen.
Trotz der scheinbaren Trivialität erweist sich die korrekte Formulierung des neuen
Postulats als ziemlich schwierig. Darum beschränken wir uns zunächst auf die Statik und bereiten die Aufstellung des Postulats durch die elementare Anschauung
an der schiefen Ebene vor:
z
Z
K
G⊥
G||
δs
G
ϕ
x
An unseren Massenpunkt greift eine Federkraft K, eine Gewichtskraft G und
die Zwangskraft Z an. Im statischen Gleichgewicht muß die Summe aller Kräfte
verschwinden:
F = K+G +Z = 0.
Die intuitive Lösung des Problems besteht nun darin, zu postulieren, daß die
Zwangskraft senkrecht auf der Führung steht. Zerlegen wir die Gewichtskraft
entsprechend in die Anteile Gk und G⊥ mit
Gk = mg sin ϕ und G⊥ = mg cos ϕ ,
so erhalten wir die beiden Beziehungen
G⊥ + Z = 0 und Gk + K = 0 .
37
Die erste Gleichung interessiert uns nicht, da wir die Zwangskraft eliminieren
wollen. Aus der zweiten finden wir
K = −mg cos ϕ .
Unsere intuitive Behandlung der Zwangsbedingung macht also Gebrauch von dem
Postulat “Die Zwangskraft steht senkrecht auf der Führung”. Wir können diesen
Sachverhalt mit Hilfe des Arbeitsintegrals ohne explizite Zerlegung der Kräfte
ausdrücken:
Prinzip der virtuellen Arbeit: Zwangskräfte leisten bei virtuellen Verrückungen δri keine Arbeit,
X
i
Zi · δri = 0 .
(91)
Die Gleichgewichtsbedingungen Fi = 0 gehen damit in die Bedingungen
X
i
Fei · δri = 0
(92)
über, welche die Zwangskräfte gar nicht mehr enthalten! Hierin liegt bei komplexeren Problemen der entscheidende Vorteil gegenüber der Zerlegung nach dem
Kräfteparallelogramm.
Virtuelle Verrückungen sind dabei differentielle Systemänderungen δri der
Massenpunkte,
• die mit den Zwangsbedingungen verträglich sind und
• die “im Gedankenexperiment” ohne Rücksicht auf den tatsächlichen Bewegungsablauf vorgenommen werden.
Hinweise:
1. Beachte, daß aus Gl. (92) nicht Fei = 0 gefolgert werden kann, da die δri
nicht unabhängig sind.
2. Warum es so wichtig ist, die virtuellen Änderungen vom tatsächlichen Bewegungsablauf zu unterscheiden, werden wir gleich sehen.
3. Wir weisen nochmals darauf hin, daß sich das Postulat nicht beweisen läßt,
sondern daß damit “glatte Führungen” definiert werden. Wir werden es
für holonome und einfache differentielle anholonome Zwangsbedingungen
benutzen.
38
Für unser Beispiel der schiefen Ebene erhalten wir also die Gleichgewichtsbedingung
(G + K) · δs = 0 ,
wobei zu beachten ist, daß δs mit der Zwangsbedingung verträglich ist. Das heißt,
daß die Richtung von δs längs der schiefen Ebene zu wählen ist. Damit geht die
Gleichgewichtsbedingung in
(Gk + K)δs = 0
über, und für δs 6= 0 folgt die oben formulierte Gleichung
Gk + K = 0 .
Wir verlassen nun die Statik und gehen wieder zur Dynamik über, indem wir die
Gleichgewichtsbedingung Fi = 0 durch Newtons Lex secunda
ṗi = Fi = Fei + Zi
(93)
ersetzen. Dabei halten wir am Modell der glatten Führungen und damit an dem
Prinzip, daß Zwangskräfte bei virtuellen Verrückungen keine Arbeit leisten, fest:
X
i
Zi · δri = 0 .
Damit erhalten wir sofort das d’ Alembertsche Prinzip
X
i
(ṗi − Fei ) · δri = 0 .
(94)
Was wir hier so mühelos und scheinbar trivial erhalten haben, geht historisch auf
äußerst scharfsinnige Analysen von Bernoulli und d’Alembert zurück, die
auf einem dynamischen Gleichgewicht von eingeprägten Kräften, Zwangskräften
und Trägheitskräften beruhen. Wie wenig trivial das Prinzip ist, zeigt sich darin,
daß der präzise Charakter der virtuellen Verrückungen erst jetzt voll zum Tragen
kommt:
Virtuelle Verrückungen sind gedachte Systemveränderungen, die mit den (momentanen) Zwangsbedingungen verträglich sind und nichts mit dem tatsächlichen Ablauf der Bewegung zu tun haben. Ohne diesen letzteren Nachsatz wäre
das Prinzip falsch!
Insbesondere bei rheonomen Zwangsbedingungen können Zwangskräfte bei der
tatsächlichen Bewegung nämlich sehr wohl Arbeit am System leisten. Die Zwangskräfte stehen dann im Fall holonomer Bedingungen zwar weiterhin senkrecht
39
auf den momentanen beschränkenden Flächen, aber die resultierende Bewegung
verläuft eben nicht mehr in diesen Flächen.
Als einfaches Beispiel dazu betrachten wir die Arbeit, die von der Zentripetalkraft
geleistet wird, wenn ein Massenpunkt an einem Faden der Länge `(t) mit `˙ < 0
geführt wird:
δr
dr=rdt
l(t0)
l(t)
Für die Ausführung der virtuellen Verrückung muß also in Gedanken die Zeit kurz
“angehalten” werden, anschaulich: Wir führen die virtuelle Verrückung nicht am
bewegten System durch, sondern an einer Momentaufnahme, an einem Foto dieses
Systems. In abstrakter mathematischer Form formulieren wir diese fundamental
wichtige Erklärung in der Form
• Die Zeit darf bei virtuellen Verrückungen nicht variiert werden:
δt = 0 .
(95)
Wir beenden diesen Abschnitt mit einem einfachen Beispiel zum d’Alembertschen
Prinzip: Wir stellen die Bewegungsgleichung für die schiefe Ebene (nun ohne Federkraft) auf. Dabei beziehen wir uns auf die Skizze
z
m
δs
G
ϕ
40
x
und rechnen
(mr̈ − G) · δs = 0 mit
r̈ = ẍex + z̈ez ,
G = −mgez
und δs = (cos ϕex − sin ϕez )δs
=⇒ m(ẍex + z̈ez + gez )(cos ϕex − sin ϕez )δs = 0 oder
ẍ cos ϕ − z̈ sin ϕ − g sin ϕ = 0 .
Diese eine Bewegungsgleichung enthält noch zwei Unbekannte. Aber uns steht ja
außerdem auch noch die Zwangsbedingung
z = z0 − x tan ϕ
zur Verfügung, mit der wir eine der Koordinaten eliminieren können. Wir setzen
z̈ = −ẍ tan ϕ ein und erhalten die Bewegungsgleichung
sin2 ϕ
ẍ cos ϕ +
cos ϕ
!
= g sin ϕ
oder
ẍ = g sin ϕ cos ϕ
mit der Lösung
x = x0 + vx0 t +
2.3
g
sin ϕ cos ϕ t2 .
2
Generalisierte Koordinaten und Lagrangesche Gleichungen
Das Beispiel der schiefen Ebene hat einen Nachteil unserer bisherigen Formulierung deutlich gemacht, der die Rechnung noch einigermaßen unbequem gestaltet:
Unser n–Teilchen–Problem wird durch 3n Koordinaten beschrieben. Wenn alle Koordinaten unabhängig wären, könnten wir alle δri unabhängig wählen —
etwa immer nur eine einzige Koordinate variieren — und erhielten aus dem
d’Alembertschen Prinzip 3n Bewegungsgleichungen. Tatsächlich sind die Koordinaten aber durch m Beschränkungsgleichungen verknüpft und so bleiben uns
nur
f = 3n − m
(96)
“Freiheitsgrade” für die Variation. Damit liefert das d’Alembertsche Prinzip
auch nur f unabhängige Gleichungen. (Im Beispiel der schiefen Ebene war das
eine Gleichung). Mit den m Beschränkungsgleichungen zusammen erhalten wir
zwar die erforderliche Anzahl von 3n Gleichungen. Da wir im Fall holonomer
Zwangsbedingungen, auf die wir uns hier beschränken, aber nur f unabhängige
Koordinaten haben, schleppen wir einen unnötigen Ballast mit uns. Im Falle der
41
schiefen Ebene wäre es beispielsweise bequemer gewesen, statt der Koordinaten
x und z, die durch eine Zwangsbedingung verknüpft sind, sofort die eine freie
Koordinate s zu verwenden.
Im allgemeinen wird es freilich nicht ausreichen, einfach ein gedrehtes kartesisches Koordinatensystem zu benutzen. Vielmehr müssen wir bereit sein, von den
kartesischen Koordinaten, die wir nun in der Form
x1 , . . . x3n
durchnumerieren wollen, zu ganz allgemeinen krummlinigen und schiefwinkligen
Koordinaten
q1 , . . . q3n
überzugehen: Wir sprechen von generalisierten Koordinaten. Dabei streben
wir an, daß die Zwangsbedingungen trivial zu handhaben sind. Schreiben wir
diese wieder in der Form
f1 (x1 , . . . x3n , t) = 0, . . . , fm (x1 , . . . x3n , t) = 0 ,
so wählen wir beispielsweise
qf +1 = f1 (x1 , . . . x3n , t), . . . , q3n = fm (x1 , . . . x3n , t)
als neue Koordinaten und ergänzen sie durch eine geeignete Wahl von
q1 (x1 , . . . x3n , t), . . . , qf (x1 , . . . , x3n , t)
zu einem vollständigen Koordinatensatz. Die Zwangsbedingungen
qf +1 = 0, . . . , q3n = 0
sind dann in der Tat trivial und machen die m Koordinaten qf +1 , . . . q3n überflüssig. Auf jeden Fall beschreiben wir unser System von f Freiheitsgraden so durch
f generalisierte Koordinaten
q1 , . . . qf ,
daß die m Zwangsbedingungen bereits implizit in der Rücktransformation
x1 = x1 (q1 , . . . qf , t), . . . , x3n = x3n (q1 , . . . qf , t)
(97)
enthalten sind. Um dieses Konzept an einem einfachen Beispiel zu illustrieren,
betrachten wir ein ebenes Pendel, d.h einen Massenpunkt mit den Koordinaten
x1 , x2 , x3 und den Zwangsbedingungen
f1 (x) = x21 + x22 + x23 − `2 = 0 und
x2
− ϕ0 = 0 .
f2 (x) = atn
x1
42
Benutzen wir an Stelle der kartesischen Koordinaten x1 , x2 , x3 sphärische Polarkoordinaten r, ϑ, ϕ, so lauten die Zwangsbedingungen
f1 (x) = r 2 − `2 = 0 und
f2 (x) = ϕ − ϕ0 = 0 .
Mit der Wahl der Koordinaten q3 = r − ` = 0 und q2 = ϕ − ϕ0 = 0 — die
explizit gar nicht mehr benötigt werden — sind die Zwangsbedingungen trivial
erfüllt und wir können mit
q1 = ϑ
als einziger freier Koordinate arbeiten. Die Rücktransformation
x1 = ` sin ϑ cos ϕ0
x2 = ` sin ϑ sin ϕ0
x3 = ` cos ϑ
stellt die Erfüllung der Zwangsbedingungen bereits sicher.
Unsere Aufgabe besteht nun also darin, das d’Alembertsche Prinzip
3n
X
i=1
(mi v̇i − Fi )δxi = 0
(98)
in generalisierten Koodinaten zu formulieren. Hierbei bezeichnet Fi die einprägte
Kraft. Wir lassen also künftig den oberen Index e weg, da die Zwangskräfte Zi
im d’Alembertschen Prinzip gar nicht vorkommen.
Zur Umrechnung benutzen wir die differentiellen Beziehungen
δxi =
f
X
∂xi
δqk
k=1 ∂qk
und
f
X
∂
∂
d
=
q̇j
+
.
dt
∂qj ∂t
j=1
(99)
(100)
Die Umformung des zweiten Terms in Gl. (98) ist rasch erledigt: Wir schreiben
einfach
X ∂xi
X
X
Fi
Fi δxi =
Qk δqk
δqk =
∂qk
i
i,k
k
und definieren damit generalisierte Kräfte
Qk =
X
Fi
i
43
∂xi
.
∂qk
(101)
[Beachte: Eine generalisierte Kraft Qk hat nur dann die Dimension einer Kraft,
wenn qk die Dimension einer Länge hat. Die Produkte Qk δqk haben immer die
Dimension einer Energie (virtuelle Arbeit!). Beschreibt z.B. qk einen Winkel, so
ist Qk das zugehörige Drehmoment.]
Die Umformung des ersten Terms in Gl. (98) kostet etwas mehr Mühe. Wir schreiben zunächst gemäß (99)
v̇i δxi = v̇i
X
k
"
X d
∂xi
∂xi
vi
δqk =
∂qk
dt
∂qk
k
!
#
d ∂xi
− vi
δqk .
dt ∂qk
(102)
Im rechten Term können wir nach Gl. (100)


f
∂xi ∂xi  ∂vi
∂ 2 xi
∂ 2 xi
∂ X
d ∂xi X
q̇j
q̇j
=
=
+
=
+
dt ∂qk
∂qj ∂qk ∂t∂qk
∂qk j=1 ∂qj
∂t  ∂qk
j
ersetzen, denn es gilt ja — ebenfalls nach Gl. (100) —
vi =
dxi X ∂xi ∂xi
q̇j
=
+
.
dt
∂qj
∂t
j
(103)
An dieser Stelle überlegen wir uns, daß wir in der neben den qk auch die q̇k als
unabhängige Variable benötigen. Dabei gilt nach Gl. (103) offenbar
∂vi
∂xi
=
.
∂qj
∂ q̇j
(104)
Dies setzen wir im ersten Term auf der rechten Seite von Gl. (102) ein und erhalten
v̇i δxi =
X
k
"
d
∂vi
vi
dt
∂ q̇k
!
#
∂vi
− vi
δqk .
∂qk
Hier ersetzen wir nun keineswegs die vi nach Gl. (103), sondern multiplizieren
mit mi , summieren und drücken das Ergebnis mit Hilfe der kinetischen Energie
P
T = 12 mi vi2 aus:
X
mi v̇i δxi =
i
X
k
"
#
∂T
d ∂T
−
δqk .
dt ∂ q̇k ∂qk
Damit erhält das d’Alembertsche Prinzip (98) die Form
X
k
"
#
∂T
d ∂T
−
− Qk δqk = 0 .
dt ∂ q̇k ∂qk
44
(105)
Und nun kommt die entscheidende Schlußfolgerung: Wenn wir die generalisierten Koordinaten bei holonomen Zwangsbedingungen “richtig” gewählt haben,
dann sind die Variationen δqk nicht mehr durch Nebenbedingungen verknüpft
und können frei gewählt werden9 . Damit müssen die Koefizienten der δqk in Gl.
(104] einzeln verschwinden, und wir erhalten die Lagrangeschen Gleichungen
∂T
d ∂T
−
= Qk .
dt ∂ q̇k ∂qk
(106)
Meistens nimmt man bei der Formulierung der Lagrangeschen Gleichungen
zusätzlich an, daß die Kräfte aus einem Potential hergeleitet werden können.
Dann erhält man für die generalisierten Kräfte
Qk = −
und kann schreiben
X
i
∂V
∂V ∂xi
=−
∂xi ∂qk
∂qk
(107)
d ∂T
∂T
∂V
−
+
= 0.
dt ∂ q̇k ∂qk ∂qk
Da das Potential V nicht von den q̇k abhängt, können wir die Lagrangefunktion
L(q1 , . . . qf , q̇1 , . . . q̇f , t) = T − V
(108)
einführen und erhalten die Lagrangeschen Gleichungen in der üblichen Form
d ∂L
∂L
−
= 0.
dt ∂ q̇k ∂qk
(109)
Beachte: Gl. (109) ist keine partielle Differentialgleichung zur Bestimmung von L.
Vielmehr wird angenommen, daß die kinetische und die potentielle Energie mit
Hilfe der Transformationsgleichungen durch die qk und q̇k ausgedrückt wurden
und L bereits in der Form (108) vorliegt. Die Ausführung der Differentiationen in
(109) liefert dann ein System von gewöhnlichen Differentialgleichungen
gk (q1 , . . . qf , q̇1 , . . . q̇f , q̈1 , . . . q̈f , t) = 0
der Ordnung 2f zur Bestimmung der qk (t). Dies sind die “fertigen” Bewegungsgleichungen in den generalisierten Koordinaten, in denen bereits alle holonomen Zwangsbedingungen berücksichtigt sind. So schwierig auch im Einzelfall die
Lösung dieser Bewegungsgleichungen sein mag, ihre Aufstellung ist nach diesem
Standartverfahren fast mühelos. Der Rest ist Mathematik: Die (häufig numerische) Integration eines Systems gewöhnlicher Differentialgleichungen.
9
Die Gleichung (104) selbst ist nicht an diese Vorraussetzung gebunden und gilt auch bei
anholonomen Zwangsbedingungen.
45
2.4
Beispiele
Wir wollen uns das Verfahren, aus der Lagrangefunktion die Bewegungsgleichungen zu gewinnen, zunächst an dem allereinfachsten Spezialfall klarmachen:
Wir haben keine Zwangsbedingungen und verwenden kartesische Koordinaten
qi = xi . Dann wird
L(xi , ẋi ) = T − V =
X
i
und aus den Lagrangeschen Gleichungen
Newtonschen Bewegungsgleichungen
mi ẍi = −
mi 2
ẋ − V (xi ) ,
2 i
d ∂L
∂L
−
= 0 folgen sofort die
dt ∂ ẋi
∂xi
∂V
= Fi .
∂xi
Zur Verdeutlichung betrachten wir drei weitere einfache aber nicht mehr ganz so
triviale Beispiele:
1. Spiralbewegung in der Ebene
Wir greifen sogleich das Beispiel einer rheonomen Zwangsbedingung aus dem vorigen Abschnitt auf, und betrachten einen Massenpunkt in der Ebene, der durch
einen Faden der vorgegebenen Länge `(t) auf eine Spirale um den Ursprung gezwungen wird. Wir gehen von ebenen Polarkoordinaten r, ϕ aus und behalten
wegen der Zwangsbedingung r = `(t) den Winkel ϕ als einzige generalisierte
Koordinate. Mit
m
m
T = v 2 = (`˙2 + `2 ϕ̇2 ) und V = 0
2
2
folgt
L(ϕ̇, t) =
m 2 m ˙2
v = (` + `2 ϕ̇2 ) .
2
2
Da L nicht von ϕ abhängt, lautet die Lagrangegleichung
d ∂L
= 0,
dt ∂ ϕ̇
also
∂L
= m`2 ϕ̇ = j = const .
∂ ϕ̇
In dieser Bewegungsgleichung erkennen wir den Drehimpulssatz wieder. Nach
Vorgabe der Funktion `(t) erhält man die Lösung ϕ(t) durch Integration.
Betrachten wir etwa speziell `(t) = `0 e−νt und drücken den Drehimpuls in der
Form j = m`20 ϕ̇0 durch die Anfangsbedingung aus, so folgt explizit
ϕ̇ = ϕ̇0 e2νt
und ϕ = ϕ0 +
46
ϕ̇0 2νt
e .
2ν
2. Das ebene Pendel
Wir benutzen sphärische Polarkoordinaten r, ϑ, ϕ mit der Polarachse nach unten.
Wegen der beiden Zwangsbedingungen
r = ` und ϕ = ϕ0
behalten wir ϑ als einzige generalisierte Koordinate. Damit formulieren wir
T =
m 2 m 2 2
v = ` ϑ̇
2
2
und V = mgz = −mg` cos ϑ (+const)
und erhalten die Lagrangefunktion L(ϑ, ϑ̇) =
m 2 2
` ϑ̇
2
+ mg` cos ϑ.
Aus der Lagrangegleichung
d ∂L ∂L
= 0 mit
−
dt ∂ ϑ̇
∂ϑ
∂L
= ml2 ϑ̇,
∂ ϑ̇
∂L
= −mgl sin ϑ
∂ϑ
folgt die Bewegungsgleichung
m`2 ϑ̈ + mg` sin ϑ = 0 oder ϑ̈ +
g
sin ϑ = 0 .
`
Für kleine Auslenkunken (sin ϑ ≈ ϑ) erhält man harmonische Schwingungen der
Frequenz ω = (g/`)1/2 . Die Berücksichtigung endlicher Auslenkugen führt auf
elliptische Integrale. Die Schwingungsdauer hängt dabei von der Amplitude ab,
das Pendel schwingt nicht mehr isochron [griech. ισoς (isos) = gleich, χρoνoς
(chronos) = Zeit].
3. Das Zykloidenpendel
Im letzten Beispiel demonstrieren wir die Leistungsfähigkeit des Verfahrens durch
eine Umkehrung der Fragestellung: Wir suchen eine Führung, also eine Zwangsbedingung, welche die Anharmonizität (Anisochronie) des ebenen Pendels (in der
x − z-Ebene) korrigiert. Mit einer geeigneten – noch unbekannten – dimensionslosen generalisierten Koordinate q postulieren wir also die Bewegungsgleichung
g
q̈ + q = 0
`
und gehen dementsprechend von einer geeigneten Lagrangefunktion
L=
m 2 2 1
` q̇ − mg`q 2
2
2
aus. Die Parameterdarstellung x(q), z(q) erhalten wir, indem wir L = T − V mit
der kartesischen Darstellung
T =
m 2
(ẋ + ż 2 ) und V = mgz
2
47
vergleichen. Daraus folgt
1
und z = q 2 `.
2
ẋ2 + ż 2 = `2 q̇ 2
Setzen wir ż = `q q̇ in die erste Gleichung ein, erhalten wir
ẋ2 = `2 (1 − q 2 )q̇ 2
q
oder dx = ∓` 1 − q 2 dq.
Substituieren wir schließlich q = cos φ, dq = − sin φ dφ, so folgt
dx = ±` sin2 φ dφ = ± 21 `(1 − cos 2φ)dφ und x = (±) 21 `(φ − 12 sin 2φ).
Zusammen mit z = 21 `q 2 =
Parameterdarstellung
1
` cos2
2
`
x = (2φ − sin 2φ),
4
2.5
+ cos 2φ) erhalten wir also die
`
z = (1 + cos 2φ),
4
Zur Geometrie der Zykloide
0
π/3
2π/3
π
Die Figur illustriert die Lage der Punkte,4π/3
die
5π/3
Rollwinkeln 2φ = nπ/3 entsprechen. 2π
4
4z/l
einer Zykloide, die beim Abrollen des Kreises x2 + z 2 = (`/4)2
an der Geraden z = `/2 entsteht (siehe Skizze, Rollwinkel 2φ;
die Gleichgewichtslage q = 0 entspricht 2φ = π). Im Mechaniklehrbuch vonSommerfeld (Theor. Physik. Bd. 1, S. 84) ist beschrieben, wie Huygens eine solche Führung bei der Konstruktion isochroner Pendeluhren realisiert hat.
1
`(1
4
φ =
2
2φ
0
0
2
4x/l
4
6
Geschwindigkeitsabhängige Kräfte
Unter der Voraussetzung, daß sich alle generalisierten Kräfte in der Form
Qk = −
∂V
∂qk
aus einem Potential herleiten lassen, konnten wir die Lagrangeschen Bewegungsgleichungen aus einer Lagrangefunktion L = T − V gewinnen. Wir erhalten die selben Gleichungen etwas allgemeiner aus der Lagrangefunktion
L=T −U,
wenn sich die generalisierten Kräfte gemäß
48
(110)
Qk =
∂U
d ∂U
−
dt ∂ q̇k ∂qk
(111)
aus einem generalisierten Potential
U (q1 , . . . qf , q̇1 , . . . q̇f , t)
gewinnen lassen. Dieser Zusammenhang ist gleichbedeutend mit
Fi =
d ∂U
∂U
−
,
dt ∂ ẋi ∂xi
(112)
denn dann wird
X
Qk =
i
∂xi X d ∂U ∂xi
∂U ∂xi
Fi
=
−
∂qk
dt ∂ ẋi ∂qk ∂xi ∂qk
i
!
,
und wegen ∂xi /∂qk = ∂ ẋi /∂ q̇k [vgl. Gl. (104)] folgt
Qk =
X
i
d ∂U ∂ ẋi
∂U ∂xi
−
dt ∂ ẋi ∂ q̇k ∂xi ∂qk
!
=
d ∂U
∂U
−
.
dt ∂ q̇k ∂qk
Diese spitzfindige Verallgemeinerung des Lagrangeschen Formalismus könnte
als akademische Spielerei abgetan werden, wenn sie nicht eine fundamental wichtige Anwendung besäße: Das elektromagnetische Feld mit der geschwindigkeitsabhängigen Lorentzkraft
F = e(E + v × B) .
(113)
Um diese Kraft in der gewünschten Form notieren zu können, müssen wir aus der
Elektrodynamik die allgemeine Darstellung10
E = −∇Φ −
∂
A;
∂t
B=∇×A
(114)
der Felder E und B durch “Potentiale” Φ und A übernehmen. Damit wird
"
#
∂A
F = −e ∇Φ +
− v × (∇ × A) .
∂t
Den letzten Term formen wir nach dem Entwicklungssatz um:
v × (∇ × A) = ∇(v · A) − v·∇A .
10
Zur Erinnerung: B = rotA folgt aus divB = 0. Zur induzierten Feldstärke −∂A/∂t vgl.
das “Induktionsgesetz” rotE = −∂B/∂t.
49
Berücksichtigen wir außerdem
dA
∂A
+ v·∇A =
,
∂t
dt
so erhalten wir
"
#
dA
F = −e ∇Φ +
− ∇(v · A)
dt
#
"
d d
= −e ∇(Φ − v · A) +
v·A
dt dv
"
#
d d
= −e ∇(Φ − v · A) −
(Φ − v · A)
dt dv
Die letzte Umformung gilt, da Φ nicht von v abhängt. Mit
U (r, v, t) = eΦ(r, t) − ev · A(r, t)
(115)
gilt also in Übereinstimmung mit (112)
Fi =
∂U
d ∂U
−
.
dt ∂vi ∂xi
Damit erhalten wir die Bewegungsgleichungen im elektromagnetischen Feld aus
einer Lagrangefunction
L = T − eΦ + ev · A .
(116)
Im Gegensatz zur Behandlung im Abschnitt 1.7 ist hier die volle Zeitabhängigkeit
der Felder zugelassen, es fehlt allerdings die Strahlungsdämpfung.
Eine andere Gruppe von geschwindigkeitsabhängigen Kräften bilden idealisierte
Reibungskräfte. Diese können im allgemeinen nicht sinnvoll durch eine verallgemeinerte Lagrangefunktion erfaßt werden. Es steht uns aber natürlich frei,
solche Kräfte — wie beliebige weitere Kräfte — zusätzlich zu den Kräften, die
wir aus einem generalisierten Potential ableiten, in den Lagrangeformalismus
einzubringen: Schreiben wir
Qk =
d ∂U
∂U
−
+ Q̃k ,
dt ∂ q̇k ∂qk
(117)
so erhalten wir die Lagrangeschen Bewegungsgleichungen
∂L
d ∂L
−
= Q̃k .
dt ∂ q̇k ∂qk
50
(118)
Ein häufig benutzter Ansatz nimmt einen linearen Zusammenhang
Ri = −ai vi
(119)
zwischen den Reibungskräften Ri und den Geschwindigkeiten vi an. In diesem
Fall können wir mit einer Dissipationsfunktion11
F=
1X 2
ai vi
2 i
schreiben
Ri = −
(120)
∂F
.
∂vi
Für die generalisierte Reibungskraft erhält man dann
Q̃k =
X
i
Ri
X ∂F ∂ ẋi
X ∂F ∂vi
∂xi
=−
=−
,
∂qk
i ∂vi ∂ q̇k
i ∂vi ∂ q̇k
wobei wir wieder von Gl. (104) Gebrauch gemacht haben. Wenden wir schließlich
noch die Kettenregel an, so folgt
Q̃k = −
2.6
∂F
.
∂ q̇k
(121)
Die Methode der Lagrangeschen Multiplikatoren
Wir wollen eine alternative Methode zur Lösung der Bewegungsgleichungen mit
Nebenbedingungen behandeln, die es auch erlaubt, eine einfache Klasse anholonomer Zwangbedingungen zu erfassen. Obwohl das bei dieser Methode grundsätzlich
nicht erforderlich ist, nehmen wir an, daß unser System durch einen Satz q1 , . . . qm
generalisierter Koordinaten12 beschrieben wird. Diese Koordinaten seien jedoch
nicht unabhängig, sondern einer Zwangsbedingung
f (q1 , . . . , qm , t) = 0
unterworfen. Die Gleichung f = 0 beschreibt eine Hyperfläche im m–dimensionalen q–Raum. Virtuelle Verrückungen müssen in dieser Hyperfläche ausgefürt
werden:
X ∂f
δqk = 0 .
δf = ∇q f · δq =
k ∂qk
11
12
lat. dissipo = zerstreuen, verteilen, vergeuden
Darin mag ein Teil der Zwangsbedingungen bereits berücksichtigt sein, also m ≤ 3n.
51
δq muß also senkrecht auf der Flächennormalen stehen, und die Richtung der
Flächennormalen ist durch die Richtung des Gradienten ∇q f gegeben.
Wir gehen nun wieder von dem Postulat aus, daß die Zwangskraft bei virtuellen
Verrückungen keine Arbeit leistet oder — anders ausgedrückt — senkrecht auf
der beschränkenden Hyperfläche steht. Dann ist die (generalisierte) Zwangskraft
Q̂ also parallel zum Gradienten und wir können schreiben
Q̂ = λ(q, t) ∇q f (q, t)
oder
∂f
.
∂qk
Ehe wir Bewegungsgleichungen mit dieser Zwangskraft formulieren, überlegen wir
zwei einfache Verallgemeinerungen:
Q̂k = λ
Erstens können wir sofort mehrere Beschränkungsgleichungen berücksichtigen
und diese durch einen Index i, über den wir anschließend summieren, kennzeichnen.
Zweitens ist es für unserer Formulierung offenbar gar nicht wichtig, daß die Hyperfläche fi = 0 als Ganzes (d.h. holonom) vorgegeben ist, denn wir haben nur
von der lokalen Beschreibung der Tangentialfläche Gebrauch gemacht. Solche lokalen Tangentialflächen werden aber auch durch möglicherweise anholonome
(also nicht integrable13 ) Zwangsbedingungen der Form
ai (q, t) · dq + ait dt =
X
aik (q1 , . . . qn , t)dqk + ait dt = 0 (i = 1, . . . s)
(122)
k
definiert. Dabei übernehmen die Koeffizienten aik die Rolle der partiellen Ableitungen ∂fi /∂qk .
Wir gehen also von (122) aus und beschreiben die Zwangskraft durch den Ansatz
Q̂k =
s
X
λi aik
(k = 1, . . . m)
(123)
i=1
mit noch unbekannten “Lagrangeschen Multiplikatoren” λi . Diese Multiplikatoren sind zunächst Funktionen von q1 , . . . qn und t. Über den Ablauf der Bewegung
können sie aber auch als Funktionen von t allein aufgefaßt werden. Mit diesem
Ansatz gehen wir in das d’Alembertsche Prinzip
m
X
k=1
13
(
)
d ∂L
∂L
−
− Q̂k δqk = 0
dt ∂ q̇k ∂qk
Die Bedingungen sind integrablel, wenn ∂aik /∂ql = ∂ail /∂qk und ∂ait /∂qk = ∂aik /∂t gilt.
52
ein. Nun dürfen die δqk zunächst eigentlich nicht frei gewählt werden. Aus physikalischer Sicht können wir jedoch argumentieren, daß wir die Zwangsbedingungen
gar nicht explizit zu beachten brauchen, wenn wir von vornherein die entsprechenden Zwangskräfte berücksichtigen. Vom mathematisch formalen Standpunkt
können wir die s unbekannten Koeffizienten λi so wählen, daß s Klammern im
d’Alembertschen Prinzip verschwinden. Die restlichen m − s Variationen sind
dann frei. In jedem Fall erhalten wir damit die m Bewegungsgleichungen
s
X
∂L
d ∂L
−
=
λi aik
dt ∂ q̇k ∂qk
i=1
(k = 1, . . . m) .
(124)
Zusammen mit den s Zwangsbedingungen (122) stellen sie ein System von m + s
Differentialgleichungen zur Bestimmung der m + s unbekannten Funktionen
q1 (t), . . . qm (t); λ1 (t), . . . λs (t)
dar. Im Falle holonomer Zwangsbedingungen ist der Nachteil dieser Methode offenbar: Statt eines Problems mit f = m − s Unbekannten haben wir ein Problem
mit m + s Unbekannten zu lösen. Dafür sind wir in der Lage, anholonome Bedingungen der Form (122) zu berücksichtigen. Außerdem werden die Zwangskräfte
bei dieser Methode explizit mitberechnet. Benutzen wir speziell kartesische Koordinaten xk , erhalten wir die Bewegungsgleichungen
mk ẍk = Fke +
s
X
λi aik ,
(125)
i=1
die auch als “Lagrangesche Gleichungen erster
14
Art” bezeichnet werden.
Beispiel: Die schiefe Ebene (vgl. S. 40, 41)
Wir benutzen kartesische Koordinaten x, z. Die äußeren Kräfte sind durch
Fxe = 0 und Fze = −mg
oder durch das Potential
V = mgz
gegeben. Die (in diesem Fall natürlich holonome) Zwangsbedingung schreiben wir
in der differentiellen Form dz = −dx tan α oder
dx tan α + dz = 0 .
Mit der Lagrangefunktion
L=
m 2
(ẋ + ż 2 ) − mgz
2
14
Die Lagrangegleichungen der vorigen Abschnitte werden auch Lagrangegleichungen
zweiter Art oder allgemeine Lagrangegleichungen genannt.
53
und den Gln. (124) oder äquivalent mit den Gln. (125) folgen dann die Bewegungsgleichungen
mẍ = λ tan α
mz̈ = −mg + λ .
Wir lösen die zweite Gleichung nach λ auf und setzen dies in die erste ein:
mẍ = tan α(mz̈ + mg) .
Aus der Zwangsbedingung entnehmen wir außerdem z̈ = −ẍ tan α und erhalten
mẍ(1 + tan2 α) = mg tan α
oder nach der gleichen Umformung wie auf S. 41
ẍ = g sin α cos α .
Dies ist die fertige Bewegungsgleichung für x(t) (Lösung: siehe S. 41). z(t) erhält
man daraus (z.B.) über die Zwangsbedingung. Mit der ersten Bewegungsgleichung
finden wir außerdem
λ = mg cos2 α ,
und daraus ergeben sich die Zwangskräfte
Zx = λ tan α = mg sin α cos α
und
Zz = λ = mg cos2 α .
(Interpretation: Die Komponente mg cos α der Schwerkraft erscheint als Zwangskraft senkrecht zur schiefen Ebene. Zx und Zz sind wiederum die Komponenten
dieser Zwangskraft.)
2.7
Berechnung von Zwangskräften
Wenn es auch unser Bestreben war, Zwangskräfte aus der Formulierung der Bewegungsgleichungen zu eliminieren, so wünscht man doch gelegentlich, diese Zwangskräfte zu berechnen. Beispielsweise könnte es ratsam sein, die Zwangskräfte mit
der Belastbarkeit einer Führung zu vergleichen. Mit den Lagrangeschen Multiplikatoren haben wir bereits eine Methode zur Berechnung der Zwangskräfte
kennengelernt. Im Falle holonomer Zwangsbedingungen ist diese Methode jedoch
viel zu schwerfällig und umständlich. Wir geben daher einen bequemeren Weg
an, der von der physikalischen Interpretation ausgeht:
Wir beschreiben unser System von f Freiheitsgraden mit der Lagrangefunktion
L(q1 , . . . qf , q̇1 , . . . q̇f , t)
und lösen die Lagrangeschen Bewegungsgleichungen
54
∂L
d ∂L
−
=0
dt ∂ q̇k ∂qk
(k = 1, . . . f ) .
(126)
Hierbei treten die Zwangskräfte nicht in Erscheinung. Dann bilden wir mit zusätzlichen Koordinaten qf +1 , . . . qm (f < m ≤ 3n) eine erweiterte Lagrangefunktion
L̂(q1 , . . . qm , q̇1 , . . . q̇m , t) .
Wir denken uns nun wieder die Zwangsbedingungen durch die entsprechen (generalisierten) Kräfte Q̂k ersetzt. Dann gelten im erweiterten System die Lagrangegleichungen
∂ L̂
d ∂ L̂
−
= Q̂k
dt ∂ q̇k ∂qk
(k = 1, . . . m)
(127)
Diese Lagrangegleichungen15 benutzen wir nicht zur Lösung des Bewegungsproblems, denn das ist ja bereits gelöst! Vielmehr setzen wir hierin die Lösung
q1 , . . . qf der Bewegungsgleichungen (126) und die (m − f ) Zwangsbedingungen
ein und erhalten damit explizit die interessierenden generalisierten Zwangskräfte
Qk .
Als Beispiel betrachten wir wieder die schiefe Ebene des vorigen Abschnitts. Wir
wählen zunächst x als generalisierte Koordinate und erhalten aus der Lagrangefunktion
m
L(x, ẋ) = ẋ2 (1 + tan2 α) + mgx tan α
2
die Bewegungsgleichungen
mẍ(1 + tan2 α) = mg tan α
oder
ẍ = g sin α cos α .
Nun führen wir z als zusätzliche Koordinate ein und bilden die erweiterte Lagrangefunktion
m
L̂(x, z, ẋ, ż) = (ẋ2 + ż 2 ) − mgz .
2
Daraus erhalten wir die wir die Lagrangegleichungen
mẍ = Q̂x
mz̈ + mg = Q̂z .
15
Beachte, daß die Gln. (127) auch für k ≤ f von den Gln. (126) verschieden sind und
Zwangskräfte enthalten!
55
Zusammen mit der Bewegungsgleichung und der Zwangsbedingung z̈ = −ẍ tan α
erhalten wir daraus die Zwangskräfte
Q̂x = mg sin α cos α
Q̂z = −mẍ tan α + mg
= mg(1 − sin2 α) = mg cos2 α .
Beachte, daß wir bei der Verwendung generalisierter Koordinaten qk die Zwangskräfte Q̂k i.a. in der entsprechend generalisierten Form erhalten. Falls erwünscht,
können wir daraus gemäß
X
∂qk
Zi =
Q̂k
∂xi
k
die nicht generalisierten Zwangskräfte berechnen. In unserem Beispiel haben wir
jedoch von vornherein kartesiche Koordinaten x und z benutzt, und daher gilt
Q̂x = Zx
2.8
und
Q̂z = Zz .
Zyklische Koordinaten, Symmetrien und Erhaltungssätze
Wenn die Lagragefunktion L(q1 , . . . qf , q̇1 , . . . q̇f , t) von einer Koordinate qk gar
nicht abhängt (wohl aber von q̇k !), so heißt diese Koordinate zyklisch16 . Für
eine zyklische Koordinate erhalten wir die Lagrangegleichung
d ∂L
= 0.
dt ∂ q̇k
Um den entsprechenden Erhaltungssatz prägnant formulieren zu können, führen
wir allgemein (also nicht nur für zyklische Koordinaten) durch
pk =
∂L
∂ q̇k
(128)
den “zur Koordinate qk konjugierten generalisierten Impuls” pk ein. Der Name
wird für freie Teilchen ohne Magnetfeld unmittelbar verständlich, wir haben dann
nämlich
X
mi ẋ2i − V (xj )
L=T −V =
i
und erhalten mit
pk =
∂L
= mk ẋk
∂ ẋk
16
Der Name stammt von der Winkelkordinate bei Kreisbewegungen [griech. κυκλoς (kyklos)
= Kreis].
56
den altbekannten Impuls. Wir weisen jedoch mit Nachdruck darauf hin, daß im
allgemeinen pk vom Impuls, der in Newtons Lex secunda steht, verschieden ist.
Betrachten wir beispielsweise ein geladenes Teilchen im elektromagnetischen Feld,
so folgt aus
X
mX 2
ẋi Ai
L=
ẋi − eΦ + e
2 i
i
der generalisierte Impuls
pk = mẋk + eAk
oder p = mv + eA .
Für generalisierte Koordinaten qk , die nicht die Dimension einer Länge haben, hat
pk nicht einmal die Dimension eines Impulses. Der zu einer Winkelkoordinate ϕ
konjugierte Impuls pϕ ist beispielsweise ein Drehimpuls (s.u.). Aus der Definition
von pk folgt, daß Produkte pk qk in jedem Fall die Dimension einer Wirkung, also
Energie × Zeit, haben.
Wir kehren nun zu den zyklischen Variablen zurück und formulieren den allgemeinen Erhaltungssatz
• Der zu einer zyklischen Koordinate qk konjugierte generalisierte Impuls pk
bleibt bei der Bewegung erhalten.
Diese Formulierung stellt einen engen Zusammenhang zwischen Erhaltungssätzen
und Symmetrieeigenschaften her: Ist die Koordinate qk zyklisch, so ist die Lagrangefunktion invariant gegen Veränderungen von qk , und diese Invarianz begründet einen Erhaltungssatz, nämlich den des konjugierten Impulses pk . Ein
kräftefreies System ist invariant gegen Translationen, und hieraus folgt der Impulserhaltungssatz. Ebenso ergibt sich der Drehimpulserhaltungssatz aus der Rotationssymmetrie eines Systems, auf das kein Drehmoment wirkt. Wir wollen
diese intuitiv formulierten Zusammenhänge gleich etwas genauer darlegen.
Zuvor weisen wir aber darauf hin, daß unser neuer Erhaltungssatz allgemeiner ist
als die früher formulierten Sätze der Impuls– und Drehimpulserhaltung. Betrachten wir etwa die Bewegung eines geladenen Teilchens im konstanten Magnetfeld
B = Bez , so ist diese Bewegung nicht kräftefrei und wir können keinen Impulserhaltungssatz in x– oder y–Richtung formulieren. Mit V = const und der speziellen
Darstellung A = Bxey wird dagegen die Ortskoordinate y zyklisch, und damit
folgt, daß der generalisierte Impuls
py = mẏ + eAy = mẏ + eBx
bei der Bewegung konstant bleibt17 .
17
Aus den Bewegungsgleichungen finden wir unabhängig von der speziellen Wahl von A die
beiden Invarianten mẏ+eBx und mẋ−eBy. Dies sind jedoch nicht die generalisierten Impulse p y
und px . Für A = αBxey −(1−α)Byex wird nämlich py = mẏ +αBx und px = mẋ +(1−α)By.
57
Um nun den Zusammenhang zwischen Impulserhaltung und Translationsinvarianz
genauer zu fassen, betrachten wir einen Massenpunkt mit der Lagrangefunktion
m
L(r, ṙ) = ṙ2 − V (r) .
2
Die Aussage “L ist invariant gegen eine Translation in z–Richtung” heißt mathematisch, daß L0 = L gilt, wenn wir r durch r0 = r + δr mit δr = ez δz (δz → 0)
ersetzen. Da die Geschwindigkeit durch die Translation nicht geändert wird, gilt
∂L
δz .
∂z
L ist also invariant gegen eine Translation in z–Richtung, wenn
L0 − L = δL =
∂L
∂V
=−
= Fz = 0
∂z
∂z
gilt oder wenn keine Kraft in z–Richtung wirkt. Als Folge dieser Invarianz bleibt
der Impuls
∂L
= mż
pz =
∂ ż
erhalten. Die Übertragung dieser Betrachtung auf eine beliebige Richtung und
auf ein System von Massenpunkten ist trivial. Besteht Translationsinvarianz für
alle Richtungen, so ist der vektorielle Impuls konstant.
Wir wollen eine ähnliche Betrachtung auch für den Drehimpulssatz durchführen.
Dazu nehmen wir an, daß die Lagrangefunktion L = T −V eines Massenpunkts
invariant gegen Drehungen um die z–Achse ist. Eine infinitesimale Drehung um
den Winkel δϕ um die z–Achse erzeugt eine Änderung
δr = eϕ δϕ = ez × r δϕ
(vgl. S. 24). Da sich T = mv2 /2 bei einer Drehung nicht ändert, folgt
dV
· δr = F · (ez × r) δϕ
dr
= ez · (r × F) δϕ = ez · M δϕ = Mz δϕ .
L0 − L = δL = −δV = −
L ist also invariant gegen Drehungen um die z–Achse, wenn die z–Komponente
des Drehmoments M verschwindet. Den entsprechenden Erhaltungssatz erkennen
wir, wenn wir Zylinderkoordinaten (r, ϕ, z) benutzen und
m
L = (ṙ 2 + r 2 ϕ̇2 + ż 2 ) − V
2
schreiben. Aus ∂L/∂ϕ = 0 folgt dann die Erhaltungsgröße
pϕ =
∂L
= mr 2 ϕ̇ = mrvϕ = m(r × v)z = const ,
∂ ϕ̇
also die Erhaltung der z–Komponente des Drehimpulses.
Mit einem gewissen Pathos können wir also formulieren
58
• Die Impulserhaltung ist eine Folge der Homogenität des Raumes.
• Die Drehimpulserhaltung ist eine Folge der Isotropie des Raumes.
Unter diesem Gesichtspunkt fehlt uns eine Konsequenz der Homogenität der Zeit.
Wir erwarten nämlich aus relativistischen Gründen eine gewisse Äquivalenz von
Raum und Zeit. Allerdings ist die Zeit in unserem Formalismus keine generalisierte Koordinate, sondern ein freier Parameter. Folglich ist ihr auch kein generalisierter Impuls zugeordnet. Wir fragen trotzdem nach möglichen Folgen einer Invarianz der Lagrangefunktion gegen eine Zeitverschiebung, die durch ∂L/∂t = 0
gekennzeichnet ist. Dazu rechnen wir
!
dL X ∂L
∂L
∂L
=
q̇k +
q̈k +
dt
∂qk
∂ q̇k
∂t
k
und setzen
∂L
= pk
∂ q̇k
und
∂L
d ∂L
=
= ṗk
∂qk
dt ∂ q̇k
ein. Damit folgt
∂L
dL
dL X
d X
pk q̇k .
=
− (ṗk q̇k + pk q̈k ) =
−
∂t
dt
dt
dt k
k
Wir finden also in der Tat einen weiteren Erhaltungssatz:
• Hängt die Lagrangefunktion nicht explizit von der Zeit ab, so bleibt die
Größe
X
pk q̇k − L
(129)
H=
k
bei der Bewegung erhalten.
H heißt die Hamiltonfunktion (s.u.) des Systems. Wenn wir wieder freie Teilchen betrachten und kartesische Koordinaten benutzen, so haben wir
L=T −V =
1X
mi ẋ2i − V .
2 i
Also wird pk = mk ẋk und folglich
H=
X
k
mk ẋ2k − L = T + V = E .
Unserer Aufzählung eherner Gesetze können wir also hinzufügen:
• Die Energieerhaltung ist eine Folge der Homogenität der Zeit.
59
Wir merken jedoch an, daß in dieser markigen Formulierung nichts neues gegenüber dem altbekannten Energiesatz enthalten ist — wohl aber in der obigen
Formulierung mit der Hamiltonfunktion!
Wir zeigen das am Beispiel eines Massenpunktes, der reibungsfrei auf einer Stange
(x) gleitet, die mit konstanter Winkelgeschwindigkeit ω um eine senkrechte Achse
(z) rotiert. Die Lagrangefunktion
L=T =
m 2
(ẋ + x2 ω 2 )
2
dieses Systems hängt nicht explizit von der Zeit ab. Mit px = mẋ folgt also
H = mẋ2 −
m
m 2
(ẋ + x2 ω 2 ) = (ẋ2 − x2 ω 2 ) = T − mx2 ω 2 = const.
2
2
Erhaltungsgröße ist in diesem Fall also nicht die Energie E = T , sondern H =
E − mx2 ω 2 . Und warum ist die Energie in diesem Beispiel nicht konstant? Weil
Zwangskräfte bei rheonomen Zwangsbedingungen Arbeit leisten. Und was ist an
H=
m 2 m 2 2
ẋ − x ω
2
2
anschaulich? Die (Pseudo–)Energie des äquivalenten Problems im rotierenden Koordinatensystem mit dem “Potential” m2 x2 ω 2 der Fliehkraft18 mxω 2 . (Vgl. S. 26,
g = geff auf der rotierenden Erde.)
Das Beispiel läßt uns noch etwas unbefriedigt: Wann ist denn nun die Hamiltonfunktion die Energie und wann nicht? Und was ist die Hamiltonfunktion,
wenn sie nicht die Energie ist?
Um das zu untersuchen rechnen wir von den generalisierten Koordinaten qk in
die kartesischen Koordinaten
xi = hi (q1 , . . . qf , t)
zurück und bilden
ẋi =
X
hik q̇k + hit
mit hik =
k
∂hi
∂qk
und hit =
∂hi
.
∂t
Damit wird
T =
X
i
18


X
mi  X
hik hit q̇k + h2it  = T2 + T1 + T0 .
hik hil q̇k q̇l + 2
2 k,l
k
Beachte, daß dieses effektive Potential für ω = const und l =const verschieden aussieht,
vgl. Gl. (38)!
60
Dabei bezeichnet Tν den Anteil der kinetischen Energie, der homogen vom Grade
ν (s.u.) in den generalisierten Geschwindigkeiten q̇k ist. Entsprechend läßt sich
der “magnetische Anteil”
X
M=
ei ẋi Ai
i
der Lagrangefunktion in zwei homogene zwei Anteile M1 undM0 zerlegen. Das
Potential V hängt nicht von den Geschwindigkeiten ab, ist also homogen vom
Grade Null in den q̇k .
Nach diesen Vorüberlegungen bilden wir nun die Lagrangefunktion L = T −
V + M und stellen fest, daß sie offenbar in drei Anteile
L
L2
L1
L0
=
=
=
=
L2 + L1 + L0 mit
T2
T1 + M 1
T0 + M 0 − V ,
zerfällt, wobei die Lν homogen vom Grade ν in den generalisierten Geschwindigkeiten sind.
Wir gehen nun etwas genauer auf den Begriff der Homogenität ein: Eine Funktion
f (x) heißt homogen vom Grade ν, wenn gilt
f (λx) = λν f (x) .
(130)
Differenziern wir diese Definitionsgleichung nach λ und setzen anschließend λ = 1,
so erhalten wir die Eulersche Homogenitätsrelation
X
i
xi
∂f
= νf .
∂xi
(131)
Nach diesem Exkurs kehren wir zur Bedeutung der Hamiltonfunktion
H=
X
k
pk q̇k − L =
X
∂L
q̇k − L
∂ q̇k
zurück: Setzen Wir L = L2 + L1 + L0 ein und beachten, daß nach (131)
X
∂Lν
q̇k = νLν
∂ q̇k
gilt , so folgt H = 2L2 + 1L1 + 0L0 − (L2 + L1 + L0 ) oder (mit der obigen
Spezifizierung der Lν )
H = L 2 − L 0 = T2 + V − T 0 − M 0 .
61
(132)
Damit ist die obige Frage nach dem Zusammenhang und dem Unterschied von
Hamiltonfunktion und Energie klar beantwortet: H ist die Gesamtenergie T +V ,
wenn T1 , T0 und M0 verschwinden, das heißt, wenn die generalisierten Koordinaten nicht explizit von der Zeit abhängen. Eine explizite Zeitabhängikeit der
generalisierten Koordinaten kommt i.a. durch rheonome Zwangsbedingungen zustande.
Als Beispiel betrachten wir noch einmal den Massenpunkt auf der rotierenden
Stange. Hier haben wir19
m
m
L = (ẋ2 + x2 ω 2 ), also L2 = ẋ2 und L0 = x2 ω 2 .
2
2
Damit erhalten wir sofort
m
H = L2 − L0 = (ẋ2 − x2 ω 2 ) .
2
Wie in diesem Beispiel läßt sich −L0 häufig als Pseudopotential interpretieren. H = const ist dann die (Pseudo–)Energie in dem entsprechenden Nicht–
Inertialsystem.
Wir bemerken, daß die Größe H überhaupt nicht von L1 = T1 + M1 abhängt,
insbesondere also im Fall skleronomer Zwangsbedingungen nicht von M . Damit
folgt, daß der Energieerhaltungssatz auch in Anwesenheit zeitunabhängiger Magnetfelder gilt [vgl. Gl. (49)].
2.9
Routhsches Verfahren und kanonische Gleichungen
Wir befassen uns nun mit der Frage, wie wir zyklische Koordinaten mit ihren
Erhaltungssätzen möglichst ökonomisch ausnutzen. Dazu nehmen wir an, daß
unsere Lagrangefunktion die Form
L(q2 , . . . qf , q̇1 , . . . q̇f , t)
(133)
hat, daß q1 also zyklisch ist. Zu q1 haben wir das Integral
∂L
= p1 = const .
∂ q̇1
(134)
Die übrigen Lagrangegleichungen
d ∂L
∂L
−
=0
dt ∂ q̇k ∂qk
19
(k = 2, . . . , f )
(135)
Beachte die wichtige Unterscheidung zwischen generalisierten Geschwingkeiten q̇ k (hier ẋ)
und anderen Geschwindigkeiten (hier ωx), die auf den Zwangsbedingungen beruhen!
62
enthalten zwar noch q̇1 , wir können jedoch Gl. (134) nach
q̇1 = g(q2 , . . . qf , q̇2 , . . . q̇f , p1 , t)
(136)
auflösen und in die Bewegungsgleichungen (135) einsetzen. Dort tritt dann weder
die Koordinate q1 noch die Geschwindigkeit q̇1 explizit in Erscheinung: Wir haben
das Gesamtproblem also in die separaten Probleme der Lösung der Gln. (135)
(Ordnung 2(f − 1)) und der Integration der Gl. (136) (Ordnung 1) aufgespalten.
Falsch wäre es, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren. Denn L ist stets als Funktion der generalisierten
Koordinaten und Geschwindigkeiten und nicht der generasierten Impulse zu formulieren! Wir wollen uns das an einem Beispiel klarmachen und betrachten das
Zentralkraftproblem in der Ebene. In ebenen Polarkoordinaten haben wir
L=
m 2
(ṙ + r 2 ϕ̇2 ) − V (r) .
2
Die Winkelkoordinate ist zyklisch und liefert den Erhaltungssatz
∂L
= mr 2 ϕ̇ = pϕ = const
∂ ϕ̇
des Drehimpulses (Flächensatz, vgl. S. 14, 18). Für die radiale Koordinate erhalten wir die Bewegungsgleichung
mr̈ − mr ϕ̇2 +
dV
= 0.
dr
In diese Bewegungsgleichung können wir
ϕ̇ =
pϕ
mr 2
einsetzen und erhalten die separate Bewegungsgleichung20
mr̈ −
p2ϕ
dV
+
=0
3
mr
dr
für r(t) allein. Nach ihrer Lösung kann man ϕ(t) durch Integration des Flächensatzes berechnen.
Wenn wir dagegen versuchen, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in
der Lagrangefunktion (134) zu eliminieren, erhalten wir aus
L̂ =
20
p2ϕ
m 2
(ṙ + 2 2 ) − V (r)
2
mr
Nach Multiplikation mit ṙ läßt sie sich zum Energiesatz (38) integrieren.
63
die offenbar falsche Bewegungsgleichung mr̈ ⊕
p2ϕ
mr 3
+
dV
dr
= 0.
Es gibt jedoch eine systematische Möglichkeit, q̇1 von vornherein zu eliminieren:
Das Routhsche Verfahren. Dazu geht geht man von einer modifizierten Lagrangefunktion oder Routhfunktion
R1 = L − p1 q̇1
(137)
aus. R1 hängt damit — so scheint es zunächst — von dem erweiterten Variablensatz
q2 , . . . qf , q̇1 , . . . q̇f , p1 , t
(138)
ab. Tatsächlich hängt R1 aber von der Geschwindigkeit q̇1 gar nicht mehr explizit
ab, denn wir haben ∂R1 /∂ q̇1 = ∂L/∂ q̇1 − p1 = 0. Gl. (137) vermittelt also eine
Transformation, welche die Variable q̇1 durch die neue Variable p1 ersetzt. Diese
Konstruktion beruht nicht auf einem glücklichen Zufall sondern folgt einem systematischen Weg des Variablenwechsels: Der Legendre–Transformation. Wir
erläutern das am Beispiel einer Funktion f (x, y) mit dem Differential
df = u dx + v dy .
Wünscht man nun die Variable x durch u = ∂f /∂x zu ersetzen, so bildet man
die neue Funktion
g = f − ux .
Ihr Differential
dg = df − u dx − x du = v dy − x du
zeigt, daß g in der Tat nur von den natürlichen Variablen y und u abhängt21 .
Mit der Transformation (137) wird also ein systematischer Wechsel von der Variablen q̇1 zu der neuen Variablen p1 vollzogen. Setzen wir in R1 die Geschwindigkeit
q̇1 = g(. . .) nach Gl. (136) ein, so erhalten wir für k = 2, . . . , f
!
∂L
∂g
∂L
∂L
∂R1
=
+
− p1
=
∂qk
∂qk
∂ q̇1
∂qk
∂qk
!
∂L
∂L
∂R1
∂L
∂g
=
+
− p1
=
.
∂ q̇k
∂ q̇k
∂ q̇1
∂ q̇k
∂ q̇k
Damit bleibt die Form der Lagrangegleichungen (mit R1 an Stelle von L) also
invariant:
d ∂R1 ∂R1
d ∂L
∂L
−
=
−
= 0 (k = 2, . . . , f ) .
dt ∂ q̇k
∂qk
dt ∂ q̇k ∂qk
21
(139)
Von solchen Transformationen wird in der Thermodynamik beim Wechsel der Variablen S
und T bzw. V und p reichlich Gebrauch gemacht.
64
Wir überzeugen uns davon auch wieder an unserem Beispiel der Zentralkraft und
rechnen
m 2
(ṙ + r 2 ϕ̇2 ) − V (r) − pϕ ϕ̇
Rϕ =
2
!
p2
p2ϕ
m 2
=
ṙ + 2 2 − V (r) − ϕ2
2
mr
mr
2
p
m 2
=
ṙ ϕ 2 − V (r) .
2
2mr
Aus der modifizierten Lagrangefunktion Rϕ folgt dann gemäß Gl. (139) die
korrekte Bewegungsgleichung
mr̈ −
p2ϕ
dV
+
= 0.
3
mr
dr
Wir sind damit an einem Punkt angelegt, von dem aus es nur noch zweier kleiner,
fast trivialer Schritte zu einer alternativen Formulierung der Bewegungsgleichungen bedarf:
(1) Wir können diesen Variablenwechsel von q̇1 nach p1 natürlich auch dann
durchführen, wenn q1 nicht zyklisch ist. Statt der Gleichung p1 = const
haben wir dann die Lagrangegleichung
ṗ1 =
∂R1
∂L
=
.
∂q1
∂q1
Wir benutzen also für k = 2, . . . , f die Variablen qk und q̇k und erhalten die
Bewegungsgleichungen (zweiter Ordnung)
d ∂R1 ∂R1
−
= 0 (k = 2, . . . f ) .
dt ∂ q̇k
∂qk
Für k = 1 dagegen ersetzen wir q̇k durch pk und haben die beiden Bewegungsgleichungen erster Ordnung
q̇1 = −
∂R1
∂p1
und ṗ1 =
∂R1
.
∂q1
(2) Was wir mit der Geschwindigkeit q̇1 gemacht haben, können wir mit jeder anderen Geschwindigkeit q̇k , und schließlich auch mit allen Geschwindigkeiten machen. Wir definieren uns also durch die f –fache Legendretransformation
R1...f (q1 , . . . qf , p1 , . . . pf , t) = L(q1 , . . . qf , q̇1 , . . . q̇f , t) −
65
f
X
i=1
pi q̇i
eine “neue Lagrangefunktion” oder Routhfunktion R1...f , in der sämtliche Geschwindigkeiten durch Impulse ersetzt sind, und erhalten alle Bewegungsgleichungen in der Form
q̇k = −
∂R1...f
∂pk
und ṗk =
∂R1...f
.
∂qk
Die “neue Lagrangefunktion” R1...f ist gar nicht so neu für uns, durch Vergleich
mit Gl. (129) erkennen wir nämlich bis aufs Vorzeichen die Hamiltonfunktion
H(q1 , . . . qf , p1 , . . . pf , t) =
f
X
i=1
pi q̇i − R(q1 , . . . qf , q̇1 , . . . q̇f , t)
(140)
wieder. Mit der expliziten Anschrift betonen wir zugleich, daß wir die Hamiltonfunktion als Funktion der natürlichen Variablen q1 , . . . qf , p1 , . . . pf , t auffassen
wollen. Generalisierte Geschwindigkeiten dürfen also in der Hamiltonfunktion
nicht mehr vorkommen! Aus dieser Hamiltonfunktion erhalten wir die Hamiltonschen Gleichungen oder kanonischen Bewegungsgleichungen22
∂H
∂pk
∂H
,
= −
∂qk
q̇k =
(141)
ṗk
(142)
die nicht nur durch ihr hohes Maß an Symmetrie bestechen, sondern auch die Formulierung Newtons in suggestiver Weise verallgemeinern: Der erste Satz (141)
stellt den Zusammenhang zwischen (generalisierten) Impulsen und Geschwindigkeiten her, der zweite Satz (142) drückt die Impulsänderung durch (generalisierte)
Kräfte und Scheinkräfte ∂H/∂qk aus. Für freie Teilchen im Kraftfeld mit Potential
erhält man ja tatsächlich
−
∂H
∂V
=−
= Fk .
∂xk
∂xk
Im Vergleich mit den Lagrangegleichungen bieten die kanonischen Bewegungsgleichungen also den Vorteil einer bequemeren Elimination zyklischer Koordinaten. Davon abgesehen sind die beiden Formulierungen aber völlig äquivalent und
bringen im gegenseitigen Vergleich rechnerisch (s.u.) weder Vor- noch Nachteile.
Wir haben ja auch physikalisch nichts Neues eingebracht, sondern nur mathematisch umgeformt. Ein essentieller Vorteil der Hamiltonschen Formulierung wird
erst zum Tragen kommen, wenn wir im 6. Kapitel ihre Symmetrie ausnutzen,
22
griech. κανων (kanon) = Richtschnur, Gesetz
66
um die grundsätzliche Unterscheidung von Koordinaten und Impulsen fallen zu
lassen.
Selbstverständlich lassen sich aus der Hamiltonfunktion die selben Erhaltungssätze
wie aus der Lagrangefunktion ablesen, denn nach Konstruktion gilt
∂H
∂L
=−
∂qk
∂qk
und
∂L
∂H
=−
.
∂t
∂t
(143)
Wir können also auch sagen: Eine Koordinate qk ist zyklisch, wenn die Hamiltonfunktion H nicht explizit von qk abhängt. Aus Gl. (142) lesen wir dazu ab,
daß der zu einer zyklischen Variablen qk konjugierte Impuls pk konstant ist.
Entsprechend gilt, daß die Hamiltonfunktion H konstant ist, wenn sie nicht explizit von der Zeit abhängt. Rechnerisch folgt das auch sofort aus den kanonischen
Gleichungen:
!
X ∂H
X
dH ∂H
∂H
−
=
ṗk +
q̇k = (q̇k ṗk − ṗk q̇k ) = 0 .
dt
∂t
∂pk
∂qk
k
k
Praktisch geht man beim Rechnen mit den Hamiltonschen Gleichungen wie
folgt vor:
1. Bilde die Lagrangefunktion L und berechne die generalisierten Impulse
pk = ∂L/∂ q̇k .
2. Bilde die Hamiltonfunktion gemäß H =
L2 − L0 [vgl. (132)]
P
i
pi q̇i − L [vgl. (129)] oder H =
3. Ersetze in H gemäß 1. alle q̇k durch pk .
4. Bilde die kanonischen Gleichungen.
Dabei ist zu beachten, daß der erste Satz (141) keine neue Information liefert: Er
löst lediglich den aus pk = ∂L/∂ q̇k bereits bekannten Zusammenhang zwischen
den pk und den q̇k nach q̇k auf. Der zweite Satz (142) liefert die eigentlichen
Bewegungsgleichungen23 .
Wir wollen dieses Verfahren am Beispiel des Zentralkraftproblems in der Ebene
(vgl. S. 63) illustrieren:
1. Aus der Lagrangefunktion L = T − V =
die generalisierten Impulse
pr =
23
∂L
= mṙ
∂ ṙ
und
m 2
(ṙ
2
pϕ =
+ r 2 ϕ̇2 ) − V (r) bilden wir
∂L
= mr 2 ϕ̇.
∂ ϕ̇
Diese konstruktionsbedingte Unsymmetrie wird in Kapitel 6 aufgehoben.
67
2. Aus H = L2 −L0 oder aus H = T +V berechnen wir die Hamiltonfunktion
zunächst in der vorläufigen Form
H=
m 2
(ṙ + r 2 ϕ̇2 ) ⊕ V (r).
2
3. Wir setzen anschließend ṙ = pr /r und ϕ̇ = pϕ /(mr 2 ) ein und erhalten die
endgültige Hamiltonfunktion
H(r, pr , pϕ ) =
p2
p2r
+ ϕ 2 + V (r).
2m 2mr
4. Daraus folgen die kanonischen Gleichungen
ṙ =
pr
,
m
ϕ̇ =
pϕ
,
mr 2
ṗr =
p2ϕ
dV
−
,
3
mr
dr
ṗϕ = 0 .
Die ersten beiden Gleichungen wiederholen den bereits vorher bekannten Zusammenhang zwischen Geschwindigkeiten und Impulsen. In der zweiten Zeile finden
wir die radiale Bewegungsgleichung und die Konstanz des Drehimpulses. Die formale Rechnung ist wesentlich identisch mit der im Lagrangeformalismus. Der
Vorteil der kanonischen Behandlung liegt allenfalls darin, daß wir uns um die
Ausnutzung der zyklischen Koordinate ϕ gar nicht zu kümmern brauchen.
Um die Folgen eines häufigen Fehlers zu verdeutlichen, betrachten wir noch einmal
die Bewegung eines geladenen Teilchens im elektromagnetischen Feld mit
L=
m 2
v − eΦ(r, t) + v · A(r, t)
2
=⇒
L2 =
m 2
v , L0 = −eΦ .
2
Und so ist es falsch: Die Hamiltonfunktion H = L2 − L0 = mv 2 /2 + eΦ hängt
gar nicht von A und damit vom Magnetfeld B ab. Insbesondere ist die Bewegung
im konstanten Magnetfeld ohne elektrische Felder kräftefrei.
Richtig ist dagegen: Wir müssen die Geschwindigkeit v durch den generalisierten
Impuls
p = mv + eA
ersetzen und erhalten die Hamiltonfunktion
H=
1
(p − eA)2 + eΦ ,
2m
(144)
die sehr wohl vom Vektorpotential A und damit vom Magnetfeld abhängt. Ein
konstantes Magnetfeld trägt zwar nicht zum Zahlenwert von H, nämlich der
Energie, bei (beachte F ⊥ v!), es beeinflußt aber die Abhängigkeit der Hamiltonfunktion von ihrer natürlichen Variablen p.
68
3
3.1
Dynamik des starren Körpers
Modell und Koordinaten des starren Körpers
Bisher haben wir nur punktförmige Massen betrachtet. Als idealisiertes Modell für
ausgedehnte Massenverteilungen führen wir nun den Begriff des starren Körpers
ein. Wir verstehen darunter ein System von n Massenpunkten (meistens im Limes
n → ∞) mit festen Abständen, also mit den Zwangsbedingungen
|ri − rj | = dij
(i, j = 1, . . . n) .
(145)
Die Zahl f der Freiheitsgrade des starren Körpers läßt sich offenbar nicht ermitteln, indem man die Zahl der Nebenbedingungen von 3n subtrahiert. Denn die
n(n − 1)/2 Bedingungen (145) können nicht unabhängig sein. Wir ermitteln f
daher, indem wir das Gerüst aus Massenpunkten schrittweise aufbauen:
Der erste Massenpunkt m1 hat drei Freiheitsgrade, die wir beispielsweise durch
die drei Komponenten von r1 beschreiben.
Fügen wir einen zweiten Massenpunkt m2 hinzu, so ist m2 durch die Zwangsbedingung |r2 − r1 | = d12 an eine Kugeloberfläche um m1 gebunden. Der zweite
Massenpunkt bringt also zwei weitere Freiheitsgrade . Als entsprechende Koordinaten können wir etwa zwei Polarkoordinaten zur Angabe der Richtung der
Verbindungslinie von m1 nach m2 benutzen.
Ein dritter Massenpunkt m3 außerhalb dieser Verbindungslinie kann sich wegen
der beiden Zwangsbedingungen |r3 − r1 | = d13 und |r3 − r2 | = d23 nur noch auf
einem Kreis bewegen. Dem entspricht ein weiterer Freiheitsgrad. Als zugehörige
Koordinate können wir z.B. einen Winkel wählen, der die Rotation von m3 um
die Achse durch m1 und m2 beschreibt.
Bei diesen 3 + 2 + 1 = 6 Freiheitgraden bleibt es beim weiteren Aufbau, denn
jeder weitere Massenpunkt ist bereits durch die Festlegung seiner Abstände zu
m1 , m2 und m3 fixiert. Im Prinzip könnten wir die bei der obigen Konstruktion
verwendeten sechs speziellen Koordinaten zur Beschreibung der Lage des starren
Körpers benutzen. Eine solche willkürliche Wahl erscheint jedoch weder rational
noch ökonomisch. Wir wollen stattdessen einen bestimmten Punkt des starren
Körpers (meist, aber nicht immer, seinen Schwerpunkt) als Koordinatenursprung
eines körpereigenen Koordinatensystems auszeichnen und seine Lage durch drei
Koordinaten beschreiben. Die restlichen drei Koordinaten dienen zur Festlegung
der Orientierung des körpereigenen Koordinatensystems.
Bezeichnen wir die Achsen eines raumfesten kartesischen Koordinatensystems mit
e1 , e2 und e3 , die des körperfesten Systems mit e01 , e02 und e03 , so bietet es sich
69
zunächst an, die Orientierung durch die Richtungskosinus
aij = e0i · ej
(i, j = 1, . . . 3)
zu kennzeichnen. Mit ihrer Hilfe erhält man auch sofort die Transformationsgleichungen
3
X
e0i =
aij ej
und ek =
3
X
ajk e0j
(146)
j=1
j=1
zwischen den raumfesten und körpereigenen Basisvektoren. Nach dem selben
Schema transformieren sich die Komponenten eines Vektors
x=
X
xj e j =
Denn aus den inneren Produkten
x · e0i =
X
j
xj e0i · ej
X
x0j e0j .
und x · ek =
X
j
x0j e0j · ek
lesen wir ab
x0i =
X
aij xj
und xk =
ajk x0j .
(147)
j
j
Die Matrix
X


a11 a12 a13

A =  a21 a22 a23 

a31 a32 a33
ist also nicht nur geeignet, die Orientierung des starren Körpers zu beschreiben, sondern sie ermöglicht auch einen bequemen Übergang vom raumfesten zum
körpereigenen Koordinatensystem und umgekehrt.
Allerdings eignen sich die neun Richtungskosinus nicht als generalisierte Koordinaten, denn die Orientierung entspricht nur drei Freiheitsgraden. Die Elemente
der Matrix A können also nicht unabhängig sein, und in der Tat finden wir, daß
sie durch die drei Orthogonalitätsrelationen
e0i · e0k =
X
aij akj = 0
(i, k = 1, . . . 3, i 6= k)
j
(148)
und durch die drei Normierungen
2
e0i =
X
a2ij = 1
j
70
(i = 1, . . . 3)
(149)
eingeschränkt sind. Matrizen mit diesen Einschränkungen heißen orthogonal.
Unsere orthogonale Matrix A muss sich also durch drei unabhängige Parameter
(generalisiete Koordinaten) darstellen lassen. Für eine solche Darstellung verwendet man gern die Eulerschen Winkel φ, θ und ψ, die wir anhand einer Skizze
einführen:
e3
e3’
e2’
θ
φ
e1
e2
ψ
e1’
Knotenlinie
Ausgangspunkt ist die Knotenlinie, in der sich die e1 –e2 – und die e01 –e02 –Ebene
schneiden. Von der Knotenlinie aus gemessen ist e1 durch den Winkel −φ und
e01 durch den Winkel ψ charakterisiert. θ ist der Winkel zwischen den beiden
Ebenen und damit der Winkel zwischen der e3 – und der e03 –Achse. Der Übergang
vom raumfesten Koordinatensystem (e1 , e2 , e3 ) zum körpereigenen Koordinaten
(e01 , e02 , e03 ) läßt sich damit in drei Schritten vollziehen:
Im ersten Schritt drehen wir das Koordinatensystem (e1 , e2 , e3 ) um den Winkel
φ um die e3 –Achse, so daß ẽ1 in der Knotenlinie liegt. Diese Drehung beschreiben
wir mit den Transformationsgleichungen
~
e2
ẽ1 = cos φe1 + sin φe2
ẽ2 = − sin φe1 + cos φe2
ẽ3 = e3 .
e2
~
e1
φ
e1
Als nächstes kippen wir das System (ẽ1 , ẽ2 , ẽ3 ) um den Winkel θ um die Knotenlinie (ẽ1 –Achse). Für diese Drehung gilt
71
(~)
e3
e^ 3
ê1 = ẽ1
ê2 = cos θẽ2 + sin θẽ3
ê3 = − sin θẽ2 + cos θẽ3 .
e^ 2
Θ
e~2
Im letzen Schritt drehen wir (ê1 , ê2 , ê3 ) um den Winkel ψ um die ẽ3 –Achse und
erhalten damit das neue Koordinatensystem
e01
e02
e03
e2’
= cos ψê1 + sin ψê2
= − sin ψê1 + cos ψê2
= ê3 .
e^ 2
e1’
ϕ
e1
Um die drei Schritte bequemer zu notieren, benutzen wir die Matrizenschreibweise








e1
ẽ1




 ẽ2  = A1  e2 
e3
ẽ3
ẽ1
ê1




 ê2  = A2  ẽ2 
ẽ3
ê3
ê1
e01


 0 
 e2  = A3  ê2 
ê3
e03





(150)


(151)


(152)
cos φ sin φ 0


A1 =  − sin φ cos φ 0  ,
0
0
1
mit
1
0
0


A2 =  0 cos θ sin θ  ,
0 − sin θ cos θ
mit
mit

cos ψ sin ψ 0


A3 =  − sin ψ cos ψ 0  .
0
0
1
Hierbei haben wir Basisvektoren als Zeilenvektoren24 notiert. Die Matrizenmultiplikation folgt der Regel ’Zeile × Spalte’ oder genauer: Das Element in der i–ten
Zeile und k– ten Spalte der Produktmatrix C=AB ist das innere Produkt
cik =
X
aij bjk
j
der i–ten Zeile von A und der k–ten Spalte von B.
Mit dieser Regel der Produktbildung wird auch die (nicht kommutative!) Hintereinanderausführung der Einzeltransformationen beschrieben. Für die Gesamttransformation [vgl. Gl. (146)]
24
Das entspricht gerade der Repräsentation von Vektoren x durch ihre Koordinatenspalten
xi , vgl. Gln. (146,147).
72
e1
e01


 0 
 e2  = A  e2 
e3
e03




bzw.
e01
e1


∗  0 
 e2  = A  e2 
e03
e3




(153)
erhält man damit nach einiger Rechnung25
A = A 3 A2 A1 =

(154)

cos ψ cos φ − cos θ sin φ sin ψ
cos ψ sin φ + cos θ cos φ sin ψ sin θ sin ψ


 − sin ψ cos φ − cos θ sin φ cos ψ − sin ψ sin φ + cos θ cos φ cos ψ sin θ cos ψ  .
sin θ sin φ
− sin θ cos φ
cos θ
Die Matrix A∗ der Rück transformation erhält man für orthogonale Transformationen nach (146) einfach durch Transposition, d.h. durch Vertauschung von Zeilen
und Spalten oder durch Spiegelung an der Hauptdiagonalen.
Wir haben damit das prinzipielle Rüstzeug bereitgestellt, die sechs Freiheitsgrade
des starren Körpers durch die drei Koordinaten x0 , y0 und z0 des Ursprungs eines
körpereigenen Koordinatensystems sowie die drei Eulerschen Winkel φ θ und ψ
zu beschreiben. Wegen der Komplexität werden wir diesen systematischen Weg
jedoch nach Möglichkeit vermeiden. Der Vollständigkeit halber notieren wir uns
abschließend lediglich noch, wie sich die Winkelgeschwindigkeit ω durch die Änderung der Eulerschen Winkel ausdrücken läßt. Wenn wir uns an die Drehachsen
der drei Einzeltransformationen zurückerinnern, finden wir zunächst
ω = φ̇e3 + θ̇ê1 + ψ̇e03 .
Diese gemischte Darstellung möchten wir auf das körpereigene Koordinatensystem umrechnen. Dazu erinnern wir daran, daß die Rück transformation durch
die transponierte Matrix beschrieben wird und lesen aus (153, 154) ab
e3 = sin θ sin ψe01 + sin θ cos ψe02 + cos θe03 .
Ebenso folgt aus Gl. (152)
ê1 = cos ψe01 − sin ψe02 .
Damit erhalten wir
ω = (sin θ sin ψ φ̇ + cos ψ θ̇)e01
+ (sin θ cos ψ φ̇ − sin ψ θ̇)e02 + (cos θ φ̇ + ψ̇)e03 .
(155)
Natürlich könnten wir ω mit dem selben Rechenaufwand auch im raumfesten System (e1 , e2 , e3 ) darstellen. Dieses spielt — obwohl es im Gegensatz zu (e01 , e02 , e03 )
ein Inertialsystem ist — bei der Behandlung des starren Körpers jedoch eine
untergeordnete Rolle, da die Massenverteilung nur im körpereigenen System festliegt.
25
Beachte die Reihenfolge der Faktoren!
73
3.2
Das Eulersche Theorem
Wir betrachten die Bewegung eines starren Körpers und sehen zunächst einmal
von der Translation des Ursprungs des körpereigenen Koordinatensystems ab.
Dann wird die Orientierung durch eine orthogonale Matrix A(t) beschrieben. Zum
Zeitpunkt t = 0 falle das körpereigene mit dem raumfesten Koordinatensystem
zusammen, dann gilt also


1 0 0


A(0) = 1 =  0 1 0  .
0 0 1
(156)
Im vorigen Abschnitt haben wir gesehen, daß die Orientierung des Körpers zur
Zeit t, die durch A(t) repräsentiert wird, durch drei Drehungen aus der Anfangslage erzeugt werden kann. Wir wollen nun untersuchen, ob hierzu auch eine einzige Drehung ausreicht. Der mathematische Formalismus zur Beantwortung dieser
Frage wird uns gleichzeitig elementare Anschauung zu einem wichtigen abstrakten
Kapitel der Mathematik liefern.
Woran erkennt man, daß eine orthogonale Transformation A einer Drehung entspricht? Daran, daß Vektoren x, die in Richtung der Drehachse zeigen, durch die
Transformation nicht geändert werden:
Ax = x .
Diese Gleichung stellt einen Spezialfall des Eigenwertproblems
(A − λ1)x = 0
(157)
dar, mit dem wir uns nun befassen müssen. Dabei bezeichnet 1 die Einheitsmatrix,
λ heißt Eigenwert und x Eigenvektor der Matrix A.
Trivialerweise ist mit x auch jeder gestreckte Vektor αx Eigenvektor von A. Damit aber überhaupt eine nicht triviale Lösung von Gl. (157) existiert, muß die
“charakteristische Gleichung”
det (A − λ1) = 0
(158)
erfüllt sein. Durch eine Induktion, bei der man die Determinante nach der ersten
Zeile (oder Spalte) entwickelt, weist man leicht nach, daß die charakteristische
Gleichung einer n×n–Matrix auf ein Polynom n–ten Grades in λ führt. Lösungen
der charakteristischen Gleichung können daher i.a. komplex sein. Solche Lösungen
sind für uns natürlich nicht interessant. Im Falle ungerader n, also insbesondere
in unserem Fall n = 3, besitzt jede Polynomgleichung aber mindestens eine reelle
74
Lösung λ mit einem nicht trivialen Eigenvektor x. Vektoren, die in die Richtung
von x zeigen, behalten also bei einer Transformation mit A ihre Richtung bei.
Nun ist es eine Besonderheit der orthogonalen Transformationen, daß sie Skalarprodukte (und damit Entfernungen) invariant lassen26 . Wir können den Beweis
in prägnanter Form führen, wenn wir das Skalarprodukt als Matrizenprodukt von
Zeilenvektoren27 und Spaltenvektoren auffassen und uns den trivialen Zusammenhang
(AB)∗ = B∗ A∗
(159)
klarmachen. Aus
x0 = Ax und y0 = Ay
folgt dann nämlich
0
x0 · y0 = x ∗ y0 = (Ax)∗ Ay = x∗ A∗ Ay = x∗ y = x · y .
(160)
Hierbei haben wir in der Form
A∗ A = 1 = AA∗
(161)
von unserer früheren Feststellung [vgl. Gl. (153)] Gebrauch gemacht, daß die
Umkehrtransformation einer orthogonalen Transformation A durch die Matrix
A∗ beschrieben wird. (Die entsprechende Gleichung
X
aij akj = δik
j
in Koeffizientenschreibweise faßt unsere Gln. (148) und (149) zusammen.)
Insbesondere bleibt bei orthogonalen Transformationen also die Norm jedes Vektors erhalten:
x0 · x0 = x · x .
Da für einen Eigenvektor x zu dem (reellen) Eigewertλ außerdem
x0 = λx
gilt, folgt λ2 = 1. Für orthogonale Matrizen sind also nur die reelen Eigenwerte
λ = 1 und λ = −1 möglich. Für die Ausgangsmatrix A(0) = 1 ist trivialerweise jeder Vektor Eigenvektor zum Eigenwert λ = +1. Mit den Koeefizienten der Matrix
A(t) sind aber auch die Eigenwerte stetige Funktionen der Zeit. Wenn sich nun
λ(t) stetig aus λ(0) = 1 entwickeln soll und überhaupt nur die Werte +1 und −1
26
Wir haben hiervon bereits in naiver Unschuld implizit Gebrauch gemacht, als wir die
Zwangsbedingungen (145) aufgestellt und das körpereigene Koordinatensystem eingeführt haben!
27
Die Zeilenvektoren sind mathematisch die Elemente des Dual raums zum Vektorraum der
Spaltenvektoren.
75
infrage kommen, so bleibt λ = +1 als einzige Möglichkeit über28 . Zu jeder orthogonalen Transformation, die die Orientierung eines starren Körpers beschreibt,
gibt es also eine ausgezeichnete Richtung, eine Drehachse, deren Vektoren bei der
Transformation invariant bleiben.
Gibt es noch mehrere solche Richtungen? Wenn ja, dann muß — wie man in der
linearen Algebra zeigt — λ = 1 mehrfacher Eigenwert von A sein. Nun tauchen
komplexe Lösungen der charakteristischen Gleichung immer nur in konjugiert
komplexen Paaren auf. Unser charakteristisches Polynom hat also genau eine oder
gleich drei reelle Lösungen. Ist λ = +1 dreifacher Eigenwert, dann gibt es auch
drei linear unabhängige Eigenvektoren. Da auch jede Linearkombination wieder
ein Eigenvektor ist, bleibt in diesem Fall jeder Vektor invariant, d.h. wir haben
die identische Transformation A = 1. Zu jeder nicht identischen orthogonalen
Transformation gibt es also genau eine invariante Drehachse.
Wir wollen uns das an dem Beispiel der Drehungen eines Buchs von S. 23 verdeutlichen:
z
z
z
y
y

e01
 e02 
e03

e02 = e3
= A

x
x
x
Das Endresultat e01 = e2
y
e03 = e1 notieren wir in der Form

e1
 e2 
e3
mit A =

0 1 0
 0 0 1 
1 0 0

.
Nach S. 23 können wir A durch zwei Drehungen D1 und D2 erzeugen. [Wenn wir
beachten, daß D2 im körpereigen System des Buchs formuliert werden muß,
erhalten wir dafür die Matrizen

1 0 0
D1 =  0 0 1 
0 −1 0

und

0 0 −1
D2 =  0 1 0 
1 0 0

und überzeugen uns, daß tatsächlich D2 D1 = A gilt.] Um das selbe Resultat
durch eine Drehung zu erhalten, lösen wir das Eigenwertproblem von A. Zunächst
erhalten wir die charakteristische Gleichung
det(A − λ1) =
−λ 1
0
0 −λ 1
1
0 −λ
= 1 − λ3 = 0,
die — was von vornherein klar war — λ = +1 als einzigen reellen Eigenwert
liefert. Der zugehörige Eigenvektor muß das Gleichungssystem
28
Daneben kann auf dem Umweg über die komplexe Ebene ein doppelter Eigenwert −1 auftreten (z.B. eine Drehung um π um die z–Achse, bei der sowohl x als auch y ihr Vorzeichen
wechseln).
76



−1 1
0
x1
 0 −1 1   x2 
1
0 −1
x3
=


−x1 + x2
 −x2 + x3 
x1 − x 3
=


0
 0 
0
erfüllen. Die Gleichungen sind natürlich nicht unabhängig, man erhält beispielsweise die dritte Gleichung durch Addition der ersten beiden. Wir wählen daher
eine Komponente beliebig, z.B. x3 = 1. Daraus folgt dann x1 = x2 = 1. Wir
erhalten die gewünschte Transformation also durch eine Drehung um die Achse,
die in Richtung der Raumdiagonalen x = e1 + e2 + e3 zeigt.
Den abstrakten mathematischen Satz formulieren wir physikalisch als das Eulersche Theorem
• Die allgemeinste Auslenkung eines starren Körpers, der in einem Punkt
festgehalten wird, ist eine Drehung um eine wohldefinierte Achse.
Wenn wir nun noch die Bewegung des Koordinatenursprungs unseres körpereigenen Koordinatensystems hinzunehmen, ergibt sich fast selbstverständlich der
Satz von Cashle
• Die allgemeinste Auslenkung eines starren Körpers setzt sich aus einer
Translation und einer Drehung zusammen.
Wegen dieses Satzes liegt es nahe, das gesamte Bewegungsproblem des starren
Körpers in die separaten Probleme der Translation und der Drehung zu zerlegen.
Eine solche Zerlegung ist auch häufig, aber keineswegs immer möglich.
Sie ist trivialerweise möglich, wenn ein Punkt (oder gar eine ganze Drehachse) des
Körpers festgehalten wird. Man wird dann den (bzw. einen) festgehalten Punkt
als Ursprung des körpereigenen Koordinatensystems benutzen und braucht nur
die Drehung zu beschreiben. In diese Gruppe fallen die meisten Kreiselprobleme.
Die Separation ist aber auch möglich, wenn die potentielle Energie des starren
Körpers nur von seiner Lage (Beispiel: homogenes Schwerefeld) oder nur von
seiner Orientierung (Beispiel: Dipol im homogenen Magnetfeld) abhängt. Denn
im Abschnitt 1.9 haben wir gesehen, daß die kinetische Energie [vgl. Gl. (69)]
und der Drehimpuls [vgl. Gl. (77)] in einen Schwerpunkts– und einen inneren
Anteil aufgespalten werden können. In diesem Fall muß man also den Ursprung
des körpereigenen Koordinatensystems in den Schwerpunkt legen.
Wegen der Komplexität des Gesamtproblems werden wir uns im folgenden ausschließlich mit der Behandlung separierbarer Probleme befassen. (Selbst hierbei
werden wir nur einige besonders einfache Probleme auswählen). Da die Schwerpunktsbewegung als die Bewegung eines Massenpunktes beschreibbar ist, können
wir uns hierbei auf die Dynamik der Drehung beschränken.
77
3.3
Der Trägheitstensor
Um die Untersuchung der Dynamik des starren Körpers vorzubereiten, berechnen
wir zunächst seinen Drehimpuls. Wie erwähnt wollen wir dabei von einer möglichen Translation absehen und beziehen uns auf den Ursprung des körpereigenen
Koordinatensystems. Wir lassen von nun an auch den 0 zur Kennzeichnung dieses
Systems weg, da wir uns im folgenden, wenn nicht ausdrücklich etwas anderes
gesagt wird, immer darauf beziehen. Unter diesen Gegebenheiten erhalten wir
nach Gl. (74) den Drehimpuls
l=
X
i
mi ri × ṙi =
Z
P
r × ṙ dm .
(162)
Z
Das Symbol Σ soll an dieser Stelle auf die verschiedenen Modelle der Massenverteilung im starren Körper hinweisen. Wir verstehen darunter insbesondere
Z
P
. . . dm =
X
(. . .)i mi
(163)
i
bzw. =
Z
. . . ρdV
Z
. . . σdA
bzw. = ,
. . . τ ds
bzw. =
Z
wenn der Körper als ein System von Massenpunkten mi , durch eine räumliche
Verteilung der Massendichte ρ, durch eine flächenhafte Massenverteilung σ (z.B.
Blech) oder durch eine linienhafte Verteilung τ (z.B. Draht) beschrieben wird.
Natürlich können solche Modelle auch kombiniert auftreten (z.B. Draht mit Perlen). Wir verzichten in Zukunft auf diese explizite Erinnerung und benutzen das
Integralzeichen.
Wenn wir uns nun an die Beziehung29
ṙ = ω × r
[vgl. (57)] erinnern, erhalten wir aus (162)
l=
oder in Komponenten
li =
29
Z

Z
r 2 ωi
r × (ω × r) dm =
− ri
X
j

ωj r j 
Z
dm =
(r 2 ω − r ω · r) dm
X
j
ωj
Z
(r 2 δij − ri rj ) dm .
Beachte, wir rechnen im körpereigenen Koordinatensystem. Die zeitliche Ableitung ṙ =
dr/dt in Gl. (162) ist aber im Intertialsystem zu bilden.
78
Mit dem Trägheistensor30
Θij =
Z
(r 2 δij − ri rj ) dm oder Θ =
Z
y 2 +z 2 −xy
−xz

2
2
x +z
−yz 
 dm (164)
 −xy
2
2
−xz
−yz x +y


gilt also
li =
X
Θij ωj
oder l = Θ ω ,
(165)
j
wobei an die Regel “Zeile × Spalte” für das Matrizenprodukt erinnert sei. Wir
stellen also fest, daß wir bei der Berechnung des Drehimpulses l die Massenverteilung durch die symmetrische Matrix Θ repräsentieren können. Der Drehimpuls
l hat im allgemeinen nicht die selbe Richtung wie die Winkelgeschwindigkeit ω,
sondern hängt mit ihr über das Matrizenprodukt Θ ω zusammen.
Auch bei der Berechnung der kinetischen Energie wird die Massenverteilung durch
Θ repräsentiert, es gilt nämlich
1Z 2
1Z
ṙ dm =
ṙ · (ω × r) dm
2
2
Z
1
1
=
ω · r × ṙ dm = ω · l .
2
2
T =
Mit Gl. (165) erhalten wir deshalb die einprägsame Beziehung
T =
1
1
1X
ω · Θ ω = ω∗Θ ω =
Θij ωi ωj ,
2
2
2 ij
(166)
die T als quadratische Form in den Komponenten von ω ausweist.
Wenn eine feste Drehachse n durch den Koordinatenursprung vorgegeben ist,
kann der Trägheitstensor Θ durch das Trägheitsmoment Θn um diese Drehachse
ersetzt werden. Mit ω = ωn folgt nämlich
T =
1
Θn ω 2
2
mit Θn = n · Θn .
(167)
Mit der Definition des Trägheitstensors folgt
Θn = n ·
Z
[r 2 n − (n · r)r] dm =
Z
[r 2 − (n · r)2 ] dm .
Wenn wir im Integranden [r 2 − rk2 ] schließlich noch den Satz des Pythagoras
berücksichtigen, erhalten wir die vertraute Formel
30
Ein Tensor ist mathematisch durch sein Transformationsverhalten definiert. Wir verstehen
darunter einfach eine Matrix.
79
Θn =
Z
2
r⊥
dm ,
(168)
die das Trägheitsmoment durch den senkrechten Abstand r⊥ der Massen von
der Drehachse ausdrückt. Dieser Ausdruck ergibt sich auch aus der elementaren
Anschauung über vrot = ωr⊥ .
Fällt die Drehachse speziell mit einer Koordinatenachse zusammen (n = ei ),
finden wir das zugehörige Trägheitsmoment
Θn = Θii
in der Hauptdiagonalen des Trägheitstensors. Die Elemente Θi6=j außerhalb der
Hauptdiagonalen werden auch Fliehkraft– oder Deviationsmomente genannt. Sie
erzeugen bei einer gleichmäßigen Rotation Drehmomente in den Lagern.
Häufig ist es wünschenswert, einen Koordinatenursprung r0 außerhalb der Drehachse zu wählen. Ausgehend von der Drehachse schreiben wir dann
r⊥ = r0⊥ + r0⊥
und erhalten
Θ =
2
r0⊥
Z
dm + 2r0⊥ ·
2
= M r0⊥
+ 2r0⊥ ·
Z
Z
r0⊥ dm
+
Z
0
r⊥2 dm
r0⊥ dm + Θ0 .
Links steht die gesamte Masse des Körpers multipliziert mit dem Quadrat des Abstandes des Koordinatenursprungs r0 von der Drehachse und rechts das Trägheitsmoment um eine parallele Drehachse durch den Koordinatenursprung. Im allgemeinen verhindert jedoch der Term in der Mitte eine einfache Transformationsformel. Wenn jedoch der Schwerpunkt rS als Koordinatenursprung r0 gewählt
wird, verschwindet das Integral im mittleren Term und wir erhalten den Satz
von Steiner
2
Θ = ΘS + M rS⊥
,
(169)
in Worten:
• Das Trägheitsmoment um eine gegebene Achse ist gleich dem Trägheitsmoment um eine parallele Achse durch den Schwerpunkt plus dem Produkt aus
der Gesamtmasse und dem Quadrat des Abstands des Schwerpunkts von
der Drehachse.
80
Da der Schwerpunkt häufig auch durch eine Symmetrie desKörpers ausgezeichnet
ist, bietet der Steinersche Satz eine nützliche Rechenhilfe zur Bestimmung von
Tägheitsmomenten. Als weitere Rechenhilfe notieren wir für eine ebene Massenverteilung in der x–y–Ebene die Beziehungen
Θzz = Θxx + Θyy
und Θxz = Θyz = 0,
(170)
welche direkt aus Gl. (165) folgen.
Beispiel: Wir betrachten ein physikalisches Pendel, also einen starren Körper, der
sich frei um eine gegebene Achse drehen kann. Θ sei das Trägheitsmoment um
diese Achse und a der Abstand des Schwerpunkts von der Drehachse. Mit der
generalisierten Winkelkoordinate ϕ erhalten wir dann dieLagrangefunktion
1
L = T − V = Θϕ̇2 + M ga cos ϕ
2
und die Bewegungsgleichung
Θϕ̈ + M ga sin ϕ = 0 .
Das entspricht der Gleichung für das mathematische Pendel (vgl. S. 45) mit einer
effektiven Pendellänge
Θ
`eff =
.
Ma
Nach dem Steinerschen Satz können wir Θ gemäß
Θ = ΘS + M a2
aus dem Trägheitsmoment ΘS um eine parallele Drehachse durch den Schwerpunkt berechnen. Die effektive Pendellänge
`eff = a +
ΘS
Ma
ist daher immer größer als der Abstand a des Schwerpunkts vom Aufhängepunkt.
Hierin zeigt sich der Beitrag der Rotation des starren Körpers um den Schwerpunkt zur gesamten kinetischen Energie.
Als spezielles Beispiel für die Massenverteilung wählen wir eine homogene Kreisscheibe vom Radius R um den Koordinatenursprung in der x–y–Ebene. Dann
wird
ZR
Z
R4
2
2
Θzz = (x + y ) dm = σ r 2 2πr dr = 2πσ
,
4
0
2
oder wegen σ = M/(πR )
1
Θzz = M R2 .
2
81
Mit der Symmetrie und Gl. (170) folgt daraus sofort der gesamte Trägheitstensor


1 0 0
Mr 

Θ=
 0 1 0 .
4
0 0 2
2
Für eine Drehung um die z–Achse durch den Schwerpunkt haben wir das Trägheitsmoment ΘS = Θzz = M R2 /2. Legen wir parallel dazu eine senkrechte Drehachse durch die Peripherie (a = R), so bildet die Kreisscheibe ein physikalisches
Pendel mit der effektiven Pendellänge
3
`eff = R .
2
Wählt man dagegen eine tangentiale Drehachse in der Peripherie, so müssen wir
von ΘS = Θxx = M R2 /4 ausgehen und erhalten
5
`eff = R .
4
3.4
Trägheitshauptachsen
Über den Drehimpuls und die kinetische Energie ist das dynamische Verhalten
des starren Körpers wesentlich durch seinen Trägheitstensor bestimmt. Für eine
einfache Formulierung der Dynamik stören hierbei die Nicht–Diagonal–Elemente.
Darum fragen wir nach einem speziellen körpereigenen Koordinatensystem, dem
Hauptachsensystem, in dem der Trägheitstensor die Diagonalgestalt


I1 0 0


Θ =  0 I2 0 
0 0 I3
(171)
annimt. Im Hauptachsensystem gelten für den Drehimpuls und die kinetische
Energie die einfachen Beziehungen
li = I i ω i
bzw. l =
X
I i ωi e i
(172)
i
und
T =
1X
Ii ωi2 .
2 i
(173)
Gibt es nun immer so ein schönes Hauptachsensystem? Und wenn ja: Wie finde
ich es? Zur Beantwortung dieser Frage gehen wir von der Beziehung (172) für den
Drehimpuls aus.
82
Wenn es eine Hauptachse e gibt, so gilt bei einer Rotation ω = ωe um diese
Hauptachse
l = Iω ,
l und ω haben also dieselbe Richtung. Vergleichen wir das mit der allgemeinen
Beziehung
l = Θω,
so sehen wir uns mit dem Eigenwertproblem
(Θ − I1)ω = 0
(174)
konfrontiert. Wir müssen insbesondere die Frage beantworten, ob wir drei reelle
Eigenwerte I1 , I2 , I3 und zugehörige linear unabhängige Eigenvektoren finden.
Die Frage nach reellen Lösungen ist im allgemeinen im Reellen viel schwieriger
zu beantworten, als wenn man das Problem in eine komplexe Theorie einbettet.
Wir verallgemeinern darum den Begriff der transponierten Matrix zum Begriff
der adjungierten Matrix, die neben der Spiegelung an der Hauptdiagonalen durch
einen Übergang zu konjugiert komplexen Koeffizienten gekennzeichnet ist:
(. . . aij . . .)∗ = (. . . a∗ji . . .) .
Über einspaltige Matrizen übertragen wir die Begriffsbildung auf Vektoren: Der zu
einem komplexen Spaltenvektor a adjungierte Vektor a∗ ist also ein Zeilenvektor
mit konjugiert komplexen Koeffizienten. Das im Sinne der Matrizenmultiplikation
erklärte Skalarprodukt
a · b = a∗ b = α
b · a = b∗ a = α ∗
liefert eine komplexe Zahl und ist nicht mehr kommutativ. Reell ist dagegen das
Skalarprodukt
x · x = x∗ x = |x|2 ,
das man benutzen kann, um dem Vektor x eine Norm oder Länge zuzuordnen.
Nach diesen Erklärungen sehen wir uns den Trägheitstensor an und stellen fest,
daß er reell und symmetrisch ist. Er ist also sowohl gegen die Spiegelung an der
Hauptdiagonalen als auch gegen die komplexe Konjugierung invariant und erfüllt
die Relation
Θ∗ = Θ .
Matrizen (auch mit komplexen Koeffizienten), die diese Relation erfüllen, heißen
selbstadjungiert.
Mathematisch handelt es sich bei unserer Fragestellung also um das Eigenwertproblem selbstadjungierter Matrizen A. Um das zu untersuchen, gehen wir von
der Eigenwertbeziehung
Axi = λi xi
83
aus und multiplizieren von links mit dem Eigenvektor x∗k :
x∗k Axi = λi x∗k xi .
Nun nutzen wir die Voraussetzung, daß A selbstadjungiert ist, zur Umformung
der linken Seite aus und erhalten
x∗k Axi = (A∗ xk )∗ xi = (Axk )∗ xi = (λk xk )∗ xi = λ∗k x∗k xi .
Durch Vergleich finden wir die Relation
(λ∗k − λi )x∗k xi = 0 ,
aus der wir (für i = k bzw. i 6= k) zwei wichtige Folgerungen ablesen:
1. Alle Eigenwerte selbstadjungierter Matrizen sind reell.
2. Die Eigenvektoren zu verschieden Eigenwerten selbstadjungierter Matrizen
sind orthogonal.
Für eine beliebige n × n – Matrix A hat die charakteristische Gleichung [vgl.
Gl. (158)]S
det(A − λ1) = 0 ,
als Polynomgleichung n–ten Grades grundsätzlich n (möglicherweise komplexe)
Lösungen λi . Bei einer selbstadjungierten Matrix sind diese n Eigenwerte sämtlich
reell. Sind alle Eigenwerte zudem verschieden, so stehen die Eigenvektoren automatisch senkrecht aufeinander und definieren in natürlicher Weise ein Hauptachsensystem.
Im Falle mehrfacher Eigenwerte spricht man von Entartung. Man kann nun zeigen (was anschaulich durch einen stetigen Übergang von verschiedenen zu gleichen Eigenwerten klar ist), daß die Eigenvektoren zu einem ν–fach entarteten
Eigenwert einen ν–dimensionalen Unterraum aufspannen. Aus einer Basis dieses
Unterraums lassen sich dann durch ein geeignetes Orthogonalisierungsverfahren
stets ν orthogonale Eigenvektoren bilden. Wir können also sicher sein, daß wir
zu unserem Satz von n Eigenwerten immer n orthogonale Eigenvektoren angeben
können, die unser Hauptachsensystem aufspannen.
Unser Ausgangsproblem, ein Hauptachsensystem zu finden, in dem der Trägheitstensor Diagonalgestalt annimmt, besitzt also immer eine Lösung, die sich nach
dem folgenden Rezept gewinnen läßt:
1. Benutze ein beliebiges rechnerisch günstiges (z.B. Symmetrie) körpereigenes
Koordinatensystem zur Bestimmung des Trägheitstensors Θ nach Gl. (164).
84
2. Bilde die charakteristische Gleichung
Θ11 −I
Θ12
Θ13
Θ12
Θ22 −I
Θ23
det(Θ − I1) =
Θ13
Θ23
Θ33 −I
= 0.
(175)
Die drei (reellen) Lösungen (Eigenwerte) I1 , I2 und I3 dieser Gleichung sind
die Hauptträgheitsmomente.
3. Bestimme aus den 3 Gleichungsystemen (ν = 1, 2, 3)


Θ11 −Iν
Θ12
Θ13

Θ
Θ
−I
Θ23 
(Θ − Iν 1)eν = 
eν = 0
12
22
ν
Θ13
Θ23
Θ33 −Iν
(176)
drei Eigenvektoren eν . Wegen der verschwindenden Determinante sind die
Lösungen nicht eindeutig und können durch eine Zusatzforderung (z.B. Normierung) festgelegt werden. Wenn alle Hauptträgheitsmomente verschieden
sind, sind die eν automatisch orthogonal und können (ggf. nach einer Umnumerierung) als Basis des Hauptachsensystems benutzt werden. Sind zwei
Hauptträgheitsmomente gleich, kann man aus der Lösungsmenge von (176)
zwei zugehörige orthogonale Eigenvektoren auswählen. [Sind alle drei Eigenwerte gleich, so ist jedes orthogonale Koordinatensystem ein Hauptachsensystem.]
Wir behandeln als Beispiel einen Drahthaken in der x–y–Ebene (siehe Skizze)
mit der homogen Massebelegung τ = M/(4a).
1. Wir bleiben im Koordinatensystem x, y, z und finden durch einfache Rechnungen und/oder Symmetrieüberlegungen
Θyy = τ
Za
−a
2
2
x2 dx = τ a3 = M a2
3
12
85
Θxx = Θyy +
Θxy = −2τ
Za
0
8
M 2
a = M a2
2
12
ax dx = −τ a3 = −
3
M a2 .
12
Aus Gl. (170) lesen wir außerdem
10
M a2 und Θxz = Θyz = 0
12
ab. Damit erhalten wir den Trägheitstensor
Θzz = Θxx + Θyy =


8 −3 0
1

2
Θ = M a  −3 2 0  .
12
0
0 10
2. Mit I = λM a2 /12 folgt daraus die charakteristische Gleichung
8 − λ −3
0
−3 2 − λ
0
0
0
10 − λ
= [(8 − λ)(2 − λ) − 9](10 − λ) = 0 .
Aus der Gleichung [. . .] = λ2 − 10λ + 7 = 0 finden wir
√
√
λ1 = 5 − 3 2 und λ2 = 5 + 3 2 ,
und (. . .) = 0 ergibt sofort
λ3 = 10.
Damit haben wir die Hauptträgheitsmomente Iν = λν M a2 /12 ermittelt.
3. Da alle Eigenwerte verschieden sind, erhalten wir aus den Gleichungen



eν1
8 − λν
−3
0



2 − λν
0
  eν2  = 0
 −3
eν3
0
0
10 − λν
automatisch drei orthogonale Eigenvektoren eν . Zu λ3 = 10 liest man unmittelbar e3 = (0, 0, 1) ab, die alte z–Achse ist also bereits Hauptachse.
Für ν = 1 und 2 folgt sofort eν3 = 0, diese Eigenvektoren liegen also in der
x–y–Ebene. Die beiden Gleichungen
(8 − λν )eν1 − 3eν2 = 0
−3eν1 + (2 − λν )eν2 = 0
sind nicht linear unabhängig. Wir benutzen daher nur die erste und erhalten
die Achsenneigungen
eν2
8 − λν
= tan αν =
eν1
3
oder
√
√
α1 = atn(1 + 2) = 67.5o und α2 = atn(1 − 2) = 157.5o .
Die Hauptachsen mit diesen Richtungen sind in der Skizze bereits eingezeichnet.
86
3.5
Trägheitsellipsoid und Poinsotsche Konstruktion
Die Eigenwerte des Trägheitstensors sind nicht nur reell, sondern sogar positiv,
wie man an der Hauptachsenform (173)
T =
1X
Ii ωi2
2 i
der kinetischen Energie erkennt. Die Fäche T = const beschreibt also ein Ellipsoid
im ω–Raum31 . Das selbe Ellipsoid wird natürlich auch durch die (positiv definite!)
quadratische Form [vgl. (166)]
T =
1X
Θij ωi ωj
2 i,j
(177)
in anderen Koordinatensystemen beschrieben. Die Ellipsoide zu verschiedenen
Werten von T sind einander ähnlich, und es ist üblich (aber nicht notwendig),
das normierte Ellipsoid (setze etwa w = ω/(2T )1/2 )
w · Θw =
X
Θij wi wj = 1
(178)
i,j
als Trägheitsellipsoid zu bezeichnen. Speziell im Hauptachsensystem erfüllt das
Trägheitsellipsoid die Gleichung
X
ν
Iν wν2 = 1 .
(179)
Die Halbachsen aν des Trägheitsellipsoids sind also durch
1
aν = √
Iν
(180)
gegeben; eine große Halbachse entspricht einem kleinen Hauptträgheitsmoment
und umgekehrt. Allgemeiner folgt durch Vergleich der Gln. (167) und (178), daß
der Abstand
|w| = √
1
Θw
(181)
eines Punkts w auf dem Trägheitsellipsoid vom Ursprung das Trägheitsmoment
Θw um die durch w angebene Drehachse charakterisiert.
31
Nur wenn die Massenverteilung ausschließlich auf eine Gerade beschränkt ist, wird ein
Eigenwert Null, und das Ellipsoid entartet zu einem Kreiszylinder.
87
Durch einen Vergleich der Symmetrie eines Ellipsoids mit Symmetrien des starren Körpers folgt, daß die Entartung des Eigenwertproblems des Tägheitstensors
kein seltener Ausnahmefall ist. Vielmehr entartet das Trägheitsellipsoid offenbar
immer zum Rotationsellipsoid, wenn der Körper invariant gegen eine Drehung
um 2π/n mit n ≥ 3 um eine Symmetrieachse ist. Die Symmetrieachse wird dann
selbst Hauptachse32 , und die beiden andern Hauptachsen können in der Ebene senkrecht dazu beliebig gewählt werden. Gibt es eine weitere entsprechende
Symmetrieachse, so entartet das Trägheitellipsoid sogar zur Kugel. In dem Fall
ist jedes beliebige Orthogonalsystem Hauptachsensystem. Wir illustrieren das an
einigen Beispielen:
Gls. Dreieck
Vierkantstab
Würfel
Tetraeder
Zugehöriges Trägheitsellipsoid (schematisch):
Wir verzichten im folgenden auf die (triviale) Normierung und bezeichnen die
Fläche T = const im ω–Raum als Trägheitsellipsoid.
Wegen der fundamentalen Bedeutung des Drehimpulses bilden wir nach Gl. (177)
li =
X
Θij ωj =
j
∂T
∂ωi
oder
l = ∇ω T .
(182)
Der Gradient ∇ω T steht senkrecht auf der Fläche T = const, denn für alle dω aus
der Tangentialebene gilt ja
dT = ∇ω T · dω = 0 .
Daraus folgt, daß der Drehimpulsvektor in die Richtung der Oberflächennormalen
des Trägheitsellipsoids zeigt. Wir können also die Drehimpulsrichtung zu einer
32
Das gilt bereits für n = 2. Dabei liegt aber noch keine Entartung vor.
88
gegebenen Drehachse (ω) finden, indem wir im Punkt ω auf dem Trägheitsellipsoid die Flächennormale errichten (siehe Skizze). Diese geometrische Bestimmung
heißt Poinsotsche Konstruktion.
l
ω
[Wir wenden die Poinsotsche Konstruktion auf die Bewegung des kräftefreien
Kreisels an. Darunter verstehen wir einen starren Körper, der in einem Punkt
festgehalten wird, und auf den keine Kräfte wirken. Wegen V = 0 haben wir die
Integrale
T = const und l = const .
Wir wählen die l–Richtung als raumfeste z–Achse. Dann ist
ωz =
2T
ω·l
=
|l|
|l|
offenbar ebenfalls konstant. Der Bewegung des Kreisels entspricht eine Drehung
des Trägheitsellipsoids um den Ursprung. Diese Drehung erfolgt also so, daß das
Trägheitsellipsoid in jedem Zeitpunkt die “invariable Ebene” ωz = const berührt:
T=const
ω
ωz
ωz =const
z,l
Bei der Bewegung wandert der Berührungspunkt weiter und beschreibt
(a) auf dem Ellipsoid (also im körperfesten Koordinatensystem) die “Polhodie”
und
(b) auf der invariablen Ebene (also im raumfesten Koordinatensystem) die
“Herpolhodie”.
89
Die beiden Wanderungen erfolgen mit der selben Geschwindigkeit, denn wegen
ω × ω = 0 gilt
!
!
dω
dω
=
.
dt Körper
dt Raum
Damit läßt sich die Bewegung des kräftefreien Kreisels wie folgt charakterisieren:
• Das Trägheitsellipsoid rollt bei festgehaltenem Mittelpunkt ohne zu gleiten
über die invariable Ebene. Die momentane Winkelgeschwindigkeit ist dabei
durch den Abstand des Berührungspunktes vom Mittelpunkt gegeben.
Mit dieser geometrischen Beschreibung ist die Bewegung des kräftefreien Kreisels vollständig beschreiben. Die analytische Formulierung (die wir nicht mehr
anstreben) ist jedoch recht verwickelt und führt auf elliptische Integrale.
Beim symmetrischen Kreisel entartet das Trägheitsellipsoid zum Rotationsellipsoid und Polhodie sowie Herpolhodie werden einfache Kreise. Vom Körper aus
betrachtet beschreiben daher die Vektoren ω und l Kegel um die Figurenachse. Diese Bewegung wird Nutation (lat. nutare = nicken, wanken) oder auch
reguläre Präzession33 genannt. Im raumfesten System bewegen sich ω und die
Figurenachse auf Kegeln um den konstanten Drehimpuls l.]
3.6
Die Eulerschen Kreiselgleichungen
Wir hatten im Abschnitt 3.1 gesehen, daß die Eulerschen Winkel geeignete
generalisierte Koordinaten zur Beschreibung der Drehung des starren Körpers
sind. Wegen der recht komplexen Transformationsgleichungen ist es jedoch häufig
günstiger, direkt von der Grundgleichung
d
l=M
dt
(183)
auszugehen, als denLagrangeschen Formalismus auf dieEulerschen Winkel anzuwenden. Gl. (183) bezieht sich natürlich zunächst auf ein raumfestes Koordinatensystem. Den Trägheitstensor — und damit den Zusammenhang zwischen
ω und l — können wir jedoch nur in einem körpereigenen Koordinatensystem
angeben. Wir benutzen also die Beziehungen
d
=
dt
d
dt
!
Körper
+ω×
und
33
dl
dt
!
= Θ ω̇ ,
Körper
Um die Begriffe Nutation und Präzession herrscht eine bedauerliche Sprachverwirrung.
Man muß alt/neu, deutsch/amerikanisch und physikalisch/astronomisch unterscheiden. Vgl.
auch Fußnote 39, S. 97.
90
um Gl. (183) ins körpereigene System zu transformieren und erhalten
Θ ω̇ + ω × Θ ω = M .
Die komponentenweise Anschrift dieser Gleichung wird wesentlich vereinfacht,
wenn wir das Koordinatensystem der Trägheitshauptachsen benutzen:






I1 ω̇1
ω1
I 1 ω1

 
 

I
ω̇
ω
+
×
 2 2   2   I 2 ω2  = M .
I3 ω̇3
ω3
I 3 ω3
Wenn wir schließlich das Kreuzprodukt noch explizit ausmultiplizieren, erhalten
wir die Eulerschen Kreiselgleichungen
I1 ω̇1 + (I3 − I2 )ω2 ω3 = M1
I2 ω̇2 + (I1 − I3 )ω1 ω3 = M2
I3 ω̇3 + (I2 − I1 )ω1 ω2 = M3 .
(184)
Wir weisen nochmals darauf hin, daß sich diese Gleichungen auf das körpereigene
Hauptachsensystem bezieht. Eine dieser Gleichungen — mit unserer speziellen
Festlegung der Koordinaten die dritte — erhält man auch als Lagrangegleichung
zum Eulerschen Winkel ψ. Die beiden andern folgen dann durch zyklische Vertauschung der Indizes.
[Um das zu zeigen, bilden wir die kinetische Energie
1
1
1
T = I1 ω12 + I2 ω22 + I3 ω32
2
2
2
und setzen die Komponenten
ω1 = sin θ sin ψ φ̇ + cos ψ θ̇
ω2 = sin θ cos ψ φ̇ − sin ψ θ̇
ω3 = cos θ φ̇ + ψ̇
aus Gl. (155) ein:
T =
I2
I3
I1
(sin θ sin ψ φ̇+cos ψ θ̇)2 + (sin θ cos ψ φ̇−sin ψ θ̇)2 + (cos θ φ̇+ ψ̇)2 . (185)
2
2
2
Wenn wir damit die Lagrangegleichung
∂T
∂V
d ∂T
−
=−
dt ∂ ψ̇
∂ψ
∂ψ
91
bilden, erhalten wir
I3 ω̇3 − I1 ω1 ω2 + I2 ω2 ω1 = −
∂V
.
∂ψ
Damit bleibt nur noch zu bestätigen, daß −∂V /∂ψ die Komponente M3 des Drehmoments im körpereigenen Koordinatensystem ist. Das folgt aber aus der Figur
auf S. 71, da ψ die Drehung um die körpereigene z–Achse beschreibt.]
3.7
Die kräftefreie Bewegung des starren Körpers
Wir erinnern daran, daß wir annehmen, daß ein Punkt des Körpers festgehalten wird, oder daß wir die Schwerpunktsbewegung als uninteressant abspalten.
Die verbleibende Drehung des kräftefrein Kreisels wird durch die Eulerschen
Gleichungen
I1 ω̇1 = (I2 − I3 )ω2 ω3
I2 ω̇2 = (I3 − I1 )ω1 ω3
I3 ω̇3 = (I1 − I2 )ω1 ω2 .
(186)
beschrieben. Die resultierende Bewegung haben wir im Abschnitt 3.5 mit der
Poinsotschen Konstruktion bereits geometrisch beschrieben. Die analytische Beschreibung ist wegen der Nichtlinearität der Eulerschen Gleichungen im allgemeinen schwierig34 . Wir werden uns daher auf zwei einfache Spezialfälle beschränken, bei denen dieEulerschen Gleichungen linear werden.
1. Stabile Drehachsen des starren Körpers
Wenn alle Hauptträgheitsmomente verschieden sind, ist eine gleichförmige kräftefreie Rotation ω = const des Kreisels nach Gl.(186) nur um die Hauptträgheitsachsen möglich. Wir nehmen an, daß der Körper um die z–Achse rotiert und
fragen nach der Stabilität dieser Rotation. Dazu betrachten wir kleine Abweichungen ω1 , ω2 von der ausgezeichneten Rotationsrichtung. Damit meinen wir,
daß wir quadratische Terme (ω12 , ω22 und hier insbesondere ω1 ω2 ) vernachlässigen
können. Dadurch werden dieEulerschen Gleichungen linearisiert. Aus der letzten Gl. (186) folgt sofort die gleichförmige Rotation ω3 = const. Daher erhalten
wir aus den ersten beiden Gleichungen
ω̇1 = −Ω1 ω2
mit Ω1 =
34
I3 − I 2
ω3 ,
I1
Die Lösung läßt sich zwar generell auf Quadraturen zurückführen, führt jedoch auf nicht–
elementare (elliptische) Funktionen.
92
I3 − I 1
ω3 .
I2
Wenn wir eine dieser Gleichungen noch einmal nach t differenzieren und die andere
einsetzen, folgt
ω̈1,2 = −Ω1 Ω2 ω1,2 .
ω̇2 = Ω2 ω1
mit Ω2 =
Diese Gleichung entspricht einer Schwingungsgleichung
ω̈1,2 + Ω2 ω1,2 = 0 mit Ω2 = Ω1 Ω2 ,
falls Ω1 und Ω2 das selbe Vorzeichen haben. Diese Vorraussetzung ist erfüllt,
wenn I3 das größte oder das kleinste Hauptträgheitsmoment ist. In diesem Fall
reagiert der Kreisel also auf eine kleine Störung mit kleinen Schwingungen um
die Drehachse:
• Eine Rotation um die Drehachse mit dem größten oder kleinsten Hauptträgheitsmoment ist stabil.
Ist I3 dagegen das mittlere Hauptträgheitsmoment, so ist Ω1 Ω2 < 0, und wir
erhalten exponentiell wachsende Störungen
ω1,2 ∼ exp(|Ω1 Ω2 |1/2 t) :
• Eine Rotation um die Hauptachse mit dem mittleren Hauptträgheitsmoment ist labil.
2. Der kräftefreie symmetrische Kreisel
Beim symmetrischen Kreisel werden zwei Hauptträgheitsmomente, etwa I1 und
I2 , gleich. Damit folgt aus der dritten Gl. (186)
ω3 = const ,
d.h. die Projektion der Winkelgeschwindigkeit auf die Symmetrieachse ist konstant. Da ω3 nun eine Integrationskonstante darstellt, werden auch die beiden
übrigenEulerschen Gleichungen linear:
ω̇1 = −Ωω2
ω̇2 = Ωω1
mit
Ω=
I3 − I 1
ω3 .
I1
Die allgemeinen Lösungen dieser Gleichungen sind Kreise
ω1 = ω⊥ cos[Ω(t − t0 )]
ω2 = ω⊥ sin[Ω(t − t0 )] ,
93
(187)
wie man z.B. durch direktes Einsetzen erkennt35 .
Die Spitze des Vektors ω durchläuft also mit der Nutationsfrequenz Ω einen Kreis
um die Figurenachse, die Polhodie (vgl. S. 89). Mit der selben Frequenz rotiert
auch der (raumfeste!) Drehimpuls (im körpereigenen System!) um die Figurenachse.
Die Nutation ist je nach dem Vorzeichen von I3 − I1 vor – oder rück läufig. Sie
verschwindet, wenn (außer I2 auch noch) I3 = I1 wird, wenn also das Trägheitsellipsoid zur Kugel entartet. Für Kugel kreisel ist daher eine gleichförmige Rotation
um jede Achse möglich, wie man auch sofort an Gl. (186) erkennt.
Dies gilt angenähert auch für die rotierende Erde. Die Abplattung führt jedoch
zu einer kleinen Abweichung
I3 − I 1
1
≈
,
I1
300
die einer Nutationsfrequenz
2π
300 Tage
entspricht. Tatsächlich findet man bei der Erdrotation Polschwankungen einer
Amplitude von rund 5 Metern. Der Pol wandert jedoch nicht auf einem Kreis
sondern beschreibt eine eher irreguläre Kurve. Und statt der erwarteten Nutationsperiode von 300 Tagen = 10 Monaten beobachtet man eine gewisse Periodizität mit der Chandlerschen Periode von etwa 14 Monaten. Die Abweichungen
werden auf die Deformierbarkeit des Erdkörpers und auf größere Massenbewegungen zurückgeführt.
Ω=
Die Nutationsfrequenz (187) bezieht sich wohlgemerkt auf die Beobachtung im
körpereigenen Koordinatensystem, das selbst rotiert. Eine Übersetzung ins raumfeste Koordinatensystem, in dem ω und die Figurenachse um den konstanten
Drehimpuls l rotieren (vgl. Abschnitt 3.5), ist wegen der verschiedenen Achsrichtungen etwas unübersichtlich. Fällt die Symmetrieachse annähernd mit der
Drehimpulsrichtung zusammen (ω ≈ ω3 ), sieht ein raumfester Beobachter die
Nutationsfrequenz
I3
ωN ≈ ω + Ω ≈ ω .
(188)
I1
(Eine exakte Beschreibung folgt im nächsten Abschnitt.)
3.8
Der Lagrangeformalismus für den Kreisel
Wegen der Komplexität des Problems beschränken wir uns von vornherein auf
den symmetrischen Kreisel mit I1 = I2 , denn die Symmetrie bewirkt erhebliche
35
Systematisch findet man das am einfachsten über die DGL für w = ω1 + iω2 . Eine andere
Möglichkeit beruht auf dem Nachdifferenzieren, vgl. vorige Seite und Abschnitt 1.7.
94
Vereinfachungen. Zunächst lassen sich in den ersten beiden Termen der kinetischen Energie (185) die Beiträge mit sin ψ und cos ψ entweder zusammenfassen
(Pythagoras) oder sie verschwinden:
1
1
T = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 .
2
2
Bei den Kräften, die auf den Kreisel einwirken, beschränken wir uns auf ein
homogenes Schwerefeld. Auch hier erhalten wir eine wesentliche Vereinfachung
durch die Symmetrie, da der Schwerpunkt auf der Symmetrieachse liegt: Das
zugehörige Potential36
V = V0 cos θ
mit V0 = mgzS
hängt nur vom Winkel θ zwischen der raumfesten und der körpereigenen z–Achse
ab.
Die Symmetrievoraussetzung hat nicht nur die Anschrift
1
1
L = T − V = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 − V0 cos θ
2
2
(189)
derLagrangefunktion vereinfacht, ihr ist auch zu verdanken, daß neben der
Koordinate φ auch noch ψ zyklisch geworden ist. Wir lesen aus (189) daher die
beiden Erhaltungsgrößen
pψ = I3 (cos θ φ̇ + ψ̇) und
pφ = I1 sin2 θ φ̇ + pψ cos θ
(190)
(191)
ab. pψ und pφ sind (nicht orthogonale) Komponenten des Drehimpulses. Die Komponente [vgl. (155)]
p ψ = I 3 ω3
(192)
in Richtung der körpereigenen z–Achse ist konstant, da der Kraftarm der Gewichtskraft in diese Richtung weist und folglich das entsprechende Moment verschwindet. Ebenso ist die Drehimpulskomponete pφ in Richtung der raumfesten
z–Achse konstant, denn die Kraft selbst zeigt in diese Richtung, und daher verschwindet das entsprechende Moment. Während also die Existenz der Erhaltungsgrößen (190) und (191) auch aus der physikalischen Anschauung nachvollziehbar
ist, wird die explizite Formulierung durch denLagrangeformalismus zumindest
wesentlich erleichtert.
36
Die selbe Abhängigkeit (mit V0 = µB) ergibt sich auch für einen Kreisel mit konstantem
Dipolmoment µ im homogenen Magnetfeld B.
95
Die Zahlenwerte von pφ und pψ ergeben sich aus den Anfangsbedingungen. Damit
lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) gewinnen, wenn
θ(t) bekannt ist. θ(t) läßt sich aus der Lagrangegleichung
I1 θ̈ − I1 sin θ cos θ φ̇2 + pψ sin θ φ̇ − V0 sin θ = 0
(193)
bestimmen, wenn man φ̇ mit Gl. (191) eliminiert. Damit läßt sich die Lösung
im Prinzip auf Quadraturen zurückführen. Dieser systematische Weg ist jedoch
ziemlich aufwendig und wenig instruktiv. Wir wollen daher versuchen, die Charakteristika der Bewegung mit geringerem Aufwand zu erkennen. Dazu unterscheiden
wir noch einmal den kräftefreien und den schweren Kreisel.
1. Der kräftefreie symmetrische Kreisel
Hier haben wir V0 =0, und im raumfesten Koordinatensystem ist keine Richtung
mehr a priori ausgezeichnet. Da der Drehimpuls nun konstant wird, ist es günstig,
die raumfeste z–Achse in seine Richtung zu legen. Damit gilt
pφ = j und
pψ = j cos θ ,
(194)
(195)
wenn j den Betrag des Drehimpulses bezeichnet. Bei der Bewegung bleibt also
auch der Winkel θ zwischen Figurenachse und Drehimpuls konstant:
Die Figurenachse bewegt sich auf dem Mantel des Nutationskegels (vgl. Abschnitt
3.5, S. 90). Setzen wir (194) und (195) in (191) ein37 , so erhalten wir
j = I1 sin2 θ φ̇ + j cos2 θ
oder
φ̇ = ωN =
j
.
I1
(196)
Die Knotenlinie — und damit auch die Figurenachse — läuft also mit konstanter
Winkelgeschwindigkeit φ̇ um die Drehimpulsrichtung. Damit haben wir Gl. (188)
präzisiert und die Nutation im raumfesten System exakt beschrieben.
Zusätzlich rotiert der der Körper mit der Winkelgeschwindigkeit ψ̇ um seine Figurenachse. Für diese Rotation erhalten wir aus Gl. (190)
I3 ψ̇ = pψ − I3 cos θ φ̇ ,
oder mit (195) und (196)
37
Das selbe Ergebnis folgt mit θ = const 6= 0 auch aus den Gln. (193) und (191).
96
ψ̇ =
1
1
−
j cos θ .
I3 I1
(197)
Die gesamte momentane Winkelgeschwindigkeit
ω = ψ̇e3 + φ̇el
setzt sich additiv aus den beiden Rotationen mit ψ̇ und φ̇ zusammen und liegt
in der Ebene, die von der Figurenachse e3 und dem Drehimpuls l aufgespannt
wird. ω läuft also ebenfalls mit der konstanten Winkelgeschwindigkeit φ̇ auf einem
Kegelmantel um den konstanten Drehimpuls.
2. Der schwere symmetrische Kreisel
Im Gegensatz zum kräftefreien Kreisel ist nun der gesamte Drehimpuls l nicht
mehr konstant38 , und die z–Richtung des raumfesten Systems ist durch das Schwerefeld von außen vorgegeben. Trotzdem existieren auch beim schweren Kreisel partikuläre Lösungen mit θ = const und φ̇ = const, bei denen also die Figurenachse
mit konstanter Winkelgeschwindigkeit auf einen Kegelmantel um die raumfeste
z–Achse läuft. Diese Bewegung der Figurenachse des schweren Kreisels nennt
man Präzession39 (lat. praecedere = vorangehen).
Wenn wir θ = const in Gl. (193) einsetzen, erhalten wir für φ̇ die quadratische
Gleichung
−I1 cos θ φ̇2 + pψ φ̇ − V0 = 0 .
(198)
Ihre Lösung
1 I 3 ω3
φ̇ =
1∓
2 I1 cos θ
s
4V0 I1 cos θ
1−
I32 ω32
!
(199)
(bei der wir von der Gl. (192) pψ = I3 ω3 Gebrauch gemacht haben) zeigt zunächst,
daß die gleichförmige Präzession einen Mindestwert ω3 für die Rotation um die
Figurenachse erfordert. Diese Bedingung ist trivial erfüllt, wenn wir uns für den
“schnellen” Kreisel interessieren, der so rasch um seine Symmetrieachse rotiert,
daß I3 ω3 bzw. I3 ω32 groß gegen alle konkurrierenden Drehimpulse bzw. Energien
ist. Für den schnellen Kreisel gilt insbesondere
pψ = I3 ω3 I1 φ̇ und I3 ω32 V0 .
38
Wohl aber die Komponenten pφ und pψ , vgl. (190) und (191).
Auf der mathematischen Analogie beruht die alternative Bezeichnung “reguläre Präzession”
für die Nutation des kräftefreien Kreisels. Physikalisch stellt die Präzession des schweren Kreisels
ein von der Nutation grundlegend verschiedenes Phänomen dar. Vgl. auch die beiden folgebden
Fußnoten.
39
97
Damit scheidet das untere Vorzeichen in Gl. (199) aus. Durch Entwicklung der
Wurzel oder durch direkte Vernachlässigung des quadratischen Terms in Gl. (198)
erhalten wir für die Präzession eine gleichförmige Winkelgeschwindigkeit
V0
V0
=
,
pψ
I 3 ω3
φ̇ = ωP =
(200)
die nicht von der Neigung θ der Figureanchse gegen das Schwerefeld abhängt. Die
Präzession erfolgt um so langsamer, je schneller der Kreisel rotiert.
Diese gleichförmige Präzession ist nur eine partikuläre Lösung des Problems. Um
die grundsätzliche Struktur der allgemeinen Lösung aufzuzeigen, nehmen wir kleine Abweichungen
θ = θ0 + δ
von der speziellen Lösung θ = θ0 an. Dann folgt aus (191) eine ungleichförmige
Präzessionsgeschwindigkeit
pφ − pψ cos θ
I1 sin2 θ
pψ sin θ0
pφ − pψ cos θ0
pφ − pψ cos θ0
≈
+δ
− 2δ
cos θ0
2
2
I1 sin θ0
I1 sin θ0
I1 sin3 θ0
pψ
= ωP +
δ − 2ωP tan θ0 δ .
I1 sin θ0
φ̇ =
Hierbei haben wir bereits für θ = θ0 die gleichförmige Präzession ωP des schnellen
Kreisels nach Gl. (200) eingesetzt. Für kleine δ können wir schließlich noch den
dritten Term gegen den ersten vernachls̈sigen und erhalten
φ̇ = ωP +
pψ
δ.
I1 sin θ0
(201)
Wenn wir dies in die Lagrangegleichung (193) einsetzen und gleichzeitig für den
schnellen Kreisel (pψ I1 φ̇) den zweiten gegen den dritten Term vernachlässigen,
erhalten wir
p2
δ̈ + ψ2 δ = 0 .
(202)
I1
δ und damit θ oszilliert also mit der selben Frequenz40
j
pψ
≈
= ωN ,
I1
I1
40
Man beachte die verschiedenen Koordinatensysteme bei der Beschreibung des kräftefreien
und des schweren Kreisels. Daß der Eulersche Winkel φ einmal die Nutation und einmal die
Präzession beschreibt, mag wesentlich zu der sprachlichen Verwirrung beigetragen haben!
98
die nach Gl. (196) die Nutation des kräftefreien Kreisels beschreibt. Mit der selben
Frequenz schwankt daher nach Gl. (201) auch die Präzessionsgeschwindigkeit φ̇
um ihren Mittelwert ωP . Wir schließen daraus, daß die allgemeine Bewegung des
schnellen schweren Kreisels durch eine gleichförmige Präzession mit überlagerter
Nutation41 beschrieben wird.
Je nach der Amplitude δmax der Nutation kann die Bewegung eines Punktes auf
der Kreiselachse (etwa des sogenannten Locus mit dem Abstand 1 von der festgehaltenen Kreiselspitze) wellig verlaufen oder mit zeitweise rückläufiger Präzession
Schleifen bilden (siehe Skizze). Der Grenzfall einer zykloidischen Bahn mit Spitzen
entspricht den Anfangsbedingungen θ̇(0) = 0 und φ̇(0) = 0. Dies ist kein akademischer Spezialfall, sondern beschreibt die Bewegung eines schweren Kreisels, der
zunächst festgehalten, und dann plötzlich dem Schwerefeld ausgesetzt wird.
Bahn des Locus eines schweren symmetrischen Kreisels (nach Goldstein)
Der Vollständigkeit halber erwähnen wir, daß sich der schwere symmetrische Kreisel auch ohne
weitere Vorraussetzungen und Näherungen exakt beschreiben läßt. Dazu ergänzt man die beiden
Integrale (190) und (191) durch den Energiesatz [vgl. (189)]
T +V =
1
1
I1 (sin2 θ φ̇2 + θ̇2 ) + I3 (cos θ φ̇ + ψ̇)2 + V0 cos θ = E .
2
2
Eliminieren wir hier ψ̇ und φ̇ durch (190) und (191), so erhalten wir
1 2
I1 θ̇ + Veff (θ) = E
2
mit dem effektiven Potential
Veff (θ) =
p2ψ
(pφ − pψ cos θ)2
+
+ V0 cos θ .
2I3
2I1 sin2 θ
41
Da die überlagerte Nutation bei einem hinreichend schnellen Kreisel kaum zu beobachten
ist, spricht man auch von pseudoregulärer Präzession.
99
Da das effektive Potential für θ = 0 und θ = π unendlich wird, muß sich θ zwischen zwei
Umkehrpunkten θ1 und θ2 bewegen. Hierin erkennen wir die Nutation wieder. Ihre exakte mathematische Beschreibung gemäß
r
I1
dθ
p
= dt
2 E − Veff (θ)
führt mit der Substitution u = cos θ auf das elliptische Integral
Z
I1 du
t=− q
p2ψ
2I1 (1 − u2 )(E − 2I3 − V0 u) − (pφ − pψ u)2
mit einem Polynom dritten Grades (für V0 6= 0) in u unter der Wurzel im Nenner. Nach
der Bestimmung von θ(t) lassen sich φ(t) und ψ(t) durch Integration von (190) und (191)
bestimmen.
3.9
Zum elementaren Verständnis des Kreisels
Der Kreisel findet nicht nur zahlreiche technische Anwendungen sondern ist auch
ein zeitlos beliebtes Spielzeug. Seine scheinbar paradoxe Reaktion auf äußere
Kräfte stellt dabei eine nicht ganz triviale Aufgabe an die physikalische Anschauung. Wenn wir nun elementare Betrachtungen nachtragen, so zielen wir damit auf
das anschauliche Verständnis der Präzession. Denn die überlagerte Nutation ist
mehr oder weniger selbsverständlich, wenn die Richtung des Drehimpulses nicht
mit einer Hauptachse (der Symmetrieachse) zusammenfällt (vgl. Abschnitt 3.5).
Die einfachste elementare Begründung der Präzession des schnellen Kreisels geht
direkt vom Drehimpulssatz aus. Auf den Kreisel wirkt eine Kraft vom Betrag
F = mg
längs der raumfesten zR –Achse. Diese Kraft greift im Schwerpunkt mit dem Kraftarm zS in Richtung der körpereigenen zK –Achse an und erzeugt ein Drehmoment
vom Betrag
M = mgzS sin θ = V0 sin θ .
Es steht senkrecht auf beiden z–Achsen, zeigt also in die Richtung der Knotenlinie
(vgl. Skizze und die Figur auf S. 71).
zR
M
θ
zS
100
F
zK
Dieses Drehmoment verändert nun den Drehimpuls l, der für den schnellen Kreisel
angenähert durch l = I3 ω3 e3 gegeben ist. Seine raumfeste zR –Komponente pφ ≈
I3 ω3 cos θ bleibt konstant, da das Drehmoment keine zR –Komponente besitzt. Die
Projektion l⊥ in die raumfeste x–y–Ebene steht senkrecht auf der Knotenlinie,
der Betrag
l⊥ = I3 ω3 sin θ
bleibt daher ebenfalls konstant. Durch das Drehmoment wird l⊥ jedoch gemäß
l⊥ dφ = M dt
gedreht. Damit erhalten wir in Übereinstimmung mit (200) eine Präzessionsgeschwindigkeit
dφ
M
V0 sin θ
=
=
= ωP ,
dt
l⊥
I3 ω3 sin θ
aus der sich die Abhängigkeit vom Neigungswinkel θ herauskürzt.
Die soweit skizzierte Betrachtung ist zwar mathematisch besonders einfach, aber
noch wenig hilfreich für das anschauliche Verständnis. Sie geht nämlich von dem
integralen Drehimpulssatz aus und sagt nichts darüber aus, welche Kräfte an
welchen Massenpunkten des Kreisels die Wirkung der Schwerkraft kompensieren
und das Kippen des Kreisels verhindern. Eine in dieser Hinsicht aufschlußreichere
Interpretation der Präzession ergibt sich in dem Koordinatensystem, das mit ωP
um die zR –Achse rotiert, das also der Präzession (nicht aber der Rotation) der
Kreiselachse folgt. In diesem System erfahren die Massenpunkte des rotierenden
Kreisels eine Corioliskraft FC1 , die senkrecht zur zR –Achse gerichtet ist (siehe
Skizze).
ZR
FC1
ωp
FC1
Speziell bei den Massenpunkten am ’oberen’ Kreiselrand zeigt diese Kraft nach
’innen’, bei denen am ’unteren’ Rand nach ’außen’. Dadurch entsteht ein Drehmoment M1 , das den Kreisel aufzurichten versucht. Dieses Drehmoment kompensiert
das entgegengesetzte Moment der Gewichtskraft.
101
Auch diese Interpretation kann noch nicht voll befriedigen, da sie bereits von der
Präzession ausgeht statt sie zu erklären. Welche Kraft zwingt also den Kreisel
senkrecht auszuweichen, wenn er dem Schwerefeld ausgesetzt wird?
Gar keine! Der Kreisel beginnt zu kippen, wie jeder Körper, der in einem Punkt
festgehalten wird, im Schwerefeld kippt. Dabei erlangt er eine wachsende Winkelgeschwindigkeit θ̇ um die Knotenlinie. Und diese Drehung erzeugt nun ebenfalls
eine Corioliskraft FC2 (siehe Skizze).
zR
Fc2
Fc2
θ
Sie steht senkrecht auf der Knotenlinie und ist am ’rechten’ Kreiselrand nach
’innen’, am ’linken’ nach ’außen’ gerichtet. Dadurch entsteht ein Drehmoment
M2 , dem der Kreisel ebenfalls folgt: Er beginnt zu präzedieren.
Die Präzession erzeugt nun ihrerseits das oben beschriebene Drehmoment M1 ,
das dem Moment der Schwerkraft entgegenwirkt und es schließlich kompensiert.
Aufgrund der Trägheit schießt der Kreisel aber über dieses ’Ziel’ hinaus, er kippt
weiter und erfährt durch FC2 bzw. M2 eine weitere Beschleunigung der Präzession,
bis schließlich das wachsende Moment M1 die Kippbewegung zur Umkehr zwingt.
Nun wird θ̇ < 0 und M2 wechselt das Vorzeichen. Dadurch wird die Präzession
verlangsamt, bis sie schließlich ganz zum Stillstand kommt.
In diesem Punkt beginnt ein neuer Nutationszyklus. Die Kreiselachse führt also
insgesamt die Bewegung aus, die in der mittleren Figur von S. 99 skizziert ist.
Die Nutation ist daher am Aufbau der Präzession wesentlich beteiligt, ja, wir
können die Präzession als eine Folge von Versetzungen durch Nutationszyklen
auffassen. Erst wenn durch Reibung (die in unserer Analyse nicht enthalten ist)
die Amplitude der Nutation weggedämpft ist, erhalten wir die reine (reguläre)
Präzession mit der oben skizzierten Kompensation von Schweremoment und M1 .
102
4
Stabilität und kleine Schwingungen
In diesem Kapitel befassen wir uns mit einer Anwendung des Lagrangeformalismus auf die Untersuchung der Bewegung in der Nähe von “Gleichgewichtszuständen”, d.h. von Ruhelagen des Systems. Reagiert das System mit Oszillationen auf kleine Störungen der Ruhelage (z.B. Kugel in einer Potentialmulde) , so
heißt der Gleichgewichtszustand stabil. Ein labiler Gleichgewichtszustand dagegen
(z.B. Kugel auf einem Potentialberg) wird endgültig verlassen, wenn die Ruhelage
gestört wird. Methodisch benutzen wir in diesem Kapitel das wichtige Werkzeug
der Linearisierung. Wir behandeln das Problem hier im Anschluß an die Dynamik des starren Körpers, weil wir dabei von unserer mathematischen Vorarbeit
bei der Hauptachsentransformation des Trägheitstensors profitieren können.
Da es sich bei dem Problem – wie gesagt – um eine Anwendungen und nicht um
Grundlagen handelt, kann dieses Kapitel ohne Schaden für das folgende ausgelassen werden.
4.1
Gleichgewichte und kleine Abweichungen
Wir betrachten ein mechanisches System mit holonomen Zwangsbedingungen,
das wir durch die generalisierten Koordinaten q1 , . . . qf beschreiben. Wenn wir
uns außerdem auf skleronome42 Zwangsbedingungen beschränken, erhalten wir
aus der Rücktransformation
xν = hν (q)
die kinetische Energie (vgl. S. 60)
T = T2 =
f
n
X
1X
∂hν ∂hν
mν
q̇i q̇j .
2 ν=1
i,j=1 ∂qi ∂qj
Wir wollen schließlich noch annehmen, daß alle Kräfte aus einem Potential herleitbar sind. Dann erhalten wir die Lagrangefunktion
f
1 X
L=
Tij (q)q̇i q̇j − V (q)
2 i,j=1
mit
Tij (q) =
n
X
mν
ν=1
42
∂hν ∂hν
.
∂qi ∂qj
Über ein effektives Potential lassen sich auch viele Systeme mit rheonomen Zwangsbedingungen nach dem gleichen Schema behandeln. Im allgemeinen erfordert jedoch ein Anteil L1
(vgl. S. 60) in der Lagrangefunktion einen größeren mathematischen Aufwand, wie man am
Beispiel des Facaultschen Pendels oder des harmonischen Oszillators im Magnetfeld sieht.
103
Aus den Ableitungen
X
∂L
Tik q̇i ,
=
∂ q̇k
i
und
X ∂Tik
X
d ∂L
Tik q̈i +
=
q̇i q̇j
dt ∂ q̇k
i,j ∂qj
i
∂L
1 X ∂Tij
∂V
=
q̇i q̇j −
∂qk
2 i,j ∂qk
∂qk
folgen dann die Bewegungsgleichungen
X
i
Tik q̈i +
X
i,j
∂Tik 1 ∂Tij
−
∂qj
2 ∂qk
!
q̇i q̇j +
∂V
= 0.
∂qk
(203)
Wir interessieren uns nun speziell für Gleichgewichte q = q0 , q̇ = q̈ = 0. Hierfür
muß offenbar
∂V =0
(204)
∂qk q=q0
gelten, d.h. die generalisierte Kraft im Gleichgewichtspunkt muß verschwinden.
Wir nehmen o.B.d.A. (etwa, indem wir q durch q − q0 ersetzen) q0 = 0 an und
betrachten kleine Abweichungen vom Gleichgewicht. Damit meinen wir, daß wir
alle Glieder von höher als
• linearer Ordnung in q, q̇ und q̈ in den Bewegungsgleichungen bzw.
• quadratischer Ordnung in q und q̇ in der Lagrangefunktion
vernachlässigen. Damit entfällt der mittlere Term in der Bewegungsgleichung
(203). Außerdem können wir die kinetische Energie durch die symmetrische quadratische Form
f
1 X
T =
Tij q̇i q̇j
2 i,j=1
mit Tij = Tji = Tij (0)
(205)
in q̇ repräsentieren. Entsprechend können wir
V (q) = V (0) +
X
i
∂V 1 X ∂ 2 V qi +
qi qj
∂qi 0
2 i,j ∂qi ∂qj 0
bis zur quadratischen Ordnung in q entwickeln. Die bedeutungslose Konstante
V0 können wir o.B.d.A. gleich Null setzen. Im Gleichgewicht gilt nach Gl. (204)
außerdem ∂V /∂qi |0 = 0. Daher wird das Potential durch die symmetrische quadratische Form
104
f
1 X
V =
Vij qi qj
2 i,j=1
∂ 2 V mit Vij = Vji =
∂qi ∂qj 0
(206)
in q repräsentiert. Kleine Abweichungen vom Gleichgewicht werden also durch
die Lagrangefunktion
L=
1X
1
1X
1
Tij q̇i q̇j −
Vij qi qj = q̇∗ Tq̇ − q∗ Vq
2 i,j
2 i,j
2
2
(207)
und die Bewegungsgleichungen
X
(Tik q̈i + Vik qi ) = 0 oder Tq̈ + Vq = 0
(208)
i
mit symmetrischen f×f –Matrizen
T = (Tik ) und V = (Vik )
beschrieben.
4.2
Eigenfrequenzen und Stabilität
Gl. (208) ist ein linear homogenes Differentialgleichungssystem mit konstanten
Koeffizienten, das grundsätzlich elementar lösbar ist. Die einzige Schwierigkeit
liegt darin, daß die Gleichungen gekoppelt sind. Wir streben daher an, die Gleichungen durch eine Transformation
q = Aξ
oder qi =
X
ail ξl
(209)
l
zu entkoppeln, so daß Gl. (208) in
ξ¨l + λl ξl = 0
(210)
übergeht. Die entkoppelten Koordinaten ξl heißen Normalkoordinaten. Die
Eigenwerte λl erhalten wir, wenn wir
d2
→ −λ
dt2
in Gl. (208) einsetzen:
f
X
i=1
(Vik − λTik )qk = 0 oder (V − λT)q = 0
105
Dieses linear homogene Gleichungssystem für q besitzt nur dann nicht–triviale
Lösungen, wenn
det(V − λT) = 0
(211)
gilt. Wir werden im nächsten Abschnitt zeigen, daß dieses Polynom f –ten Grades
in λ tatsächlich f reelle Lösungen besitzt.
Für Eigenwerte λl > 0 erhalten wir harmonische Eigenschwingungen
ξl = cl cos ωl t + dl sin ωl t mit ωl =
q
λl .
Wir nennen ωl eine Eigenfrequenz oder Normalfrequenz des Systems.
Für Eigenwerte λl < 0 erhalten wir dagegen exponentielle Lösungen
ξl = cl exp(γl t) + dl exp(−γl t) mit γl =
q
−λl .
Der Sonderfall λl = 0 führt auf eine gleichförmige Variation
ξl = c l + d l t .
Dieser Fall erfordert im allgemeinen eine gesonderte Untersuchung, bei der höhere
Terme in den Abweichungen vom Gleichgewicht berücksichtigt werden müssen.
Zur Klassifizierung des Gleichgewichts können wir daher die folgenden Fälle unterscheiden:
• Alle λl > 0:
Das System führt bei einer kleinen Störung kleine Schwingungen um die
Gleichgewichtslage aus, das Gleichgewicht ist stabil.
• Mindestens ein λl < 0:
Das System läuft bei einer Störung exponentiell aus dem Gleichgewicht, das
Gleichgewicht ist labil.
• Alle λl ≥ 0 und mindestens ein λl = 0:
Das Gleichgewicht ist zunächst indifferent. In diesem Sonderfall kommen
jedoch im allgemeinen höhere Entwicklungsglieder zum Tragen und entscheiden letzendlich über die Stabilität.
Die folgende Analyse wird zeigen, daß diese Klassifizierung mit der elementaren
Anschauung übereinstimmt, die man aus der Beurteilung des Potentials in der
Umgebung des Gleichgewichts (Minimum, Sattelpunkt, Maximum) gewinnt:
106
Quadratische Form q∗ Vq
positiv definit
positiv semidefinit
negativ– oder indefinit
4.3
Gleichgewicht
stabil
indifferent
labil
Transformation auf Normalkoordinaten
Mit der Transformation (209) erhalten wir die kinetische Energie
1 ∗
T = ξ˙ T̂ξ˙ mit T̂ = A∗ TA
2
und die potentielle Energie
1
V = ξ ∗ V̂ξ mit V̂ = A∗ VA .
2
Wenn wir angenommen haben, mit dieser Transformation entkoppelte Bewegungsgleichungen (210) zu erhalten, so ist das gleichbedeutend mit der optimistischen
Erwartung, mit ein und derselben Transformation A sowohl T als auch V diagonalisieren zu können:
Vl
T̂kl = Tl δkl , V̂kl = Vl δkl und λl = .
Tl
Bei entsprechender Dehnung oder Stauchung der Achsen können wir dann sogar
T̂ = 1 verlangen.
Bevor wir diese überraschende Aussage beweisen, erinnern wir daran, daß T und
V reell symmetrische und damit selbstadjungierte Matrizen sind, und weisen auf
das im Abschnitt 3.4 zusammengestellte mathematische Rüstzeug hin. Danach
ist zunächst klar, das sowohl T als auch V einzeln mit verschiedenen orthogonalen Matrizen diagonalisiert werden können. Wir werden hiervon bei unserem
Existenzbeweis Gebrauch machen. Als Ergebnis werden wir eine nicht orthogonale
Matrix A finden, die das Gewünschte leistet.
Zum Beweis geben wir in schematischer Form Einzeltransformationen an und
verdeutlichen ihr Wesen anhand kleiner Skizzen:
Die Ausgangssituation sei durch
1
T = q̇Tq̇ ,
2
q2
1
V = qVq
2
mit nicht diagonalen Matrizen T und V
charakterisiert. (Wir skizzieren rechts die
Flächen T = const und V = const schematisch für ein zweidimensionales stabiles
System.)
107
q2
q1
q1
1. Schritt: Wir diagonalisieren T durch eine orthogonale Matrix A1 :
q = A1 η ,
1
T = η̇ ∗ T1 η̇ ,
2
1
V = η ∗ V1 η ,
2

η2
η2

τ1 · · · 0

. ..
. 
T1 = A∗1 TA1 = 
. .. 
 ..

0 · · · τf
η1
η1
V1 = A∗1 VA1 .
Da die kinetische Energie positiv definit
ist, sind alle Eigenwerte τi > 0. Dies bietet
die Grundlage für den zweiten Schritt.
2. Schritt: Wir dehnen oder stauchen das
Ellipsoid T = const durch eine Transformation mit der Matrix


A2 = 

−1/2
τ1
..
.
0

···
0
.. 
..
.
. 

−1/2
· · · τf
ζ2
ζ2
zur Einheitskugel:
η = A2 ζ ,
1 ∗
T = ζ̇ T2 ζ̇ ,
2
1
V = ζ ∗ V2 ζ ,
2
ζ1
ζ1
T2 = 1 ,
V2 = A∗2 VA2 .
In dieser Stauchung liegt der nicht orthogonale Kern der Gesamttransformation.
3. Schritt: Diagonalisieren wir nun V
durch eine orthogonale Matrix A3 . Da
T2 = 1 gegen orthogonale Transformationen invariant ist, erhalten wir
ζ = A3 ξ ,
1 ∗
T = ξ˙ T3 ξ˙ ,
2
ξ2
1
V = ξ ∗ V3 ξ ,
2
T3 = A∗3 T2 A3 = 1 ,

ξ2
ξ1

λ1 · · · 0

 . .
∗

. . ... 
V3 = A3 V2 A3 =  ..
.
0 · · · λf
108
ξ1
Mit A = A1 A2 A3 erhalten wir also die angestrebte Gesamttransformation
q = Aξ ,
(212)
durch welche die Matrizen T und V in
T̂ = A∗ TA = 1
und

(213)

λ1 · · · 0
 .

∗

V̂ = A VA =  .. . . . ... 

0 · · · λf
(214)
übergehen. Damit erhalten wir die einfache Lagrangefunktion
1 X ˙2 1 X
ξ −
λi ξi2 ,
2 i i
2 i
L=
die zu den Bewegungsgleichungen (210) führt.
Zur Berechnung der Transformationsmatrix A brauchen wir nicht von der Zerlegung des Existenzbeweises in Einzelschritte auszugehen, sondern können sogleich
die Gesamttransformation in einem Schritt konstruieren. Dazu setzen wir A in
der Form
A = (a1 , . . . , af )
(215)
aus Spaltenvektoren al zusammen und notieren die Transformation in der Form
q = Aξ =
X
ξ l al .
l
Mit den Bewegungsgleichungen Tq̈ + Vq = 0 [vgl. Gl. (208)] und ξ¨l = −λl ξl [vgl.
Gl. (210)] erhalten wir dann
X
l
ξl (V − λl T)al = 0 .
Da die Koordinaten ξl unabhängig sind, erhalten wir für die gesuchten al das
linear homogene Gleichungssystem
(V − λl T)al = 0 .
109
(216)
Die Vektoren al erfüllen also eine Beziehung, die die Definition von Eigenvektoren
verallgemeinert. Die Bedingung, daß nicht–triviale Lösungen existieren, führt wieder auf Gl. (211). Unser Existenzbeweis stellt sicher, daß diese Polynomgleichung
tatsächlich f reelle Werte λl liefert.
Natürlich ist al durch Gl. (216) nur bis auf einen konstanten Faktor bestimmt.
Im Prinzip sollte dieser Faktor durch die Normierung [vgl. (213)]
a∗l Tal = 1
(217)
festgelegt werden. Tatsächlich kann auf die Normierung aber verzichtet werden43 ,
wenn die Umkehrtransformation
A−1 = A∗ T
(218)
nach Gl. (213) nicht benötigt wird.
4.4
Die formale Durchführung
Wir fassen die obigen Überlegungen in dem folgenden Rechenprogramm zusammen. Dabei setzen wir zunächst voraus, daß keine Entartung vorliegt, d.h. daß
alle λl verschieden sind.
1. Suche die fragliche Gleichgewichtslage q̃0 und benutze die Abweichungen
qk = q̃k − q̃k0 als generaliesierte Koordinaten.
2. Entwickle T und V in der Umgebung der Gleichgewichtslage bis zur quadratischen Ordnung und bringe sie in die Form
T =
1X
1
Tij q̇i q̇j = q̇∗ Tq̇ ,
2 i,j
2
V =
1X
1
Vij qi qj = q∗ Tq .
2 i,j
2
Dabei ist unbedingt darauf zu achten, daß T und V symmetrisch gewählt
werden (Tij = Tji und Vij = Vji )!
3. Bilde das charakteristische Polynom [vgl. (211)]
det(V − λT) = 0 .
43
Das bedeutet, daß die Achsen zum Schluß noch einmal gestaucht werden. Hierbei bleibt die
Entkoppelung erhalten. Natürlich spielt auch das Vorzeichen von al keine Rolle.
110
Es besitzt f relle Lösungen λl deren Vorzeichen Auskunft über die Stabilität
des Gleichgewichts geben: Sind alle λl > 0, so ist das System stabil, ist mindestens ein λl < 0, labil. Indifferentes Gleichgewicht (das aber i.a. genauer
untersucht werden muß) liegt vor, wenn alle λl ≥ 0 sind und mindestens ein
λl = 0 ist. Für stabile Systeme erhält man die Eigenfrequenzen
ωl =
q
λl .
4. Bestimme für jedes λl einen Eigenvektor al aus der Beziehung [vgl. (216)]
(V − λl T)al = 0 .
Eine Normierung der Eigenvektoren nach Gl. (217) ist nur dann erforderlich,wenn die Umkehrtransformation (218) benötigt wird.
5. Die Normalkoordinaten erfüllen die einfachen Bewegungsgleichungen [vgl.
(210)]
ξ¨l + λl ξl = 0 .
Ihre Lösungen lassen sich mit der Matrix [vgl. (215)]
A = (a1 , . . . , af )
gemäß [vgl. (212)]
q = Aξ
oder qk =
X
alk ξl
l
auf die alten Koordinaten q übertragen. Nimmt man insbesondere an, daß
nur eine “mode”, d.h. eine isolierte Eigenschwingung ξl , angeregt ist (ξi = 0
für i 6= l), so erhält man durch
q(l) = ξl al
eine Beschreibung des Bewegungsablaufs dieser isolierten Mode.
6. Ist der Bewegungsablauf durch Anfangsbedingungen q(0) und q̇(0) vorgege˙
ben, so erhält man die entsprechenden Anfangsbedingungen ξ(0) und ξ(0)
aus der Umkehrtransformation
ξ = A−1 q .
Hat man die Eigenvektoren nach Gl. (217) normiert (vgl. Punkt 4.), so
erhält man A−1 aus Gl. (218).
[Abschließend müssen wir in unserem Konzept noch den Sonderfall der Entartung
erörtern. Dieser stellt eher ein Problem für die theoretische Begründung als für die
praktische Auswertung dar. Wenn nämlich zwei oder mehr Eigenwerte des charakteristischen Polynoms (211) gleich werden, so brauchen wir nur den Punkt 4 unseres
Programms zu modifizieren:
Ist λl eine m–fache Nullstelle von Gl. (211), so spannen die Lösungen von Gl. (216)
einen m–dimensionalen Unterraum U m auf.
111
• Wenn die Umkehrtransformation (218) nicht benötigt wird, können wir einfach
(1)
(m)
m beliebige linear unabhängige Vektoren al , . . . , al aus Um auswählen.
• Wollen wir jedoch die Umkehrtransformation nach Gl. (218) bilden (vgl. 6.), so
müssen wir m Vektoren a1l , . . . , am
l konstruieren, die im Einklang mit Gl. (217)
den “Orthogonalitätsrelationen”
µ
aν∗
l Tal = δνµ
genügen. Hierzu kann man wieder von einem beliebigen linear unabhängigen Sy(1)
(m)
stem al , . . . , al
ausgehen und etwa nach dem Schmidtschen Verfahren orthogonalisieren: Dabei setzt man
(1)
(1)
a1l = α11 al , a2l = α21 al
(2)
+ α22 al
...
und bestimmt die α’s sukzessive so, daß
1
1∗
2
2∗
2
a1∗
l Tal = 1, al Tal = 0, al Tal = 1, . . .
gilt.]
4.5
Gekoppelte Pendel
Zur Illustration des Verfahrens betrachten
wir das einfache Beispiel zweier gleicher mathematischer Pendel (Masse m, Länge `), die
durch eine (schwache) Feder (k) gekoppelt
sind. Die Länge der entspannten Kopplungsfeder sei gleich dem Abstand d der Aufhängepunkte (siehe Skizze), so daß die Gleichgewichtslage nicht verändert wird.
y
Von S. 47 übernehmen wir die Ausdrücke
d
ϑ2 l
ϑ1
m
l
m
x
m 2 2
` ϑ̇ und V = −mg` cos ϑ
x20 x2
x10
x1
2
für die kinetische und die potentielle Energie eines Pendels. Bei unseren gekoppelten Pendeln müssen wir nun die entsprechenden Terme für beide Pendel addieren.
Außerdem ist die potentielle Energie durch die Kopplungsenergie
T =
Vk ≈
k
k
(x2 − x1 − d)2 = `2 (sin ϑ1 − sin ϑ2 )2
2
2
zu ergänzen. Damit erhalten wir
T =
m 2 2
` (ϑ̇1 + ϑ̇22 )
2
112
und
k
V = −mg`(cos ϑ1 + cos ϑ2 ) + `2 (sin ϑ1 − sin ϑ2 )2 .
2
Wir gehen nun nach den Programmpunkten des vorigen Abschnitts vor:
1. Die Gleichgewichtslage liegt nach Konstruktion bei ϑ1 = ϑ2 = 0. (Natürlich
kann man das auch aus ∂V /∂ϑi = 0 ausrechnen.)
2. Wir sehen nun ϑi (und ϑ̇i ) als klein an und entwickeln bis zur quadratischen
Ordnung, d.h. wir setzen
sin ϑi ≈ ϑi
1
cos ϑi ≈ 1 − ϑ2i
2
und
und erhalten
m 2 2
` (ϑ̇1 + ϑ̇22 )
2
k
m
V = V0 + g`(ϑ21 + ϑ22 ) + `2 (ϑ1 − ϑ2 )2 .
2
2
Dabei ist die Konstante V0 = −2mg` ohne Bedeutung und kann weggelassen
werden. Wir können T und V deshalb mit den Matrizen
T =
T = m`
2
!
1 0
0 1
und V = m`
g
`
2
k
+m
k
−m
k
−m
g
k
+m
`
!
in der Form
1
T = (ϑ̇1 , ϑ̇2 )T
2
ϑ̇1
ϑ̇2
!
1
und V = (ϑ1 , ϑ2 )V
2
ϑ1
ϑ2
!
schreiben.
3. Das charakteristische Polynom
det(V − λT) = 0
oder
g
`
k
+m
−λ
k
−m
g
`
− mk
k
+m
−λ
=
k
g
+
−λ
` m
!2
−
k2
= 0
m2
besitzt die beiden positiven Lösungen
g
g
k
und λ2 = + 2 .
`
`
m
Das Gleichgewicht ist also (natürlich) stabil. Das Pendelsystem führt bei
einer Störung Schwingungen der Eigenfrequenzen
λ1 =
ω1 =
r
g
`
und/oder ω2 =
aus.
113
s
g
k
+2
`
m
4. Wir bestimmen die Eigenvektoren al aus
(V − λl T)al = 0 .
Für l = 1, d.h. λl = g/`, erhalten wir
k
m
1 −1
−1
1
!
!
a11
a12
= 0,
α
α
also a1 =
!
mit beliebigem α. Entsprechend folgt für l = 2, d.h. λl = g/` + 2k/m
k
−
m
1 1
1 1
!
!
a21
a22
= 0,
also a2 =
α
−α
!
.
Da T bis auf den Vorfaktor m`2 gleich der Einheitsmatrix ist, sind a1 und
a2 bereits
√ orthogonal. Eine Normierung nach der formalen Vorschrift würde
α = 1/ 2m`2 erfordern. Wir verzichten darauf und wählen der Einfachheit
halber α = 1.
5. Die Normalkoordinaten ξl führen harmonische Schwingungen der Frequenz
ωl aus. Mit der Matrix
1
1
1 −1
A = (a1 , a2 ) =
!
lassen sich daraus die ursprünglichen Koordinaten
ϑ1
ϑ2
!
ξ1
ξ2
=A
!
=
ξ1 + ξ 2
ξ1 − ξ 2
!
berechnen.
Führt das System insbesondere nur die Eigenschwingung 1 aus (ξ2 = 0), so
folgt
ϑ1 = ϑ 2 .
Beide Pendel schwingen also gleichsinnnig mit gleicher Amplitude, so daß
die Koppelfeder gar nicht gedehnt wird. Daher erhalten wir die ungestörte
Pendelfrequenz
q
ω1 = g/` .
Für die Eigenschwingung 2 (ξ1 = 0) erhalten wir dagegen
ϑ1 = −ϑ2 .
Die Pendel schwingen also gegensinnig mit gleicher Amplitude, so daß die
Koppelfeder maximal beansprucht wird. Da ihr Mittelpunkt bei dieser Mode
in Ruhe bleibt, kann sie durch zwei Federn halber Länge und doppelter
Federkonstante ersetzt werden. Dies erklärt die Eigenfrequenz
ω2 =
q
g/` + 2k/m .
114
6. Unter Beachtung der Orthogonalität und der Normierung erhalten wir die
Matrix
!
1 ∗ 1 1
1
−1
A = A =
2
2 1 −1
der Umkehrtransformation. Daher gilt
1
1
ξ1 = (ϑ1 + ϑ2 ) und ξ2 = (ϑ1 − ϑ2 ) .
2
2
Wenn wir die Pendel beispielsweise mit den Anfangsbedingungen
ϑ1 (0) = 2c ,
ϑ2 (0) = ϑ̇1 (0) = ϑ̇2 (0) = 0
starten, so folgt
ξ1 (0) = ξ2 (0) = c ,
ξ˙1 (0) = ξ˙2 (0) = 0 .
Wir erhalten also die spezielle Lösung
ξ1 = c cos ω1 t ,
ξ2 = c cos ω2 t
oder nach Rücktransformation
c
1
1
t cos ω2 +ω
t
cos ω2 −ω
2
2
2
c
1
1
= c(cos ω1 t − cos ω2 t) =
t sin ω2 +ω
t.
sin ω2 −ω
2
2
2
ϑ1 = c(cos ω1 t + cos ω2 t) =
ϑ2
Für schwache Kopplung (d.h. k/m g/` oder ω2 ≈ ω1 ) ergibt dies die bekannte Schwebung, bei der die gesamte Schwingungsenergie mit der kleinen
Differenzfrequenz zwischen den beiden Pendeln ausgetauscht wird.
115
5
Spezielle Relativitätstheorie
5.1
Galileisches und Einsteinsches Relativitätsprinzip
Wir betrachten ein Koordinatensystem K0 , das sich gegenüber unserem Inertialsystem K mit der konstanten Geschwindigkeit v bewegt. Der Zusammenhang44
r0 = r − vt
(219)
zwischen den Ortskoordinaten (x, y, z) in K und den entsprechenden Koordinaten
(x0 , y 0 , z 0 ) in K0 heißt Galileitransformation.
Wir hatten bereits in den Abschnitten 1.1 und 1.8 festgestellt, daß die Grundgesetze der Mechanik “Galileiinvariant”, d.h. invariant gegen Galileitransformationen, sind. Denn wegen v̇ = 0 folgt aus
(219)
mi r̈0i = mi r̈i = Fi .
(220)
Die Newtonschen Bewegungsgleichungen bieten also keine Möglichkeit, zwischen
den Koordinatensystemen K und K0 zu unterscheiden, ⇒
• Galileisches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit,
durch mechanische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen.
Im Rahmen der klassischen Mechanik kann also prinzipiell nicht entschieden werden, ob sich ein System im Zustand der ‘Ruhe’ oder der ‘gleichförmigen Bewegung’
(wogegen eigentlich?) befindet45 . Es liegt nun einmal aus philosophisch–ästhetischen Gründen, mehr noch aber aufgrund der experimentellen Erfahung, die um
die Wende zum 20. Jahrhundert gewonnen wurde, nahe, dieses Relativitätsprinzip
auf die gesamte Physik zu übertragen. Wir postulieren daher
• Einsteinsches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit,
durch physikalische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen.
Mit diesem Postulat kommen wir aber sogleich in Schwierigkeiten mit den Grundlagen der Elektrodynamik, wenn wir an der Galileitransformation festhalten.
44
Wir setzen hier und im folgenden voraus, daß die Koordinatenursprüge von K und K0 zur
Zeit t = 0 zusammenfallen.
45
Man kann nicht einmal immer zwischen Scheinkräften in Nicht–Inertialsystemen und “wahren” (was ist das?) Kräften in Inertialsystemen unterscheiden! Vgl. dazu auch Abschnitt 5.11.
116
Denn nach dem Relativitätsprinzip erhalten wir in jedem Inertialsystem eine
Lichtgeschwindigkeit c = (ε0 µ0 )−1/2 . Nach Gl. (219) müssen wir dagegen in K0
die anisotrope Lichtgeschwindigkeit
c0 = c − v cos α
(221)
erwarten, wenn α den Winkel bezeichnet, der zwischen v und der Ausbreitungsrichtung des Lichts liegt.
Wenn wir also am Relativitätsprinzip festhalten, müssen wir die Galileitransformation abändern. Ändern wir die aber ab, sind die Newtonschen Bewegungsgleichungen nicht mehr transformationsinvarint und müssen ebenfalls abgeändert
werden. Wir stehen also vor der grundsätzlichen Frage, ob wir an den Newtonschen Bewegungsgleichungen oder (lat. ‘aut’, nicht ‘vel’ !) am Relativitätsprinzip festhalten wollen. Wegen der fundamentalen Bedeutung für die Grundlagen der gesamten Physik und Naturphilosophie soll das historische experimentum
crucis (Michelson 1881, Michelson und Morley 1887, Morley und Miller 1904, Joos 1930) zu dieser Frage im folgenden in seinen Grundgedanken
skizziert werden.
5.2
Das Michelson–Experiment
Das Experiment zielt auf einen Vergleich der Lichtgeschwindigkeit in verschiedenen Koordinatensystemen K und K0 , und der erste Grundgedanke liegt darin, die
große – und doch gegen c so kleine! – Geschwindigkeit
v ≈ 30 km/s ≈ 10−4 c
der Erde auf ihrer Bahn um die Sonne auszunutzen.
Eine hinreichend genaue Bestimmung der Lichtgeschwindigkeit (mit den damaligen Mitteln!) durch die Messung der Laufzeit über eine bestimmte Strecke scheidet aus, weil die erforderliche Synchronisation am Start– und am Zielpunkt selbst
von der Lichtgeschwindigkeit abhängt. Man muß also den Hin– und Rückweg eines
Lichtstrahls verfolgen. Dabei hebt sich der Einfluß von v aber in erster Nähererung weg. Der verbleibende Einfluß der Größenordnung
v 2 /c2 ∼ 10−8
ist aber so klein, daß nur ein Interferenzversuch infrage kommt. Hierzu brauchen
wir noch einen zweiten Hin– und Rückweg. Nach dieser Vorklärung können wir
den grundsätzlichen Aufbau des Experiments schematisch skizzieren:
Das Licht einer monochromatischen Lichtquelle L wird durch einen halbdurchlässigen Spiegel S0 in zwei Strahlen (x– und y–Richtung) aufgespalten, die nach
Reflexion an den Spiegeln Sx und Sy auf dem Schirm Sch interferieren. Die Wege
lx und ly sind dabei etwa gleich lang (siehe Skizze).
117
Sy
ly
S0
lx
L
Sx
Sch
Wir nehmen nun an, daß Gl. (221) gilt und daß sich die Lichtgeschwindigkeit c
auf einen ruhenden “Äther” bezieht. Die Apparatur bewege sich mit einer Geschwindigkeit v in x–Richtung gegen den Äther. Dann braucht das Licht für den
Weg S0 –Sx –S0 die Laufzeit
tx =
lx
2lx
lx
+
=
,
c−v c+v
c(1 − β 2 )
wenn wir hier und im folgenden die übliche Abkürzung
β = v/c
(222)
benutzen. Für die konkurrierende Laufzeit ty auf dem Weg S0 –Sy –S0 gilt (nach
Pythagoras) die Beziehung
q
cty = 2 ly2 + ( 21 vty )2 =
q
4ly2 + v 2 t2y .
Lösen wir nach ty auf, so erhalten wir (5.2)
2ly
ty = √
.
c 1 − β2
Insgesamt folgt also eine Laufzeitdifferenz
"
lx
ly
2
√
−
δtk = tx − ty =
c 1 − β2
1 − β2
#
Und nun kommt der entscheidende Schritt: Drehen wir die Apparatur um 90o , so
vertauschen x und y ihre Rollen, und wir erhalten
"
#
l
ly
2
√ x 2−
.
δt⊥ =
c
1 − β2
1−β
118
Die Differenz
#
"
lx + l y 2
1
2(lx + ly )
1
≈
−√
β
∆t = δtk − δt⊥ =
2
2
c
1−β
c
1−β
sollte man als Verschiebung des Interferenzmusters beobachten können. Um allerding einen Gangunterschied von
c∆t ∼ 5 · 10−7 m ,
der der Wellenlänge von gelbem Licht entspricht, zu erzielen, benötigt man für
β = 10−4 Wegstrecken
lx + ly ∼ 50m ,
die im Sub–µm–Bereich stabil sind! Dies ist mit verschiedenen technischen Tricks
tatsächlich erreicht worden.
Man hat den Versuch unter verschiedenen Bedingungen und Annahmen mehrfach mit steigender Genauigkeit wiederholt und immer ein negatives Ergebnis
gefunden:
• Die Lichtgeschwindigkeit ist unter allen Bedingungen isotrop und gleich c.
Wir müssen daraus schließen, daß die Galileitransformation und die Galileiinvarianten Newtonschen Bewegungsgleichungen für hohe Geschwindigkeiten zu korrigieren sind.
5.3
Die Lorentztransformationen
Die Ausbreitung eines Lichtblitzes, der zur Zeit t = 0 im Ursprung erzeugt wurde,
folgt im System K der Gleichung
x2 + y 2 + z 2 = c 2 t 2 .
Da wir festgestellt haben, daß auch in K0 eine isotrope Lichtausbreitung mit der
Geschwindigkeit c beobachtet wird, liegt es zunächst nahe, anzunehmen, daß dort
2
2
2
x0 + y 0 + z 0 = c 2 t 2
gilt. Das heißt aber, daß K0 und K durch eine orthogonale Transformation im R3
verknüpft sind: r0 geht durch eine reine Drehung aus r hervor. Daß eine isotrope
Kugelwelle bei einer reinen Drehung des Koordinatensystems invariant bleibt, ist
trivial. Eine solche Drehung beschreibt aber offensichtlich nicht die gewünschte
Relativbewegung der Koordinatensysteme. Das Fatale ist nun, daß die Drehung
die einzige Möglichkeit ist, unseren ersten Ansatz zu befriedigen.
119
Wir stehen deshalb vor der befremdlichen Notwendigkeit, unseren Ansatz zu modifizieren und neben der Transformation r → r0 auch eine Transformation t → t0
der Zeit zuzulassen. Die Konstanz der Lichtgeschwindigkeit wird dann durch die
Gleichung
2
2
2
x2 + y 2 + z 2 − c 2 t 2 = x 0 + y 0 + z 0 − c 2 t 0
2
= 0
(223)
beschrieben. Die rein formale Anschrift dieser Beziehung legt es nahe, einen vierdimensionalen Raum mit den Koordinaten
x1 = x ,
x2 = y ,
x3 = z ,
x4 = ict
einzuführen. Die Konstanz der Lichtgeschwindigkeit schreibt sich dann in der
Form46
4
X
x2ν =
4
X
2
x0 ν = 0 .
(224)
ν=1
ν=1
Hierbei ist allerdings störend, daß wir eine imaginäre Koordinate x4 = ict benutzen, die zu recht seltsamen Konsequenzen führt. Beispielsweise kann die Summe
von Quadraten negativ werden, und wir können rechtwinklig gleichschenklige
Dreiecke mit der Hypothenuse Null bilden. Wir bewegen uns also nicht mehr in
dem vertrauten euklidischen Raum, sondern in einem vierdimensionalen Raum
mit einer ungewohnten Metrik, im Minkowskiraum.
Es gibt nun verschiedene Argumente, eine lineare Transformation
x0ν
=
4
X
ανµ xµ
oder kurz x0 = Ax
(225)
µ=1
zwischen den Koordinaten in K und K0 zu fordern. Einmal soll für kleine v c
die lineare Galileitransformation reproduziert werden. Gewichtiger aber ist, daß
nicht–lineare Terme die Homogenität von Raum und Zeit verletzen würden. Denn
wir erwarten, daß die Koeffizienten
ανµ =
∂x0µ
∂xν
nicht von x, also von der Lage r und der Zeit t, abhängen. Sie sollen dagegen
allein von der Geschwindigkeit v zwischen K und K0 abhängen.
46
Wir folgen in diesem Kapitel dem allgemeinen Gebrauch, im vier dimensionalen Raum griechische Indizes, im dreidimensionalen Ortsraum dagegen lateinische Indizes zu verwenden.
120
Eine invertierbare lineare Transformation (225), die Gl. (224) erfüllt, ist aber
notwendigerweise eine orthogonale47 Transformation im vierdimensionalen Minkowskiraum. Eine solche Transformation heißt Lorentztransformation.
Orthogonale Transformationen lassen sich vorteilhaft als Drehungen veranschaulichen. Bei der Interpretation einer Lorentztransformation als Drehung sollten wir aber vorsichtig sein, weniger wegen der Schwierigkeit, unsere Anschauung auf vier Dimensionen auszudehnen, als wegen des imaginären Charakters
der Koordinate x4 (oder besser: wegen der nicht–euklidischen Metrik des Minkowskiraumes). Aber selbstverständlich sind reine Drehungen im R3 (s.o.) auch
Lorentztransformationen. Sie drücken die Isotropie des Raumes und speziell
der Lichtausbreitung aus.
Wegen der Isotropie können wir o.B.d.A. annehmen, daß v in der x3 –Richtung
liegt. Wir sprechen nun von einer speziellen Lorentztransformation, wenn sie
keine räumliche Drehung enthält. Da keine Drehachse vorliegt, ist x3 dabei die
einzige ausgezeichnete Raumrichtung.
Die Koordinaten x1 und x2 sind daher im wesentlichen an der Transformation
unbeteiligt. Insbesondere wird die Zugehörigkeit eines Punktes zur x2 –x3 –Ebene
(x1 = 0) oder zur x1 –x3 –Ebene (x2 = 0) nicht berührt, es gilt also
x01 = ax1
und x02 = ax2
oder
α11 = α22 = a und
α12 = α13 = α14 = α21 = α23 = α24 = 0 .
Der Koeffizient a kann nur vom Betrag der Geschwindigkeit v abhängen. Darum
gilt umgekehrt nach dem Äuivalenzprinzip auch
x1 = ax01
und x2 = ax02 ,
und wir folgern
a = 1.
Die Koordinaten x03 und x04 dürfen natürlich auch nicht von x1 und x2 abhängen,
es gilt also
α31 = α32 = α41 = α42 = 0
Die spezielle Lorentztransformation wird also durch eine Matrix der Form




As = 
47
1
0
0
0
0 0
0
1 0
0
0 α33 α34
0 α43 α44





(226)
Wir benutzen imaginäre Zahlen nur als formales Hilfsmittel. Daher meinen wir wirklich
‘orthogonal’ und nicht ‘unitär’.
121
beschrieben. Die allgemeine Lorentztransformation erhält man durch Kombination von (226) mit räumlichen Drehungen48 . Wegen dieses Zusammenhangs interessieren wir uns nur für die speziellen Lorentztransformationen. Dabei können
wir uns auf den zweidimensionalen Unterraum (x3 , x4 ) beschränken und die vereinfachte zweidimensionale(!) Anschrift
x03
x04
!
=A
!
x3
x4
mit A =
α33 α34
α43 α44
!
(227)
benutzen. Zur Bestimmung der vier Koeffizienten steht uns erstens die Aussage
zur Verfügung, daß sich der Koordinatenursprung von K0 mit der Geschwindigkeit
v längs der z–Achse bewegt, also
x03 = 0 f ür x3 = vt = −iβx4 .
Mit x03 = α33 x3 + α34 x4 [vgl. Gl. (227)] folgt daraus −α33 iβ + α34 = 0 oder
α34 = iβα33 .
(228)
Damit ist die Herleitung schon fast abgeschlossen, denn der Rest folgt einfach aus
den drei Orthogonalitätsbeziehungen
2
2
α33
+ α34
= 1
2
α43 + α44 = 1
α33 α43 + α34 α44 = 0 .
(229)
2
Aus Gl. (228) und der ersten Gl. (229) folgt sofort (1 − β 2 )α33
= 1, also
α33 = √
1
1 − β2
und α34 = √
iβ
.
1 − β2
Nach den beiden andern Gln. (229) ist der Zeilenvektor (α43 , α44 ) zum Vektor
(α33 , α34 ) orthogonal und hat den selben Betrag, bei richtiger Wahl des Vorzeichens gilt also
α43 = −α34 und α44 = α33 .
Damit ist die Matrix

A=

√1
1−β 2
−iβ
√
1−β 2
√ iβ
1−β 2
√1
1−β 2



(230)
der spezielle Lorentztransformation bereits eindeutig festgelegt.
48
Die allgemeine Form ist A = D2 As D1 . Dabei bezeichnet D1 eine räumliche Drehung in K
und D2 eine in K0 .
122
Die elegante mathematische Herleitung birgt die Gefahr in sich, daß der physikalische Hintergrund nicht mehr deutlich genug gesehen wird. Wir wollen deshalb
zusätzlich eine elementare Herleitung der Lorentztransformation anfügen, die
unmittelbar an unsere Grundprinzipien anknüpft, ohne explizit auf die lineare Algebra zurückzugreifen. Zur Stützung der Anschauung benutzen wir hierbei auch
die ursprünglichen Bezeichnungen und vermeiden imaginäre Größen. Wir suchen
also die Koeffizienten der Transformation
z 0 = Az + Bt ,
t0 = Cz + Dt
und benutzen dazu vier unabhängige Forderungen:
1. Wie oben spezifizieren wir die Bewegung des Koordinatenursprungs z 0 = 0
von K0 durch z = vt in K und erhalten entsprechend Gl. (228)
B = −Av .
2. Die Lichtgeschwindigkeit in positiver z–Richtung ist in beiden Koordinatensystemen gleich:
z = ct =⇒ z 0 = ct0 .
Mit den Transformationsgleichungen erhalten wir daraus
Ac + B = Cc2 + Dc .
3. Das selbe gilt für die negative z–Richtung:
z = −ct
=⇒
z 0 = −ct0 .
Wir finden entsprechend
Ac − B = −Cc2 + Dc .
Wir können nun die Beziehungen aus 2. und 3. addieren und subtrahieren und
erhalten
B
D = A und C = 2 .
c
Mit 1. nimmt dann unsere Transformation bereits die Gestalt
z 0 = (z − vt)A ,
t0 = (− cv2 z + t)A
an. Lediglich der Faktor A kann noch nicht festgelegt werden. Das ist auch
verständlich, da ein gemeinsamer Faktor in der Transformation von Ort und Zeit
die Lichtgeschwindigkeit nicht beeinflußt. Wir brauchen also noch eine vierte Bedingung, und die finden wir im
123
4. Relativitätsprinzip: K und K0 sind äquivalent, die Transformation zwischen
K und K0 muß abgesehen von dem Vorzeichen von v symmetrisch sein.
Lösen wir die Transformation nach z und t auf, erhalten wir
z=
1
(z 0 + vt0 )
v2
(1 − c2 )A
t=
Das Relativitätsprinzip verlangt also
1
( cv2 z 0 + t0 ).
v2
(1 − c2 )A
1
2
(1 − vc2 )A
A=
oder
A= q
1
1−
v2
c2
.
Auf diese Weise sehen wir ohne Anleihen bei der linearen Algebra, daß die grundlegenden Postulate, welche die Erfahrungen entsprechender Experimente zusammenfassen, notwendig auf die Transformationsgleichungen
0
z =
z − vt
q
1−
v2
c2
0
,
− cv2 z + t
t = q
1−
v2
c2
(231)
mit den Umkehrungen
v
z 0 + vt0
z=q
,
2
1 − vc2
c2
t= q
z 0 + t0
1−
v2
c2
(232)
führen. Man überzeugt sich leicht, daß die Transformation (231) mit den Gln.
(227) und (230) übereinstimmt.
5.4
Die Zeitdilatation
Für unsere Anschauung bleibt es eine äußerst befremdliche Eigenschaft der Lorentztransformation, daß wir keine universelle Zeit einführen können, sondern
die Zeiten t und t0 unterscheiden müssen. Gleichzeitige Ereignisse an verschiedenen Orten in K sind in K0 nicht mehr gleichzeitig, und umgekehrt. Die Uhren in K
und in K0 gehen außerdem verschieden schnell. Und welche geht dabei schneller?
Eine Uhr bei z = z0 in K gebe die Zeitsignale t1 und t2 . Dann erscheint das
Zeitintervall
t2 − t 1
t02 − t01 = √
1 − β2
(233)
√
in K0 um den Faktor 1/ 1 − β 2 gegenüber dem Zeitintervall t2 − t1 in K gedehnt.
124
Wir wollen das formale Ergebnis direkt auf die Konstanz der Lichtgeschwindigkeit
zurückführen. Zur Zeit t1 = 0 werde in K am Ort z0 = 0 ein Lichtblitz in y–
Richtung ausgesandt, an einem Spiegel Sy im Abstand ly reflektiert und zur Zeit
t2 = 2ly /c wieder am Ort z = 0 empfangen. Ein Beobachter in K0 registriert
das Aussenden des Lichtblitzes am Ort z10 = 0 zur Zeit t01 = 0. Er empfängt das
reflektierte Licht aber an einem anderen Ort z20 = −vt02 (siehe Skizze).
y
ly
0
y
K
Sy
ly
z
0
0
K’
Sy
z’
−vt’2
0
In K0 hat das Licht also nicht den Weg 2ly , sondern den längeren Weg
q
2 ly2 + ( 12 vt02 )2
zurückgelegt und dafür eine längere Zeit gebraucht. Die Auswertung können wir
direkt vom Lichtweg cty im Michelson–Experiment (S. 118) übernehmen, wir
erhalten Gl. (233).
Ein Beobachter in K0 stellt also fest, daß die Uhren in K nachgehen. Woher kommt
diese Unsymmetrie? Kann ich nun doch zwischen ’ruhenden’ und ’bewegten’ Koordinatensystemen unterscheiden? Ist etwa dasjenige System absolut ruhend, in
dem die Uhren am allerlangsamsten gehen?
Natürlich nicht! Das Ergebnis ist inhaltlich auch gar nicht unsymmetrisch, denn
ein Beobachter in K wird genauso feststellen, daß die Uhren in K0 nachgehen!
Die formale Unsymmetrie wird ausschließlich durch unsymmetrische Beobachtungsbedingungen erzeugt. Wir haben oben nämlich eine Uhr an einem bestimmten Ort in K mit zwei synchronisierten Uhren an verschiedenen Orten in K0 verglichen. Langsamer geht also immer die eine Uhr, die in ihrem Koordinatensystem
ruht.
Eine natürliche Uhr, die das illustriert, finden wir in den Myonen, welche die
kosmische Strahlung am Rand der Atmosphäre, also in etwa 10 km Höhe bildet.
Während seiner typischen Lebensdauer von τµ = 2.2 · 10−6 s kann ein Myon
nämlich höchstens die Strecke cτµ = 660 m zurücklegen. Wenn wir an der Erdoberfläche trotzdem solche Myonen finden, so bedeutet das, daß unsere Uhren
schneller gehen als die innere Uhr des Myons. Denn zwischen der Erzeugung des
125
Myons und seinem Nachweis vergeht auf der schnellebigen Erde eine Zeit von
etwa 15τµ . Man beachte hier wieder die Unsymmetrie einer Uhr (τµ ) im System
des Myons und zweier räumlich getrennter Uhren (Erzeugung und Nachweis) auf
der Erde.
Von der ruhenden Erde aus gesehen kann ein schnelles Myon also ein biblisches
Alter von mehr als 15τµ erreichen. Und von diesem Gedanken aus ist nur noch
ein kurzer Schritt zum Zwillingsparadoxon.
Der Zwilling, der seinen Bruder im schnellen Raumschiff ins All geschickt hat,
findet nämlich, daß dessen Uhr, Herzschlag, Gedanken, Gefühle und schließlich
der gesamte Alterungprozeß verlangsamt ablaufen. Ein leicht vergessener Haken
hierbei ist allerding zunächst, daß der Zwilling im Raumschiff das selbe über
seinen Bruder auf der Erde feststellt. Zum Paradoxon wird diese Science fiction
story erst, wenn der jugendliche Raumfahrer zur Erde zurückkeht und nun im
selben Bezugssystem seinem greisen Bruder gegenübersteht. Die Äquivalenz der
beiden Systeme ist nun durch die Umkehr des Raumschiffes aufgehoben.
5.5
Die Lorentzkontraktion
Im Bezugssystem K seien zwei Meilensteine bei z1 und z2 aufgestellt. Diese Meilensteine werden nun von K0 aus zu einer Zeit t0 vermessen. Da wir beide Meilensteine zur gleichen Zeit t0 (und nicht t !) beobachten, gehen wir von der Umkehr transformation (232) aus und erhalten den Zusammenhang
z20 − z10 =
q
1 − β 2 (z2 − z1 ) .
(234)
√
Wegstrecken und Maßstäbe in K erscheinen also in K0 um den Faktor 1 − β 2
verkürzt. Man nennt diesen Effekt Lorentzkontraktion oder Lorentz–Fitzgeraldsche Längenkontraktion.
Wir brauchen kaum noch zu erläutern, daß wir wieder nur eine scheinbare Unsymmetrie zwischen K und K0 haben. Ein in K0 ruhender Maßstab erscheint von
K aus gemessen genau so verkürzt, wie der in K ruhende von K0 aus. Formal
haben wir eine Unsymmetrie durch die Forderung der Gleichzeitigkeit t01 = t02 in
K0 erzeugt.
In Wirklichkeit ist immer nur dasjenige System ausgezeichnet, in dem der Maßstab ruht. In diesem System ist der Maßstab länger als in allen anderen Systemen.
Entsprechend war bei der Zeitdilatation dasjenige Koordinatensystem ausgezeichnet, in dem die beobachtete Uhr ruht: In diesem System geht die Uhr langsamer
als in allen andern Koordinatensystemen.
Nun sind Raum und Zeit als Komponenten einer zusammengehörigen Raum–
Zeit im Minkowskiraum im wesentlichen gleichberechtigt, und auch die Lor126
entztransformation spiegelt die wesentliche Symmetrie von Raum und Zeit wider. Woher kommt denn dann die Unsymmetrie einer Zeitdehnung und einer Längenkontraktion, wenn man das durch die Versuchsbedingungen ausgezeichnete
Eigensystem, in dem Uhr und Maßstab ruhen, verläßt?
Diese Unsymmetrie zwischen Raum und Zeit ist in der unsymmetrischen Meßvorschrift begründet:
• Bei der Zeitdilatation messen wir zwei Zeitmarken einer Uhr, die in K
lokalisiert ist. Die beiden Zeitmessungen in K0 erfolgen also bei gleichen
Ortskoordinaten in K.
• Bei der Lorentzkontraktion führen wir dagegen die beiden Ortsmessungen
in K0 gleichzeitig, d.h. bei gleichen Zeitkoordinaten in K0 aus.
Tatsächlich besteht ein enger innerer Zusammenhang zwischen der Lorentzkontraktion und der Zeitdilation, wie man sofort an einer Uminterpretation der
Myonenbeobachtung aus dem vorigen Abschnitt erkennt: Der Abstand zwischen
dem Erzeugungsort (Atmosphärenrand) und dem Nachweisort (Erdoberfläche)
definiert einen Maßstab, der im System der Erde ruht. Vom System eines schnellen
Myons aus gesehen erscheint dieser Abstand (∼ 10 km) so verkürzt (< 660 m),
daß es ihn während seiner kurzen Lebensdauer τµ durchlaufen kann.
Aufgrund der Lorentzkontraktion erwartet man typische Verzerrungen der Gestalt schnell bewegter Objekte auf der Photoplatte oder auf der Netzhaut. Denn
gerade der Verschluß des Fotoapparats demonstriert uns anschaulich die Bedingung der Gleichzeitigkeit in K0 . Natürlich ist eine experimentelle Überprüfung
wegen der Kleinheit des Effekts bei realistischen Fotoobjekten nicht möglich.
Darum war die Menschheit in dieser Frage auch lange einem Irrtum erlegen. In
Wirklichkeit machen nämlich konkurrierende Laufzeiteffekte des Lichts die Lorentzkontraktion (lokal) unsichtbar !
Wir zeigen das beispielhaft an einem achsenparallelen Würfel (in der Skizze durch
das Quadrat ABCD repräsentiert), der sich mit der Geschwindigkeit v in z–
Richtung bewegt, und durch ein paralleles Lichtbündel auf eine Fotoplatte in
der xy-Ebene abgebildet wird (siehe Skizze auf der folgenden Seite). Das Bild
A0 B0 der Grundseite AB erscheint zwar auf der Photoplatte wegen der Lorentzkontraktion mit der verkürzten Länge
q
l2 = l 1 − β 2 .
Wegen der Endlichkeit der Lichtgeschwindigkeit erreicht aber zum gleichen Zeitpunkt auch noch Licht die Photoplatte, das zu früheren Zeitpunkten von Punkten
der Seite DA ausgesandt wurde. Das Bild D0 A0 dieser Seite hat die Länge
l1 =
vl
= βl .
c
127
D
C
D
C
C
D
B
l
α
l
v
l
A
A’
l
A
B
l
A
B’
l1
D’
α
B
l2
A’
B’
D’
l1
l2
A’
B’
Auf dem Bild sieht man folglich ein unverzerrtes Quadrat der unveränderten
Seitenlänge l, das aufgrund der Lorentzkontraktion und der endlichen Laufzeit
des Lichts um einen Winkel α mit
sin α = β
gedreht erscheint. Entsprechende Verhältnisse findet man bei parallelen Lichtbündeln (kleinen Raumwinkeln) für alle Beobachtungsrichtungen. Da der Drehwinkel
jedoch von der Richtung abhängt, erscheinen größere Objekte verbogen.
5.6
Die Gruppeneigenschaft der Lorentztransformation
Wir gehen mit einer Lorentztransformation
x03
x04
!
x3
x4
=A
!
mit A = q
1
1 − β12
1
iβ1
−iβ1 1
!
von einem Koordinatensystem K zu einem System K0 und von da aus mit einer
zweiten Lorentztransformation
x003
x004
!
x03
x04
=B
!
mit B = q
1
1 − β22
1
iβ2
−iβ2 1
!
zu einem Kordinatensystem K00 über. Wie sieht dann die Gesamttransformation
x003
x004
!
=C
x3
x4
!
mit C = BA
aus? Zur Beantwortung dieser Frage rechnen wir
BA = AB = q
1
(1 − β12 )(1 − β22 )
128
1 + β 1 β2
i(β1 + β2 )
−i(β1 + β2 ) 1 + β1 β2
!
1
1 + β 1 β2
= q
1 − β12 − β22 + β12 β22
= q
(1 + β1 β2 )2 − 2β1 β2 − β12 − β22
= q
(1 + β1 β2 )2 − (β1 + β2 )2
= q
β1 +β2
−i 1+β
1 β2
1 + β 1 β2
1 + β 1 β2
1
(1 − β 2
1 iβ
−iβ 1
!
β1 +β2
i 1+β
1 β2
1
!
1 iβ
−iβ 1
1 iβ
−iβ 1
mit β =
!
!
β1 + β 2
.
1 + β 1 β2
Die Hintereinderausführung zweier spezieller Lorentztransformationen mit β1 =
v1 /c und β2 = v2 /c ergibt also wieder eine Lorentztransformation mit
β=
β1 + β 2
1 + β 1 β2
oder v = βc =
v1 + v 2
.
1 + v1c2v2
(235)
Die Lorentztransformationen bilden also eine em Gruppe49 . Dieses Ergebnis
ist nicht überraschend. Physikalisch hätten wir es eigentlich sofort aus dem Relativitätsprinzip postulieren können, und mathematisch lassen sich sich die Lorentztransformationen der x3 –x4 –Ebene eineindeutig auf die Drehungen in der
Ebene abbilden, die ebenfalls eine Gruppe bilden.
Wichtiger als die Feststellung, daß die Hintereinanderausführung von Lorentztransformationen wieder eine Lorentztransformation ergibt, ist für uns die Aussage, wie wir die Gesamttransformation erhalten. Die Vorschrift (235), nach der
die Gesamtgeschwindigkeit v zu bilden ist, nennt man das Einsteinsche Additionstheorem der Geschwindigkeiten.
Die Tatsache, daß sich Geschwindigkeiten nicht einfach additiv zusammensetzen,
kann uns nach der Relativierung von Raum und Zeit kaum noch überraschen.
Das additive Gesetz unserer Alltagserfahrung ergibt sich lediglich im Grenzfall
v1/c, v2/c → 0, sonst gilt für v1 , v2 > 0 immer v < v1 + v2 .
Eine wichtige Konsequenz von Gl. (235) ist die prinzipielle Unmöglichkeit, durch
Addition von Geschwindigkeiten v1 < c und v2 < c Überlichtgeschwindigkeiten
v > c zu erhalten. Denn für 0 < β1 < 1 und 0 < β2 < 1 folgt
1 + β1 β2 = (1 − β1 )(1 − β2 ) + β1 + β2 > β1 + β2 ,
also
β < 1.
49
Hierzu muß außerdem das Assoziationsgesetz, das Einselement und die Umkehrtransformation nachgewiesen werden. Die Ausführung spezieller Lorentztransformationen ist nach der
obigen Rechnung sogar kommutativ, sie bilden also eine abelsche Gruppe.
129
Für v2 = c wird v = c unabhängig von v1 . Dies zeigt noch einmal die Lorentzinvarianz der Lichtgeschwindigkeit.
Wir kommen noch einmal darauf zurück, daß wir eine Transformationsmatrix

A=

√1
1−β 2
√−iβ
1−β 2
√ iβ
1−β 2
√1
1−β 2



als Drehung in der Ebene auffassen können. Der Drehwinkel ϕ = iϑ ist dabei allerdings imaginär. Wir können dem Rechnung tragen, indem wir die von Drehungen
in der Ebene vertrauten Kreisfunktionen durch Hyperbelfunktionen ersetzen. Mit
β=
v
= tanh ϑ
c
folgt dann
A=
cosh ϑ i sinh ϑ
−i sinh ϑ cosh ϑ
!
.
Das Additionstheorem (235) entspricht der Additionsformel
tanh (ϑ1 + ϑ2 ) =
tanh ϑ1 + tanh ϑ2
1 + tanh ϑ1 tanh ϑ2
des Hyperbeltangens und zeigt, daß die Hintereinanderausführung zweier Transformationen mit ϑ1 und ϑ2 einer Gesamttransformation mit ϑ = ϑ1 +ϑ2 entspricht.
Damit wird auch die Unerreichbarkeit der Lichtgeschwindigkeit noch einmal illustriert (siehe Skizze).
c
v
ϑ
v2
ϑ2
v1
ϑ1
ϑ1
c tanh ϑ
0
5.7
0
1
ϑ
2
Kovariante Formulierung einer Theorie
Das Relativitätsprinzip verlangt, daß Naturgesetze Lorentz–invariant sind, daß
sie also in gleicher Form in K und in K0 gelten, wenn K und K0 durch eine
Lorentztransformation verknüpft sind. Wie stellen wir die Lorentzinvarianz
sicher?
130
Der Vierervektor
x = (xν ) = (x, y, z, ict)
transformiert sich bei einer Lorentztransformation gemäß der Beziehung
x0 = Ax oder x0ν =
X
aνµ xµ ,
µ
wobei die Matrix A = (aνµ ) eine Drehung des Minkowskiraums beschreibt. Alle
andern Vektoren y = (yν ) des Minkowskiraums transformieren sich daher nach
dem selben Schema
X
aνµ yµ ,
y0 = Ay oder yν0 =
µ
ihre Koeffizienten yν ändern sich kovariant mit den Koeefizienten xν . Da die
Lorentztransformationen A orthogonal sind, lassen sie Skalarprodukte50 zwischen den Vektoren des Minkowskiraums invariant.
Wir brauchen uns um die Lorentzinvarianz eines physikalischen Gesetzes also
gar nicht mehr zu kümmern, wenn wir es konsistent als Beziehung
a=b
zwischen Vektoren a = (aν ) und b = (bν ) oder als Beziehung
a=b
zwischen Skalaren a und b des Minkowskiraums formulieren. Die entsprechende
Feststellung für Vektoren und Skalare im dreidimensionalen Euklidischen Raum
erscheint uns so selbstverstänlich, daß wir sie nie explizit erwähnt haben. Newtons Lex secunda ṗ = F und der Energiesatz E = const beispielsweise gelten
unabhängig von der Orientierung des Koordinatensystems. (Beachte dabei aber,
daß eine Vektorkomponente, etwa Fz , kein Skalar ist!)
Eine solche konsistente Formulierung heißt kovariant, ihre Elemente51 nennen
wir Vierer–Vektoren und Vierer–Skalare oder Lorentz–Skalare. Nicht kovariant ist also z.B. eine Beziehung a3 = b zwischen einer Vektorkomponente und
einem Skalar, denn der Skalar bleibt bei einer Lorentztransformation invariant,
während die Vektorkomponente sich ändert.
Nun ist natürlich nicht jedes Schema von vier Zahlen (z.B. [Länge, Breite, Höhe,
Gewicht]) ein Vektor des Minkowskiraums, und — was für uns besonders wichtig ist — nicht jeder Vektor des R3 läßt sich zu einem Vierer–Vektor ergänzen.
Vektorbeziehungen im R3 müssen vor einer vierdimensionalen Ergänzung also im
allgemeinen abgeändert werden.
50
Wir erinnern an Fußnote 47, S. 121. Skalarprodukte sind also ebenfalls ohne komplexe
Konjugation zu verstehen!
51
Eine Verallgemeinerung auf Vierer–Tensoren sparen wir uns hier. Neben der hier bevorzugten Terminologie werden auch die Bezeichnung Welt–Vektoren und Welt–Skalare verwendet.
131
Wie finde ich dann Vierer–Vektoren?
Erstens, indem ich von bekannten Vierer–Vektoren a, b, . . . ausgehe und mich
überzeuge, daß damit auch
a ± b und ca
Vierer–Vektoren sind, wenn nur c einen Skalar ist. Und Skalare sind neben reinen Zahlwerten und physikalischen Konstanten (Lichtgeschwindigkeit, Ladung,
(Ruh–)Masse usw.) insbesondere die Skalarprodukte
a·b=
4
X
a ν bν
ν=1
von Vierer–Vektoren.
Die zweite Möglichkeit besteht darin, eine als Lorentz–invariant erkannte (oder
postulierte) Größe a als Skalarprodukt mit einem bereits bekannten Vierervektor zu deuten. Hiervon wird insbesondere bei der kovarianten Formulierung der
Elektrodynamik Gebrauch gemacht52 .
Wir nutzen hier die erste Möglichkeit und gehen von dem Vierer–Ortsvektor
x = (x, y, z, ict)
aus, der uns ein Punkt–Ereignis (Ort, Zeitpunkt) im Minkowskiraum lokalisiert.
Als ersten neuen Vierer–Vektor bilden wir den Differenzvektor
d = x 2 − x1 ,
der den Abstand zweier Punktereignisse x1 und x2 im Minkowskiraum repräsentiert.
Sein Abstandsquadrat
2
d =
3
X
i=1
2
(x2i − x1i )2 − c2 (t2 − t1 )2 = r12
− c2 (t2 − t1 )2
kann kleiner oder größer als Null sein, je nachdem die räumliche Distanz r12 in
der Zeitspanne |t2 − t1 | durch Licht überbrückt werden kann oder nicht, oder —
salopp ausgedrückt — je nachdem die zeitliche oder räumliche Distanz überwiegt.
Finden die Ereignisse x1 und x2 insbesondere am selben Ort statt, so wird
d2 = −c2 (t2 − t1 )2 < 0,
52
Ein Beispiel: Der Vierer–Vektor (Aν ) = (Ax , Ay , Az , iϕ/c) wird eingeführt, indem man die
als Lorentz–invariant
postulierte Lorentzeichung div A + c−2 ∂ϕ/∂t = 0 über das SkalarproP
dukt
∂Aν /∂xν mit dem Vierer–Vektor ∇4 = (d/dxν ) deutet.
132
der Abstand ist “zeitartig”. Finden sie dagegen zur gleichen Zeit statt, so ist der
Abstand “raumartig” und es gilt
2
d2 = r12
> 0.
Wir verallgemeinern die Begriffe und nennen
• Vierervektoren mit negativem Betragsquadrat zeitartig und
• Vierervektoren mit positivem Betragsquadrat raumartig.
Man kann durch eine räumliche Drehung im R3 stets erreichen, daß der räumliche
Anteil des Abstandes in x3 = z–Richtung fällt. Mit Gl. (231) lassen sich dann die
folgenden beiden Aussagen leicht beweisen: Ist der Abstand d = x2 − x1 zweier
Punktereignisse x1 und x2
• zeitartig, so läßt sich immer eine Lorentztransformation mit v < c in ein
Koordinatensystem K0 angeben, in dem die beiden Ereignisse am gleichen
Ort stattfinden.
• raumartig, so läßt sich immer eine Lorentztransformation mit v < c in
ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse gleichzeitig
stattfinden.
Der Minkowskiraum wird durch den Lichtkegel (seine Projektion auf den R3
ist die Lichtkugel)
r 2 = c 2 t2
in zeit– und raumartige Gebiete geteilt (siehe Skizze). Dabei ist wichtig, daß all
diese Begriffe wegen der Definition über ein Skalarprodukt Lorentz–invariant
sind.
ct
l
Li
e
eg
ch
tk
tk
ch
eg
e
l
Li
Zukunft
zeitartig
Gegenwart
Gegenwart
raumartig
raumartig
Vergangenheit
zeitartig
133
z
Die Gegenwart wird im Minkowskiraum durch die Hyperebene t = 0 (also durch
die z–Achse in der Skizze) repräsentiert. Da sich alle raumartigen Vektoren so
transformieren lassen, daß die Zeitkomponente t0 = 0 wird, ist es sinnvoll, den
gesamten raumartigen Bereich als Gegenwart zu bezeichnen. Die Gegenwart
teilt den zeitartigen Bereich in die Zukunft und in die Vergangenheit. Hängt das
Ereignis 2 kausal von Ereignis 1 ab, so liegt x2 von x1 aus gesehen in der Zukunft.
Der Abstand x2 − x1 ist also zeitartig und es gilt (in allen Koordinatensystemen)
t2 > t 1 .
Wir betrachten nun insbesondere Punktereignisse, die zur Bahn eines Teilchens im
Minkowskiraum gehören. Ihr Abstand ist wegen v < c auf jeden Fall zeitartig,
und wir benutzen ihn, um das Lorentz–invariante Differential dτ der Eigenzeit
zu definieren:
2
2
c dτ = −
4
X
ν=1
2
2
3
X
2
(dxν ) = c dt −
oder
dτ =
i=1
q
(dxi )2 = (c2 − v 2 )dt2
1 − β 2 dt .
(236)
Offenbar ist die Eigenzeit τ die Zeit, welche in einem System abläuft, in dem
das Teilchen (momentan) ruht (β = 0). Sie verläuft langsamer als die Zeit in
jedem andern Kordinatensystem. Wir können hier unmittelbar an die Diskussionen im Abschnitt 5.5 anknüpfen: Die Eigenzeit τ ist ein Maß für die Zahl der
Herzschläge des Raumfahrers im Zwillingsparadoxon, und sie mißt die myonische
Lebenserwartung τµ im System des Myons. In der Anschrift
dt = √
dτ
1 − β2
sehen wir auch unmittelbar die Zeitdilatation, mit der ein äußerer (also gegenüber
dem Teilchen bewegter !) Beobachter die innere Uhr des Teilchens registriert.
Da das Differential dτ der Eigenzeit Lorentz–invariant ist, wäre es verlockend,
hiervon ausgehend eine Weltzeit τ zu definieren. Das ist aber nicht möglich, da
die im System gemessene Zeitspanne
∆τ =
Z
dτ
Weg
nach Ausweis des Zwillingparadoxonsnicht wegunabhängig ist.
Aus dem Vierer–Vektor x und dem Lorentz–Skalar dτ können wir den Vektor
der Vierer–Geschwindigkeit
u=
dx
dτ
oder
uν =
134
dxν
1
dxν
=√
dτ
1 − β 2 dt
(237)
bilden. Aus der expliziten Anschrift
ui = √
vi
(i = 1, 2, 3)
1 − β2
und
u4 = √
ic
1 − β2
(238)
lesen wir erstens ab, daß seine räumlichen Komponenten für β → 0 in die gewöhnlichen Geschwindigkeiten53 vi übergehen, während als vierte Komponente
die Lichtgeschwindigkeit c erscheint. Zweitens finden wir, daß sein Betragsquadrat
X
ν
u2ν =
c2
v2
−
= −c2
1 − β2 1 − β2
(239)
konstant und negativ ist. u ist also ein zeitartiger Vierer–Vektor.
Schließlich liegt es noch nahe, durch Multiplikation mit der Masse m0 den Vierer–
Impuls
p = m0 u oder pν = m0 uν
(240)
mit den expliziten Koeffizienten
m0 v i
pi = √
= mr vi (i = 1, 2, 3)
1 − β2
und
im0 c
p4 = √
= imr c
1 − β2
(241)
zu bilden. Durch die Einführung der “relativistischen Masse”
mr = √
m0
1 − β2
(242)
wird diese Beziehung besonders suggestiv. Um Verwechslungen auszuschließen,
haben wir die Lorentz-invariante Masse m0 mit dem Index 0 versehen und
bezeichnen sie als Ruhmasse.
Im Gegensatz zu m0 wächst mr also mit der Geschwindigkeit und hängt damit
vom Bezugssystem ab. Über die Frage, ob die Ruhmasse oder die relativistische
Masse54 als die eigentliche Masse m angesehen werden soll, ist gelegentlich mit
Eifer gestritten worden. Während die Unabhängigkeit vom Bezugssystem für m0
spricht, liefert der folgende Abschnitt auch starke Argumente für mr . Wir sehen in
dem Problem letztlich eine Geschmacksfrage und vermeiden die mißverständliche
Bezeichnung m ohne Index 0 oder r.
Damit haben wir die Elemente zusammengetragen, die wir für eine relativistische
Korrektur der klassischen Mechanik benötigen.
53
Beachte: v selbst läßt sich für β 6= 0 nicht zu einem Vierer–Vektor ergänzen!
In älteren Darstellungen findet man daneben auch noch longitudinale und transversale
Massen, vgl. Gl. (258) und Fußnote 55 auf S. 141.
54
135
5.8
Relativistische Mechanik
Daß die drei Komponenten der Vektoren ṗ = m0 v̇ und F aus Newtons Lex
secunda
dpi
= Fi
dt
(243)
sich nicht zu einem Vierer–Vektor ergänzen lassen, wissen wir bereits. Denn die
Lex secunda ist Galilei– und nicht Lorentz–invariant. Wir haben aber bereits
den kovarianten Vierer–Impuls p eingeführt [Gln. (240, 241)]. Seine Ableitung
nach der Lorentz–invarianten Eigenzeit τ ist wieder ein Vierervektor. In Anlehnung an die Lex secunda bezeichnen wir diesen Vierer–Vektor als Minkowski–
Kraft
K=
dp
dτ
oder Kν =
dpν
.
dτ
(244)
Wie hängen nun die räumlichen Komponenten Ki mit den Newtonschen Kraftkomponenten Fi zusammen?
Um das zu entscheiden, brauchen wir eine kovariante Formulierung der Kraft. Die
steht zwar eigentlich nur für elektromagnetische Kräfte zur Verfügung, man kann
jedoch argumentieren, daß andere Kräfte sich ebenso transformieren müssen wie
elektromagnetische. Denn der Begriff des Gleichgewichts muß Lorentz–invariant
sein.
Wir verzichten hier auf diese Anleihe bei der kovarianten Elektrodynamik, verlassen uns auf die “prophetische Sicherheit” der Newtonschon Formulierung
(Sommerfeld, vgl. S. 3) und definieren die Newtonsche Kraft F durch Gl. (243).
Allerdings soll dabei pi nicht m0 vi , sondern im Einklang mit den Gln. (241) und
(244) die räumlichen Komponenten
m0 v i
pi = m r vi = √
1 − β2
√
des Viererimpulses bezeichnen. Wegen dτ = 1 − β 2 dt folgt so der Zusammenhang
Ki = √
Fi
(i = 1, 2, 3) ,
1 − β2
(245)
der natürlich mit der elektrodynamischen Formulierung übereinstimmt.
Wir könnten nun an dieser Stelle das ganze Raum–Zeit–Gefüge der Speziellen
Relativitätstheorie vergessen, den Minkowskiraum verlassen und als einzige relativistische Korrektur die veränderliche Masse mr in Newtons Lex secunda
136
aufnehmen:
d
(mr vi ) = Fi .
dt
(246)
So werden wir im nächsten Abschnitt verfahren.
Im Augenblick bleiben wir jedoch noch im Minkowskiraum und fragen nach der
vierten Komponente der Minkowski–Kraft. Dazu bilden wir nach Gln. (240) und
(244)
du
m0 d 2
K · u = m0 u ·
=
u = 0,
dτ
2 dτ
denn u2 ist nach Gl. (239) konstant. Die Minkowski–Kraft steht also stets senkrecht auf der Vierer–Geschwindigkeit. Damit läßt sich die Komponente K4 aus
K1 , K2 , K3 berechnen, denn aus
X
ν
3
X
1
√
Kν uν =
Ki vi + icK4 = 0
1 − β 2 i=1
!
folgt wegen Gl. (245)
i F·v
K4 = √
.
c 1 − β2
(247)
K4 hängt also eng mit der von der Kraft F je Zeiteinheit geleisteten Arbeit F · v
zusammen. Sehen wir uns dazu die vierte Komponente der “Bewegungsgleichung”
(244) an [vgl. auch (241)]:
dmr
dp4
i F·v
√
=
ic
.
=
K
=
4
c 1 − β2
dτ
dτ
Mit dτ =
√
1 − β 2 dt folgt also
d
mr c 2 = F · v .
dt
Der Zusammenhang
dA = F · vdt = dT
zwischen der durch die Kraft F geleisteten Arbeit dA und der Zunahme dT der
kinetischen Energie zwingt uns also, den Ausdruck
m0 c 2
T = m r c2 = √
1 − β2
(248)
— abgesehen von einer zunächst bedeutungslosen additiven Konstanten — als die
relativistische kinetische Energie anzusehen. Durch Entwicklung der Wurzel
folgt
137
T → m0 c
2
β2
1+
2
!
1
= m 0 c 2 + m0 v 2
2
(β → 0) .
(249)
Damit ist der Zusammenhang mit der nicht-relativistischen Energie T = m0 v 2 /2
hergestellt. Die willkürlich erscheinende additive Konstante
E0 = m 0 c2 ,
(250)
die Ruhenergie des Teilchens, ziehen wir nicht ab, weil T nur mit dieser Konstanten als vierte Komponente des Vierer-Impulses [vgl. Gl. (241)] angesehen
werden kann:
m0 v i
= mr vi (i = 1, 2, 3)
pi = √
1 − β2
und
i
p4 = T .
c
(251)
Der Vierer–Vektor p wird darum auch als Energie–Impuls–Vektor bezeichnet.
Wegen p = m0 u ist sein Betragsquadrat konstant und es gilt [vgl. Gl. (239)]
p2 = −m20 c2 =
X
i
p2i −
T2
.
c2
Daraus folgt die häufig benutzte relativistische Beziehung
2
T =
m20 c4
+c
2
3
X
p2i
(252)
i=1
zwischen kinetischer Energie und Impuls.
Die Bewegungsgleichungen (244) im Minkowskiraum lassen sich mit den Gln.
(245), (247) und (251) in der klassischen Form
dpi
= Fi
dt
und
dT
=F·v
dt
(253)
schreiben, der man ihren relativistischen Hintergrund gar nicht mehr ansieht.
Speziell für die kräftefreie Bewegung mit F = 0 folgt auch wieder, daß sowohl
p als auch T konstant sind. Im Gegensatz zur nicht–relativistischen Mechanik
ist nun aber T keine sekundäre, abgeleitete Größe mehr, sondern der Impuls p
und die kinetische Energie T gehören nun a priori zu einem einheitlichen Ganzen
zusammen. Das hat für Systeme mit inneren Freiheitsgraden Konsequenzen von
fundamentaler Bedeutung:
Während es in der nicht–relativistischen Mechanik — etwa bei inelastischen Stoßprozessen — sehr wohl Situationen gibt, in denen der Impuls, nicht aber die kinetische Energie erhalten bleibt, verlangt die Lorentz–invarianz nach Ausweis der
138
kovarianten Formulierung, daß bei Impulserhaltung auch die kinetische Energie
T = mr c2 erhalten bleibt. Das ist in voller Allgemeinheit offenbar nur möglich,
wenn die Masse m0 nicht generell konstant ist, sondern über die berühmte Einsteinsche Beziehung
∆E = ∆m0 c2
(254)
mit einer eventuellen Änderung ∆E der inneren Energie verknüpft ist. Betrachten
wir etwa den Zerfallsprozeß eines ruhenden Teilchens der Masse m0 , so haben wir
vor bzw. nach dem Zerfall die kinetische Energien
T0 = m 0 c 2
bzw. T1 =
X
mir c2 =
X
(mi0 c2 + i ),
wenn mi0 die Massen und i die Bewegungsenergien der Zerfallsprodukte bezeichnet. Da wegen der Impulserhatung aber T1 = T0 gelten muß, folgt
m0 =
X
mi0 + ∆E/c2 ,
wobei der “Massendefekt” ∆E/c2 der Änderung ∆E =
entspricht.
P
i der inneren Energie
Für unsere alltägliche Erfahrung ist diese Massenänderung allerdings nicht sehr
groß: Das Äquivalent einer Kilowattstunde beträgt
∆m(1kWh) =
3.6 · 106 Ws
= 0.4 · 10−10 kg = 4 · 10−8 g ,
9 · 1016 m2 /s2
oder anders ausgedrckt: Der Preis von 16 ct für Energie aus der Steckdose entspricht einem Preis von 4 Mio. EUR für 1g Materie!
Als Einstein im Jahr 1905 die Äquivalenz von Masse und Energie formulierte,
war es noch nicht möglich, diese fundamentale Aussage experimentell zu überprüfen. Heute ist die Bestätigung bekanntlich keine Frage mehr.
5.9
Die relativistische Bewegungsgleichung
Wie bereits angkündigt, verlassen wir nun den Minkowskiraum und wenden uns
den praktischen Problemen der relativistischen Bewegungsgleichung [vgl. (246)]
d
m0
mr v = F mit mr = q
dt
1−
v2
c2
(255)
zu. Der einzige Unterschied zur nicht–relativistischen Mechanik zeigt sich also
darin, daß sich die zeitliche Ableitung auch auf die veränderliche Masse mr erstreckt. Die Auswirkung demonstrieren wir an einem einfachen Beispiel:
139
Wir berechnen die Bewegung z(t) eines zur Zeit t = 0 ruhenden Elektrons in
einem konstanten elektrischen Feld E = Eez . Die Bewegungsgleichung
d m0 v
√
= eE
dt 1 − β 2
läßt sich sofort einmal integrieren:
√
m0 v
= eEt .
1 − β2
Wenn wir nach v auflösen, erhalten wir
v=q
ceEt
m20 c2 + e2 E 2 t2
=q
cvnr
mit vnr =
2
c2 + vnr
e
Et .
m0
(256)
Für kleine Zeiten eEt/m0 c folgt also wie erwartet das nicht–relativistische
Ergebnis v → vnr . Im Gegensatz zu vnr bleibt v aber immer kleiner als c und
strebt für große Zeiten gegen c. Wenn wir Gl. (256) in der Form
c dq 2 2
dz
=
m 0 c + e 2 E 2 t2
dt
eE dt
schreiben, können wir sogleich nochmals integrieren und erhalten
s
m0 c 2
z=
eE
!
e 2 E 2 t2
1+
−1 .
m20 c2
Auch hier läßt sich das Grenzverhalten z →
große Zeiten wieder leicht interpretieren.
1 eE 2
t
2 m0
für kleine bzw. z → ct für
Wenn wir das Ergebnis in der Form
s
eEz + m0 c2 = m0 c2 1 +
2
vnr
c2
schreiben und Gl. (256) nach
1+
2
vnr
1
=
.
2
c
1 − v 2 /c2
umformen, sehen wir, daß die Bewegung den Energiesatz
erfüllt.
m c2
√ 0 2 − eEz = T + V = m0 c2 = const
1−β
140
(257)
In diesem einfachen Beispiel haben wir eine eindimensionale Bewegung betrachtet. Allgemein erhalten wir aus Gl. (255)
m0
v · v̇
m0 v · v̇
v= √
v
v̇ + 2
F = mr v̇ +
v 2 3/2
2
c (1 − β 2 )
1−β
(1 − c2 )
!
.
F und v̇ haben also im allgemeinen nicht mehr die selbe Richtung55 . Für die
Komponenten parallel (k) und senkrecht (⊥) zu v erhalten wir
m0
v̇k = Fk
(1 − β 2 )3/2
√
und
m0
v̇⊥ = F⊥ .
1 − β2
(258)
[Zur Vertiefung unseres Verständnisses wollen wir Gl. (258) aus der unterschiedlichen
Sicht verschiedener Koordinatensysteme interpretieren. K 0 sei das Koordinatensystem,
in dem das Teilchen momentan ruht. Die Beschleunigung wird in K 0 also durch Newtons Lex secunda
dvk0
dv 0
m0 0 = Fk0 und m0 ⊥0 = F⊥0
dt
dt
beschrieben. Nach dem Additionstheorem (235) gilt
v + dvk =
v + dvk0
1 + vdvk0 /c2
= (v + dvk0 )(1 − vdvk0 /c2 ) = v + (1 − v 2 /c2 )dvk0 ,
also
dvk
.
1 − β2
Für die ⊥–Bewegung gilt x0 = x, also haben wir
dt
0
v⊥
= 0 v⊥ .
dt
dvk0 =
Mit dt0 =
p
1 − β 2 dt folgt also
m0
v̇k = Fk0
(1 − β 2 )3/2
m0
v̇⊥ = F⊥0 .
1 − β2
und
(259)
Zur Transformation der Kraft beziehen wir uns zunächst auf die kovariante Minkowskikraft F. Wegen v 0 = 0 in K0 erhalten wir nach (245) und (247)
Ki0 = Fi0
und K40 = 0 .
Ki0 transformiert sich nun mit der selben Lorentztransformation wie x 0i , also
Kk = p
Fk
1
(Kk0 − iβK40 ) = p
2
1−β
1 − β2
Im System K gilt schließlich nach (245) F i =
Fk = Fk0
0
und K⊥ = K⊥
= F⊥0 .
p
und F⊥ =
1 − β 2 Ki , also
q
1 − β 2 F⊥0 .
(260)
Damit geht die Bewegungsgleichung (259) in (258) über.]
55
Aufgrund dieser Tatsache sprach man früher der Masse einen Tensorcharakter zu und unterschied entsprechend Gl. (258) insbesondere die longitudinale und die transversale Masse.
141
5.10
Relativistischer Lagrangeformalismus
Ausgehend von der Bewegungsgleichung (255) kann man wie im nicht–relativistischen Fall einen Lagrangeformalismus aufbauen: Der relativistische Impuls
m0 v i
pi = √
1 − β2
läßt sich als Ableitung eines kinetischen Potentials G schreiben:
∂G
pi =
∂vi
mit G = −m0 c
2
s
1−
v2
.
c2
(261)
Ist die Kraft in der Form
∂V
∂xi
aus einem Potential V herleitbar, können wir daher die relativistische Lagrangefunktion
Fi = −
L = G − V = −m0 c
2
q
1 − β2 − V
(262)
einführen und erhalten die Bewegungsgleichung (255) in der Form
d ∂L
∂L
−
= 0.
dt ∂ ẋi ∂xi
(263)
Wir können auch wieder eine Hamiltonfunktion
H=
X
i
pi ẋi − L mit pi =
∂G
∂L
=
∂ ẋi
∂ ẋi
(264)
bilden, deren Wert
q
m0 v 2
m0 c 2
2
2
√
√
H=
+ m0 c 1 − β + V =
+V =T +V
1 − β2
1 − β2
(265)
die Gesamtenergie repräsentiert. Wenn wir hier noch β durch die pi ausdrücken,
erhalten wir die Bewegungsgleichungen in der kanonischen Form
ṗi = −
∂H
∂xi
und ẋi =
142
∂H
.
∂pi
(266)
Wir können auch Systeme von Massenpunkten betrachten, generalisierte Koordinaten einführen und erhalten wie im nicht–relativistischen Fall die Lagrangegleichungen
d ∂L
∂L
−
= 0.
dt ∂ q̇k ∂qk
(267)
Es gilt auch weiterhin, daß der zu einer zyklischen Variblen konjugierte Impuls
konstant ist, und daß aus
∂L
∂H
=−
=0
∂t
∂t
der Energiesatz in der Form
H = T + V = const
(268)
folgt. Schließlich können wir wie früher die elektromagnetischen Kräfte in den
Formalismus einbinden, indem wir V durch ein generalisietes Potential (vgl. Abschnitt 2.4)
U = eΦ − ev · A
(269)
ersetzen.
Obwohl die Rechnung im Detail wesentlich komplizierter sein kann, läuft das
Verfahren im Prinzip also wie im nicht–relativistischen Fall ab. Trotzdem sind
einige kritischen Punkte zu erwähnen.
• Zunächst ist aus systematischer Sicht zu bemängeln, daß der Formalismus
zwar die relativistisch korrekten Bewegungsgleichungen liefert, aber nicht
kovariant formuliert ist. Vielmehr bezieht er sich auf ein festes System K
und benutzt die Zeit t in K als Parameter. Dies macht es schwierig, die
Ergebnisse in ein anderes System zu übertragen.
Nun ist es zwar grundsätzlich nicht schwierig, einen kovarianten Lagrangeformalismus aufzubauen, der direkt von der vierdimensionalen Bewegungsgleichung
(244) ausgeht und mit u und τ statt mit v und t arbeitet (vgl. z.B. Goldstein
Abschnitt 6-6). Es muß aber darauf hingewiesen werden, daß eine konsistente
kovariante Beschreibung von Kräften nur in der Elektrodynamik zur Verfügung
steht. Damit kommen wir bereits zu den wesentlichen Defiziten unserer speziellrelativistischen Theorie:
• Statische Kräfte mit einer instantanen Fernwirkung (Wechselwirkungspotentiale Vij (rij ), Gravitation!) können nicht Lorentz–invariant formuliert
werden, denn eine Wechselwirkung kann höchstens mit Lichtgeschwindigkeit übertragen werden.
143
• Aus dem selben Grund sind die meisten Zwangsbedingungen nicht mit der
Lorentzinvarianz verträglich. Das gilt insbesondere für das gesamte Konzept des starren Körpers.
• Beschleunigte Bezugssysteme, (insbesondere rotierende) Koordinatensysteme können nicht problemlos in eine speziell-relativistische Theorie integriert
werden.
Mit diesen Bemerkungen stehen wir bereits an der Schwelle zur allgemeinen
Relativitätstheorie. Wenn wir diese umfassendere Theorie hier auch nicht mehr
behandeln können, so wollen wir ihren Grundgedanken doch zur Überleitung in
das letzte Kapitel dieser Vorlesung aufgreifen:
5.11
Grundgedanken zur allgemeinen Relativitätstheorie
Wir hatten bereits im Zusammenhang mit dem Relativitätsprinzip (Fußnote 45
auf S. 116) die Schwierigkeit angedeutet, wahre und Scheinkräfte zu unterscheiden. Aus solchen Überlegungen heraus verallgemeinerte Einstein das Relativitätsprinzip bewegter Inertialsysteme zum allgemein relativistischen Äquivalenzprinzip beschleunigter Bezugssysteme: Mit der grundsätzlichen Äquivalenz
von träger und schwerer Masse postulierte er, daß die Scheinkräfte in beschleunigten Koordinatensystem prinzipiell nicht von der Gravitation unterschieden
werden können.
Dieses Postulat hat die Konsequenz, daß der ohnehin schon befremdliche Minkowskiraum in der Nähe großer Massen auch noch gekrümmt ist. Damit ist
beispielsweise gemeint, daß die Erdoberfläche (unmeßbar) kleiner ist als 4πrE2 .
Die Krümmung betrifft aber auch die Zeit:
• Uhren im Tal gehen langsamer als Uhren auf dem Berg!
Darum ist es nicht gleichgültig, ob man erst eine Stunde das Tal entlang geht
und dann eine Stunde lang aufsteigt oder ob man erst aufsteigt und dann einen
Höhenweg benutzt. Die Differenz der Endpunkte dieser verschiedenen Wege in
der Raum–Zeit deutet auf eine Krümmung der x3 –x4 –Ebene.
Das Maß der Zeitdehnung findet man am leichtesten aus der Frequenzverstimmung
h̄ω (1 + φ/c2 ) = h̄ω0 ,
welche der Energiesatz für Photonen im Gravitationspotential φ verlangt. Addieren wir versuchsweise die entsprechende Zeitverstimmung mit der Zeitdilation
der speziellen Relativitätstheorie, so erhalten wir
144
q
dτ = ( 1 − β 2 + φ/c2 )dt
(270)
als Differential der Eigenzeit.
Und nun kommen wir noch einmal auf das Zwillingsparadoxon zurück: Der Bruder, der im gravitationsfreien Fall in seinem unbeschleunigten Inertialsystem bleibt,
der also immer Newtons Lex prima ṗ = 0 erfüllt, altert schneller als sein Bruder, der irgendeinen andern Weg im Minkowskiraum wählt. Die gleichförmige
Bewegung der Lex prima Newtons ist also im kräftefreien Fall dadurch ausgezeichnet, daß die Zeitspanne
τ12 =
Z(2)
dτ
(1)
größer wird als bei jeder anderen Bewegung.
Sollen nun Gravitation und Beschleunigung wirklich äquivalent sein, dann muß
auch das “schwerelose” System K0 , das einem frei fallenden Körper folgt, ein
kräftefreies Inertialsystem sein. Der frei fallende Körper, der nach der Lex prima
in K0 ruht, muß also ebenfalls durch ein maximales τ12 ausgezeichnet sein.
In dem nicht–schwerelosen “festen” System K ist dτ durch Gl. (270) gegeben. Mit
der Lagrangefunktion [vgl Gl. (262]
q
L = −m0 c2 1 − β 2 − m0 φ
finden wir den Zusammenhang
dτ = −
L
dt .
m0 c 2
Das Äquivalenzprinzip verlangt also für die Bewegung im Gravitationsfeld eine
maximale Eigenzeit
τ12
1
=−
m0 c 2
Z(2)
L dt .
(271)
(1)
Wird diese Forderung von den Bewegungsgleichungen der Lex secunda erfüllt?
Mit dieser Frage kommen wir zum Hamiltonschen Prinzip, mit dem wir nun
das Schlußkapitel einleiten.
145
6
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip
Wir haben das letzte Kapitel mit der Frage beendet, ob die Bewegung im Schwerefeld so verläuft, daß die Eigenzeit maximal wird. Wir fragen nun allgemeiner
nach den Bedingungungen dafür, daß das Integral
J=
Z(2)
F (q, q̇, t)dt
(272)
(1)
extremal — oder genauer: stationär — wird. Mit dieser Frage soll präziser das
folgende Problem charakterisiert werden:
Wie muß bei
• vorgebenem Startpunkt q(t1 ) = q1 zur Zeit t = t1 und bei
• vorgebenem Endpunkt q(t2 ) = q2 zur Zeit t = t2
die Bahn q(t) im Konfigurationsraum gewählt werden, damit das Integral J ein
Extremum annimmt?
Dieses Problem stellt die Grundaufgabe der Variationsrechnung dar. Sie erinnert
an das Aufsuchen von Extrema in der Differentialrechnung und läßt sich auch in
der Tat darauf zurückführen. Wenn wir nämlich die (noch unbekannte) Lösung
mit q(t) bezeichnen, setzen wir
qk0 (t) = qk (t) + εηk (t) = qk + δqk
(273)
mit beliebigen Variationen ηk (t), die allein der Bedingung
ηk (t1 ) = ηk (t2 ) = 0
unterworfen sind. Damit wird J eine Funktion von ε, die für ε = 0 ein Extremum
annehmen soll. Das führt auf die Bedingung
dJ δJ = ε
=
dε ε=0
Z(2) X
f (
(1) k=1
)
∂F
∂F
δqk +
δ q̇k dt = 0 .
∂qk
∂ q̇k
(274)
Ehe wir Gl. (274) auswerten, machen wir uns klar, daß wir notwendige Bedingungen für Extrema herleiten, die keineswegs hinreichend sind. Statt von extremalem
146
Verhalten sollten wir daher besser von stationärem Verhalten sprechen: δJ = 0
bedeutet, daß sich J bei einer infinitesimalen Variation der Bahn nicht ändert.
Falls wirklich ein Extremum vorliegt, ist das im allgemeinen lokal zu verstehen.
Außerdem können wir nicht zwischen einem Maximum und einem Minimum unterscheiden.
Wegen der wichtigen Unterscheidung zu anderen Variationsprinzipien der Mechanik weisen wir auch nochmals auf unsere Variationsregeln hin:
• Die Variationen δq beziehen sich ausschließlich auf die Bahn q(t) zwischen
zwei festen Endpunkten q1 (t1 ) und q2 (t2 ) im Konfigurationsraum.
• Die Zeit wird nicht variiert: δt = 0.
Damit ist auch klar, was die Variationen δ q̇k der Geschwingkeiten in Gl. (274)
bedeuten: Wenn wir Gl. (273) nach t differenzieren, erhalten wir nämlich
q̇k0 (t) = q̇k (t) + εη̇k (t) = q̇k + δ q̇k
oder
d
(δqk ) .
(275)
dt
Die generalisierten Geschwindigkeiten können also nicht unabhängig variiert werden. Um diesen Zusammenhang einzuarbeiten, integrieren wir Gl. (274) partiell
und erhalten
δ q̇k = εη̇k =
δJ =
Z(2)X (
(1)
k
∂F
d ∂F
−
∂qk dt ∂ q̇k
)
δqk dt +
X
k
t=t
2
∂F
δqk .
∂ q̇k t=t1
Der letzte Term dieser Gleichung verschwindet, weil wir die Randpunkte nicht
variieren dürfen. Davon abgesehen sind die δqk = εηk (t) aber beliebige Bahnvariationen. Wir können deshalb insbesondere
ηi = 0 f ür i 6= k
und ηk (t0 ) = 0 f ür t0 6∈ (t − τ, t + τ ) (τ → 0)
wählen und daraus schließen, daß die Klammern{} einzeln und in jedem Bahnpunkt verschwinden müssen:
Bedingung dafür, daß das Integral (272) ein Extremum annimmt (stationär wird)
ist also, daß q(t) die Euler– Lagrange–Gleichungen
∂F
d ∂F
−
=0
dt ∂ q̇k ∂qk
(276)
erfüllt. Die Form dieser Gleichungen ist uns von den Lagrangeschen Gleichungen vertraut. Die Bewegung in konservativen Systemen mit holonomen Zwangsbedingungen läuft also so ab, daß die Hamiltonsche Prinzipalfunktion oder kurz
das Wirkungsintegral
147
S=
Z(2)
Ldt
(277)
(1)
stationär wird. Die Stationaritätsbedingung
δS = δ
Z(2)
Ldt = 0
(278)
(1)
wird als Hamiltonsches Prinzip der kleinsten56 Wirkung bezeichnet.
Für den Spezialfall der Gravitation sehen wir im Hamiltonschen Prinzip das
relativistische Postulat (271) der maximalen Eigenzeit bestätigt. Das Prinzip gilt
aber allgemeiner und besitzt dabei kein Korrelat relativistischer Äquivalenzpostulate mehr.
Eine allgemeine anschauliche Interpretation gewinnt das Hamiltonsche Prinzip
aber beim Übergang zur Quantenmechanik. Dort wird ein Teilchen nicht durch
seine Bahn beschrieben, sondern durch eine Wellenfunktion, welche die Aufenthaltswahrscheinlichkeit repräsentiert. Man kann nun zeigen, daß
S
1
=
h̄
h̄
Z
Ldt
die Phase der Wellenfunktion beschreibt. Die Stationarität δS = 0 besagt dann,
daß sich in der Nähe des klassischen Weges die Wellenamplituden nicht durch
Interferenz weglöschen. Das Teilchen folgt danach nicht einfach der Bahn, sondern
es “riecht” alle Wege der Nachbarschaft (Feynman Lectures, Bd. II, Kap. 19).
Versperrt man die benachbarten Konkurrenzwege, so stört man die Bewegung
(Beugung!). Diese Interpretation macht auch deutlich, daß die Stationarität des
Wirkungsintegrals und nicht ein minimaler oder maximaler Wert entscheidend
ist.
6.2
Das Hamiltonsche Prinzip im Phasenraum
Das Hamiltonsche Prinzip ermöglicht einen eleganten (allerdings recht abstrakten) Aufbau der Mechanik: Wir können dieses Prinzip statt der Newtonschen
Axiome an die Spitze stellen und die Lagrangegleichungen deduktiv daraus herleiten (siehe z.B. Landau–Lifshitz). Aus den Lagrangegleichungen folgen
56
Es sei nochmals ausdrücklich darauf hingewiesen, daß die Behauptung eines Minimums
weder bewiesen noch allgemein gültig ist. Hier liegt offenbar noch ein Rest mittelalterlich teleologischer Denkweise verborgen.
148
weiter die völlig äquivalenten Hamiltonschen Bewegungsgleichungen oder kanonischen Gleichungen (siehe Abschnitt 2.8).
Wir wollen nun versuchen, die kanonischen Gleichung ohne den Umweg über die
Lagrangeschen Gleichungen direkt aus dem Hamiltonschen Prinzip herzuleiten. Dazu gehen wir von
L(q, q̇, t) =
X
k
pk q̇k − H(p, q, t) mit pk =
∂L
∂ q̇k
aus und bilden
δS = δ
Z(2)(X
(1)
k
)
pk q̇k − H(p, q, t) dt = 0 .
(279)
Wenn wir die Variation schematisch ausführen, erhalten wir
Z(2)X (
(1)
k
)
∂H
∂H
δpk −
δqk dt = 0
pk δ q̇k + q̇k δpk −
∂pk
∂qk
oder nach partieller Integration des ersten Terms
Z(2)X (
(1)
k
!
∂H
∂H
δpk − ṗk +
q̇k −
∂pk
∂qk
!
)
δqk dt = 0 .
(280)
Ehe wir voreilig versuchen, die kanonischen Gleichungen
q̇k =
∂H
∂pk
und ṗk = −
∂H
∂qk
(281)
aus dem Verschwinden der Klammern () in Gl. (280) abzulesen, müssen wir uns
überlegen, was unter den Variationen δpk denn überhaupt zu verstehen ist. Im
Prinzip müssen wir die δpk über δ q̇k aus den Variationen δqk im Konfigurationsraum berechnen. Diese Variationen sind also zunächst nicht unabhängig, und
daher dürfen wir nicht ohne weiteres auf die Gültigkeit der Gleichungen (281)
schließen. Andererseits kennen wir aber bereits die Gültigkeit der kanonischen
Gleichungen und können daraus umgekehrt folgern57 :
• Das Hamiltonsche Prinzip gilt sogar unter der erweiterten Konkurrenz
beliebiger Variationen δqk und δpk im Phasenraum.
57
Man beachte dazu, daß die Beziehungen q̇k = ∂H/∂pk , die eine unabhängige Variation
der δpk gestatten, bereits ohne die Bewegungsgleichungen aus der Konstruktion der Hamiltonfunktion folgen (vgl. S. 67 und Fußnote 23).
149
Umgekehrt können wir aus dem erweiterten Hamiltonprinzip im Phasenraum
die kanonischen Gleichungen deduzieren.
6.3
Kanonische Transformationen
Aus dem erweiterten Hamiltonsche Prinzip im Phasenraum folgt, daß die pk
des Hamiltonformalislismus im Gegensatz zu den q̇k der Lagrangeschen Formulierung eine eigenständige, den qk gleichwertige Bedeutung haben.
Die Gleichwertigkeit der pk und qk läßt es sinnvoll erscheinen, ganz auf die
grundsätzliche Unterscheidung von Koordinaten und Impulsen zu verzichten.
Statt generalisierte Koordinaten ausschließlich durch Punkttransformationen qk =
hk (xi , t) im Konfigurationsraum zu gewinnen, kann man dann durch allgemeinere
Transformationen
Qk = Qk (p, q, t) und Pk = Pk (p, q, t)
(282)
im Phasenraum zu neuen Sätzen von verallgemeinerten Koordinaten und Impulsen
übergehen. Die Transformationen (281) heißen kanonisch, wenn für die Qk und
die Pk wieder kanonische Gleichungen
∂K
∂K
und Ṗk = −
(283)
∂Pk
∂Qk
mit einer geeignet transformierten Hamiltonfunktion K(P, Q, t) gelten. Um das
sicherzustellen, brauchen wir nur zu fordern, daß für die neuen Koordinaten ein
Hamiltonsches Prinzip
Q̇k =
δ
Z(2)(X
(1)
k
)
Pk Q̇k − K(P, Q, t) dt = 0
(284)
gilt. Wegen unserer Vorschrift, die Randpunkte nicht zu variieren, ist das aber
sicher gewährleistet, wenn sich die Integranden von (279) und (284) nur um eine
totale Zeitableitung unterscheiden, etwa
X
k
Pk Q̇k − K(P, Q, t) =
X
k
pk q̇k − H(p, q, t) −
dΦ
.
dt
(285)
Φ kann dabei außer von der Zeit etwa von q und p abhängen. Wir können uns aber
auch denken, daß (nach Ausführung der Transformation) p durch einen Halbsatz
der neuen Koordinaten ersetzt wird und schreiben
Φ(q, p, t) = R1 (q, Q, t) .
150
Setzen wir
!
dΦ X ∂R1
∂R1
∂R1
Q̇k +
=
q̇k +
dt
∂qk
∂Qk
∂t
k
in Gl. (285) ein, so erhalten wir
X
k
!
!
X
∂R1
∂R1
∂R1
Pk +
q̇k = K − H −
pk −
Q̇k −
∂Qk
∂qk
∂t
k
!
.
Diese Gleichung können wir am einfachsten erfüllen, wenn wir die Transformation
so ausführen, daß alle Klammern () einzeln verschwinden. Wir erhalten damit die
Transformationsgleichungen
und
∂R1
,
∂qk
∂R1
,
= −
∂Qk
pk =
(286)
Pk
(287)
K(P, Q, t) = H(p, q, t) +
∂R1
.
∂t
(288)
R1 (q, Q, t) heißt die Erzeugende der kanonischen Transformation (286-288). Die
Gln. (286) liefern die erste Hälfte der Transformationsgleichungen. Sie legen in
impliziter Form fest, wie die neuen Koordinaten Qk von den alten Koordinaten
q und Impulsen p abhängen. Hat man sie nach den Qk aufgelöst, so erhält man
die konjugierten Impulse Pk explizit durch die Gln. (287). Aus Gl. (288) liest man
zudem die neue Hamiltonfunktion K ab, mit der die kanonischen Gleichungen
(283) gelten. Sie stimmt mit der alten Hamiltonfunktion überein, wenn die
Transformationsgleichungen die Zeit nicht explizit58 enthält.
Die formale Sonderstellung, die wir den Koordinaten q und Q bei der Konstruktion der Erzeugenden R1 zugewiesen haben, war rein willkürlich. Tatsächlich
können wir Koordinaten und Impulse völlig gleichwertig behandeln. Um zu Transformationsgleichungen zu gelangen, müssen wir nur darauf achten, daß wir von
einer Erzeugenden ausgehen, die von einem Halbsatz der alten und einem Halbsatz
der neuen Variablen abhängt. Um das zu sehen machen wir von einer Legendretransformation (siehe Abschnitt 2.8) Gebrauch und bilden eine neue Erzeugende
R2 (p, Q, t) = R1 (q, Q, t) −
X
p k qk .
k
Aus ihrem Differential
58
Bei explizit zeitabhängigen Transformationen läßt sich die Änderung der Hamiltonfunktion durch Pseudopotentiale von Scheinkräften interpretieren. Vgl. dazu S. (62).
151
dR2 =
X
k
(
!
)
∂R1
∂R1
∂R1
− pk dqk +
dQk − qk dpk +
dt
∂qk
∂Qk
∂t
und den Gl. (286-288) lesen wir sofort die partiellen Ableitungen
∂R2
∂R1
=
= −Pk
∂Qk
∂Qk
∂R2
= −qk ,
∂pk
und
∂R2
∂R1
=
=K−H
∂t
∂t
ab. In voller Analogie zu Gln. (286-288) ergibt das die Transformationsgleichungen
qk = −
∂R2
,
∂pk
Pk = −
∂R2
∂Qk
und K = H +
∂R2
.
∂t
(289)
Nach dem selben Schema können wir Q durch P ersetzen, indem wir von der
Erzeugenden
R3 (q, P, t) = R1 (q, Q, t) +
X
Pk Q k
k
ausgehen. Wir erhalten dann entsprechend die Transformationsgleichungen
pk =
∂R3
,
∂qk
Qk =
∂R3
∂Pk
und K = H +
∂R3
.
∂t
(290)
Schließlich können wir noch beide Halbsätze von Variablen austauschen und aus
der Erzeugenden
R4 (p, P, t) = R1 (q, Q, t) −
X
k
p k qk +
X
Pk Q k
k
die Transformationsgleichungen
qk = −
∂R4
,
∂pk
Qk =
∂R4
∂Pk
und K = H +
∂R4
.
∂t
(291)
gewinnen.
Wir wollen die vier Fälle der besseren Übersicht wegen in einer Tabelle zusammenfassen. Dabei verzichten wir in den Transformationsgleichungen auf eine Kennzeichnung der Erzeugenden durch Indizes:
152
..
.
..
.
Q
q
R1 (q, Q, t)
∂R
· · · · · · Pk = − ∂Q
k
p
R2 (p, Q, t)
P
∂R
∂qk
pk =
..
.
R3 (q, P, t)
···+···
..
.
Qk =
∂R
qk = − ∂p
k
..
.
∂R
∂Pk
···
R4 (p, P, t)
K = H + ∂R/∂t
In jedem Fall gehen wir also von einer Erzeugenden R aus, die von einem alten
und einem neuen Variablen–Halbsatz abhängt. Der jeweils konjugierte Halbsatz
ist dann durch die partiellen Ableitungen von R gegeben. Das richtige Vorzeichen erhält man aus der Merkregel, daß Ableitungen nach neuen Variablen und
Ableitungen nach Impulsen jeweils ein Minuszeichen bringen.
6.4
Beispiele für kanonische Transformationen
Wir beginnen mit einem trivialen Beispiel: Die Erzeugende
R1 (q, Q) =
X
qi Q i
(292)
i
führt auf die Transformationsgleichungen
pk =
∂R1
= Qk
∂qk
und Pk = −
∂R1
= −qk .
∂Qk
(293)
Abgesehen von einer Vorzeichenänderung, die zur unveränderten Anschrift der
kanonischen Gleichungen nötig ist, werden durch diese Transformation also Koordinaten und Impulse vertauscht. So trivial und nutzlos diese Operation auch ist,
so führt sie uns doch die Gleichwertigkeit von Koordinaten und Impulsen deutlich
vor Augen.
Die selbe Vertauschung Qk = pk und Pk = −qk von Koordinaten und Impulsen erhalten wir auch aus der Erzeugenden
R4 (p, P) =
X
p i Pi .
(294)
i
Es ist also nicht möglich, einer vorgebenen Transformation eindeutig eine Erzeugende zuzuordnen.
153
Ebenfalls einfach, aber bereits nützlicher ist die Erzeugende
R2 (p, Q) = −
X
pi fi (Q).
(295)
i
Sie erzeugt Punkttransformationen
qk = −
∂R2
= fk (Q)
∂pk
(296)
zwischen einem alten (q) und einem neuen (Q) Satz generalisierter Koordinaten.
Die zweite Hälfte
X
∂R2
∂fi
Pk = −
pi
=
(297)
∂Qk
∂Qk
i
liefert die zugehörigen neuen Impulse Pk .
Auch die Erzeugende
R3 (q, P) =
X
Pi gi (q) .
(298)
i
mit den Transformationsgleichungen
Qk =
∂R3 X ∂gi
∂R3
Pi
= gk (q) und pk =
=
∂Pk
∂qk
∂qk
i
(299)
liefert Punkttransformationen. Im Gegensatz zur Darstellung durch R2 erhält
man hierbei die neuen Koordinaten Qk jedoch explizit, dafür aber die neuen Impulse Pk nur noch implizit.
Eine triviale Punkttransformation stellt die identische Transformation
Qk = q k
und Pk = pk
(300)
dar. Wir können sie gleichwertig aus den aus den Erzeugenden
R2 id = −
X
pi Qi
oder R3 id =
i
X
Pi q i
(301)
i
gewinnen. Trotz der Trivialität sind diese Darstellungen ein nützlicher Ausgangspunkt zur Erzeugung infinitesimaler kanonischer Transformationen (siehe Abschnitt 6.6).
Nach diesen mehr oder weniger trivialen Beispielen wollen wir die Lösung eines
konkreten Problems durch eine nicht–triviale kanonischen Transformation demonstrieren: Zur Behandlung des harmonischen Oszillators bildet man gern die
Erzeugende
k 2
x cot ωQ mit ω 2 = k/m .
(302)
R1 (x, Q) =
2ω
Sie generiert die Transformationsgleichungen
p=
k
∂R1
= x cot ωQ und
∂x
ω
154
sin ωQ cos2 ωQ
k
∂R1
= x2
+
P =−
∂Q
2
sin ωQ sin2 ωQ
!
=
kx2
.
2 sin2 ωQ
Lösen wir die zweite Gleichung nach x auf und setzen sie anschließend in die erste
Gleichung ein, so erhalten wir
s
√
2 1/2
2k 1/2
x=
P sin ωQ
und
p=
P cos ωQ .
(303)
k
ω
Mit dieser Transformation geht die Hamiltonfunktion
H(p, x) =
p2
k
+ x2
2m 2
des harmonischen Oszillators in
K(P, Q) = H =
!
k
cos2 ωQ + sin2 ωQ P
2
mω
über. Mit ω 2 = k/m erhalten wir also die besonders einfache Hamiltonfunktion
K = P,
(304)
und die einzige Variable Q wird zyklisch. Darum ist P konstant, und es gilt
offenbar
P =K =H =E.
Die kanonische Gleichung
Q̇ =
∂K
=1
∂P
zeigt, daß die neue Koordinate
Q = t − t0
(305)
die Zeit beschreibt. Mit P = E und Q = t − t0 liefern die Transformationsgleichungen (303) explizit den Bewegungsablauf.
Die kanonische Transformation gestattet also in der Tat eine überaus elegante
Problemlösung — vorausgesetzt man hat Glück, und der Himmel verrät eine
geeignete Erzeugende. Was aber macht man, wenn man kein Glück hat und der
Himmel schweigt?
6.5
Die Hamiltonsche partielle Differentialgleichung
Wie bereits angedeutet, ist es nicht sehr befriedigend, bei der Suche nach einer
geeigneten kanonischen Transformation auf den Zufall oder die Intuition angewiesen zu sein. Wir suchen daher nach einem systematischen Weg, besonders
155
vorteilhafte Erzeugende zu finden. Der günstigste Fall liegt sicher vor, wenn die
neue Hamiltonfunktion K überhaupt nicht mehr von den neuen Variablen Pk
und Qk abhängt. Dann folgt nämlich
∂K
= 0,
∂Qk
∂K
Q̇k =
= 0,
∂Pk
Ṗk = −
also
P k = αk
also
Q k = βk
und
(306)
(307)
mit geigneten Integrationskonstanten αk und βk . Die neue Hamiltonfunktion ist
selbst konstant und kann gleich Null gewählt werden. Diese ’ideale’ Transformation auf einen vollständigen Satz von 2f Integrationskonstanten wollen wir dem
allgemeinen Brauch folgend aus einer Erzeugenden vom Typ R3 gewinnen, die wir
mit S bezeichnen und Wirkungsfunktion nennen. Mit (306) und (307) gelten
dann die Transformationsgleichungen
∂
S(q, α, t) und
∂qk
∂
=
S(q, α, t) .
∂αk
pk =
(308)
βk
(309)
In diesen Transformationsgleichungen ist bereits die gesamte Problemlösung enthalten (Satz von Jacobi): Bei vorgegebenen Integrationskonstanten αk , βk sind
die Koordinaten qk (t) implizit durch Gl. (309) bestimmt. Gl. (308) liefert die zugehörigen Impulse pk (t). Die 2f Integrationskonstanten αk und βk folgen mit den
selben Gleichungen aus den Anfangsbedingungen qk (0) und pk (0).
Existiert eine so wunderbare Erzeugende denn wirklich? Wenn ja: Hat sie eine
physikalische Bedeutung? Wie finde ich sie?
Wir hatten verlangt, daß S die neue Hamiltonfunktion zum Verschwinden bringt:
K = H(p, q, t) +
Setzen wir hierin
∂S
= 0.
∂t
(310)
dS X ∂S
∂S
=
−
q̇k
∂t
dt
∂qk
k
ein, so erhalten wir mit Gl. (308)
X
dS
=
pk q̇k − H = L .
dt
k
156
(311)
Die Wirkungsfunktion S ist also identisch mit dem im Abschnitt 6.1 [Gl. (277)]
definierten Wirkungsintegral. Bei der Diskussion des Hamiltonschen Prinzips
hatten wir erwähnt, daß S/h̄ die Phase der quantenmechanischen Wellenfunktion beschreibt. Die Gleichung S = const beschreibt also Wellenflächen gleicher
Phase. Auf diesen Wellenflächen steht der generalisierte Impuls nach Gl. (308)
senkrecht. Betrachten wir speziell ein Teilchen in kartesischen Koordinaten, so
sind die Wellenflächen S(x, α, t) = const also die orthogonalen Trajektorien aller
mit den Integrationskonstanten α verträglichen Teilchenbahnen. Oder umgekehrt:
Man erhält die möglichen Teilchenbahnen als orthogonale Trajektorien der Wellenflächen.
Damit läßt sich ein Bündel möglicher Teilchenbahnen mit einem Bündel von Lichtstrahlen in der geometrischen Optik vergleichen, und man kann tatsächlich zeigen, daß die Gleichungen der Wellenmechanik in der Näherung der geometrischen
Optik (λ → 0) auf die Hamilton–Jacobi–Theorie führen: Die klassische Mechanik unterscheidet sich von der Quantenmechanik genau durch das Fehlen von
Interferenz– und Beugungseffekten.
So ästhetisch schön und inhaltsschwanger die Beziehung (311) auch sein mag, so
wenig ist sie allerdings zur Berechnung von S geeignet. Denn die Integration von
Gl. (311) setzt ja bereits die Kenntnis der Teilchenbahnen, also die Lösung des
Problems, voraus. Zu einer Bestimmungsgleichung für S kommen wir aber, wenn
wir die Transformationsgleichungen (308) in Gl. (310) einsetzen. Wir erhalten
dann die Hamiltonsche partielle Differentialgleichung
H
!
∂S
∂S
, q, t +
=0
∂q
∂t
(312)
und sehen, welch hohen Preis wir für die wunderbare Erzeugende zu zahlen haben:
Während uns das Bewegungsproblem selbst ’nur’ mit einem System gewöhnlicher
Differentialgleichungen der Ordnung 2f konfrontiert, müssen wir zur Bestimmung
von S ein vollständiges Integral der partiellen Differentialgleichung finden, das 2f
freie Integrationskonstanten59 αk enthält.
Für diesen hohen Preis wird allerdings auch eine adäquat hohe Leistung geboten.
Denn die eine Funktion S enthält bereits die vollständige und fertig ausintegrierte
Information über sämtliche Lösungen des Bewegungsproblems für beliebige Anfangsbedingungen.
Der hohe Preis – und hier wird es wieder unbefriedigend – ist jedoch nur selten
bezahlbar. Praktisch kommt man nur in den Fällen zu der erwünschten Wirkungs59
Wegen der f + 1 partiellen Ableitungen gehören zur allgemeinen Lösung von Gl. (312)
eigentlich f +1 Integrationskonstanten. Eine davon ist jedoch die triviale additive Konstante,
die in den Transformationsgleichungen nicht auftaucht.
157
funktion S, in denen die Hamiltonsche partielle Differentialgleichung durch Separation gelöst werden kann. Damit meinen wir, daß S in eine Summe
S=
X
Sk (qk , α) + St (t, α)
(313)
k
zerfällt. Dieser glückliche Umstand beschränkt sich aber auch wieder auf diejenigen Fälle, in denen das Bewegungsproblem auch ohne Hamilton–Jacobi–
Theorie in allgemeiner Form lösbar ist60 .
Der zeitliche Anteil St läßt sich immer abseparieren, wenn die Hamiltonfunktion
nicht explizit von t abhängt. Dann gilt nämlich H = Ê = const61 und aus Gl.
(312) folgt
∂S
= −Ê ,
∂t
also
S = S0 (q, α) − Êt .
(314)
Die Hamiltonsche charakteristische Funktion (oder ’verkürzte Wikungsfunktion’) S0 ist nun aus der (“verkürzten”) Hamiltonschen partiellen Differentialgleichung
H
!
∂S0
, q = Ê
∂q
(315)
zu bestimmen. Dabei ist zu beachten, daß Ê selbst eine Integrationskonstante ist,
die von den αk abhängt oder mit einem der α’s identisch ist. Es ist üblich,
α1 = Ê
(316)
zu verfügen. Damit zerfällt Gl. (309) in die beiden Gleichungen
βk =
∂
S0 (q, Ê, α) (k ≥ 2)
∂αk
und
β1 =
∂S0
− t,
∂ Ê
(317)
welche die Bahn und den “Fahrplan” getrennt beschreiben.
6.6
Der harmonische Oszillator als Beispiel
Aus der Hamiltonfunktion
H=
p2
k
+ x2
2m 2
60
Ob die Hamiltonsche partielle Differentialgleichung separierbar ist, hängt außerdem von
den verwendeten Koordinaten ab.
61
Zur Frage, wann Ê die Gesamtenergie des Systems ist, siehe Abschnitt 2.7
158
des harmonischen Oszillators erhalten wir die Hamiltonsche partielle Differentialgleichung [vgl. Gl. (312)]
∂S
∂x
1
2m
!2
k
∂S
+ x2 +
= 0.
2
∂t
(318)
Da die Hamiltonfunktion die Zeit nicht explizit enthält und H = E = α gilt,
können wir die Zeitabhängigkeit abseparieren und setzen gemäß (314)
S(x, E, t) = S0 (x, E) − Et .
Die charakteristische Funktion S0 genügt dann der Gleichung [vgl. Gl. (315)]
1
2m
∂S0
∂x
!2
k
+ x2 = E .
2
(319)
Daraus erhalten wir durch Integration
S0 (x, E) =
Z
s
k
2m(E − x2 ) dx .
2
Die Integration ist elementar (siehe unten), wir brauchen sie aber gar nicht auszuführen, da die Transformationsgleichungen nur Ableitungen von S0 enthalten:
∂S0
∂S
=
=
p=
∂x
∂x
s
k
2m(E − x2 ) ,
2
Z
∂S
∂S0
m dx
−t.
β=
=
−t= q
∂α
∂E
2m(E − k2 x2 )
Die erste Gleichung liefert uns (in der Form des Energiesatzes) die Gleichung der
Bahn des harmonischen Oszillators. Die zweite Gleichung, die den “Fahrplan”
liefern soll, müssen wir weiter auswerten:
t+β =
r
m
2E
Z
dx
q
1−
k 2
x
2E
=
r
m
k
Z
√
du
,
1 − u2
u=
q
k
2E
x.
Mit einer Formelsammlung oder einer zweiten Substitution u = sin v finden wir
die Lösung
r
q
m
1
k
arcsin u = arcsin 2E
t+β =
x
k
ω
oder
s
2E
x=
sin[ω(t + β)] .
(320)
k
[Obwohl das Problem damit vollständig gelöst ist, wollen wir zur Vertiefung die charakteristische Funktion S0 (x, E) selbst noch einmal als Erzeugende einer kanonischen
159
Transformation betrachten. Um diesen Aspekt zu verdeutlichen, benutzen wir auch die
Bezeichnungen
E → P und S0 (x, E) → R3 (x, P )
und schreiben
R3 (x, P ) =
Z q
2m(P − k2 x2 ) dx .
Die formale Rechnung ist natürlich identisch mit der oben und liefert die Transformationsgleichungen
∂R3 q
p=
= 2m(P − k2 x2 )
∂x
und
q
1
∂R3
k
= arcsin
Q=
2P x .
∂P
ω
Wegen K=H=P folgt die Beziehung Q = t + β nun aus der kanonischen Gleichung
Q̇ =
∂K
= 1.
∂P
Die Erzeugende R3 (x, P ) = S0 (x, P ) liefert also die selben neuen Variablen P = E und
Q = t+ const wie die Erzeugende R1 (x, Q) nach Gl. (302). Um den Zusammenhang
zwischen R3 und R1 zu untersuchen, rechnen wir R3 nun doch explizit aus:
R3 (x, P ) =
Z q
√
2mP
1−
= 2
=
r
m
P
k
Z p
k
2P
x2 dx
1 − u2 du
P p
(u 1 − u2 + arcsin u)
ω
(u =
q
k
2P
x) .
Nun führen wir eine Legendretransformation
R1 (x, Q) = R3 (x, P ) − P Q
aus. Mit den Beziehungen
P =
kx2
,
2u2
arcsin u = ωQ
und u = sin ωQ
erhalten wir
R1 (x, Q) =
=
P
(sin ωQ cos ωQ + ωQ) − P Q
ω
kx2
kx2 sin ωQ cos ωQ
cot ωQ .
=
2ω
2ω
sin2 ωQ
Damit verliert die Erzeugende R1 (x, Q) aus Gl. (302) den magischen Zauber eines
gnädigen Himmelsgeschenks und entpuppt sich als biederes Produkt zielstrebigen Fleißes.]
160
6.7
Ergänzende Bemerkungen
Wir beenden an dieser Stelle die Einführung in die Hamilton–Jacobi–Theorie
und weisen nur noch andeutungsweise auf die folgenden wichtigen Ergänzungen
hin:
1. Zur Verdeutlichung der Zusammenhänge ist es nützlich, infinitesimale kanonische Transformationen
Qk = qk + δqk () ,
Pk = pk + δpk ()
mit δqk , δpk = O() ,
(321)
→0
zu betrachten. Ausgehend von der identischen Transformation (300,301) kann
man sie zum Beispiel durch
R3 (q, P) =
X
qk Pk + G(q, P) =
k
X
qk Pk + G(q, p) + O(2 )
(322)
k
erzeugen und findet gemäß Qk = ∂R3 /∂Pk und pk = ∂R3 /∂qk in erster Ordnung
in δqk = ∂
∂
G(q, p) und δpk = −
G(q, p) .
∂pk
∂qk
(323)
Man nennt G(q, p) die Erzeugende der infinitesimalen kanonischen Transformation (323). Wählt man speziell die Hamiltonfunktion H als Erzeugende, so folgt
mit den kanonischen Gleichungen
δqk = q̇k
und δpk = ṗk .
Die Hamiltonfunktion ist also die Erzeugende einer infinitesimalen Zeitverschiebung = δt. Daraus folgt die wichtige Feststellung, daß der Bewegungsablauf
selbst als Folge infinitesimaler kanonischer Transformationen oder als kanonische
Transformation aufgefaßt werden kann62 .
Auf ähnliche Weise sieht man, daß der Impuls und der Drehimpuls die Erzeugenden infinitesimaler Translationen bzw. Drehungen sind. Man kann dies zum
Ausgangspunkt der Diskussion von Symmetrien und Erhaltungssätzen machen,
die wir im Abschnitt 2.7 geführt haben.
62
Diese Folgerung kann man auch aus der Transformation auf die Konstanten αk und βk im
Abschnitt 6.5 ziehen.
161
2. Kanonische Transformationen bilden Gebiete des Phasenraums volumentreu
ab. Da auch der Bewegungsablauf durch kanonische Transformationen beschrieben werden kann, folgt daraus, daß das Phasenraum–Volumen, das ein Ensemble
von gleichartigen mechanischen Systemen im Phasenraum einnimmt, im Lauf der
Zeit erhalten bleibt (Satz von Liouville). Das Phasenraumvolumen kann allerdings durch die Bewegung wie Zuckerwatte in feine Fäden gezogen und zu
hochkomplexen, scheinbar voluminöseren Strukturen verwickelt werden.
Der Satz von Liouville spielt eine wichtige Rolle in der Statistischen Mechanik. Es besteht ein enger Zusammenhang zwischen dem Phasenraumvolumen und
der Entropie.
3. Neben dem Phasenraumvolumen und den kanonischen Gleichungen gibt es
zahlreiche weitere Invarianten kanonischer Transformationen. Wir erwähnen hier
noch die Invarianz der Poissonklammern63
{A, B} =
X
k
∂A ∂B
∂A ∂B
−
∂qk ∂pk ∂pk ∂qk
!
=
X
k
∂A ∂B
∂A ∂B
−
∂Qk ∂Pk ∂Pk ∂Qk
!
.
(324)
Mit Hilfe der Poissonklammern und der kanonischen Gleichungen erhält man
die zeitliche Variation einer dynamischen Größe A(q, p, t) in der knappen Form
!
X ∂A
dA
∂A
∂A
∂A
=
q̇k +
ṗk +
= {A, H} +
.
dt
∂qk
∂pk
∂t
∂t
k
(325)
Die tiefere Bedeutung dieser Notation liegt im Korrespondenzprinzip, nach dem
die Poissonklammern beim Übergang zur Quantenmechanik in die Kommutatorklammern übergehen:
{A, B} →
1
[A, B] .
ih̄
(326)
Aus der klassischen Gleichung (325) ensteht so die quantenmechanische Heisenberggleichung
dA
1
∂A
=
[A, H] +
.
dt
ih̄
∂t
63
(327)
Das Vorzeichen wird gelegentlich (z. B. im Lehrbuch der Quantenmechanik von E. Fick)
umgekehrt definiert.
162
Literaturhinweise
Alle üblichen Lehrbücher gehen im Umfang wesentlich über den Inhalt dieser
Vorlesung hinaus, eignen sich aber, einzelne Probleme nachzulesen und zu vertiefen. Dabei richtet sich die optimale Wahl nicht zuletzt nach dem persönlichen
Geschmack. Die folgende Aufstellung ist deshalb nicht als Empfehlung zu verstehen, sondern gibt die Quellen an, die ich bei der Ausarbeitung der Vorlesung
vornehmlich benutzt habe.
a) H. Goldstein: Klassische Mechanik,
Akademische Verlagsgesellschaft, Frankfurt
Ein älteres Standardlehrbuch, das an Vollständigkeit unübertroffen ist. Leider vermittelt es ein wenig den falschen Eindruck, als wären die meisten
Probleme mit den Mitteln der analytischen Mechanik analytisch lösbar.
b) W. Greiner: Theoretische Physik, Band 1 Mechanik I und Band II Mechanik II
Verlag Harri Deutsch, Thun und Frankfurt
Stark didaktisch ausgerichtete, für meinen Geschmack etwas langatmige
Einführung in die Mechanik, die erst im letzten Drittel des zweiten Bandes
den Lagrange- und Hamiltonformalismus behandelt.
c) A. Sommerfeld: Mechanik
(Bd. I der Vorlesungen über Theoretische Physik), VAG Leipzig bzw. Teubner.
Eine ausgezeichnete Darstellung, die tiefsinnig und spielerisch (Exkurse
über das Billardspiel und das Radfahren) die physikalischen Grundideen
herausarbeitet und verständlich und elegant mit der Mathematik umgeht.
Leider ist Sommerfelds Darstellung viel zu unsystematisch, um die Vorlesung zu begleiten. Das Lehrbuch eignet aber hervorragend, um den Stoff zu
vertiefen.
d) Feynman/Leighton/Sands: Vorlesungen über Physik, Bd. 1 und
2, R. Oldenbourg Verlag München
Diese ausgezeichnete Darstellung der gesamten Physik weicht stark von der
üblichen Gliederung in Teilgebiete ab. Sie legt großen Wert auf die Didaktik
und vermittelt ein tiefes Verständnis der Grundlagen. Wegen der Gliederung
ist das Werk zur direkten Begleitung der Vorlesung weniger geeignet, ich
empfehle aber einzelne Kapitel daraus zur Ergänzung und Vertiefung.
163