Grundlagen der Mechanik und Elektrodynamik

Transcription

Grundlagen der
Mechanik und Elektrodynamik
Teil 1: Mechanik
Vorlesung an der Ruhruniversität Bochum
K.–U. Riemann
Inhaltsverzeichnis
1.
Mechanik freier Massenpunkte
1.1
1.10
Newtons Axiome
Maßsysteme
Impuls, Energie und Drehimpuls
Konservative Kräfte, Zentralkräfte
Mathematische Gesichtspunkte
Die Bewegung im konstanten Schwerefeld
Der harmonische Oszillator
Bahn, Hodograph und Phasenbahn
Zentralkraft– und Keplerproblem
Geometrie der Ellipse
Coulombwechselwirkung
Die Bewegung im konstanten elektrischen und magnetischen Feld
Beschleunigte Koordinatensysteme und Scheinkräfte
Drehungen
Rotierende Koordinatensysteme, Zentrifugal– und Corioliskraft
Systeme von Massenpunkten
Schwerpunkts– und Relativbewegung
Zerlegung der kinetischen Energie
Zerlegung der potentiellen Energie
Zerlegung des Drehimpulses
Das Zweikörperproblem
2.
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskräfte
Klassifikation von Zwangsbedingungen
Das Selbstkonsistenzproblem
Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip
Modell der glatten Führungen
Virtuelle Verrückungen und Bewegungsablauf
Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip
Beispiele: Zentripetalkraft und schiefe Ebene
Generalisierte Koordinaten und Lagrangesche Gleichungen
Generalisierte Koordinaten und Kräfte
Lagrangesche Gleichungen (zweiter Art)
Beispiele
Spiralbewegung in der Ebene
Das ebene Pendel
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.2
2.3
2.4
i
1
5
9
11
12
14
19
22
27
32
35
37
41
46
2.5
2.6
2.7
2.8
2.9
Das Zykloidenpendel
Geschwindigkeitsabhängige Kräfte
Generalisierte Potentiale
Lagrangefunktion für elektromagnetische Kräfte
Reibung und Dissipationsfunktion
Die Methode der Lagrangeschen Multiplikatoren
Lagrange–Multiplikatoren und Zwangskräfte
Lagrangesche Gleichungen mit Nebenbedingungen
Lagrangesche Gleichungen erster Art
Beispiel: Die schiefe Ebene
Berechnung von Zwangskräften (ohne Multiplikatoren)
Zyklische Koordinaten, Symmetrien und Erhaltungssätze
Generalisierte Impulse
Impulserhaltung und Homogenität des Raumes
Drehimpulserhaltung und Isotropie des Raumes
Energieerhaltung und Homogenität des Zeit
Die Hamiltonfunktion
Die Hamiltonfunktion rheonomer Systeme
Routhsches Verfahren und kanonische Gleichungen
Eliminierung zyklischer Variablen aus den Bewegungsgleichungen
Eliminierung zyklischer Variablen aus der Lagrangefunktion
Legendretransformationen
Kanonische Gleichungen
Beispiel: Zentralkraftproblem
Hamiltonfunktion und generalisierter Impuls im Magnetfeld
3.
Dynamik des starren Körpers
3.1
Modell und Koordinaten des starren Körpers
Orientierung des starren Körpers
Richtungskosinus und orthogonale Matrizen
Eulersche Winkel 70
Das Eulersche Theorem
Die Drehachse als Eigenvektor
Das Eigenwertproblem orthogonaler Matrizen
Eulersches Theorem und Satz von Cashle
Der Trägheitstensor
Drehimpus und kinetische Energie des starren Körpers
Das Trägheitsmoment um eine feste Drehachse
Der Satz von Steiner
Beispiel: Physikalisches Pendel
Trägheitshauptachsen
Das Eigenwertproblem selbstadjungierter Matrizen
Hauptachsentransformationen
3.2
3.3
3.4
ii
48
51
54
56
62
69
74
78
82
3.9
Beispiel
Trägheitsellipsoid und Poinsotsche Konstruktion
Geometrische Beschreibung des kräftefreien Kreisels
Die Eulerschen Kreiselgleichungen
Die kräftefreie Bewegung des starren Körpers
Stabile Drehachsen des starren Körpers
Der kräftefreie symmetrische Kreisel
Der Lagrangeformalismus für den Kreisel
Lagrangefunktion und zyklische Koordinaten des symmetrischen Kreisels
Der kräftefreie symmetrische Kreisel
Der schwere symmetrische Kreisel
Zum elementaren Verständnis des Kreisels
4.
Stabilität und kleine Schwingungen
4.1
4.4
4.5
Gleichgewichte und kleine Abweichungen
Quadratische Formen
Eigenfrequenzen und Stabilität
Transformation auf Normalkoordinaten
Gleichzeitige Diagonalisierung von T und V
Die formale Durchführung
Gekoppelte Pendel
5.
Spezielle Relativitätstheorie
5.1
Galileiisches und Einsteinsches Relativitätsprinzip
Das Problem der Lichtgeschwingkeit
Das Michelson–Experiment
Die Lorentztransformationen
Minkowskiraum und orthogonale Transformationen
Spezielle und allgemeine Lorentztransformationen
Elementare Herleitung aus den physikalischen Postulaten
Die Zeitdilatation
Symmetrie des Uhrenvergleichs und Zwillingsparadoxon
Die Lorentzkontraktion
Zusammenhang mit der Zeitdilatation
Unsichtbarkeit der Lorentzkontraktion
Die Gruppeneigenschaft der Lorentztransformation
Einsteinsches Additionstheorem der Geschwindigkeiten
Kovariante Formulierung einer Theorie
Vierer–Vektoren und Lorentz–Skalare
Raumartige und zeitartige Vektoren, der Lichtkegel
Vergangenheit, Gegenwart und Zukunft; kausale Ereignisse
Bahn im Minkowskiraum und Eigenzeit
Vierer–Geschwindigkeit und –Impuls
3.5
3.6
3.7
3.8
4.2
4.3
5.2
5.3
5.4
5.5
5.6
5.7
iii
87
90
92
94
100
103
105
106
110
112
116
117
119
125
126
128
131
5.8
5.11
Relativistische Mechanik
Die Minkowski–Kraft und Bewegungsgleichung
Der Energie–Impuls–Vektor
Die Einheit von Impuls– und Energiesatz
Die Äquivalenz von Masse und Energie
Die relativistische Bewegungsgleichung
Beispiel: Elektron im konstanten elektrischen Feld
Longitudinale und transversale Beschleunigung
Die Transformation von Kräften
Relativistischer Lagrangeformalismus
Die relativistische Lagrange– und Hamiltonfunktion (nicht kovariant)
Probleme: Instantane Fernwirkung, Zwangsbedingungen
und Nicht–Inertial–Systeme
Grundgedanken der allgemeinen Relativitätstheorie
Vom Zwillingparadoxon zum Hamiltonprinzip
6.
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip
Grundaufgabe der Variationsrechnung
Bahnvariationen im Konfigurationsraum
Das Wirkungintegral und die Quantenmechanik
Das Hamiltonsche Prinzip im Phasenraum
Die erweiterte Konkurrenz der Bahnen im Phasenraum
Hamiltonsches Prinzip und kanonische Gleichungen
Kanonische Transformationen
Tabelle: Erzeugende und Transformationsgleichungen
Beispiele kanonischer Transformationen
Die Hamiltonsche partielle Differentialgleichung
Das Wirkungsintegral als Erzeugende
Klassische Mechanik und geometrische Optik
Separation und Hamiltonsche charakteristische Funktion
Der harmonische Oszillator als Beispiel
Ergänzende Bemerkungen
Infinitesimale kanonische Transformationen
Liouvillescher Satz
Poissonklammern
5.9
5.10
6.2
6.3
6.4
6.5
6.6
6.7
Literaturhinweise
136
140
142
144
147
149
151
154
156
159
162
164
iv
1
Mechanik freier Massenpunkte
1.1
Newtons Axiome
Die Entwicklung der Grundlagen der Mechanik in der Renaissance ist als Geburtsstunde der Naturwissenschaft im heutigen Sinn anzusehen. Sie ist durch präzise
Begriffsbildungen und eine Mathematisierung gekennzeichnet. Dadurch wurden
Verallgemeinerungen möglich, die durch weitere Beobachtungen bestätigt oder
falsifiziert werden konnten. Diesem Umstand ist es zu verdanken, daß kontroverse
Auffassungen der Begründer nicht zu widerstreitenden Schulen führten, sondern
in eine allgemein akzeptierte Mechanik mündeten. Wir können den gewaltigen
Umbruch des Denkens in jener Zeit nicht hier im Detail verfolgen, sondern charakterisieren den historischen Hintergrund durch wenige Meilensteine:
• Nicolaus Copernicus (1473–1543) propagierte das heliozentrische System.
• Tycho Brahe (1546–1601) lehnte das heliozentrische System ab und führte sehr genaue Beobachtungen durch — in der Absicht, das geozentrische
System des Ptolemäus zu stützen.
• Johannes Kepler (1571–1630) leitete aus den Beobachtungen T. Brahes seine Planetengesetze (1609–1618) her. Diese Gesetze sind rein kinematisch zu
verstehen und nicht dynamisch begründet.
• Galileo Galilei (1564–1642) ist als entschiedener Verfechter des heliozentrischen Systems bekannt. Dabei glaubte er jedoch an vollkommene Kreisbahnen und lehnte Keplers Ergebnisse ab. Er führte “Fallversuche” an der
schiefen Ebene durch und kam für den Spezialfall verschwindender Neigung
zu einer Vorform des Trägheitsprinzips.
• Isaac Newton (1643–1727) veröffentlichte 1687 die Abhandlung “Philosophiae naturalis principia mathematica”. Darin formulierte er die “Newtonschen Gesetze” als Grundlage der Dynamik.
Vor der Aufstellung dieser Gesetze formulierte Newton zwei grundlegende Vorausetzungen:
• Die absolute Zeit
Tempus absolutum, verum, et mathematicum, in se et natura sua sine relatione ad externum quodvis, aequabiliter fluit, alioque nomine dicitur duratio.
Die absolute, wahre und mathematische Zeit verfließt an sich und vermöge
ihrer Natur gleichförmig und ohne Beziehung zu irgendeinem äußeren Geschehen. Sie wird auch mit dem Namen Dauer belegt.
1
• Der absolute Raum
Spatium absolutum, natura sua sine relatione ad externum quodvis, semper
manet similare et immobile.
Der absolute Raum bleibt vermöge seiner Natur und ohne Beziehung zu
irgendeinem äußeren Geschehen stets gleich und unbeweglich.
Wir verzichten hier auf eine Kritik dieser aus der intuitiver Vorstellung gewonnenen Definitionen und verweisen auf die Diskussion von Uhren und Maßstäben
im 5. Kapitel. Bemerkenswert ist, daß Newton die Notwendigkeit erkannte, sich
diese Voraussetzngen bewußt zu machen.
LEX PRIMA (Trägheitsgesetz)
Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in directum, nisi quatenus illud a viribus impressis cogitur statum suum mutare.
Jeder Körper beharrt in seinem Zustand der Ruhe oder der gleichförmigen Bewegung, wenn er nicht durch einwirkende Kräfte gezwungen wird, seinen Zustand
zu ändern.
Die Lex prima stellt eigentlich einen Spezialfall der Lex secunda dar (vgl. Gl. (6).
Wegen seiner für die damalige Zeit revolutioniernden Aussage stellt Newton
dieses Gesetz aber bewußt an die Spitze seines Systems. Widerspricht es doch der
alltäglichen Erfahrung, daß jede Bewegung zum Stillstand kommt. (I. Kant 1747:
Es gibt zweierlei Art von Bewegungen, solche, die nach einiger Zeit aufgehört
haben, und solche, welche andauern. [Gegenstände, die getragen oder geschoben
werden und Geschoßkugeln.]) Die Äquivalenz von Ruhe und von gleichförmiger
Bewegung (wogegen?) drängt schon fast eine Diskussion von Bezugssystemen und
Relativität auf. Wir verweisen dazu auf das 5. Kapitel.
Der Formulierung seiner Lex secunda stellt Newton zunächst zwei Definitionen
voran:
Definitio I: Quantitas materiae est mensura eiusdem orta ex illius densitate et
magnitudine coniunctim.
Die Menge der Materie (Masse m) wird durch ihre Dichte und ihr Volumen vereint
gemessen.
Definitio II: Quantitas motus est mensura eiusdem orta ex velocitate et et quantitate materiae conjunctim.
Die Größe der Bewegung (Bewegungsgröße, Impuls p) wird durch die Geschwindigkeit und die Menge der Materie vereint gemessen:
p = mv .
2
(1)
Es ist bemerkenswert, daß Newton die Notwendigkeit erkannte, den aus der alltäglichen Erfahrung scheinbar so vertrauten Begriff der Masse (Materiemenge)
zu definieren1 . Seine Definitio I ist aber offensichtlich nur eine Scheindefinition:
Man kann die Grundgröße “Masse” nicht durch die abgeleitete Größe “Dichte”
definieren.
Im Gegensatz zur Masse m ist die Geschwindigkeit v = dr/dt nach der Einführung
von Raum und Zeit eine abgeleitete Größe und benötigt keine eigene Definition.
Newton nennt mv die “Bewegungsgröße”, das heute übliche Wort Impuls vertauscht im Grunde Ursache und Wirkung [vgl. Gl. (5)]. Mit der Definitio II kann
die Lex prima auch als Satz der Erhaltung des Impulses formuliert werden [vgl. Gl.
(6)].
Eigentlich erfordert die folgende lex secunda noch eine weitere vorbereitende
Erläuterung: Sie bezieht sich auf das Modell eines Massenpunktes, eines massebehafteten Objekts ohne räumliche Ausdehnung. Da alle Körper endlich ausgedehnt sind, ist die Tragfähigkeit dieses Modells keineswegs von vornherein klar.
Wir begnügen uns im Augenblick mit dem Hinweis, daß der Schwerpunkt eines
ausgedehnten Körpers in vielen Aspekten dem Massenpunkt entspricht.
LEX SECUNDA (Bewegungsgesetz)
Mutationem motus proportionalem esse vi motrici impressae, et fieri secundum
lineam rectam qua vis illa imprimitur.
Die Änderung der Bewegung ist der Einwirkung der bewegenden Kraft proportional und geschieht nach der Richtung derjenigen geraden Linie, nach welcher
jene Kraft wirkt:
ṗ = F .
(2)
Dieses zentrale Gesetz der Newtonschen Mechanik wirft eine ganz fundamentale
Frage auf: Handelt es sich wirklich um ein Naturgesetz oder bloß um die Definition
der Kraft? Diese Frage ist typisch für grundlegende Beziehungen der Physik, die
sich durch die inhaltliche Deutung eben doch von mathematische Axiomen unterscheiden. Wir können Kräfte durch die Änderung des Bewegungszustandes messen, besitzen durch unsere Muskeln aber auch eine intuitive a priori-Erfahrung.
Für eine Gesetzmäßigkeit sprechen auch Experimente mit verschiedenen Massen
bei gleicher Kraft und verschiedenen Kräften bei gleicher Masse (wenn man Unabhängigkeit und ggf. ungestörte Superposition veraussetzt; vgl. auch die Schwierigkeit, die (träge) Masse zu definieren.)
Phänomenologisch unterscheiden wir Kräfte bei der Berührung verschiedener Körper (Druck, Zug, Reibung . . . ) und Fernwirkungen (besser: Felder) wie Gravitation oder Magnetismus. Von einem systematischen Standpunkt aus beruhen alle
makroskopischen Kräfte auf elektromagnetischen Kräften oder der Gravitation.
1
Zur Problematik des Begriffs “Masse” vgl. die Diskussion um “schwere Masse” und “träge
Masse” beim Aufbau der allgemeinen Relativittstheorie.
3
(Auf die starke und schwache Wechselwirkung ist das klassische Konzept nicht
anwendbar.)
Newtons Lex secunda ändert sich nicht, wenn man von einem Bezugssystem
S zu einem gleichförmig dagegen bewegten Bezugssystem S 0 übergeht (Galileitransformation): Die Lex secunda gilt in allen Inertialsystemen. In NichtInertialsystemen (z. B. rotierende Erde) treten neben den oben diskutireten Kräften auch Scheinkräfte (z. B. Zentrifugalkraft und Corioliskraft) auf. Was aber
unterscheidet “wahre” Kräfte und Scheinkräfte? Wir spüren hier wieder die Notwendigkeit, Bezugssysteme und Relativität zu diskutieren und verweisen auf das
5. Kapitel.
Abschließend erwähnen wir die prophetische Sicherheit (Sommerfeld), mit der
sich die Newtonsche Formulierung (2.) gegenüber der späteren Formulierung
“Kraft=Masse mal Beschleunigung” in der Relativitätstheorie bewährt hat. Bei
der Interpretation des Unterschiedes ist allerdings Vorsicht geboten. Zum kritischen Verständnis stellen wir die Frage, was an der folgenden Beschreibung einer
Rakete falsch ist:
d
(mv) = F = 0,
dt
mv = m0 v0 ,
v=
m0
v0 .
m
LEX TERTIA (Reaktionsprinzip, “actio = reactio”)
Actioni contrariam semper et aequalem esse reactionem: sive corporum duorum
actiones in se mutuo semper esse aequales et in partes contrarias dirigi.
Die Gegenwirkung ist der Wirkung stets entgegengesetzt und gleich, oder die
Wirkungen zweier Körper aufeinander sind stets gleich und von entgegengesetzter
Richtung:
Fij = −Fji .
(3)
Dieses Gesetz schafft die Grundlage zum Übergang zur Mechanik eines Systems
von Massenpunkten. Die Gültigkeit ist allerdings eingeschränkt: Gl. (3) gilt bei
elektromagnetischer Wechselwirkug nur, wenn die Abstrahlung vernachlässigt
werden kann. (Spielt die Strahlungsdämpfung eine Rolle, läßt sich die Bewegungsgleichung nicht mehr durch die erste Ableitung v̇ formulieren!)
Häufig (Zentralkräfte) läßt sich die Lex tertia durch den Zusatz “Die Kräfte liegen
in der Richtung der Verbindungslinie der Körper ” verschärfen. Diese Verschärfung wird aber bereits durch die Lorentzkraft verletzt.
CORROLARIUM (“Lex quarta”, Parallelogramm der Kräfte)
Corpus viribus coniunctis diagonalem parallelogrammi eodem tempore describere,
quo latera separatis.
4
Bei vereinten Kräften wird ein Körper durch die Diagonale des Parallelogramms
beschrieben, dessen Seiten zur gleichen Zeit den getrennten Kräften entsprechen,
d. h. Kräfte addieren sich wie Vektoren:
F=
X
Fi .
(4)
i
Dieses Gesetz ist keineswegs trivial, sondern fordert die Unabhängigkeit der einzelnen Kraftwirkungen. Newton formulierte die Aussage nicht als “Gesetz”, sondern als Corollarium (Zusatz) zu den Bewegungsgesetzen.
Ergänzung: Maße und Maßsysteme
Newtons Grundvoraussetzungen und die Lex secunda erforden Meßvorschriften
und Maßeinheiten für die Länge, die Masse und die Zeit.
Das internationale Maßsystem (SI) legt hierzu das Meter (m), das Kilogramm
(kg) und die Sekunde (s) fest. (MKS–System). Daneben wird häufig auch (noch)
das CGS–System mit den Grundeinheiten Zentimeter (cm), Gramm (g) und
Sekunde verwendet.
Grundsätzlich könnte für die Kraft eine vierte Grundeinheit — etwa das Kilopond
(kp) — festgelegt werden. Mit der Verfügung der Proportionalitätskonstante 1 in
der Lex secunda wird die Kraft jedoch eine abhängige Größe und erhält im SI die
Maßeinheit 1N = 1 kg m s−2 (1 Newton). Die entsprechende Maßeinheit des
CGS–Systems ist 1 dyn = 1 g cm s−2 = 10−5 N. Daneben sind veraltete Bezeichnungen und Maßeinheiten wie 1 Dyn = 1 N und 1 kp = 9.81 N in Gebrauch.
Auf abgeleitete Größen wie 1 J = 1 Nm = 1 kg m2 s−2 (Joule) für Arbeit und
Energie oder 1 W = 1 J s−1 (Watt) für Leistung weisen wir nur am Rande hin.
Im folgenden wollen wir Folgerungen aus den Newtonschen Gesetzen diskutiern
und einfache Anwendungsbeispiele geben. Dabei beschränken wir uns zunächst
auf die Mechanik eines Massenpunktes.
1.2
Grundbegriffe: Impuls, Energie und Drehimpuls
Wir integrieren die Lex secunda:
∆p = p2 − p1 =
Zt2
F dt,
(5)
t1
also Änderung der Bewegungsgröße = Kraftstoß oder Impuls. Von hier aus ist der
Begriff Impuls (eigentlich etwas ungenau!) auf die Bewegungsgröße übertragen
worden. Wir schließen uns trotzdem diesem allgemeinen Sprachgebrauch an.
5
Für die kräftefreie Bewegung formulieren wir den Impulserhaltungssatz
p = const
(6)
und erhalten so die Lex prima als Spezialfall.
Zur Einführung der Begriffe Energie2 und Arbeit multiplizieren wir die Lex secunda vor der Integration skalar mit v:
Zt2
t1
mv · v̇ dt =
Zt2
F · ṙ dt =
t1
Zr2
F· dr
r1
Das Integral auf der linken Seite können wir in der Form
Zt2
t1
mv · v̇ dt =
Zt2
t1
d m 2
v dt = T2 − T1
dt 2
schreiben, wenn wir durch
T =
m 2
v
2
(7)
die kinetische Energie eines Massenpunktes definieren. Durch das Integral
A12 =
Zr2
F· dr
(8)
r1
auf der rechten Seite definieren wir die Arbeit, die von der Kraft F geleistet
wird, wenn unser Massenpunkt von r1 nach r2 bewegt wird. Damit erhalten wir
den Satz
A12 = T2 − T1 ,
(9)
der die Änderung der kinetischen Energie mit der am Massenpunkt geleisteten
Arbeit in Beziehung bringt.
Das Kunstwort Energie bedeutet so etwas wie ein Arbeitsvermögen. Kinetische
Energie deutet also auf ein Arbeitsvermögen, das in der Bewegung steckt. Die
Begriffe Energie und Kraft wurden lange Zeit nicht sauber getrennt. Bei Leibnitz
wird die kinetische Energie vis viva genannt.
2
griech. ν (en) = in, griech. ργoν (ergon) = “Werk” (gleiche indogerm. Wurzel!), Arbeit
6
Von besonderer Bedeutung sind Kraftfelder F = F(r), bei denen das Integral (8)
vom Weg unabhängig ist. Solche Kraftfelder heißen konservativ. Für konservative
Kraftfelder gilt also
I
F·dr = 0
und wir können eine bis auf eine additive Konstante eindeutige Ortsfunktion
V (r) = −
Zr
F(r0 )· dr0
(10)
definieren, die wir als Potential oder potentielle Energie bezeichnen. Für konservative Kräfte haben wir [vgl. Gl. (8)]
A12 = V1 − V2 ,
(11)
und können [vgl. Gl. (9)] den Energieerhaltungssatz (daher der Name konservativ)
V1 − V 2 = T 2 − T 1
oder E = T + V = const
(12)
formulieren. E = T + V wird als Gesamtenergie oder kurz Energie bezeichnet.
Nach Gl. (10) läßt sich eine konservative Kraft gemäß
F=−
dV
= −grad V
dr
(13)
aus ihrem Potential V berechnen. Aus der Vertauschbarkeit der zweiten Ableitungen von V folgt
∂2V
∂2V
∂Fj
∂Fi
=−
=−
=
.
∂xj
∂xi ∂xj
∂xj ∂xi
∂xi
Damit erhalten wir die Beziehung
∂Fj
∂Fi
=
∂xj
∂xi
oder rot F = 0
als notwendige Bedingung dafür, daß die Kraft F ein Potential besitzt. Sie ist
aber auch hinreichend, wie wir am Stokeschen Satz erkennen.
Beispiel für konservative Kräfte:
7
Betrachten wir eine beliebige Zentralkraft
F(r) = f (r)r,
(14)
also Fi = f (r)xi . Dann wird
∂xi
∂r
∂Fi
= f (r)
+ f 0 (r)
xi
∂xj
∂xj
∂xj
Dazu rechnen wir ∂r/∂xj = xj /r, und für i 6= j haben wir ∂xi /∂xj = 0, also
∂Fi
f 0 (r)
∂Fj
=
xi xj =
.
∂xj
r
∂xi
Alle Zentralkräfte sind folglich konservativ. Für ihr Potential gilt
dV
= −f (r)r,
dr
d.h. V (r) = −
Zr
f (r 0 )r 0 dr 0 .
(15)
Als Spezialfälle erwähnen wir
(i) die elastische Kraft
F(r) = −kr
=⇒
V (r) =
k 2
r
2
und
(16)
(ii) die Coulomb– und Gravitationskraft
F(r) = −
c
r
r3
=⇒
c
V (r) = − .
r
(17)
Natürlich sind die Potentiale nur bis auf eine additive Konstante bestimmt. Bei
(i) haben wir V (0) = 0 gewählt, d.h. wir haben bei “gespannter Feder” eine
positive potentielle Energie. Im Fall (ii) haben wir dagegen V (∞) = 0 gesetzt.
Für anziehende Kraftzentren wird daher die potentielle Energie negativ: Dies ist
der Energiebetrag, der nötig ist, um einen Massenpunkt aus dem Einflußbereich
des Kraftfeldes zu “befreien”. Beachte, daß V (∞) im Fall (i) und V (0) im Fall
(ii) singulär werden.
Als ein letztes triviales Beispiel erwähnen wir das Potential
V = mg·r = mgz
des konstanten Schwerefeldes F = −mg = −mgez .
8
(18)
Auf einen weiteren fundamentalen Grundbegriff werden wir geführt, wenn wir die
Lex secunda vektoriell mit r multiplizieren:
r × ṗ = r × F.
Zur Interpretation der linken Seite führen wir den Drall oder Drehimpuls
l=r×p
(19)
ein. Für seine zeitliche Ableitung erhalten wir
d
l = r × ṗ + ṙ × p = r × ṗ,
dt
da ṙ × p = mv × v = 0 gilt. Mit der analogen Definition des Drehmoments
M=r×F
(20)
erhalten wir also die grundlegende Beziehung
l̇ = M
(21)
zwischen der Drehimpulsänderung und dem einwirkenden Drehmoment. Sie spielt
in der Dynamik des starren Körpers eine ähnliche Rolle wie Newtons Lex secunda für den Massenpunkt.
Hinweise:
1. Drehimpuls wie Drehmoment hängen nach ihrer Definition von der Lage des
gewählten Koordinatenursprungs ab und sind keine galileiinvarianten Begriffe.
(Natürlich gilt Gl. (21) jedoch in jedem Inertialsystem). Bei der physikalischen
Interpretation des Drehimpulses wird man sich also stets auf ein dem Problem
natürlich angepaßtes Koordinatensystem beziehen müssen.
2. Man beachte die Reihenfolge der Faktoren in den Gln. (19, 20).
3. Zum Namen Drehimpuls gilt entsprechendes wie beim Impuls. Trotz des Namens ist die Bedeutung nicht auf Drehbewegungen beschränkt.
Von besonderer Wichtigkeit ist der Spezialfall eines verschwindenden Drehmoments. In diesem Fall gilt der Drehimpulserhaltungssatz
l = const.
(22)
Wegen r × r = 0 treffen wir diesen Speziallfall für alle Zentralkräfte an, wenn
wir — was ja naheliegt — das Kraftzentrum als Koordinatenursprung wählen.
Als wichtige Folgerung aus Gln. (19, 22) bemerken wir, daß die Bewegung bei
Drehimpulserhaltung in einer Ebene — nämlich in der Ebene r · l = 0 — abläuft.
9
1.3
Mathematische Gesichtspunkte
Das Bewegungsproblem eines Massenpunktes wird durch drei gekoppelte gewöhnliche Differentialgleichungen
mẍi = Fi (xj , ẋj , t) (i, j = 1, 2, 3)
(23)
zweiter Ordnung oder durch sechs Differentialgleichungen
ẋi = pi /m,
ṗi = Fi (xj , pj , t) (i, j = 1, 2, 3)
(24)
erster Ordnung beschrieben und stellt damit ein Problem sechster Ordnung dar.
(Wir werden für allgemeine Betrachtungen die zweite Form bevorzugen). Eine
vollständige Lösung
xi = ξi (t, ck ),
pi = πi (t, ck )
(25)
hängt also von sechs Integrationskonstanten c1 , . . . c6 ab. Als Integrationskonstanten können insbesondere die Anfangsbedingungen
r(t = 0) = r0
und p(t = 0) = p0
(26)
(bzw. v(t = 0) = v0 ) gewählt werden. Mit diesen Differentialgleichungen
(Newtons Lex secunda) und den zugehörigen Anfangsbedingungen ist die
Bewegung eindeutig festgelegt. (Kausalität, physikalisches Geschehen als Uhrwerk!).
Die Ordnung des Problems läßt sich reduzieren, wenn es gelingt, einzelne Variable
zu eliminieren. Hierzu können Beziehungen der Form
φ(xj , pj , t, C) = 0,
(27)
die eine Integrationskonstante C enthalten, dienen. Solche Beziehungen nennen
wir Integrale. Als Beispiele erwähnen wir insbesondere den Energiesatz T + V −
E = 0 (1 Integral), den Impulssatz p = p0 (3 Integrale) und den Drehimpulssatz
r × p = j (3 Integrale).
Mit jedem Integral wird die Ordnung um eins reduziert und durch sechs Integrale
wird das Problem vollständig gelöst. Dabei ist allerdings folgendes zu beachten:
1. Die verwendeten Integrale müssen voneinander unabhängig sein. Für die kräftefreie Bewegung sind beispielsweise Impulssatz v = v0 und Energiesatz v 2 = v02
trivialerweise nicht unabhängig.
10
2. Eine Beziehung der Form
φ(xj , C1 , C2 ) = 0,
die zwei Integrationskonstanten enthält, zählt doppelt, da sich aus ihr durch Differentiation ein weiteres Integral gewinnen läßt.
Wir werden im folgenden einige grundlegende Bewegungsprobleme explizit lösen
und auf diese Gesichtspunkte zurückkommen.
1.4
Die Bewegung im konstanten Schwerefeld
Mit der Kraft F = −mg lautet die Bewegungsgleichung
r̈ = v̇ = −g .
(28)
An Integralen steht zunächst (nur) der Energie–Erhaltungssatz zur Verfügung.
Es ist in diesem Fall allerdings nicht sinnvoll, mit seiner Hilfe eine Variable zu
eliminieren. Denn die Bewegungsgleichungen sind ungekoppelt, und die bequemste
Lösung besteht in der direkten zweifachen Integration:
ṙ = v = v0 − gt,
1
r = r0 + v0 t − gt2 .
2
(29)
Als Integrationskonstanten haben wir den Anfangsort r0 und die Anfangsgeschwindigkeit v0 benutzt. Damit ist das Problem bereits vollständig gelöst.
Den Energieerhaltungssatz finden wir aus der Lösung, wenn wir Gl. (29) skalar
mit mg multiplizieren:
mg·(r − r0 ) =
m 2 m
v0 − (v0 − gt)2 .
2
2
Unter Beachtung von v = v0 − gt und V = mg · r [vgl. Gl. (18)] geht dies in
T + V = T 0 + V0
oder v 2 − v02 = 2g·(r0 − r)
über.
Zur anschaulichen Beschreibung der Bewegung wählt man zweckmäßigerweise in
ein kartesisches Koordinatensystem mit g in z–Richtung und vy0 = 0. Dann erhält
man
11
vx = vx0 ,
x = x0 + vx0 t
g
z = z0 + vz0 t − t2
2
vz = vz0 − gt,
und erkennt die Wurfparabel in der x–z–Ebene (d.h. in der durch v0 und g
aufgespannten Ebene). Man beachte, daß sich wegen der Unabhängigkeit der
Koordinaten neben dem vollen Energiesatz auch ein separater Energiesatz
2
vz2 − vz0
= 2g(z0 − z)
formulieren läßt. Aus dem selben Grund gilt auch ein Teil–Impulssatz
mvx = const.
Erhaltungssätze müssen also nicht immer in der im Abschnitt 1.3 angegebenen
Form auftreten, sondern können sich auch auf einzelne Koordinaten beziehen. Wir
werden später sehen, daß dieser Aspekt sogar wesentlich verallgemeinert werden
kann.
1.5
Der harmonische Oszillator
Für das Bewegungsproblem der linearen elastischen Kraft
F = −kr
(30)
haben wir mit dem Energie– und Drehimpuls–Erhaltungssatz vier Integrale (vgl.
Abschnitte 1.3 und 1.6). Aber auch hier sind die drei Komponenten der Bewegungsgleichung
r̈ + ω 2 r = 0 mit ω 2 =
k
m
(31)
ungekoppelt und man erhält die Lösung am bequemsten direkt in der Form
r = a cos ωt + b sin ωt .
(32)
Alle drei Ortskoordinaten führen also unabhängig harmonische Schwingungen der
selben Frequenz ω aus. Offensichtlich gilt
a = r0
und b =
12
1
v0 ,
ω
und die Bewegung verläuft — was wir auch aus der Drehimpulserhaltung schließen
können — in der durch a und b (bzw. in der durch r0 und v0 ) aufgespannten
Ebene.
Diese Ebene wählen wir zweckmäßig als x–y–Ebene (z = 0) eines speziell angepaßten Koordinatensystems. Offenbar ist die Bewegung beschränkt (r 2 ≤ a2 + b2 )
und es gibt eine maximale Auslenkung rm (“Amplitude”). Wir wollen — was
keine Einschränkung bedeutet — den Zeitpunkt t = 0 in eine solche maximale
Auslenkung legen. Dann gilt zur Zeit t = 0
r · ṙ = 0 oder a ⊥ b.
Wählen wir nun x in a– und y in b–Richtung, so erhalten wir die Lösung in der
bequemen Form
x = a cos ωt,
y = b sin ωt
(33)
und erkennen als Bahnkurve eine Ellipse der Halbachsen a und b mit dem Ursprung im Zentrum.
Wir benutzen die Gelegenheit, um den Begriff der Bahngleichung f (x, y) = 0
einzuführen. Wir erhalten sie, indem wir die Zeit t aus den Lösungen x = x(t),
y = y(t) eliminieren. Die Bahngleichung erhält also die Information über die
Bahnkurve ohne Berücksichtigung des ’Fahrplans’. Im Fall des harmonischen Oszillators folgt aus cos2 + sin2 = 1 die Bahngleichung
x2 y 2
+ 2 − 1 = 0.
a2
b
Für manche Zwecke ist es auch nützlich, die “Bahn” im Geschwindigkeits– oder
Impulsraum zu betrachten. Die entsprechende “Bahngleichung” g(ẋ, ẏ) heißt Hodograph [griech. oδoς (hodos) = Weg, γραϕω (grapho) = schreiben, zeichnen].
Für den harmonischen Oszillator mit
ẋ = −aω sin ωt,
ẏ = bω cos ωt
beschreibt also der Hodograph
ẋ2 ẏ 2
+ 2 − ω2 = 0
a2
b
bis auf einen Maßstabsfaktor ω 2 die gleiche Ellipse wie die Bahngleichung.
Als letzten Begriff dieser Art erwähnen wir die Phasenbahn hi (xi , pi ) = 0 in dem
aus Koordinate (xi ) und “zugehörigem” Impuls (pi ) aufgespannten Phasenraum
13
(Bedeutung: Statistische Mechanik, Bohr–Sommerfeldsche Quantentheorie).
Für den Harmonischen Oszillator erhalten wir die Ellipsen
x2 +
p2x
= a2
m2 ω 2
und y 2 +
p2y
= b2
m2 ω 2
als Phasenbahnen. Ihre Gleichungen lassen sich als separate (s.o.) Energiesätze
k 2 m 2
x + ẋ = const und
2
2
k 2 m 2
y + ẏ = const
2
2
deuten.
1.6
Zentralkraft– und Keplerproblem
Mit dem harmonischen Oszillator haben wir schon ein spezielles Zentralkraftproblem behandelt. Im Gegensatz zu diesem Spezialfall lassen sich die (kartesischen)
Bewegungsgleichungen bei allen übrigen Zentralkräften
F=−
dV(r) r
dr r
(34)
jedoch nicht separieren, da über r eine Kopplung besteht. Wir behandeln das
allgemeine Problem daher mit systematischen Methoden und gehen von den Erhaltungssätzen aus:
• Der Drehimpulssatz
l = mr × v = j
liefert uns drei Integrale und gestattet die Reduktion auf ein Problem dritter
Ordnung. Da die Bewegung in der Ebene r · j = 0 verläuft, kann die Koordinate
z = r · j/j senkrecht zu dieser Ebene (samt ihrer Ableitung!) entfallen. In dem
verbleibenden Problem vierter Ordnung behalten wir das Integral
l = mr 2 ϕ̇ = j,
(35)
wenn wir Polarkoordinaten r, ϕ in der Bewegungsebene benutzen. Dieses Integral
besagt, daß der ’Fahrstrahl’ (radius vector) die Bahnebene mit konstanter ’Flächengeschwindigkeit’ überstreicht.
• Als zweites (unabhängiges) Integral notieren wir den Energiesatz
T +V =
m 2 m 2 2
ṙ + r ϕ̇ + V (r) = E .
2
2
14
(36)
Das verbleibende Problem zweiter Ordnung besteht in der Lösung der beiden
gekoppelten Differentialgleichungen (35, 36) für r(t) und ϕ(t). Da ϕ nicht explizit
vorkommt, erreichen wir die Entkopplung, indem wir (35) nach ϕ̇ auflösen und
in (36) einsetzen:
ṙ 2 =
2
(E − V ) − r 2 ϕ̇2 ,
m
ṙ 2 =
mit ϕ̇ =
j
mr 2
=⇒
j2
2
(E − V ) − 2 2 .
m
m r
(37)
Damit ist das Problem im Prinzip bis auf Quadraturen gelöst. Wir bemerken
außerdem, daß Gl. (37) mit dem eindimensionalen Problem übereinstimmt, bei
dem das Potential V (r) durch ein zusätzliches Fliehkraftpotential (Diskussion!)
Ṽ (r) =
j2
2mr 2
(38)
ergänzt ist.
Für die weitere Diskussion wollen wir dem üblichen Weg folgen und mittels
dr/dϕ = ṙ/ϕ̇ = mr 2 ṙ/j von Gl. (37) zur Differentialgleichung
dr
dϕ
!2
mr 2
j
=
!2 "
2
j2
(E − V ) − 2 2
m
m r
#
der Bahngleichung übergehen. Mit der Substitution
s=
1
r
entsteht daraus die Differentialgleichung
ds
dϕ
!2
1
2m
= 2 E − V ( ) − s2 ,
j
s
(39)
Z1/r
(40)
die generell durch das Integral
ϕ = ϕ0 ±
1/r0
ds
n
2m
j2
h
E −V
gelöst wird.
15
( 1s )
i
−
s2
o1/2
Speziell für das Gravitations– oder Coulomb–Potential
V (r) = −
C
= −Cs
r
(41)
läßt sich die Integration (nach quadratischer Ergänzung des Nenners) analytisch
ausführen (und führt auf die arccos–Funktion). Wir folgen jedoch der eleganteren
Behandlung Sommerfelds (Bd. I, S. 37) und differenzieren Gl. (39) (mit V =
−Cs) nach ϕ:
ds d2 s
2mC ds
ds
2
=
−
2s
.
dϕ dϕ2
j 2 dϕ
dϕ
Für ds/dϕ 6= 0 ensteht daraus die einfache Differentialgleichung
mC
d2 s
+
s
=
dϕ2
j2
mit der allgemeinen Lösung3
s=
mC
+ α cos ϕ + β sin ϕ.
j2
Diese Lösung enthält zwei Integrationskonstanten α und β. Zur Festlegung einer
Konstanten bemerken wir, daß s offenbar beschränkt ist und verfügen ϕ = 0 für
das maximale s (minimale r, ’Perihel’). Dann haben wir β = 0 und α > 0.
Nun ist unsere Ausgangsgleichung (39) aber erster Ordnung und läßt gar keine
zwei Integrationskonstanten frei. Nach der Wahl von β muß α also durch Rückeinsetzen in (39) bestimmt werden. Dabei können wir uns allerdings auf einen
speziellen Punkt beschränken. Der Bequemlichkeit halber wählen wir dazu ϕ =
π/2 und erhalten
ds
mC
und
= −α.
s= 2
j
dϕ
Setzen wir das [mit (41)] in (39) ein, erhalten wir
α2 =
2mE 2mC mC m2 C 2
+ 2
−
,
j2
j
j2
j4
also
2j 2
m|C|
1+
E
α= 2
j
mC 2
!1/2
.
Damit lautet die Gleichung der Bahngkurve
3
Auf S. 35/36 (Bd. I) gibt Sommerfeld einen noch kürzeren Weg zu dieser Lösung an.
16
2j 2
mC m|C|
1+
E
s= 2 + 2
j
j
mC 2
!1/2
cos ϕ
oder
r=
j2
mit p =
m|C|
p
sgn C + ε cos ϕ
(42)
2j 2
und ε = 1 +
E
mC 2
!1/2
.
Für C > 0 und ε < 1 (also E < 0, Planetenbahnen) beschreibt Gl. (42) Ellipsen
mit dem Brennpunkt F1 im Zentrum. Wir wollen das kurz an einer kleinen Skizze
rekapitulieren:
y
r
q
F2
ψ
e
e
b
ϕ
p
F1
x
a
Die Ellipse ist definiert durch die Beziehung
q + r = 2a,
wobei r und q die Abstände zu den beiden Brennpunkten F1 und F2 sind und a
die große Halbachse der Ellipse bezeichnet. Nach dem Kosinussatz gilt
q 2 = r 2 + 4e2 − 4re cos ψ.
Setzen wir q = 2a − r und cos ψ = − cos ϕ ein, erhalten wir
4a2 − 4ar + r 2 = r 2 + 4e2 + 4er cos ϕ
r(a + e cos ϕ) = a2 − e2
17
oder
a2 − e 2
.
a + e cos ϕ
wird als Parameter p bezeichnet, für ihn gilt also
r=
Der Radius für ϕ =
π
2
p=
a2 − e 2
.
a
Damit erhalten wir schließlich
r=
p
1 + ε cos ϕ
mit ε =
e
.
a
(43)
Abschließend notieren wir noch (Symmetrie, Pythagoras) die Beziehung
b2 = a2 − e2 = ap
(44)
zur Berechnung der kleinen Halbachse b.
Kehren wir nach diesem Exkurs zu unserem physikalischen Problem zurück, so
folgt durch Vergleich der Gln. (42) und (43) für attraktive Potentiale (C > 0)
und gebundene Bahnen (E < 0, d.h. ε < 1)
1. Keplersches Gesetz: Der Planet beschreibt eine Ellipse, in deren einem
Brennpunkt die Sonne steht.
Das zweite Gesetz hatten wir schon bei Gl. (35) angesprochen. Es beruht allgemein auf der Drehimpulserhaltung und ist nicht auf 1/r–Potentiale beschränkt:
2. Keplersches Gesetz: Der radius vector von der Sonne nach dem Planeten
überstreicht in gleichen Zeiten gleiche Flächen.
Die konstante Flächengeschwindigkeit schreiben wir nach (35)
1
j
Ȧ = r 2 ϕ̇ =
.
2
2m
Wir wollen diese Beziehung benutzen, um mit der Fläche
A = πab = πa3/2 p1/2
der Ellipse [vgl. (44)] die Umlaufzeit T zu berechnen. Setzen wir [vgl. (42)] p =
j 2 /(mC) ein, so erhalten wir
A
j
2m
m
T = = πa3/2 1/2 1/2
= 2πa3/2
m C
j
C
Ȧ
1/2
.
Für die Gravitation haben wir
C = γmM,
18
(45)
wobei γ die Gravitationskonstante und M die Sonnenmasse bezeichnet. Das
Verhältnis m/C ist daher für alle Planeten gleich; also gilt
3. Keplersches Gesetz: Die Quadrate der Umlaufszeiten der Planeten verhalten
sich wie die dritten Potenzen der großen Achsen:
T2
4π 2
=
.
a3
γM
(46)
Bei den gebundenen Bahnen mit E < 0 bleibt der Planet im Einflußbereich der
Sonne ’eingefangen’. Für E > 0 öffnen sich die Bahnen (in unserer Darstellung auf
der linken Seite) und lassen den Massenpunkt nach r = ∞ ’entweichen’: Statt der
Planetenbahnen erhalten wir die Bahnen der Kometen, und das sind wieder Kegelschnitte. Wir könnten analoge Betrachtungen wie bei der Ellipse durchführen,
ersparen uns jedoch die Rechnung und notieren nur kurz das Ergebnis:
E < 0 ε < 1 Ellipse
E = 0 ε = 1 Parabel
E > 0 ε > 1 Hyperbel
Betrachten wir statt der Gravitation die Coulombkraft, so wird
C=−
e1 e2
.
4π0
(47)
Im attraktiven Fall (C > 0) erhalten wir die gleichen Bahnen wie für Planeten
und Kometen. Vom Wasserstoffatom wissen wir allerdings, daß die klassischen
Begriffe für ein Elektron–Proton–System nur noch sehr beschränkt und vorsichtig
angewendet werden dürfen.
Für gleichnamige Ladungen haben wir C < 0, und Lösungen existieren nur noch
für E > 0. Als Bahnen finden wir nun Hyperbeln, bei denen das Kraftzentrum
im äußeren Brennpunkt liegt (vgl. Skizze).
F2
F1
−
19
Eine Übersicht über weitere Kraftgesetze, für die das Zentralkraftproblem analytisch oder mittels elliptischer Integrale lösbar ist, findet sich im Lehrbuch von
Goldstein (S. 81f). Wegen der Konkurrenz zum Fliehkraftpotential Ṽ (r) [vgl. (38)]
stellt das Potential V (r) = Cr −2 einen (akademisch) interessanten Sonderfall dar
(→ Übungen).
1.7
Die Bewegung im konstanten elektrischen und magnetischen Feld
Als letztes Beispiel der Bewegung eines Massenpunktes im vorgegebenen Kraftfeld
betrachten wir Newtons Lex secunda
mv̇ = e (E + v × B)
(48)
für ein geladenes Teilchen (e, m) unter dem Einfluß einer stationären Lorentzkraft.
Obwohl sich die Lorentzkraft nicht aus einem Potential ableiten läßt, gilt hier
der Energiesatz
m 2
v + eVel = = const .
2
(49)
Mathematisch erkennen wir dies, wenn wir Gl. (48) skalar mit v multiplizieren.
Denn da sich ein statisches Feld E gemäß E = −∇Vel aus einem elektrostatischen
Potential Vel herleiten läßt, erhalten wir
mv· v̇ + e
dVel
· ṙ = 0,
dr
aus der Gl. (49) durch Integration folgt. Aus physikalischer Sicht gilt der Energiesatz, weil (i) die magnetische Lorentzkraft senkrecht auf der Geschwindigkeit
steht und nicht zum Wegintegral (8) der Arbeit beiträgt und (ii) im stationären
Fall keine Energie durch Induktion aus dem Magnetfeld zu– oder abgeführt wird.
Wir wollen speziell die Bewegung in konstanten Feldern
E = const und B = const
untersuchen. Wie bei unseren ersten Beispielen ist es vorteilhaft, die Lex secunda
direkt zu integrieren, ohne vom Energiesatz Gebrauch zu machen. Dazu spalten
wir die Bewegung (z.B. durch skalare oder vektorielle Multiplikation mit B) in
einen Anteil parallel und einen senkrecht zum Magnetfeld auf. Mit vk = v · B/B
und Ek = E · B/B erhalten wir für den parallelen Anteil mv̇k = eEk oder
vk = vk0 +
20
e
Ek t .
m
(50)
Die Bewegung parallel zum Magnetfeld (in z–Richtung) wird also (trivialerweise) gar nicht vom Magnetfeld beeinflußt und durch das Gesetz des freien Falls
beschrieben.
Zur Beschreibung der (interessanteren) Bewegung senkrecht zum Magnetfeld differenzieren wir Gl. (48) noch einmal nach der Zeit und erhalten
e
v̇ × B ,
m
v̈⊥ =
da v̈k = 0 ist. Auf der rechten Seite setzen wir das Kreuzprodukt [vgl. (48)]
v̇ × B =
e
e
(E × B − B × (v × B)) =
(E × B − B 2 v⊥ )
m
m
ein. Mit der Zyklotronfrequenz
ωc =
erhalten wir dann
v̈⊥ =
ωc2
e
B
m
E×B
− v⊥
B2
(51)
!
.
Diese linear inhomogene Gleichung besitzt offenbar die spezielle konstante Lösung
vD =
E×B
,
B2
(52)
bei der sich die elektrische Kraft eE⊥ und die magnetische Lorentzkraft v × B
gerade die Waage halten. (Eine Galileitransformation mit vD transformiert das
Feld E⊥ weg!)
Die homogene Gleichung beschreibt eine harmonische Schwingung, die allgemeine
Lösung der inhomogenen Gleichung lautet also
v⊥ = vD + a cos ωc t + b sin ωc t .
Wegen der Differentiation haben wir eine vektorielle Integrationskonstante (etwa
b) zuviel. Zu ihrer Festlegung setzen wir die Lösung speziell für t = 0 noch einmal
in die Ausgangsgleichung (48) ein und erhalten
ωc b =
e
(E⊥ + vD × B + a × B) .
m
Aus Gl. (52) erkennen wir vD × B = −E⊥ , also muß gelten
b=
a×B
.
B
21
Die Vektoren a und b sind also betragsgleich und stehen (in der Ebene senkrecht
zu B) senkrecht aufeinander. Die Geschwindigkeit
v⊥ = vD + a cos ωc t +
a×B
sin ωc t
B
(53)
beschreibt somit eine Kreisbewegung mit überlagerter konstanter Drift (’E × B–
Drift’). Die Integrationskonstante a ergibt sich aus der Anfangsbedingung
v⊥0 = vD + a.
1.8
Beschleunigte Koordinatensysteme und Scheinkräfte
Gehen wir von unserem Inertialsystem K zu einem Koordinatensystem K0 über,
das sich relativ zu K mit der Geschwindigkeit u bewegt, so messen wir in K0 die
Geschwindigkeit
v0 = v − u.
Aus Newtons Lex secunda folgern wir
mv̇0 = F − mu̇.
(54)
Für gleichförmig bewegte Koordinatensysteme u̇ = 0 haben wir damit explizit
die Galileiinvarianz der Newtonschen Grundgleichung angeschrieben.
In beschleunigten Koordinatensystemen glauben wir dagegen, zusätzlich zu F eine
Scheinkraft
Fs = −mu̇
(55)
zu beobachten. Alltägliche Beispiele sind aus der persönlichen Erfahrung in Fahrzeugen hinreichend bekannt. Die grundsätzliche Unterscheidung von “wahren”
und von Scheinkräften ist aber keineswegs trivial und unproblematisch.
Von besonderer Bedeutung für unsere Erfahrung auf der Erde – aber auch für die
spätere Behandlung des starren Körpers – sind die Scheinkräfte in rotierenden
Koordinatensystemen. Um sie zu behandeln, müssen wir uns zunächst mit der
Beschreibung von Drehungen befassen.
Es liegt zunächst nahe, Drehungen, die ja durch die Richtung der Drehachse
und durch den Betrag des Drehwinkels eindeutig festgelegt sind, als Vektoren zu
beschreiben. Das macht aber nur Sinn, wenn zusammengesetzte Drehungen den
Rechenregeln der Vektoraddition genügen. Das ist jedoch nicht der Fall, wie wir
22
an dem einfachen Beispiel den folgenden Skizzen erkennen (wir wollen ein Buch,
das im Regal liegt, richtig aufstellen):
z
y
Ausgangssituation
x
z
y
D1 = 90o – Drehung um die x–Achse
x
z
y
D2 = 90o – Drehung um die z–Achse
x
Die Hintereinanderausführung D2 D1 liefert also das gewünschte Resultat, nicht
dagegen die Drehung D1 D2 mit vertauschter Reihenfolge:
D2
z
D1D2
z
y
y
x
x
Drehungen sind also nicht kommutativ. Sie werden durch orthogonale Matrizen4
beschrieben, die Hintereinanderausführung entspricht der Matrizenmultiplikation.
Wir kommen jedoch zu der viel bequemeren Beschreibung durch Vektoren, wenn
wir uns zunächst auf infinitesimale Drehungen beschränken: Für kleine Drehwin4
Die 9 Koeffizienten einer orthogonalen Matrix sind durch 3 Orthogonalitätsrelationen und
3 Normierungen verknüpft, so daß 3 freie Parameter bleiben.
23
kel δ1 , δ2 schreiben wir
D1 = 1 + δ1 D10
D2 = 1 + δ2 D20
und erhalten im Limes δ1 δ2 → 0
D1 D2 = 1 + δ 1 D1 + δ 2 D2 = D 2 D1 .
Infinitesimale Drehungen sind also kommutativ und können mit der Vektoraddition beschrieben werden. Zur sinnvollen Definition eines geeigneten Drehvektors
legen wir die z–Achse in Richtung der Drehachse und betrachten die Änderung
δa eines Vektors a durch eine infinitesimale Drehung δϕ. Dazu zerlegen wir
a = ak + a⊥
mit ak = az ez . Dann bleibt ak bei der Drehung invariant, und wir erhalten
δa = δa⊥ =
δϕ
a⊥+δa
= |a⊥ |δϕ eϕ =
= δϕ ez × a⊥ =
ϕ
= δϕ ez × a .
a⊥
Die Änderung δa kann also durch vektorielle Multiplikation von a mit einem
infinitesimalen Drehvektor δϕ ez beschrieben werden. Für eine zeitliche Abfolge
infinitesimaler Drehungen des Vektors a erhalten wir entsprechend
da
= ω × a,
dt
(56)
wobei die Winkelgeschwindigkeit
ω = ϕ̇ ez
einen Vektor bezeichnet, dessen Richtung in die momentane Drehachse fällt und
dessen Betrag durch die momentane Drehgeschwindigkeit ϕ̇ gegeben ist.
Wir betrachten nun ein Koordinatensystem K0 , das mit konstanter Winkelgeschwindigkeit ω rotiert und wenden Gl. (56) auf seine Basisvektoren e0i an. Dann
gilt
ė0i = ω × e0i ,
und wir erhalten für die zeitliche Ableitung eines beliebigen Vektors x =
ẋ =
=
=
X
ẋi e0i +
X
ẋi e0i + ω × x
X
ẋi e0i +
24
X
X
xi ė0i
xi ω × e0i
P
xi e0i
Der linke Term auf der rechten Seite beschreibt die in K0 beobachtete (scheinbare)
Änderung (dx/dt)0 von x, wir haben also
dx
=
dt
dx
dt
!0
+ω×x
oder in kurzer symbolischer Schreibweise
d
=
dt
d
dt
!0
+ω× .
(57)
Um nach diesem Exkurs über Drehungen zu Newtons Lex secunda zurückzukehren, wenden wir diese Beziehung auf den Ortsvektor eines Massenpunktes an:
dr
=
dt
dr
dt
!0
+ ω × r oder
v = v0 + ω × r .
Nochmalige Anwendung von (57) führt auf
!0
+ω×v =
!0
+ ω × v0 + ω × (v0 + ω × r)
v̇ =
dv
dt
=
dv0
dt
dv0 d ω × r
+
dt
dt
!0
+ ω × (v0 + ω × r)
oder r̈ = (r̈)0 + 2 ω × v0 + ω × (ω × r)
Hier bezeichnet (r̈)0 die in K0 beobachtete (scheinbare) Beschleunigung. Mit der
Grundgleichung mr̈ = F folgt
m(r̈)0 = F + 2m v0 × ω + m ω × (r × ω) .
(58)
Neben der Kraft F treten auf der rechten Seite also zwei Scheinkräfte auf. Der
Term
Z = m ω × (r × ω) = mω 2 r⊥
(59)
beschreibt die Zentrifugal– oder Fliehkraft. Sie beruht auf der Normalbeschleunigung eines Massenpunktes, der im rotierenden Koordinatensystem ruht. Damit
der Massenpunkt in Ruhe bleiben kann, muß die Zentrifugalkraft durch die entgegengesetzt gleiche Zentripetalkraft (und das ist keine Scheinkraft!) kompensiert
werden.
Die Corioliskraft
25
C = 2m v0 × ω
(60)
beruht auf der scheinbaren seitlichen Ablenkung der Bahn eines bewegten Massenpunktes durch die Drehung des Koordinatensystems. Formal mathematisch
hat sie die gleiche Struktur wie die magnetische Lorentzkraft.
Auf der rotierenden Erde geht die Fliehkraft mit dem Cosinus der geographischen
Breite. Am größten ist sie am Äquator und macht dort ∼ 0.3 % der Erdbeschleunigung aus. Generell ergänzt sie ggrav zu dem beobachteten g = geff (Lot!). |g|
nimmt also zu den Polen hin zu, und dieser Effekt wird durch die Abplattung der
Erde – die selbst hierauf beruht! – verstärkt.
Unter Vernachlässigung der Erdkrümmung (aber nicht der Erddrehung!) wird der
freie Fall also durch die Gleichung
(r̈)0 = g(eff) + 2 v0 × ω
(61)
beschrieben, die in ihrer mathematischen Struktur exakt mit der im vorigen Abschnitt behandelten Bewegungsgleichung (48) im konstanten elektrischen und
magnetischen Feld übereinstimmt. Dabei können in dieser ebenen Näherung die
Gyrationen natürlich nicht voll ausgebildet sein, denn sie würden Fallzeiten von
mehreren Tagen voraussetzen.
Der Effekt der Corioliskraft hängt generell von der Flugzeit ab, denn er beschreibt, wie sich die Erde unter der geraden Bahn wegdreht5 . Bei Fallversuchen
ist dieser Effekt klein, er spielt aber bereits eine Rolle bei Geschoßbahnen und
kann bei langdauernden Bewegungen dominant werden. Hierzu gehört insbesondere das großräumige Wettergeschehen: Durch die Corioliskraft wird die Luft,
die auf der Nordhalbkugel in ein Tiefdrucksystem einströmt, im Gegenuhrzeigersinn abgelenkt, so daß ein rotierender Wirbel, ein Zyklon, entsteht (vgl. Skizze). Ebenso bilden sich um Hochdruckgebiete Antizyklone mit entgegengesetztem
Drehsinn aus.
H
T
Im reibungsfreien stationären Zustand halten sich Corioliskraft und Druckgradient sogar die Waage und die Windrichtung verläuft parallel zu den Isobaren.
5
Ein Teil der Corioliskraft läßt sich auch als Korrektur der Zentrifugalkraft interpretieren
(Zug, der längs des Äquators fährt).
26
Darauf beruht die hohe Lebensdauer großer Hoch– und Tiefdruckgebiete. (Aufgrund der Reibung weicht die Windrichtung tatsächlich um einen Winkel von
etwa 20 bis 300 von den Isobaren ab.)
1.9
Systeme von Massenpunkten
Wir erweitern nun die Mechanik des einzelnen Massenpunkts im vorgegebenen
Krafteld und betrachten ein System von n Massenpunkten, die miteinander wechselwirken6 . Dazu gehen wir wieder von der Lex secunda
ṗi = Fi = Fai +
X0
Fij
(i, j = 1 . . . n)
(62)
j
aus. Fai bezeichnet dabei eine äußere Kraft und Fij die Kraft, die der j–te Massenpunkt auf den i–ten ausübt. Dabei deutet der Apostroph an der Summe an,
daß wir eine Selbstwechselwirkung ausschließen, also
Fii = 0
verlangen. Diese Forderung fügt sich auch zwanglos in Newtons Lex tertia
Fij = −Fji
(63)
ein, von der wir von nun an Gebrauch machen werden.
Nach den Überlegungen in Abschnitt 1.3 wird die Dynamik eines Systems aus n
Massenpunkten durch eine Differentialgleichungssystem 6n-ter Ordnung beschrieben. Durch jedes Integral, also jede Erhaltungsgröße, wird die Ordnung um eins
reduziert. Wir folgen daher den Ausführungen des Abschnitts 1.2, um grundlegende Erhaltungsstze zu formulieren.
Zur Herleitung des Impulssatzes definieren wir den Gesamtimpuls
P=
X
pi
i
und erhalten für seine Ableitung
Ṗ =
X
Fai +
i
X0
Fij .
i,j
Da die Doppelsumme nach der Lex tertia verschwindet, verhält sich das System
als Ganzes, als wirke nur die äußere Gesamtkraft
Fa =
X
Fai .
i
6
Damit tun wir auch einen ersten Schritt zur Beschreibung der Dynamik ausgedehnter
Körper und kommen zur Begründung des Modells eines Massenpunktes.
27
Hierin liegt die eigentliche Begründung für das Modell des Massenpunktes. Besonders prägnant tritt dieses Modell in Erscheinung, wenn wir die Begriffe der
Gesamtmasse
X
M=
mi
(64)
i
und des Massenzentrums oder Schwerpunkts7
P
rS =
mi r i
M
(65)
einführen. Dann erhalten wir
P=
X
mi ṙi = M ṙS
i
und können die Lex secunda in der Form
Ṗ = Mr̈S = Fa
(66)
formulieren: Der Schwerpunkt eines Systems von Massenpunkten bewegt sich so,
als wäre die Gesamtmasse in ihm vereinigt und als griffe die Resultierende aller äußeren Kräfte in ihm an. (Anschauliches Beispiel: Feuerwerksrakete). Verschwindet insbesondere die äußere Kraft, so ist der Gesamtimpuls des Systems
konstant.
Auch bei der Herleitung des Energiesatzes verfahren wir analog der Rechnungung im Abschnitt 1.2, wir multiplizieren also die Lex secunda skalar mit vi und
summieren:
mi v̇i = Fi
=⇒
X
i
mi vi ·v̇i =
d X mi 2 X
Fi ·ṙi .
v =
dt i 2 i
i
Daraus folgt durch zeitliche Integration
(2)
T2 − T 1 =
XZ
i (1)
Fi ·dri = A12 ,
(67)
wenn wir die (gesamte) kinetische Energie
T =
X
i
7
mi 2
v
2 i
Diese übliche Bezeichnung ist offensichtlich unglücklich gewählt!
28
(68)
einführen und die Summe der Wegintegrale aller Kräfte wieder als Arbeit A
bezeichnen.
In dieser Form ist der Energiesatz (67) noch wenig hilfreich. Eine erste Verbesserung erreichen wir, wenn wir die kinetische Energie in einen inneren und äußeren
Anteil zerlegen. Dazu gehen wir wieder von der Definition (65) des Schwerpunkts
aus und schreiben
ri = r S + x i .
Damit folgt
1X
mi (ṙS + ẋi ) · (ṙS + ẋi )
2 i
X
1X
1
M ṙ2S + ṙS · mi ẋi +
=
mi ẋ2i .
2
2
i
i
T =
Nun ist nach der Definition des Schwerpunkts offenbar mi xi = 0, also auch
mi ẋi = 0. Damit verschwindet der mittlere Term der unteren Zeile, und die
kinetische Energie zerfällt gemäß
P
P
1
1X
T = M ṙ2S +
mi ẋ2i
2
2 i
(69)
in die kinetische Energie “des Massenzentrums” und in den “inneren” Anteil aus
der Relativbewegung. Dabei ist zu beachten, daß diese Zerlegung der kinetischen
Energie nur bezüglich des Schwerpunktes möglich ist!
Der entscheidende Nutzen des Energiesatzes kommt erst zum Tragen, wenn alle
Kräfte aus Potentialen herleitbar sind. Denn nur dann läßt sich das Wegintegral der Arbeit ohne vorherige Lösung des Bewegungsproblems berechnen. Wir
machen den Ansatz
Fai = −
d a
∂
Vi (ri ) und Fij = −
Vij (ri − rj )
dri
∂ri
(70)
und stellen mit der Zusatzforderung
Vij = Vji
die Gültigkeit der Lex tertia sicher:
Fij = −
∂
∂
Vij = +
Vij = −Fji .
∂ri
∂rj
Gleichzeitig weisen wir aber darauf hin, daß dieser naheliegende Ansatz keinesfalls
allgemein ist. Zunächst einmal impliziert er sofort die Verschärfung der lex tertia, nach der die Kräfte in der Verbindungslinie der Körper liegen. Darüber hinaus
29
aber setz er die Annahme(!) einer Unabhängigkeit der Zweiteilchen–Wechselwirkung
Vij vom Rest der Welt, insbesondere von den äußeren Kräften, voraus. Der Ansatz
ist für die Coulomb–Wechselwirkung geladener Teilchen und die Gravitation
von Punktmassen richtig, versagt aber schon bei der Wechselwirkung induzierter
Dipole (Nägel im Magnetfeld).
Mit der Annahme der Gl. (70) zerfällt nun auch das Arbeitsintegral in Gl. (67)
in zwei Anteile, nämlich den “äußeren” Anteil
(2)
Aa12
=−
XZ
i (1)
X
dVia
[Via (1) − Via (2)]
· dri =
dri
i
und den Wechselwirkungs–Anteil
(2)
AW
12
= −
X0 Z
i,j (1)
∂Vij
· dri
∂ri
(2)"
Z
1 X0
= −
2 i,j
(1)
∂Vij
∂Vi
· dri +
· drj
∂ri
∂rj
#
(2)
(2)
1 X 0 Z ∂Vij
1 X 0 Z dVij
= −
· (dri − drj ) = −
· drij ,
2 i,j
∂ri
2 i,j
drij
(1)
(1)
wobei wir die Bezeichnung
rij = ri − rj
für das Argument von Vij benutzt haben. Wir können nun die Integration ausführen
und erhalten.
1 X0
[Vij (1) − Vij (2)] .
AW
12 =
2 i,j
Definieren wir also die gesamte potentielle Energie durch
V (r1 , . . . , rn ) =
X
Via (ri ) +
i
1 X0
Vij (ri − rj ) ,
2 i,j
(71)
so erhalten wir
A12 = V1 − V2
(72)
und formulieren den Energiesatz T2 + V2 = T1 + V1 oder
T + V = E = const.
30
(73)
Anmerkungen:
1. Die potentielle Energie (71) setzt sich zusammen aus der potentiellen Energie aller Teilchen in den äußeren Feldern und aus der Wechselwirkungsenergie.
Letztere trägt den Faktor 12 , da die Wechselwirkungsenergie je zweier Teilchen i, j
bei der Summation doppelt gezählt wird. Eine häu benutzte alternative Anschrift
lautet
X
1 X0
Vij (ri − rj ) =
Vij (ri − rj ) .
2 i,j
i<j
2. Obwohl sowohl die kinetische als auch die potentielle Energie jeweils in einen
inneren und einen äußeren Anteil zerlegt werden können, gilt i.a. kein separater
Energiesatz für die innere und die äußere Gesamtenergie! Eine wichtige Ausnahme
bildet der Spezialfall verschwindender äußerer Kräfte.
In weiterer Anlehnung an die Darstellung in Abschnitt 1.2 wollen wir den Drehimpulssatz formulieren. Dazu multipliziern wir die Lex secunda
ṗi = Fi
vektoriell mit ri und summieren über i:
X
i
ri × ṗi =
X
i
ri × F i .
Da ṙi × pi = mi vi × vi = 0 gilt, steht auf der linken Seite die zeitliche Ableitung
des Drehimpulses
l :=
X
i
ri × p i .
(74)
Die Kräfte auf der rechten Seite zerlegen wir nach Gl. (62) in äußere Kräfte und
innere Wechselwirkung und erhalten
X
i
ri × F i =
X
ri × Fai +
X
ri × Fai +
i
X0
i,j
ri × Fij
1 X0
[ri × Fij + rj × Fji ]
2 i,j
i
X
1 X0
ri × Fai +
=
(ri −rj ) × Fij .
2 i,j
i
=
Hierbei haben wir bereits von der Lex tertia Fij = −Fji Gebrauch gemacht. Wir
setzen nun außerdem wieder die Verschärfung “Die Kräfte liegen in der Verbindungslinie der Körper” voraus. Diese Verschärfung gilt für Zentralkräfte. Dann
wird
(ri − rj ) × Fij = 0
31
und wir erhalten den Drehimpulssatz
l̇ = M
(75)
mit dem Gesamt–Drehmoment
M=
X
i
ri × Fai ,
(76)
das nur von den äußeren Kräften abhängt. Wirken insbesondere keine äußeren
Kräfte, so ist der Drehimpuls konstant.
Ähnlich wie die kinetische Energie läßt sich auch der gesamte Drehimpuls in einen
äußeren und einen innneren Anteil zerlegen. Wir schreiben dazu wieder
ri = r S + x i
und rechnen
l =
X
i
mi (rS + xi ) × (ṙS + ẋi )
= M rS × ṙS + rS ×
X
mi ẋi +
i
X
mi xi × ṙS +
X
i
mi xi × ẋi .
Wieder verschwinden wegen der Definition des Schwerpunkts die Summen
P
und mi ẋi und wir erhalten die gewünschte Zerlegung
l = M rS × ṙS +
X
i
mi xi × ẋi
P
mi xi
(77)
des gesamten Drehimpulses in den Drehimpuls rs ×P der Schwerpunktsbewegung
und in den inneren Drehimpuls. Dabei sind auch entsprechende Hinweise wie bei
der Energie zu beachten, nämlich
1. Die Zerlegung des Drehimpulses gilt nur bezüglich des Schwerpunkts.
2. Trotz der Zerlegung gilt i.a. kein separater Erhaltungssatz für den äußeren und
den inneren Drehimpuls. Eine wichtige Ausnahme bildet wieder der Spezialfall
verschwindender äußerer Kräfte.
Schließlich erinnern wir noch einmal an die Voraussetzung der verschärften Lex
tertia.
32
1.10
Das Zweikörperproblem
Wir haben gesehen, daß die Bewegung des Schwerpunkts eines Systems nur von
den äußeren Kräften abhängt. Wie wir beim Energie– und Drehimpulssatz gesehen haben, gelingt eine völlige Separation des Problems in Schwerpunkts– und
Relativbewegung aber nur, wenn gar keine äußeren Kräfte angreifen. In diesem
Fall wird die Schwerpunktsbewegung trivial. Die Gleichung
rS = rS0 + vS0 t
(78)
enthält sechs Integrationskonstanten und kann benutzt werden, um einen Satz der
6n Koordinaten und Impulse zu eliminieren: Das n–Körperproblem ohne äußere
Kräfte ist also mathematisch einem (n − 1)–Körperproblem (Ordnung 6(n − 1))
äquivalent. Damit muß es möglich sein, das Zweikörperproblem, das durch die
Gleichungen (beachte die Lex tertia)
m1 v̇1 = F12
m2 v̇2 = −F12
(79)
(80)
definiert ist, auf das ausführlich diskutierte Problem eines Massenpunktes zurückzuführen. Die Addition der beiden Gleichungen liefert den bereits besprochenen
Schwerpunktsatz. Multiplizieren wir die Gleichungen dagegen wechselseitig mit
m2 und m1 und subtrahieren, so erhalten wir
m1 m2 (v̇1 − v̇2 ) = (m1 + m2 )F12 ,
oder wenn wir die Relativkoordinaten
r12 = r1 − r2
u = ṙ12 = v1 − v2
(81)
(82)
und die reduzierte Masse
µ=
m1 m2
m1 m2
=
m1 + m 2
M
(83)
einführen,
µu̇ = F12 .
33
(84)
Damit ist die gesuchte Formulierung eines äquivalenten Einkörperproblems bereits gefunden.
Ausgehend von diesem Einkörperproblem können wir nun auch wieder eine kinetische Energie
Trel =
µ 2
u
2
(85)
und einen Drehimpuls
lrel = µu × u̇
(86)
im Relativsystem definieren und entsprechende Erhaltungssätze formulieren. Unter Ausnutzung der Beziehungen
m2
r12
M
m1
= rS −
r12
M
r1 = r S +
r2
und
(87)
(88)
rechnet man jedoch leicht nach, daß es sich hierbei um die bereits aus dem vorigen
Abschnitt bekannten inneren Anteile der kinetischen Energie bzw. des Drehimpulses handelt.
Nachträglich merken wir an, daß wir auf dieser Basis die Behandlung des Keplerproblems im Abschnitt 1.6 präzisieren können, indem wir die Planetenmasse
durch die reduzierte Masse ersetzen. Wir weisen aber nochmals darauf hin, daß die
einfache Reduktion des Zweikörperproblems nur möglich ist, wenn keine äußeren
Kräfte einwirken. Die Bewegung des Mondes um die Erde im (äußeren) Schwerefeld der Sonne ist also beispielsweise kein Zweikörperproblem und und folgt nur
in sehr grober Näherung den Keplerschen Gesetzen.
34
2
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskräfte
Bei unseren bisherigen Überlegungen waren die Kräfte als Funktion von Teilchenkoordinaten, Geschwindigkeiten und eventuell der Zeit vorgegeben, und unsere
Aufgabe bestand in der Lösung der Newtonschen Differentialgleichungen
mi r̈i = Fi (rj , ṙj , t)
(i, j = 1, . . . n) .
In vielen technischen Problemen ist aber die Bewegung durch Nebenbedingungen
oder Zwangsbedingungen eingeschränkt. Dabei treten Kräfte, die sogenannten
Zwangskräfte, auf, die nicht vonvornherein bekannt sind. Bevor wir uns mit
dem damit verbundenen Selbstkonsistenzproblem befassen, wollen wir einige Begriffe zur sprachlichen Klassifikation von Zwangsbedingungen einführen und an
einfachen Beispielen erläutern.
Zwangsbedingungen, die durch Beschränkungsgleichungen der Form
fk (r1 , . . . rn , t) = 0
(89)
formuliert werden können8 , heißen holonom [griech. oλoς (holos) = lat. integer
(“Integral!”), griech. νoµoς (nomos) = Gesetz], alle andern heißen anholonom
[griech. αν (an) = lat. in = dtsch. un]. Zur Erläuterung notieren wir einige Beispiele:
holonom
anholonom
Pendel an einer Stange
r2 − a 2 = 0
Pendel an einem Faden
r 2 − a2 ≤ 0
Bewegung auf der Erdoberfläche
r2 − a 2 = 0
Bewegung außerhalb der Erde
r 2 − a2 ≥ 0
Starrer Körper
(ri − rj )2 − a2ij = 0
System harter Kugeln
(ri − rj )2 − a2 ≥ 0
“Breite” Rolle
dx = adϕ (vgl. 5 )
“Scharfkantiges” Rad
dx = a cos ϑdϕ, dy = a sin ϑdϕ
Straßenbahn
Autobus
8
Hierzu gehören also auch integrable differentielle Bedingungen
35
P
∂fk/∂ri · dri = 0!
Abgesehen von bestimmten differentiellen Bedingungen (vgl. Abschnitt 2.5) ist
man bei der Behandlung anholonomer Beschränkungen auf individuelle Ansätze
für die speziellen Probleme angewiesen. So werden Bedingungen mit einem ≤–
Zeichen i.a. auf eine Fallunterscheidung mit entprechender Untersuchung von
Bahnstücken führen (Fadenpendel) und/oder genauere Spezifizierungen der Bedingungen im Fall des =–Zeichens verlangen (Stoß harter Kugeln).
Wie werden im folgenden, wenn nicht ausdrücklich etwas anderes gesagt wird,
stets holonome Zwangsbedingungen voraussetzen.
Eine weitere Unterscheidung trifft man bezüglich der Zeitabhängigkeit: Enthalten
Zwangsbedingungen die Zeit explizit, nennt man sie rheonom [griech. ρω (rheo)
= fließen], andernfall skleronom [griech. σκληρoς (skleros) = starr]. Skleronome
Bedingungen erscheinen zunächst einfacher, der Formalismus, den wir im folgenden entwickeln, läßt aber ohne nennenswerten Mehraufwand auch die Behandlung
rheonomer Bedingungen zu.
Wir kommen nun auf das Problem der Selbstkonsistenz zurück. Wir stehen nm̈lich
vor der grundsätzlichen Schwierigket, daß wir das Bewegungsproblem mit den
Newtonschen Gesetzen allein nicht lösen können, da die Zwangskräfte nicht
apriori vorgegeben sind. Sie stellen vielmehr Reaktionen des Systems dar, die
selbst vom Bewegungsablauf — also der Lösung des Bewegungsproblems — abhängen.
Um diesen Aspekt zu verdeutlichen, betrachten wir vergleichend das Problem influenzierter Oberflächenladungen in der Elektrostatik:
Elektrostatik
Mechanik
Grundproblem: Das Potential Φ ist mit
der Poissongleichung
Grundproblem: Die Bahnen ri (t) sind
mit Newtons Gesetz
Φ = −%/ε0
mi r̈i = Fi
aus den Ladungen % zu berrechnen.
aus den Kräften Fi zu berechnen.
Beschränkung: Φ ist auf den Leiteroberflächen vorgegeben.
Beschränkung: Die ri (t) unterliegen
Zwangsbedingungen.
Schwierigkeit: Die Ladungen auf den
Leiteroberflächen (Reaktionen des Systems!) sind nicht apriori bekannt.
Schwierigkeit: Die Zwangskräfte (Reaktionen des Systems!) sind nicht
apriori bekannt.
Lösungskonzept: Wir versuchen, die
unbekannten Oberflächenladungen aus
der Beschreibung zu eliminieren (z.B.
durch die Methode der Spiegelladungen).
Lösungskonzept: Wir versuchen, die
unbekannten Zwangskräfte aus der Beschreibung zu eliminieren. Hierzu postulieren wir ein neues Prinzip.
36
2.2
Prinzip der virtuellen Arbeit und d’Alembertsches
Prinzip
Da die Zerlegung von Kräften
Fi = Fei + Zi
(90)
in von außen angelegte oder “eingeprägte” Kräfte Fei und Zwangskräfte Zi nicht
aus den Newtonschen Axiomen gefolgert werden kann, benötigen wir ein neues,
zusätzliches Postulat. In Analogie zum Modell des idealen Leiters in der Elektrostatik benutzen wir hierzu das Modell der glatten Führungen. Dabei denken wir
z.B. an reibungsfreie Schienen.
Trotz der scheinbaren Trivialität erweist sich die korrekte Formulierung des neuen
Postulats als ziemlich schwierig. Darum beschränken wir uns zunächst auf die Statik und bereiten die Aufstellung des Postulats durch die elementare Anschauung
an der schiefen Ebene vor:
z
Z
K
G⊥
G||
δs
G
ϕ
x
An unseren Massenpunkt greift eine Federkraft K, eine Gewichtskraft G und
die Zwangskraft Z an. Im statischen Gleichgewicht muß die Summe aller Kräfte
verschwinden:
F = K+G +Z = 0.
Die intuitive Lösung des Problems besteht nun darin, zu postulieren, daß die
Zwangskraft senkrecht auf der Führung steht. Zerlegen wir die Gewichtskraft
entsprechend in die Anteile Gk und G⊥ mit
Gk = mg sin ϕ und G⊥ = mg cos ϕ ,
so erhalten wir die beiden Beziehungen
G⊥ + Z = 0 und Gk + K = 0 .
37
Die erste Gleichung interessiert uns nicht, da wir die Zwangskraft eliminieren
wollen. Aus der zweiten finden wir
K = −mg cos ϕ .
Unsere intuitive Behandlung der Zwangsbedingung macht also Gebrauch von dem
Postulat “Die Zwangskraft steht senkrecht auf der Führung”. Wir können diesen
Sachverhalt mit Hilfe des Arbeitsintegrals ohne explizite Zerlegung der Kräfte
ausdrücken:
Prinzip der virtuellen Arbeit: Zwangskräfte leisten bei virtuellen Verrückungen δri keine Arbeit,
X
i
Zi · δri = 0 .
(91)
Die Gleichgewichtsbedingungen Fi = 0 gehen damit in die Bedingungen
X
i
Fei · δri = 0
(92)
über, welche die Zwangskräfte gar nicht mehr enthalten! Hierin liegt bei komplexeren Problemen der entscheidende Vorteil gegenüber der Zerlegung nach dem
Kräfteparallelogramm.
Virtuelle Verrückungen sind dabei differentielle Systemänderungen δri der
Massenpunkte,
• die mit den Zwangsbedingungen verträglich sind und
• die “im Gedankenexperiment” ohne Rücksicht auf den tatsächlichen Bewegungsablauf vorgenommen werden.
Hinweise:
1. Beachte, daß aus Gl. (92) nicht Fei = 0 gefolgert werden kann, da die δri
nicht unabhängig sind.
2. Warum es so wichtig ist, die virtuellen Änderungen vom tatsächlichen Bewegungsablauf zu unterscheiden, werden wir gleich sehen.
3. Wir weisen nochmals darauf hin, daß sich das Postulat nicht beweisen läßt,
sondern daß damit “glatte Führungen” definiert werden. Wir werden es
für holonome und einfache differentielle anholonome Zwangsbedingungen
benutzen.
38
Für unser Beispiel der schiefen Ebene erhalten wir also die Gleichgewichtsbedingung
(G + K) · δs = 0 ,
wobei zu beachten ist, daß δs mit der Zwangsbedingung verträglich ist. Das heißt,
daß die Richtung von δs längs der schiefen Ebene zu wählen ist. Damit geht die
Gleichgewichtsbedingung in
(Gk + K)δs = 0
über, und für δs 6= 0 folgt die oben formulierte Gleichung
Gk + K = 0 .
Wir verlassen nun die Statik und gehen wieder zur Dynamik über, indem wir die
Gleichgewichtsbedingung Fi = 0 durch Newtons Lex secunda
ṗi = Fi = Fei + Zi
(93)
ersetzen. Dabei halten wir am Modell der glatten Führungen und damit an dem
Prinzip, daß Zwangskräfte bei virtuellen Verrückungen keine Arbeit leisten, fest:
X
i
Zi · δri = 0 .
Damit erhalten wir sofort das d’ Alembertsche Prinzip
X
i
(ṗi − Fei ) · δri = 0 .
(94)
Was wir hier so mühelos und scheinbar trivial erhalten haben, geht historisch auf
äußerst scharfsinnige Analysen von Bernoulli und d’Alembert zurück, die
auf einem dynamischen Gleichgewicht von eingeprägten Kräften, Zwangskräften
und Trägheitskräften beruhen. Wie wenig trivial das Prinzip ist, zeigt sich darin,
daß der präzise Charakter der virtuellen Verrückungen erst jetzt voll zum Tragen
kommt:
Virtuelle Verrückungen sind gedachte Systemveränderungen, die mit den (momentanen) Zwangsbedingungen verträglich sind und nichts mit dem tatsächlichen Ablauf der Bewegung zu tun haben. Ohne diesen letzteren Nachsatz wäre
das Prinzip falsch!
Insbesondere bei rheonomen Zwangsbedingungen können Zwangskräfte bei der
tatsächlichen Bewegung nämlich sehr wohl Arbeit am System leisten. Die Zwangskräfte stehen dann im Fall holonomer Bedingungen zwar weiterhin senkrecht
39
auf den momentanen beschränkenden Flächen, aber die resultierende Bewegung
verläuft eben nicht mehr in diesen Flächen.
Als einfaches Beispiel dazu betrachten wir die Arbeit, die von der Zentripetalkraft
geleistet wird, wenn ein Massenpunkt an einem Faden der Länge `(t) mit `˙ < 0
geführt wird:
δr
dr=rdt
l(t0)
l(t)
Für die Ausführung der virtuellen Verrückung muß also in Gedanken die Zeit kurz
“angehalten” werden, anschaulich: Wir führen die virtuelle Verrückung nicht am
bewegten System durch, sondern an einer Momentaufnahme, an einem Foto dieses
Systems. In abstrakter mathematischer Form formulieren wir diese fundamental
wichtige Erklärung in der Form
• Die Zeit darf bei virtuellen Verrückungen nicht variiert werden:
δt = 0 .
(95)
Wir beenden diesen Abschnitt mit einem einfachen Beispiel zum d’Alembertschen
Prinzip: Wir stellen die Bewegungsgleichung für die schiefe Ebene (nun ohne Federkraft) auf. Dabei beziehen wir uns auf die Skizze
z
m
δs
G
ϕ
40
x
und rechnen
(mr̈ − G) · δs = 0 mit
r̈ = ẍex + z̈ez ,
G = −mgez
und δs = (cos ϕex − sin ϕez )δs
=⇒ m(ẍex + z̈ez + gez )(cos ϕex − sin ϕez )δs = 0 oder
ẍ cos ϕ − z̈ sin ϕ − g sin ϕ = 0 .
Diese eine Bewegungsgleichung enthält noch zwei Unbekannte. Aber uns steht ja
außerdem auch noch die Zwangsbedingung
z = z0 − x tan ϕ
zur Verfügung, mit der wir eine der Koordinaten eliminieren können. Wir setzen
z̈ = −ẍ tan ϕ ein und erhalten die Bewegungsgleichung
sin2 ϕ
ẍ cos ϕ +
cos ϕ
!
= g sin ϕ
oder
ẍ = g sin ϕ cos ϕ
mit der Lösung
x = x0 + vx0 t +
2.3
g
sin ϕ cos ϕ t2 .
2
Generalisierte Koordinaten und Lagrangesche Gleichungen
Das Beispiel der schiefen Ebene hat einen Nachteil unserer bisherigen Formulierung deutlich gemacht, der die Rechnung noch einigermaßen unbequem gestaltet:
Unser n–Teilchen–Problem wird durch 3n Koordinaten beschrieben. Wenn alle Koordinaten unabhängig wären, könnten wir alle δri unabhängig wählen —
etwa immer nur eine einzige Koordinate variieren — und erhielten aus dem
d’Alembertschen Prinzip 3n Bewegungsgleichungen. Tatsächlich sind die Koordinaten aber durch m Beschränkungsgleichungen verknüpft und so bleiben uns
nur
f = 3n − m
(96)
“Freiheitsgrade” für die Variation. Damit liefert das d’Alembertsche Prinzip
auch nur f unabhängige Gleichungen. (Im Beispiel der schiefen Ebene war das
eine Gleichung). Mit den m Beschränkungsgleichungen zusammen erhalten wir
zwar die erforderliche Anzahl von 3n Gleichungen. Da wir im Fall holonomer
Zwangsbedingungen, auf die wir uns hier beschränken, aber nur f unabhängige
Koordinaten haben, schleppen wir einen unnötigen Ballast mit uns. Im Falle der
41
schiefen Ebene wäre es beispielsweise bequemer gewesen, statt der Koordinaten
x und z, die durch eine Zwangsbedingung verknüpft sind, sofort die eine freie
Koordinate s zu verwenden.
Im allgemeinen wird es freilich nicht ausreichen, einfach ein gedrehtes kartesisches Koordinatensystem zu benutzen. Vielmehr müssen wir bereit sein, von den
kartesischen Koordinaten, die wir nun in der Form
x1 , . . . x3n
durchnumerieren wollen, zu ganz allgemeinen krummlinigen und schiefwinkligen
Koordinaten
q1 , . . . q3n
überzugehen: Wir sprechen von generalisierten Koordinaten. Dabei streben
wir an, daß die Zwangsbedingungen trivial zu handhaben sind. Schreiben wir
diese wieder in der Form
f1 (x1 , . . . x3n , t) = 0, . . . , fm (x1 , . . . x3n , t) = 0 ,
so wählen wir beispielsweise
qf +1 = f1 (x1 , . . . x3n , t), . . . , q3n = fm (x1 , . . . x3n , t)
als neue Koordinaten und ergänzen sie durch eine geeignete Wahl von
q1 (x1 , . . . x3n , t), . . . , qf (x1 , . . . , x3n , t)
zu einem vollständigen Koordinatensatz. Die Zwangsbedingungen
qf +1 = 0, . . . , q3n = 0
sind dann in der Tat trivial und machen die m Koordinaten qf +1 , . . . q3n überflüssig. Auf jeden Fall beschreiben wir unser System von f Freiheitsgraden so durch
f generalisierte Koordinaten
q1 , . . . qf ,
daß die m Zwangsbedingungen bereits implizit in der Rücktransformation
x1 = x1 (q1 , . . . qf , t), . . . , x3n = x3n (q1 , . . . qf , t)
(97)
enthalten sind. Um dieses Konzept an einem einfachen Beispiel zu illustrieren,
betrachten wir ein ebenes Pendel, d.h einen Massenpunkt mit den Koordinaten
x1 , x2 , x3 und den Zwangsbedingungen
f1 (x) = x21 + x22 + x23 − `2 = 0 und
x2
− ϕ0 = 0 .
f2 (x) = atn
x1
42
Benutzen wir an Stelle der kartesischen Koordinaten x1 , x2 , x3 sphärische Polarkoordinaten r, ϑ, ϕ, so lauten die Zwangsbedingungen
f1 (x) = r 2 − `2 = 0 und
f2 (x) = ϕ − ϕ0 = 0 .
Mit der Wahl der Koordinaten q3 = r − ` = 0 und q2 = ϕ − ϕ0 = 0 — die
explizit gar nicht mehr benötigt werden — sind die Zwangsbedingungen trivial
erfüllt und wir können mit
q1 = ϑ
als einziger freier Koordinate arbeiten. Die Rücktransformation
x1 = ` sin ϑ cos ϕ0
x2 = ` sin ϑ sin ϕ0
x3 = ` cos ϑ
stellt die Erfüllung der Zwangsbedingungen bereits sicher.
Unsere Aufgabe besteht nun also darin, das d’Alembertsche Prinzip
3n
X
i=1
(mi v̇i − Fi )δxi = 0
(98)
in generalisierten Koodinaten zu formulieren. Hierbei bezeichnet Fi die einprägte
Kraft. Wir lassen also künftig den oberen Index e weg, da die Zwangskräfte Zi
im d’Alembertschen Prinzip gar nicht vorkommen.
Zur Umrechnung benutzen wir die differentiellen Beziehungen
δxi =
f
X
∂xi
δqk
k=1 ∂qk
und
f
X
∂
∂
d
=
q̇j
+
.
dt
∂qj ∂t
j=1
(99)
(100)
Die Umformung des zweiten Terms in Gl. (98) ist rasch erledigt: Wir schreiben
einfach
X ∂xi
X
X
Fi
Fi δxi =
Qk δqk
δqk =
∂qk
i
i,k
k
und definieren damit generalisierte Kräfte
Qk =
X
Fi
i
43
∂xi
.
∂qk
(101)
[Beachte: Eine generalisierte Kraft Qk hat nur dann die Dimension einer Kraft,
wenn qk die Dimension einer Länge hat. Die Produkte Qk δqk haben immer die
Dimension einer Energie (virtuelle Arbeit!). Beschreibt z.B. qk einen Winkel, so
ist Qk das zugehörige Drehmoment.]
Die Umformung des ersten Terms in Gl. (98) kostet etwas mehr Mühe. Wir schreiben zunächst gemäß (99)
v̇i δxi = v̇i
X
k
"
X d
∂xi
∂xi
vi
δqk =
∂qk
dt
∂qk
k
!
#
d ∂xi
− vi
δqk .
dt ∂qk
(102)
Im rechten Term können wir nach Gl. (100)


f
∂xi ∂xi  ∂vi
∂ 2 xi
∂ 2 xi
∂ X
d ∂xi X
q̇j
q̇j
=
=
+
=
+
dt ∂qk
∂qj ∂qk ∂t∂qk
∂qk j=1 ∂qj
∂t  ∂qk
j
ersetzen, denn es gilt ja — ebenfalls nach Gl. (100) —
vi =
dxi X ∂xi ∂xi
q̇j
=
+
.
dt
∂qj
∂t
j
(103)
An dieser Stelle überlegen wir uns, daß wir in der neben den qk auch die q̇k als
unabhängige Variable benötigen. Dabei gilt nach Gl. (103) offenbar
∂vi
∂xi
=
.
∂qj
∂ q̇j
(104)
Dies setzen wir im ersten Term auf der rechten Seite von Gl. (102) ein und erhalten
v̇i δxi =
X
k
"
d
∂vi
vi
dt
∂ q̇k
!
#
∂vi
− vi
δqk .
∂qk
Hier ersetzen wir nun keineswegs die vi nach Gl. (103), sondern multiplizieren
mit mi , summieren und drücken das Ergebnis mit Hilfe der kinetischen Energie
P
T = 12 mi vi2 aus:
X
mi v̇i δxi =
i
X
k
"
#
∂T
d ∂T
−
δqk .
dt ∂ q̇k ∂qk
Damit erhält das d’Alembertsche Prinzip (98) die Form
X
k
"
#
∂T
d ∂T
−
− Qk δqk = 0 .
dt ∂ q̇k ∂qk
44
(105)
Und nun kommt die entscheidende Schlußfolgerung: Wenn wir die generalisierten Koordinaten bei holonomen Zwangsbedingungen “richtig” gewählt haben,
dann sind die Variationen δqk nicht mehr durch Nebenbedingungen verknüpft
und können frei gewählt werden9 . Damit müssen die Koefizienten der δqk in Gl.
(104] einzeln verschwinden, und wir erhalten die Lagrangeschen Gleichungen
∂T
d ∂T
−
= Qk .
dt ∂ q̇k ∂qk
(106)
Meistens nimmt man bei der Formulierung der Lagrangeschen Gleichungen
zusätzlich an, daß die Kräfte aus einem Potential hergeleitet werden können.
Dann erhält man für die generalisierten Kräfte
Qk = −
und kann schreiben
X
i
∂V
∂V ∂xi
=−
∂xi ∂qk
∂qk
(107)
d ∂T
∂T
∂V
−
+
= 0.
dt ∂ q̇k ∂qk ∂qk
Da das Potential V nicht von den q̇k abhängt, können wir die Lagrangefunktion
L(q1 , . . . qf , q̇1 , . . . q̇f , t) = T − V
(108)
einführen und erhalten die Lagrangeschen Gleichungen in der üblichen Form
d ∂L
∂L
−
= 0.
dt ∂ q̇k ∂qk
(109)
Beachte: Gl. (109) ist keine partielle Differentialgleichung zur Bestimmung von L.
Vielmehr wird angenommen, daß die kinetische und die potentielle Energie mit
Hilfe der Transformationsgleichungen durch die qk und q̇k ausgedrückt wurden
und L bereits in der Form (108) vorliegt. Die Ausführung der Differentiationen in
(109) liefert dann ein System von gewöhnlichen Differentialgleichungen
gk (q1 , . . . qf , q̇1 , . . . q̇f , q̈1 , . . . q̈f , t) = 0
der Ordnung 2f zur Bestimmung der qk (t). Dies sind die “fertigen” Bewegungsgleichungen in den generalisierten Koordinaten, in denen bereits alle holonomen Zwangsbedingungen berücksichtigt sind. So schwierig auch im Einzelfall die
Lösung dieser Bewegungsgleichungen sein mag, ihre Aufstellung ist nach diesem
Standartverfahren fast mühelos. Der Rest ist Mathematik: Die (häufig numerische) Integration eines Systems gewöhnlicher Differentialgleichungen.
9
Die Gleichung (104) selbst ist nicht an diese Vorraussetzung gebunden und gilt auch bei
anholonomen Zwangsbedingungen.
45
2.4
Beispiele
Wir wollen uns das Verfahren, aus der Lagrangefunktion die Bewegungsgleichungen zu gewinnen, zunächst an dem allereinfachsten Spezialfall klarmachen:
Wir haben keine Zwangsbedingungen und verwenden kartesische Koordinaten
qi = xi . Dann wird
L(xi , ẋi ) = T − V =
X
i
und aus den Lagrangeschen Gleichungen
Newtonschen Bewegungsgleichungen
mi ẍi = −
mi 2
ẋ − V (xi ) ,
2 i
d ∂L
∂L
−
= 0 folgen sofort die
dt ∂ ẋi
∂xi
∂V
= Fi .
∂xi
Zur Verdeutlichung betrachten wir drei weitere einfache aber nicht mehr ganz so
triviale Beispiele:
1. Spiralbewegung in der Ebene
Wir greifen sogleich das Beispiel einer rheonomen Zwangsbedingung aus dem vorigen Abschnitt auf, und betrachten einen Massenpunkt in der Ebene, der durch
einen Faden der vorgegebenen Länge `(t) auf eine Spirale um den Ursprung gezwungen wird. Wir gehen von ebenen Polarkoordinaten r, ϕ aus und behalten
wegen der Zwangsbedingung r = `(t) den Winkel ϕ als einzige generalisierte
Koordinate. Mit
m
m
T = v 2 = (`˙2 + `2 ϕ̇2 ) und V = 0
2
2
folgt
L(ϕ̇, t) =
m 2 m ˙2
v = (` + `2 ϕ̇2 ) .
2
2
Da L nicht von ϕ abhängt, lautet die Lagrangegleichung
d ∂L
= 0,
dt ∂ ϕ̇
also
∂L
= m`2 ϕ̇ = j = const .
∂ ϕ̇
In dieser Bewegungsgleichung erkennen wir den Drehimpulssatz wieder. Nach
Vorgabe der Funktion `(t) erhält man die Lösung ϕ(t) durch Integration.
Betrachten wir etwa speziell `(t) = `0 e−νt und drücken den Drehimpuls in der
Form j = m`20 ϕ̇0 durch die Anfangsbedingung aus, so folgt explizit
ϕ̇ = ϕ̇0 e2νt
und ϕ = ϕ0 +
46
ϕ̇0 2νt
e .
2ν
2. Das ebene Pendel
Wir benutzen sphärische Polarkoordinaten r, ϑ, ϕ mit der Polarachse nach unten.
Wegen der beiden Zwangsbedingungen
r = ` und ϕ = ϕ0
behalten wir ϑ als einzige generalisierte Koordinate. Damit formulieren wir
T =
m 2 m 2 2
v = ` ϑ̇
2
2
und V = mgz = −mg` cos ϑ (+const)
und erhalten die Lagrangefunktion L(ϑ, ϑ̇) =
m 2 2
` ϑ̇
2
+ mg` cos ϑ.
Aus der Lagrangegleichung
d ∂L ∂L
= 0 mit
−
dt ∂ ϑ̇
∂ϑ
∂L
= ml2 ϑ̇,
∂ ϑ̇
∂L
= −mgl sin ϑ
∂ϑ
folgt die Bewegungsgleichung
m`2 ϑ̈ + mg` sin ϑ = 0 oder ϑ̈ +
g
sin ϑ = 0 .
`
Für kleine Auslenkunken (sin ϑ ≈ ϑ) erhält man harmonische Schwingungen der
Frequenz ω = (g/`)1/2 . Die Berücksichtigung endlicher Auslenkugen führt auf
elliptische Integrale. Die Schwingungsdauer hängt dabei von der Amplitude ab,
das Pendel schwingt nicht mehr isochron [griech. ισoς (isos) = gleich, χρoνoς
(chronos) = Zeit].
3. Das Zykloidenpendel
Im letzten Beispiel demonstrieren wir die Leistungsfähigkeit des Verfahrens durch
eine Umkehrung der Fragestellung: Wir suchen eine Führung, also eine Zwangsbedingung, welche die Anharmonizität (Anisochronie) des ebenen Pendels (in der
x − z-Ebene) korrigiert. Mit einer geeigneten – noch unbekannten – dimensionslosen generalisierten Koordinate q postulieren wir also die Bewegungsgleichung
g
q̈ + q = 0
`
und gehen dementsprechend von einer geeigneten Lagrangefunktion
L=
m 2 2 1
` q̇ − mg`q 2
2
2
aus. Die Parameterdarstellung x(q), z(q) erhalten wir, indem wir L = T − V mit
der kartesischen Darstellung
T =
m 2
(ẋ + ż 2 ) und V = mgz
2
47
vergleichen. Daraus folgt
1
und z = q 2 `.
2
ẋ2 + ż 2 = `2 q̇ 2
Setzen wir ż = `q q̇ in die erste Gleichung ein, erhalten wir
ẋ2 = `2 (1 − q 2 )q̇ 2
q
oder dx = ∓` 1 − q 2 dq.
Substituieren wir schließlich q = cos φ, dq = − sin φ dφ, so folgt
dx = ±` sin2 φ dφ = ± 21 `(1 − cos 2φ)dφ und x = (±) 21 `(φ − 12 sin 2φ).
Zusammen mit z = 21 `q 2 =
Parameterdarstellung
1
` cos2
2
`
x = (2φ − sin 2φ),
4
2.5
+ cos 2φ) erhalten wir also die
`
z = (1 + cos 2φ),
4
Zur Geometrie der Zykloide
0
π/3
2π/3
π
Die Figur illustriert die Lage der Punkte,4π/3
die
5π/3
Rollwinkeln 2φ = nπ/3 entsprechen. 2π
4
4z/l
einer Zykloide, die beim Abrollen des Kreises x2 + z 2 = (`/4)2
an der Geraden z = `/2 entsteht (siehe Skizze, Rollwinkel 2φ;
die Gleichgewichtslage q = 0 entspricht 2φ = π). Im Mechaniklehrbuch vonSommerfeld (Theor. Physik. Bd. 1, S. 84) ist beschrieben, wie Huygens eine solche Führung bei der Konstruktion isochroner Pendeluhren realisiert hat.
1
`(1
4
φ =
2
2φ
0
0
2
4x/l
4
6
Geschwindigkeitsabhängige Kräfte
Unter der Voraussetzung, daß sich alle generalisierten Kräfte in der Form
Qk = −
∂V
∂qk
aus einem Potential herleiten lassen, konnten wir die Lagrangeschen Bewegungsgleichungen aus einer Lagrangefunktion L = T − V gewinnen. Wir erhalten die selben Gleichungen etwas allgemeiner aus der Lagrangefunktion
L=T −U,
wenn sich die generalisierten Kräfte gemäß
48
(110)
Qk =
∂U
d ∂U
−
dt ∂ q̇k ∂qk
(111)
aus einem generalisierten Potential
U (q1 , . . . qf , q̇1 , . . . q̇f , t)
gewinnen lassen. Dieser Zusammenhang ist gleichbedeutend mit
Fi =
d ∂U
∂U
−
,
dt ∂ ẋi ∂xi
(112)
denn dann wird
X
Qk =
i
∂xi X d ∂U ∂xi
∂U ∂xi
Fi
=
−
∂qk
dt ∂ ẋi ∂qk ∂xi ∂qk
i
!
,
und wegen ∂xi /∂qk = ∂ ẋi /∂ q̇k [vgl. Gl. (104)] folgt
Qk =
X
i
d ∂U ∂ ẋi
∂U ∂xi
−
dt ∂ ẋi ∂ q̇k ∂xi ∂qk
!
=
d ∂U
∂U
−
.
dt ∂ q̇k ∂qk
Diese spitzfindige Verallgemeinerung des Lagrangeschen Formalismus könnte
als akademische Spielerei abgetan werden, wenn sie nicht eine fundamental wichtige Anwendung besäße: Das elektromagnetische Feld mit der geschwindigkeitsabhängigen Lorentzkraft
F = e(E + v × B) .
(113)
Um diese Kraft in der gewünschten Form notieren zu können, müssen wir aus der
Elektrodynamik die allgemeine Darstellung10
E = −∇Φ −
∂
A;
∂t
B=∇×A
(114)
der Felder E und B durch “Potentiale” Φ und A übernehmen. Damit wird
"
#
∂A
F = −e ∇Φ +
− v × (∇ × A) .
∂t
Den letzten Term formen wir nach dem Entwicklungssatz um:
v × (∇ × A) = ∇(v · A) − v·∇A .
10
Zur Erinnerung: B = rotA folgt aus divB = 0. Zur induzierten Feldstärke −∂A/∂t vgl.
das “Induktionsgesetz” rotE = −∂B/∂t.
49
Berücksichtigen wir außerdem
dA
∂A
+ v·∇A =
,
∂t
dt
so erhalten wir
"
#
dA
F = −e ∇Φ +
− ∇(v · A)
dt
#
"
d d
= −e ∇(Φ − v · A) +
v·A
dt dv
"
#
d d
= −e ∇(Φ − v · A) −
(Φ − v · A)
dt dv
Die letzte Umformung gilt, da Φ nicht von v abhängt. Mit
U (r, v, t) = eΦ(r, t) − ev · A(r, t)
(115)
gilt also in Übereinstimmung mit (112)
Fi =
∂U
d ∂U
−
.
dt ∂vi ∂xi
Damit erhalten wir die Bewegungsgleichungen im elektromagnetischen Feld aus
einer Lagrangefunction
L = T − eΦ + ev · A .
(116)
Im Gegensatz zur Behandlung im Abschnitt 1.7 ist hier die volle Zeitabhängigkeit
der Felder zugelassen, es fehlt allerdings die Strahlungsdämpfung.
Eine andere Gruppe von geschwindigkeitsabhängigen Kräften bilden idealisierte
Reibungskräfte. Diese können im allgemeinen nicht sinnvoll durch eine verallgemeinerte Lagrangefunktion erfaßt werden. Es steht uns aber natürlich frei,
solche Kräfte — wie beliebige weitere Kräfte — zusätzlich zu den Kräften, die
wir aus einem generalisierten Potential ableiten, in den Lagrangeformalismus
einzubringen: Schreiben wir
Qk =
d ∂U
∂U
−
+ Q̃k ,
dt ∂ q̇k ∂qk
(117)
so erhalten wir die Lagrangeschen Bewegungsgleichungen
∂L
d ∂L
−
= Q̃k .
dt ∂ q̇k ∂qk
50
(118)
Ein häufig benutzter Ansatz nimmt einen linearen Zusammenhang
Ri = −ai vi
(119)
zwischen den Reibungskräften Ri und den Geschwindigkeiten vi an. In diesem
Fall können wir mit einer Dissipationsfunktion11
F=
1X 2
ai vi
2 i
schreiben
Ri = −
(120)
∂F
.
∂vi
Für die generalisierte Reibungskraft erhält man dann
Q̃k =
X
i
Ri
X ∂F ∂ ẋi
X ∂F ∂vi
∂xi
=−
=−
,
∂qk
i ∂vi ∂ q̇k
i ∂vi ∂ q̇k
wobei wir wieder von Gl. (104) Gebrauch gemacht haben. Wenden wir schließlich
noch die Kettenregel an, so folgt
Q̃k = −
2.6
∂F
.
∂ q̇k
(121)
Die Methode der Lagrangeschen Multiplikatoren
Wir wollen eine alternative Methode zur Lösung der Bewegungsgleichungen mit
Nebenbedingungen behandeln, die es auch erlaubt, eine einfache Klasse anholonomer Zwangbedingungen zu erfassen. Obwohl das bei dieser Methode grundsätzlich
nicht erforderlich ist, nehmen wir an, daß unser System durch einen Satz q1 , . . . qm
generalisierter Koordinaten12 beschrieben wird. Diese Koordinaten seien jedoch
nicht unabhängig, sondern einer Zwangsbedingung
f (q1 , . . . , qm , t) = 0
unterworfen. Die Gleichung f = 0 beschreibt eine Hyperfläche im m–dimensionalen q–Raum. Virtuelle Verrückungen müssen in dieser Hyperfläche ausgefürt
werden:
X ∂f
δqk = 0 .
δf = ∇q f · δq =
k ∂qk
11
12
lat. dissipo = zerstreuen, verteilen, vergeuden
Darin mag ein Teil der Zwangsbedingungen bereits berücksichtigt sein, also m ≤ 3n.
51
δq muß also senkrecht auf der Flächennormalen stehen, und die Richtung der
Flächennormalen ist durch die Richtung des Gradienten ∇q f gegeben.
Wir gehen nun wieder von dem Postulat aus, daß die Zwangskraft bei virtuellen
Verrückungen keine Arbeit leistet oder — anders ausgedrückt — senkrecht auf
der beschränkenden Hyperfläche steht. Dann ist die (generalisierte) Zwangskraft
Q̂ also parallel zum Gradienten und wir können schreiben
Q̂ = λ(q, t) ∇q f (q, t)
oder
∂f
.
∂qk
Ehe wir Bewegungsgleichungen mit dieser Zwangskraft formulieren, überlegen wir
zwei einfache Verallgemeinerungen:
Q̂k = λ
Erstens können wir sofort mehrere Beschränkungsgleichungen berücksichtigen
und diese durch einen Index i, über den wir anschließend summieren, kennzeichnen.
Zweitens ist es für unserer Formulierung offenbar gar nicht wichtig, daß die Hyperfläche fi = 0 als Ganzes (d.h. holonom) vorgegeben ist, denn wir haben nur
von der lokalen Beschreibung der Tangentialfläche Gebrauch gemacht. Solche lokalen Tangentialflächen werden aber auch durch möglicherweise anholonome
(also nicht integrable13 ) Zwangsbedingungen der Form
ai (q, t) · dq + ait dt =
X
aik (q1 , . . . qn , t)dqk + ait dt = 0 (i = 1, . . . s)
(122)
k
definiert. Dabei übernehmen die Koeffizienten aik die Rolle der partiellen Ableitungen ∂fi /∂qk .
Wir gehen also von (122) aus und beschreiben die Zwangskraft durch den Ansatz
Q̂k =
s
X
λi aik
(k = 1, . . . m)
(123)
i=1
mit noch unbekannten “Lagrangeschen Multiplikatoren” λi . Diese Multiplikatoren sind zunächst Funktionen von q1 , . . . qn und t. Über den Ablauf der Bewegung
können sie aber auch als Funktionen von t allein aufgefaßt werden. Mit diesem
Ansatz gehen wir in das d’Alembertsche Prinzip
m
X
k=1
13
(
)
d ∂L
∂L
−
− Q̂k δqk = 0
dt ∂ q̇k ∂qk
Die Bedingungen sind integrablel, wenn ∂aik /∂ql = ∂ail /∂qk und ∂ait /∂qk = ∂aik /∂t gilt.
52
ein. Nun dürfen die δqk zunächst eigentlich nicht frei gewählt werden. Aus physikalischer Sicht können wir jedoch argumentieren, daß wir die Zwangsbedingungen
gar nicht explizit zu beachten brauchen, wenn wir von vornherein die entsprechenden Zwangskräfte berücksichtigen. Vom mathematisch formalen Standpunkt
können wir die s unbekannten Koeffizienten λi so wählen, daß s Klammern im
d’Alembertschen Prinzip verschwinden. Die restlichen m − s Variationen sind
dann frei. In jedem Fall erhalten wir damit die m Bewegungsgleichungen
s
X
∂L
d ∂L
−
=
λi aik
dt ∂ q̇k ∂qk
i=1
(k = 1, . . . m) .
(124)
Zusammen mit den s Zwangsbedingungen (122) stellen sie ein System von m + s
Differentialgleichungen zur Bestimmung der m + s unbekannten Funktionen
q1 (t), . . . qm (t); λ1 (t), . . . λs (t)
dar. Im Falle holonomer Zwangsbedingungen ist der Nachteil dieser Methode offenbar: Statt eines Problems mit f = m − s Unbekannten haben wir ein Problem
mit m + s Unbekannten zu lösen. Dafür sind wir in der Lage, anholonome Bedingungen der Form (122) zu berücksichtigen. Außerdem werden die Zwangskräfte
bei dieser Methode explizit mitberechnet. Benutzen wir speziell kartesische Koordinaten xk , erhalten wir die Bewegungsgleichungen
mk ẍk = Fke +
s
X
λi aik ,
(125)
i=1
die auch als “Lagrangesche Gleichungen erster
14
Art” bezeichnet werden.
Beispiel: Die schiefe Ebene (vgl. S. 40, 41)
Wir benutzen kartesische Koordinaten x, z. Die äußeren Kräfte sind durch
Fxe = 0 und Fze = −mg
oder durch das Potential
V = mgz
gegeben. Die (in diesem Fall natürlich holonome) Zwangsbedingung schreiben wir
in der differentiellen Form dz = −dx tan α oder
dx tan α + dz = 0 .
Mit der Lagrangefunktion
L=
m 2
(ẋ + ż 2 ) − mgz
2
14
Die Lagrangegleichungen der vorigen Abschnitte werden auch Lagrangegleichungen
zweiter Art oder allgemeine Lagrangegleichungen genannt.
53
und den Gln. (124) oder äquivalent mit den Gln. (125) folgen dann die Bewegungsgleichungen
mẍ = λ tan α
mz̈ = −mg + λ .
Wir lösen die zweite Gleichung nach λ auf und setzen dies in die erste ein:
mẍ = tan α(mz̈ + mg) .
Aus der Zwangsbedingung entnehmen wir außerdem z̈ = −ẍ tan α und erhalten
mẍ(1 + tan2 α) = mg tan α
oder nach der gleichen Umformung wie auf S. 41
ẍ = g sin α cos α .
Dies ist die fertige Bewegungsgleichung für x(t) (Lösung: siehe S. 41). z(t) erhält
man daraus (z.B.) über die Zwangsbedingung. Mit der ersten Bewegungsgleichung
finden wir außerdem
λ = mg cos2 α ,
und daraus ergeben sich die Zwangskräfte
Zx = λ tan α = mg sin α cos α
und
Zz = λ = mg cos2 α .
(Interpretation: Die Komponente mg cos α der Schwerkraft erscheint als Zwangskraft senkrecht zur schiefen Ebene. Zx und Zz sind wiederum die Komponenten
dieser Zwangskraft.)
2.7
Berechnung von Zwangskräften
Wenn es auch unser Bestreben war, Zwangskräfte aus der Formulierung der Bewegungsgleichungen zu eliminieren, so wünscht man doch gelegentlich, diese Zwangskräfte zu berechnen. Beispielsweise könnte es ratsam sein, die Zwangskräfte mit
der Belastbarkeit einer Führung zu vergleichen. Mit den Lagrangeschen Multiplikatoren haben wir bereits eine Methode zur Berechnung der Zwangskräfte
kennengelernt. Im Falle holonomer Zwangsbedingungen ist diese Methode jedoch
viel zu schwerfällig und umständlich. Wir geben daher einen bequemeren Weg
an, der von der physikalischen Interpretation ausgeht:
Wir beschreiben unser System von f Freiheitsgraden mit der Lagrangefunktion
L(q1 , . . . qf , q̇1 , . . . q̇f , t)
und lösen die Lagrangeschen Bewegungsgleichungen
54
∂L
d ∂L
−
=0
dt ∂ q̇k ∂qk
(k = 1, . . . f ) .
(126)
Hierbei treten die Zwangskräfte nicht in Erscheinung. Dann bilden wir mit zusätzlichen Koordinaten qf +1 , . . . qm (f < m ≤ 3n) eine erweiterte Lagrangefunktion
L̂(q1 , . . . qm , q̇1 , . . . q̇m , t) .
Wir denken uns nun wieder die Zwangsbedingungen durch die entsprechen (generalisierten) Kräfte Q̂k ersetzt. Dann gelten im erweiterten System die Lagrangegleichungen
∂ L̂
d ∂ L̂
−
= Q̂k
dt ∂ q̇k ∂qk
(k = 1, . . . m)
(127)
Diese Lagrangegleichungen15 benutzen wir nicht zur Lösung des Bewegungsproblems, denn das ist ja bereits gelöst! Vielmehr setzen wir hierin die Lösung
q1 , . . . qf der Bewegungsgleichungen (126) und die (m − f ) Zwangsbedingungen
ein und erhalten damit explizit die interessierenden generalisierten Zwangskräfte
Qk .
Als Beispiel betrachten wir wieder die schiefe Ebene des vorigen Abschnitts. Wir
wählen zunächst x als generalisierte Koordinate und erhalten aus der Lagrangefunktion
m
L(x, ẋ) = ẋ2 (1 + tan2 α) + mgx tan α
2
die Bewegungsgleichungen
mẍ(1 + tan2 α) = mg tan α
oder
ẍ = g sin α cos α .
Nun führen wir z als zusätzliche Koordinate ein und bilden die erweiterte Lagrangefunktion
m
L̂(x, z, ẋ, ż) = (ẋ2 + ż 2 ) − mgz .
2
Daraus erhalten wir die wir die Lagrangegleichungen
mẍ = Q̂x
mz̈ + mg = Q̂z .
15
Beachte, daß die Gln. (127) auch für k ≤ f von den Gln. (126) verschieden sind und
Zwangskräfte enthalten!
55
Zusammen mit der Bewegungsgleichung und der Zwangsbedingung z̈ = −ẍ tan α
erhalten wir daraus die Zwangskräfte
Q̂x = mg sin α cos α
Q̂z = −mẍ tan α + mg
= mg(1 − sin2 α) = mg cos2 α .
Beachte, daß wir bei der Verwendung generalisierter Koordinaten qk die Zwangskräfte Q̂k i.a. in der entsprechend generalisierten Form erhalten. Falls erwünscht,
können wir daraus gemäß
X
∂qk
Zi =
Q̂k
∂xi
k
die nicht generalisierten Zwangskräfte berechnen. In unserem Beispiel haben wir
jedoch von vornherein kartesiche Koordinaten x und z benutzt, und daher gilt
Q̂x = Zx
2.8
und
Q̂z = Zz .
Zyklische Koordinaten, Symmetrien und Erhaltungssätze
Wenn die Lagragefunktion L(q1 , . . . qf , q̇1 , . . . q̇f , t) von einer Koordinate qk gar
nicht abhängt (wohl aber von q̇k !), so heißt diese Koordinate zyklisch16 . Für
eine zyklische Koordinate erhalten wir die Lagrangegleichung
d ∂L
= 0.
dt ∂ q̇k
Um den entsprechenden Erhaltungssatz prägnant formulieren zu können, führen
wir allgemein (also nicht nur für zyklische Koordinaten) durch
pk =
∂L
∂ q̇k
(128)
den “zur Koordinate qk konjugierten generalisierten Impuls” pk ein. Der Name
wird für freie Teilchen ohne Magnetfeld unmittelbar verständlich, wir haben dann
nämlich
X
mi ẋ2i − V (xj )
L=T −V =
i
und erhalten mit
pk =
∂L
= mk ẋk
∂ ẋk
16
Der Name stammt von der Winkelkordinate bei Kreisbewegungen [griech. κυκλoς (kyklos)
= Kreis].
56
den altbekannten Impuls. Wir weisen jedoch mit Nachdruck darauf hin, daß im
allgemeinen pk vom Impuls, der in Newtons Lex secunda steht, verschieden ist.
Betrachten wir beispielsweise ein geladenes Teilchen im elektromagnetischen Feld,
so folgt aus
X
mX 2
ẋi Ai
L=
ẋi − eΦ + e
2 i
i
der generalisierte Impuls
pk = mẋk + eAk
oder p = mv + eA .
Für generalisierte Koordinaten qk , die nicht die Dimension einer Länge haben, hat
pk nicht einmal die Dimension eines Impulses. Der zu einer Winkelkoordinate ϕ
konjugierte Impuls pϕ ist beispielsweise ein Drehimpuls (s.u.). Aus der Definition
von pk folgt, daß Produkte pk qk in jedem Fall die Dimension einer Wirkung, also
Energie × Zeit, haben.
Wir kehren nun zu den zyklischen Variablen zurück und formulieren den allgemeinen Erhaltungssatz
• Der zu einer zyklischen Koordinate qk konjugierte generalisierte Impuls pk
bleibt bei der Bewegung erhalten.
Diese Formulierung stellt einen engen Zusammenhang zwischen Erhaltungssätzen
und Symmetrieeigenschaften her: Ist die Koordinate qk zyklisch, so ist die Lagrangefunktion invariant gegen Veränderungen von qk , und diese Invarianz begründet einen Erhaltungssatz, nämlich den des konjugierten Impulses pk . Ein
kräftefreies System ist invariant gegen Translationen, und hieraus folgt der Impulserhaltungssatz. Ebenso ergibt sich der Drehimpulserhaltungssatz aus der Rotationssymmetrie eines Systems, auf das kein Drehmoment wirkt. Wir wollen
diese intuitiv formulierten Zusammenhänge gleich etwas genauer darlegen.
Zuvor weisen wir aber darauf hin, daß unser neuer Erhaltungssatz allgemeiner ist
als die früher formulierten Sätze der Impuls– und Drehimpulserhaltung. Betrachten wir etwa die Bewegung eines geladenen Teilchens im konstanten Magnetfeld
B = Bez , so ist diese Bewegung nicht kräftefrei und wir können keinen Impulserhaltungssatz in x– oder y–Richtung formulieren. Mit V = const und der speziellen
Darstellung A = Bxey wird dagegen die Ortskoordinate y zyklisch, und damit
folgt, daß der generalisierte Impuls
py = mẏ + eAy = mẏ + eBx
bei der Bewegung konstant bleibt17 .
17
Aus den Bewegungsgleichungen finden wir unabhängig von der speziellen Wahl von A die
beiden Invarianten mẏ+eBx und mẋ−eBy. Dies sind jedoch nicht die generalisierten Impulse p y
und px . Für A = αBxey −(1−α)Byex wird nämlich py = mẏ +αBx und px = mẋ +(1−α)By.
57
Um nun den Zusammenhang zwischen Impulserhaltung und Translationsinvarianz
genauer zu fassen, betrachten wir einen Massenpunkt mit der Lagrangefunktion
m
L(r, ṙ) = ṙ2 − V (r) .
2
Die Aussage “L ist invariant gegen eine Translation in z–Richtung” heißt mathematisch, daß L0 = L gilt, wenn wir r durch r0 = r + δr mit δr = ez δz (δz → 0)
ersetzen. Da die Geschwindigkeit durch die Translation nicht geändert wird, gilt
∂L
δz .
∂z
L ist also invariant gegen eine Translation in z–Richtung, wenn
L0 − L = δL =
∂L
∂V
=−
= Fz = 0
∂z
∂z
gilt oder wenn keine Kraft in z–Richtung wirkt. Als Folge dieser Invarianz bleibt
der Impuls
∂L
= mż
pz =
∂ ż
erhalten. Die Übertragung dieser Betrachtung auf eine beliebige Richtung und
auf ein System von Massenpunkten ist trivial. Besteht Translationsinvarianz für
alle Richtungen, so ist der vektorielle Impuls konstant.
Wir wollen eine ähnliche Betrachtung auch für den Drehimpulssatz durchführen.
Dazu nehmen wir an, daß die Lagrangefunktion L = T −V eines Massenpunkts
invariant gegen Drehungen um die z–Achse ist. Eine infinitesimale Drehung um
den Winkel δϕ um die z–Achse erzeugt eine Änderung
δr = eϕ δϕ = ez × r δϕ
(vgl. S. 24). Da sich T = mv2 /2 bei einer Drehung nicht ändert, folgt
dV
· δr = F · (ez × r) δϕ
dr
= ez · (r × F) δϕ = ez · M δϕ = Mz δϕ .
L0 − L = δL = −δV = −
L ist also invariant gegen Drehungen um die z–Achse, wenn die z–Komponente
des Drehmoments M verschwindet. Den entsprechenden Erhaltungssatz erkennen
wir, wenn wir Zylinderkoordinaten (r, ϕ, z) benutzen und
m
L = (ṙ 2 + r 2 ϕ̇2 + ż 2 ) − V
2
schreiben. Aus ∂L/∂ϕ = 0 folgt dann die Erhaltungsgröße
pϕ =
∂L
= mr 2 ϕ̇ = mrvϕ = m(r × v)z = const ,
∂ ϕ̇
also die Erhaltung der z–Komponente des Drehimpulses.
Mit einem gewissen Pathos können wir also formulieren
58
• Die Impulserhaltung ist eine Folge der Homogenität des Raumes.
• Die Drehimpulserhaltung ist eine Folge der Isotropie des Raumes.
Unter diesem Gesichtspunkt fehlt uns eine Konsequenz der Homogenität der Zeit.
Wir erwarten nämlich aus relativistischen Gründen eine gewisse Äquivalenz von
Raum und Zeit. Allerdings ist die Zeit in unserem Formalismus keine generalisierte Koordinate, sondern ein freier Parameter. Folglich ist ihr auch kein generalisierter Impuls zugeordnet. Wir fragen trotzdem nach möglichen Folgen einer Invarianz der Lagrangefunktion gegen eine Zeitverschiebung, die durch ∂L/∂t = 0
gekennzeichnet ist. Dazu rechnen wir
!
dL X ∂L
∂L
∂L
=
q̇k +
q̈k +
dt
∂qk
∂ q̇k
∂t
k
und setzen
∂L
= pk
∂ q̇k
und
∂L
d ∂L
=
= ṗk
∂qk
dt ∂ q̇k
ein. Damit folgt
∂L
dL
dL X
d X
pk q̇k .
=
− (ṗk q̇k + pk q̈k ) =
−
∂t
dt
dt
dt k
k
Wir finden also in der Tat einen weiteren Erhaltungssatz:
• Hängt die Lagrangefunktion nicht explizit von der Zeit ab, so bleibt die
Größe
X
pk q̇k − L
(129)
H=
k
bei der Bewegung erhalten.
H heißt die Hamiltonfunktion (s.u.) des Systems. Wenn wir wieder freie Teilchen betrachten und kartesische Koordinaten benutzen, so haben wir
L=T −V =
1X
mi ẋ2i − V .
2 i
Also wird pk = mk ẋk und folglich
H=
X
k
mk ẋ2k − L = T + V = E .
Unserer Aufzählung eherner Gesetze können wir also hinzufügen:
• Die Energieerhaltung ist eine Folge der Homogenität der Zeit.
59
Wir merken jedoch an, daß in dieser markigen Formulierung nichts neues gegenüber dem altbekannten Energiesatz enthalten ist — wohl aber in der obigen
Formulierung mit der Hamiltonfunktion!
Wir zeigen das am Beispiel eines Massenpunktes, der reibungsfrei auf einer Stange
(x) gleitet, die mit konstanter Winkelgeschwindigkeit ω um eine senkrechte Achse
(z) rotiert. Die Lagrangefunktion
L=T =
m 2
(ẋ + x2 ω 2 )
2
dieses Systems hängt nicht explizit von der Zeit ab. Mit px = mẋ folgt also
H = mẋ2 −
m
m 2
(ẋ + x2 ω 2 ) = (ẋ2 − x2 ω 2 ) = T − mx2 ω 2 = const.
2
2
Erhaltungsgröße ist in diesem Fall also nicht die Energie E = T , sondern H =
E − mx2 ω 2 . Und warum ist die Energie in diesem Beispiel nicht konstant? Weil
Zwangskräfte bei rheonomen Zwangsbedingungen Arbeit leisten. Und was ist an
H=
m 2 m 2 2
ẋ − x ω
2
2
anschaulich? Die (Pseudo–)Energie des äquivalenten Problems im rotierenden Koordinatensystem mit dem “Potential” m2 x2 ω 2 der Fliehkraft18 mxω 2 . (Vgl. S. 26,
g = geff auf der rotierenden Erde.)
Das Beispiel läßt uns noch etwas unbefriedigt: Wann ist denn nun die Hamiltonfunktion die Energie und wann nicht? Und was ist die Hamiltonfunktion,
wenn sie nicht die Energie ist?
Um das zu untersuchen rechnen wir von den generalisierten Koordinaten qk in
die kartesischen Koordinaten
xi = hi (q1 , . . . qf , t)
zurück und bilden
ẋi =
X
hik q̇k + hit
mit hik =
k
∂hi
∂qk
und hit =
∂hi
.
∂t
Damit wird
T =
X
i
18


X
mi  X
hik hit q̇k + h2it  = T2 + T1 + T0 .
hik hil q̇k q̇l + 2
2 k,l
k
Beachte, daß dieses effektive Potential für ω = const und l =const verschieden aussieht,
vgl. Gl. (38)!
60
Dabei bezeichnet Tν den Anteil der kinetischen Energie, der homogen vom Grade
ν (s.u.) in den generalisierten Geschwindigkeiten q̇k ist. Entsprechend läßt sich
der “magnetische Anteil”
X
M=
ei ẋi Ai
i
der Lagrangefunktion in zwei homogene zwei Anteile M1 undM0 zerlegen. Das
Potential V hängt nicht von den Geschwindigkeiten ab, ist also homogen vom
Grade Null in den q̇k .
Nach diesen Vorüberlegungen bilden wir nun die Lagrangefunktion L = T −
V + M und stellen fest, daß sie offenbar in drei Anteile
L
L2
L1
L0
=
=
=
=
L2 + L1 + L0 mit
T2
T1 + M 1
T0 + M 0 − V ,
zerfällt, wobei die Lν homogen vom Grade ν in den generalisierten Geschwindigkeiten sind.
Wir gehen nun etwas genauer auf den Begriff der Homogenität ein: Eine Funktion
f (x) heißt homogen vom Grade ν, wenn gilt
f (λx) = λν f (x) .
(130)
Differenziern wir diese Definitionsgleichung nach λ und setzen anschließend λ = 1,
so erhalten wir die Eulersche Homogenitätsrelation
X
i
xi
∂f
= νf .
∂xi
(131)
Nach diesem Exkurs kehren wir zur Bedeutung der Hamiltonfunktion
H=
X
k
pk q̇k − L =
X
∂L
q̇k − L
∂ q̇k
zurück: Setzen Wir L = L2 + L1 + L0 ein und beachten, daß nach (131)
X
∂Lν
q̇k = νLν
∂ q̇k
gilt , so folgt H = 2L2 + 1L1 + 0L0 − (L2 + L1 + L0 ) oder (mit der obigen
Spezifizierung der Lν )
H = L 2 − L 0 = T2 + V − T 0 − M 0 .
61
(132)
Damit ist die obige Frage nach dem Zusammenhang und dem Unterschied von
Hamiltonfunktion und Energie klar beantwortet: H ist die Gesamtenergie T +V ,
wenn T1 , T0 und M0 verschwinden, das heißt, wenn die generalisierten Koordinaten nicht explizit von der Zeit abhängen. Eine explizite Zeitabhängikeit der
generalisierten Koordinaten kommt i.a. durch rheonome Zwangsbedingungen zustande.
Als Beispiel betrachten wir noch einmal den Massenpunkt auf der rotierenden
Stange. Hier haben wir19
m
m
L = (ẋ2 + x2 ω 2 ), also L2 = ẋ2 und L0 = x2 ω 2 .
2
2
Damit erhalten wir sofort
m
H = L2 − L0 = (ẋ2 − x2 ω 2 ) .
2
Wie in diesem Beispiel läßt sich −L0 häufig als Pseudopotential interpretieren. H = const ist dann die (Pseudo–)Energie in dem entsprechenden Nicht–
Inertialsystem.
Wir bemerken, daß die Größe H überhaupt nicht von L1 = T1 + M1 abhängt,
insbesondere also im Fall skleronomer Zwangsbedingungen nicht von M . Damit
folgt, daß der Energieerhaltungssatz auch in Anwesenheit zeitunabhängiger Magnetfelder gilt [vgl. Gl. (49)].
2.9
Routhsches Verfahren und kanonische Gleichungen
Wir befassen uns nun mit der Frage, wie wir zyklische Koordinaten mit ihren
Erhaltungssätzen möglichst ökonomisch ausnutzen. Dazu nehmen wir an, daß
unsere Lagrangefunktion die Form
L(q2 , . . . qf , q̇1 , . . . q̇f , t)
(133)
hat, daß q1 also zyklisch ist. Zu q1 haben wir das Integral
∂L
= p1 = const .
∂ q̇1
(134)
Die übrigen Lagrangegleichungen
d ∂L
∂L
−
=0
dt ∂ q̇k ∂qk
19
(k = 2, . . . , f )
(135)
Beachte die wichtige Unterscheidung zwischen generalisierten Geschwingkeiten q̇ k (hier ẋ)
und anderen Geschwindigkeiten (hier ωx), die auf den Zwangsbedingungen beruhen!
62
enthalten zwar noch q̇1 , wir können jedoch Gl. (134) nach
q̇1 = g(q2 , . . . qf , q̇2 , . . . q̇f , p1 , t)
(136)
auflösen und in die Bewegungsgleichungen (135) einsetzen. Dort tritt dann weder
die Koordinate q1 noch die Geschwindigkeit q̇1 explizit in Erscheinung: Wir haben
das Gesamtproblem also in die separaten Probleme der Lösung der Gln. (135)
(Ordnung 2(f − 1)) und der Integration der Gl. (136) (Ordnung 1) aufgespalten.
Falsch wäre es, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren. Denn L ist stets als Funktion der generalisierten
Koordinaten und Geschwindigkeiten und nicht der generasierten Impulse zu formulieren! Wir wollen uns das an einem Beispiel klarmachen und betrachten das
Zentralkraftproblem in der Ebene. In ebenen Polarkoordinaten haben wir
L=
m 2
(ṙ + r 2 ϕ̇2 ) − V (r) .
2
Die Winkelkoordinate ist zyklisch und liefert den Erhaltungssatz
∂L
= mr 2 ϕ̇ = pϕ = const
∂ ϕ̇
des Drehimpulses (Flächensatz, vgl. S. 14, 18). Für die radiale Koordinate erhalten wir die Bewegungsgleichung
mr̈ − mr ϕ̇2 +
dV
= 0.
dr
In diese Bewegungsgleichung können wir
ϕ̇ =
pϕ
mr 2
einsetzen und erhalten die separate Bewegungsgleichung20
mr̈ −
p2ϕ
dV
+
=0
3
mr
dr
für r(t) allein. Nach ihrer Lösung kann man ϕ(t) durch Integration des Flächensatzes berechnen.
Wenn wir dagegen versuchen, die Geschwindigkeit q̇1 gemäß Gl. (136) sofort in
der Lagrangefunktion (134) zu eliminieren, erhalten wir aus
L̂ =
20
p2ϕ
m 2
(ṙ + 2 2 ) − V (r)
2
mr
Nach Multiplikation mit ṙ läßt sie sich zum Energiesatz (38) integrieren.
63
die offenbar falsche Bewegungsgleichung mr̈ ⊕
p2ϕ
mr 3
+
dV
dr
= 0.
Es gibt jedoch eine systematische Möglichkeit, q̇1 von vornherein zu eliminieren:
Das Routhsche Verfahren. Dazu geht geht man von einer modifizierten Lagrangefunktion oder Routhfunktion
R1 = L − p1 q̇1
(137)
aus. R1 hängt damit — so scheint es zunächst — von dem erweiterten Variablensatz
q2 , . . . qf , q̇1 , . . . q̇f , p1 , t
(138)
ab. Tatsächlich hängt R1 aber von der Geschwindigkeit q̇1 gar nicht mehr explizit
ab, denn wir haben ∂R1 /∂ q̇1 = ∂L/∂ q̇1 − p1 = 0. Gl. (137) vermittelt also eine
Transformation, welche die Variable q̇1 durch die neue Variable p1 ersetzt. Diese
Konstruktion beruht nicht auf einem glücklichen Zufall sondern folgt einem systematischen Weg des Variablenwechsels: Der Legendre–Transformation. Wir
erläutern das am Beispiel einer Funktion f (x, y) mit dem Differential
df = u dx + v dy .
Wünscht man nun die Variable x durch u = ∂f /∂x zu ersetzen, so bildet man
die neue Funktion
g = f − ux .
Ihr Differential
dg = df − u dx − x du = v dy − x du
zeigt, daß g in der Tat nur von den natürlichen Variablen y und u abhängt21 .
Mit der Transformation (137) wird also ein systematischer Wechsel von der Variablen q̇1 zu der neuen Variablen p1 vollzogen. Setzen wir in R1 die Geschwindigkeit
q̇1 = g(. . .) nach Gl. (136) ein, so erhalten wir für k = 2, . . . , f
!
∂L
∂g
∂L
∂L
∂R1
=
+
− p1
=
∂qk
∂qk
∂ q̇1
∂qk
∂qk
!
∂L
∂L
∂R1
∂L
∂g
=
+
− p1
=
.
∂ q̇k
∂ q̇k
∂ q̇1
∂ q̇k
∂ q̇k
Damit bleibt die Form der Lagrangegleichungen (mit R1 an Stelle von L) also
invariant:
d ∂R1 ∂R1
d ∂L
∂L
−
=
−
= 0 (k = 2, . . . , f ) .
dt ∂ q̇k
∂qk
dt ∂ q̇k ∂qk
21
(139)
Von solchen Transformationen wird in der Thermodynamik beim Wechsel der Variablen S
und T bzw. V und p reichlich Gebrauch gemacht.
64
Wir überzeugen uns davon auch wieder an unserem Beispiel der Zentralkraft und
rechnen
m 2
(ṙ + r 2 ϕ̇2 ) − V (r) − pϕ ϕ̇
Rϕ =
2
!
p2
p2ϕ
m 2
=
ṙ + 2 2 − V (r) − ϕ2
2
mr
mr
2
p
m 2
=
ṙ ϕ 2 − V (r) .
2
2mr
Aus der modifizierten Lagrangefunktion Rϕ folgt dann gemäß Gl. (139) die
korrekte Bewegungsgleichung
mr̈ −
p2ϕ
dV
+
= 0.
3
mr
dr
Wir sind damit an einem Punkt angelegt, von dem aus es nur noch zweier kleiner,
fast trivialer Schritte zu einer alternativen Formulierung der Bewegungsgleichungen bedarf:
(1) Wir können diesen Variablenwechsel von q̇1 nach p1 natürlich auch dann
durchführen, wenn q1 nicht zyklisch ist. Statt der Gleichung p1 = const
haben wir dann die Lagrangegleichung
ṗ1 =
∂R1
∂L
=
.
∂q1
∂q1
Wir benutzen also für k = 2, . . . , f die Variablen qk und q̇k und erhalten die
Bewegungsgleichungen (zweiter Ordnung)
d ∂R1 ∂R1
−
= 0 (k = 2, . . . f ) .
dt ∂ q̇k
∂qk
Für k = 1 dagegen ersetzen wir q̇k durch pk und haben die beiden Bewegungsgleichungen erster Ordnung
q̇1 = −
∂R1
∂p1
und ṗ1 =
∂R1
.
∂q1
(2) Was wir mit der Geschwindigkeit q̇1 gemacht haben, können wir mit jeder anderen Geschwindigkeit q̇k , und schließlich auch mit allen Geschwindigkeiten machen. Wir definieren uns also durch die f –fache Legendretransformation
R1...f (q1 , . . . qf , p1 , . . . pf , t) = L(q1 , . . . qf , q̇1 , . . . q̇f , t) −
65
f
X
i=1
pi q̇i
eine “neue Lagrangefunktion” oder Routhfunktion R1...f , in der sämtliche Geschwindigkeiten durch Impulse ersetzt sind, und erhalten alle Bewegungsgleichungen in der Form
q̇k = −
∂R1...f
∂pk
und ṗk =
∂R1...f
.
∂qk
Die “neue Lagrangefunktion” R1...f ist gar nicht so neu für uns, durch Vergleich
mit Gl. (129) erkennen wir nämlich bis aufs Vorzeichen die Hamiltonfunktion
H(q1 , . . . qf , p1 , . . . pf , t) =
f
X
i=1
pi q̇i − R(q1 , . . . qf , q̇1 , . . . q̇f , t)
(140)
wieder. Mit der expliziten Anschrift betonen wir zugleich, daß wir die Hamiltonfunktion als Funktion der natürlichen Variablen q1 , . . . qf , p1 , . . . pf , t auffassen
wollen. Generalisierte Geschwindigkeiten dürfen also in der Hamiltonfunktion
nicht mehr vorkommen! Aus dieser Hamiltonfunktion erhalten wir die Hamiltonschen Gleichungen oder kanonischen Bewegungsgleichungen22
∂H
∂pk
∂H
,
= −
∂qk
q̇k =
(141)
ṗk
(142)
die nicht nur durch ihr hohes Maß an Symmetrie bestechen, sondern auch die Formulierung Newtons in suggestiver Weise verallgemeinern: Der erste Satz (141)
stellt den Zusammenhang zwischen (generalisierten) Impulsen und Geschwindigkeiten her, der zweite Satz (142) drückt die Impulsänderung durch (generalisierte)
Kräfte und Scheinkräfte ∂H/∂qk aus. Für freie Teilchen im Kraftfeld mit Potential
erhält man ja tatsächlich
−
∂H
∂V
=−
= Fk .
∂xk
∂xk
Im Vergleich mit den Lagrangegleichungen bieten die kanonischen Bewegungsgleichungen also den Vorteil einer bequemeren Elimination zyklischer Koordinaten. Davon abgesehen sind die beiden Formulierungen aber völlig äquivalent und
bringen im gegenseitigen Vergleich rechnerisch (s.u.) weder Vor- noch Nachteile.
Wir haben ja auch physikalisch nichts Neues eingebracht, sondern nur mathematisch umgeformt. Ein essentieller Vorteil der Hamiltonschen Formulierung wird
erst zum Tragen kommen, wenn wir im 6. Kapitel ihre Symmetrie ausnutzen,
22
griech. κανων (kanon) = Richtschnur, Gesetz
66
um die grundsätzliche Unterscheidung von Koordinaten und Impulsen fallen zu
lassen.
Selbstverständlich lassen sich aus der Hamiltonfunktion die selben Erhaltungssätze
wie aus der Lagrangefunktion ablesen, denn nach Konstruktion gilt
∂H
∂L
=−
∂qk
∂qk
und
∂L
∂H
=−
.
∂t
∂t
(143)
Wir können also auch sagen: Eine Koordinate qk ist zyklisch, wenn die Hamiltonfunktion H nicht explizit von qk abhängt. Aus Gl. (142) lesen wir dazu ab,
daß der zu einer zyklischen Variablen qk konjugierte Impuls pk konstant ist.
Entsprechend gilt, daß die Hamiltonfunktion H konstant ist, wenn sie nicht explizit von der Zeit abhängt. Rechnerisch folgt das auch sofort aus den kanonischen
Gleichungen:
!
X ∂H
X
dH ∂H
∂H
−
=
ṗk +
q̇k = (q̇k ṗk − ṗk q̇k ) = 0 .
dt
∂t
∂pk
∂qk
k
k
Praktisch geht man beim Rechnen mit den Hamiltonschen Gleichungen wie
folgt vor:
1. Bilde die Lagrangefunktion L und berechne die generalisierten Impulse
pk = ∂L/∂ q̇k .
2. Bilde die Hamiltonfunktion gemäß H =
L2 − L0 [vgl. (132)]
P
i
pi q̇i − L [vgl. (129)] oder H =
3. Ersetze in H gemäß 1. alle q̇k durch pk .
4. Bilde die kanonischen Gleichungen.
Dabei ist zu beachten, daß der erste Satz (141) keine neue Information liefert: Er
löst lediglich den aus pk = ∂L/∂ q̇k bereits bekannten Zusammenhang zwischen
den pk und den q̇k nach q̇k auf. Der zweite Satz (142) liefert die eigentlichen
Bewegungsgleichungen23 .
Wir wollen dieses Verfahren am Beispiel des Zentralkraftproblems in der Ebene
(vgl. S. 63) illustrieren:
1. Aus der Lagrangefunktion L = T − V =
die generalisierten Impulse
pr =
23
∂L
= mṙ
∂ ṙ
und
m 2
(ṙ
2
pϕ =
+ r 2 ϕ̇2 ) − V (r) bilden wir
∂L
= mr 2 ϕ̇.
∂ ϕ̇
Diese konstruktionsbedingte Unsymmetrie wird in Kapitel 6 aufgehoben.
67
2. Aus H = L2 −L0 oder aus H = T +V berechnen wir die Hamiltonfunktion
zunächst in der vorläufigen Form
H=
m 2
(ṙ + r 2 ϕ̇2 ) ⊕ V (r).
2
3. Wir setzen anschließend ṙ = pr /r und ϕ̇ = pϕ /(mr 2 ) ein und erhalten die
endgültige Hamiltonfunktion
H(r, pr , pϕ ) =
p2
p2r
+ ϕ 2 + V (r).
2m 2mr
4. Daraus folgen die kanonischen Gleichungen
ṙ =
pr
,
m
ϕ̇ =
pϕ
,
mr 2
ṗr =
p2ϕ
dV
−
,
3
mr
dr
ṗϕ = 0 .
Die ersten beiden Gleichungen wiederholen den bereits vorher bekannten Zusammenhang zwischen Geschwindigkeiten und Impulsen. In der zweiten Zeile finden
wir die radiale Bewegungsgleichung und die Konstanz des Drehimpulses. Die formale Rechnung ist wesentlich identisch mit der im Lagrangeformalismus. Der
Vorteil der kanonischen Behandlung liegt allenfalls darin, daß wir uns um die
Ausnutzung der zyklischen Koordinate ϕ gar nicht zu kümmern brauchen.
Um die Folgen eines häufigen Fehlers zu verdeutlichen, betrachten wir noch einmal
die Bewegung eines geladenen Teilchens im elektromagnetischen Feld mit
L=
m 2
v − eΦ(r, t) + v · A(r, t)
2
=⇒
L2 =
m 2
v , L0 = −eΦ .
2
Und so ist es falsch: Die Hamiltonfunktion H = L2 − L0 = mv 2 /2 + eΦ hängt
gar nicht von A und damit vom Magnetfeld B ab. Insbesondere ist die Bewegung
im konstanten Magnetfeld ohne elektrische Felder kräftefrei.
Richtig ist dagegen: Wir müssen die Geschwindigkeit v durch den generalisierten
Impuls
p = mv + eA
ersetzen und erhalten die Hamiltonfunktion
H=
1
(p − eA)2 + eΦ ,
2m
(144)
die sehr wohl vom Vektorpotential A und damit vom Magnetfeld abhängt. Ein
konstantes Magnetfeld trägt zwar nicht zum Zahlenwert von H, nämlich der
Energie, bei (beachte F ⊥ v!), es beeinflußt aber die Abhängigkeit der Hamiltonfunktion von ihrer natürlichen Variablen p.
68
3
3.1
Dynamik des starren Körpers
Modell und Koordinaten des starren Körpers
Bisher haben wir nur punktförmige Massen betrachtet. Als idealisiertes Modell für
ausgedehnte Massenverteilungen führen wir nun den Begriff des starren Körpers
ein. Wir verstehen darunter ein System von n Massenpunkten (meistens im Limes
n → ∞) mit festen Abständen, also mit den Zwangsbedingungen
|ri − rj | = dij
(i, j = 1, . . . n) .
(145)
Die Zahl f der Freiheitsgrade des starren Körpers läßt sich offenbar nicht ermitteln, indem man die Zahl der Nebenbedingungen von 3n subtrahiert. Denn die
n(n − 1)/2 Bedingungen (145) können nicht unabhängig sein. Wir ermitteln f
daher, indem wir das Gerüst aus Massenpunkten schrittweise aufbauen:
Der erste Massenpunkt m1 hat drei Freiheitsgrade, die wir beispielsweise durch
die drei Komponenten von r1 beschreiben.
Fügen wir einen zweiten Massenpunkt m2 hinzu, so ist m2 durch die Zwangsbedingung |r2 − r1 | = d12 an eine Kugeloberfläche um m1 gebunden. Der zweite
Massenpunkt bringt also zwei weitere Freiheitsgrade . Als entsprechende Koordinaten können wir etwa zwei Polarkoordinaten zur Angabe der Richtung der
Verbindungslinie von m1 nach m2 benutzen.
Ein dritter Massenpunkt m3 außerhalb dieser Verbindungslinie kann sich wegen
der beiden Zwangsbedingungen |r3 − r1 | = d13 und |r3 − r2 | = d23 nur noch auf
einem Kreis bewegen. Dem entspricht ein weiterer Freiheitsgrad. Als zugehörige
Koordinate können wir z.B. einen Winkel wählen, der die Rotation von m3 um
die Achse durch m1 und m2 beschreibt.
Bei diesen 3 + 2 + 1 = 6 Freiheitgraden bleibt es beim weiteren Aufbau, denn
jeder weitere Massenpunkt ist bereits durch die Festlegung seiner Abstände zu
m1 , m2 und m3 fixiert. Im Prinzip könnten wir die bei der obigen Konstruktion
verwendeten sechs speziellen Koordinaten zur Beschreibung der Lage des starren
Körpers benutzen. Eine solche willkürliche Wahl erscheint jedoch weder rational
noch ökonomisch. Wir wollen stattdessen einen bestimmten Punkt des starren
Körpers (meist, aber nicht immer, seinen Schwerpunkt) als Koordinatenursprung
eines körpereigenen Koordinatensystems auszeichnen und seine Lage durch drei
Koordinaten beschreiben. Die restlichen drei Koordinaten dienen zur Festlegung
der Orientierung des körpereigenen Koordinatensystems.
Bezeichnen wir die Achsen eines raumfesten kartesischen Koordinatensystems mit
e1 , e2 und e3 , die des körperfesten Systems mit e01 , e02 und e03 , so bietet es sich
69
zunächst an, die Orientierung durch die Richtungskosinus
aij = e0i · ej
(i, j = 1, . . . 3)
zu kennzeichnen. Mit ihrer Hilfe erhält man auch sofort die Transformationsgleichungen
3
X
e0i =
aij ej
und ek =
3
X
ajk e0j
(146)
j=1
j=1
zwischen den raumfesten und körpereigenen Basisvektoren. Nach dem selben
Schema transformieren sich die Komponenten eines Vektors
x=
X
xj e j =
Denn aus den inneren Produkten
x · e0i =
X
j
xj e0i · ej
X
x0j e0j .
und x · ek =
X
j
x0j e0j · ek
lesen wir ab
x0i =
X
aij xj
und xk =
ajk x0j .
(147)
j
j
Die Matrix
X


a11 a12 a13

A =  a21 a22 a23 

a31 a32 a33
ist also nicht nur geeignet, die Orientierung des starren Körpers zu beschreiben, sondern sie ermöglicht auch einen bequemen Übergang vom raumfesten zum
körpereigenen Koordinatensystem und umgekehrt.
Allerdings eignen sich die neun Richtungskosinus nicht als generalisierte Koordinaten, denn die Orientierung entspricht nur drei Freiheitsgraden. Die Elemente
der Matrix A können also nicht unabhängig sein, und in der Tat finden wir, daß
sie durch die drei Orthogonalitätsrelationen
e0i · e0k =
X
aij akj = 0
(i, k = 1, . . . 3, i 6= k)
j
(148)
und durch die drei Normierungen
2
e0i =
X
a2ij = 1
j
70
(i = 1, . . . 3)
(149)
eingeschränkt sind. Matrizen mit diesen Einschränkungen heißen orthogonal.
Unsere orthogonale Matrix A muss sich also durch drei unabhängige Parameter
(generalisiete Koordinaten) darstellen lassen. Für eine solche Darstellung verwendet man gern die Eulerschen Winkel φ, θ und ψ, die wir anhand einer Skizze
einführen:
e3
e3’
e2’
θ
φ
e1
e2
ψ
e1’
Knotenlinie
Ausgangspunkt ist die Knotenlinie, in der sich die e1 –e2 – und die e01 –e02 –Ebene
schneiden. Von der Knotenlinie aus gemessen ist e1 durch den Winkel −φ und
e01 durch den Winkel ψ charakterisiert. θ ist der Winkel zwischen den beiden
Ebenen und damit der Winkel zwischen der e3 – und der e03 –Achse. Der Übergang
vom raumfesten Koordinatensystem (e1 , e2 , e3 ) zum körpereigenen Koordinaten
(e01 , e02 , e03 ) läßt sich damit in drei Schritten vollziehen:
Im ersten Schritt drehen wir das Koordinatensystem (e1 , e2 , e3 ) um den Winkel
φ um die e3 –Achse, so daß ẽ1 in der Knotenlinie liegt. Diese Drehung beschreiben
wir mit den Transformationsgleichungen
~
e2
ẽ1 = cos φe1 + sin φe2
ẽ2 = − sin φe1 + cos φe2
ẽ3 = e3 .
e2
~
e1
φ
e1
Als nächstes kippen wir das System (ẽ1 , ẽ2 , ẽ3 ) um den Winkel θ um die Knotenlinie (ẽ1 –Achse). Für diese Drehung gilt
71
(~)
e3
e^ 3
ê1 = ẽ1
ê2 = cos θẽ2 + sin θẽ3
ê3 = − sin θẽ2 + cos θẽ3 .
e^ 2
Θ
e~2
Im letzen Schritt drehen wir (ê1 , ê2 , ê3 ) um den Winkel ψ um die ẽ3 –Achse und
erhalten damit das neue Koordinatensystem
e01
e02
e03
e2’
= cos ψê1 + sin ψê2
= − sin ψê1 + cos ψê2
= ê3 .
e^ 2
e1’
ϕ
e1
Um die drei Schritte bequemer zu notieren, benutzen wir die Matrizenschreibweise








e1
ẽ1




 ẽ2  = A1  e2 
e3
ẽ3
ẽ1
ê1




 ê2  = A2  ẽ2 
ẽ3
ê3
ê1
e01


 0 
 e2  = A3  ê2 
ê3
e03





(150)


(151)


(152)
cos φ sin φ 0


A1 =  − sin φ cos φ 0  ,
0
0
1
mit
1
0
0


A2 =  0 cos θ sin θ  ,
0 − sin θ cos θ
mit
mit

cos ψ sin ψ 0


A3 =  − sin ψ cos ψ 0  .
0
0
1
Hierbei haben wir Basisvektoren als Zeilenvektoren24 notiert. Die Matrizenmultiplikation folgt der Regel ’Zeile × Spalte’ oder genauer: Das Element in der i–ten
Zeile und k– ten Spalte der Produktmatrix C=AB ist das innere Produkt
cik =
X
aij bjk
j
der i–ten Zeile von A und der k–ten Spalte von B.
Mit dieser Regel der Produktbildung wird auch die (nicht kommutative!) Hintereinanderausführung der Einzeltransformationen beschrieben. Für die Gesamttransformation [vgl. Gl. (146)]
24
Das entspricht gerade der Repräsentation von Vektoren x durch ihre Koordinatenspalten
xi , vgl. Gln. (146,147).
72
e1
e01


 0 
 e2  = A  e2 
e3
e03




bzw.
e01
e1


∗  0 
 e2  = A  e2 
e03
e3




(153)
erhält man damit nach einiger Rechnung25
A = A 3 A2 A1 =

(154)

cos ψ cos φ − cos θ sin φ sin ψ
cos ψ sin φ + cos θ cos φ sin ψ sin θ sin ψ


 − sin ψ cos φ − cos θ sin φ cos ψ − sin ψ sin φ + cos θ cos φ cos ψ sin θ cos ψ  .
sin θ sin φ
− sin θ cos φ
cos θ
Die Matrix A∗ der Rück transformation erhält man für orthogonale Transformationen nach (146) einfach durch Transposition, d.h. durch Vertauschung von Zeilen
und Spalten oder durch Spiegelung an der Hauptdiagonalen.
Wir haben damit das prinzipielle Rüstzeug bereitgestellt, die sechs Freiheitsgrade
des starren Körpers durch die drei Koordinaten x0 , y0 und z0 des Ursprungs eines
körpereigenen Koordinatensystems sowie die drei Eulerschen Winkel φ θ und ψ
zu beschreiben. Wegen der Komplexität werden wir diesen systematischen Weg
jedoch nach Möglichkeit vermeiden. Der Vollständigkeit halber notieren wir uns
abschließend lediglich noch, wie sich die Winkelgeschwindigkeit ω durch die Änderung der Eulerschen Winkel ausdrücken läßt. Wenn wir uns an die Drehachsen
der drei Einzeltransformationen zurückerinnern, finden wir zunächst
ω = φ̇e3 + θ̇ê1 + ψ̇e03 .
Diese gemischte Darstellung möchten wir auf das körpereigene Koordinatensystem umrechnen. Dazu erinnern wir daran, daß die Rück transformation durch
die transponierte Matrix beschrieben wird und lesen aus (153, 154) ab
e3 = sin θ sin ψe01 + sin θ cos ψe02 + cos θe03 .
Ebenso folgt aus Gl. (152)
ê1 = cos ψe01 − sin ψe02 .
Damit erhalten wir
ω = (sin θ sin ψ φ̇ + cos ψ θ̇)e01
+ (sin θ cos ψ φ̇ − sin ψ θ̇)e02 + (cos θ φ̇ + ψ̇)e03 .
(155)
Natürlich könnten wir ω mit dem selben Rechenaufwand auch im raumfesten System (e1 , e2 , e3 ) darstellen. Dieses spielt — obwohl es im Gegensatz zu (e01 , e02 , e03 )
ein Inertialsystem ist — bei der Behandlung des starren Körpers jedoch eine
untergeordnete Rolle, da die Massenverteilung nur im körpereigenen System festliegt.
25
Beachte die Reihenfolge der Faktoren!
73
3.2
Das Eulersche Theorem
Wir betrachten die Bewegung eines starren Körpers und sehen zunächst einmal
von der Translation des Ursprungs des körpereigenen Koordinatensystems ab.
Dann wird die Orientierung durch eine orthogonale Matrix A(t) beschrieben. Zum
Zeitpunkt t = 0 falle das körpereigene mit dem raumfesten Koordinatensystem
zusammen, dann gilt also


1 0 0


A(0) = 1 =  0 1 0  .
0 0 1
(156)
Im vorigen Abschnitt haben wir gesehen, daß die Orientierung des Körpers zur
Zeit t, die durch A(t) repräsentiert wird, durch drei Drehungen aus der Anfangslage erzeugt werden kann. Wir wollen nun untersuchen, ob hierzu auch eine einzige Drehung ausreicht. Der mathematische Formalismus zur Beantwortung dieser
Frage wird uns gleichzeitig elementare Anschauung zu einem wichtigen abstrakten
Kapitel der Mathematik liefern.
Woran erkennt man, daß eine orthogonale Transformation A einer Drehung entspricht? Daran, daß Vektoren x, die in Richtung der Drehachse zeigen, durch die
Transformation nicht geändert werden:
Ax = x .
Diese Gleichung stellt einen Spezialfall des Eigenwertproblems
(A − λ1)x = 0
(157)
dar, mit dem wir uns nun befassen müssen. Dabei bezeichnet 1 die Einheitsmatrix,
λ heißt Eigenwert und x Eigenvektor der Matrix A.
Trivialerweise ist mit x auch jeder gestreckte Vektor αx Eigenvektor von A. Damit aber überhaupt eine nicht triviale Lösung von Gl. (157) existiert, muß die
“charakteristische Gleichung”
det (A − λ1) = 0
(158)
erfüllt sein. Durch eine Induktion, bei der man die Determinante nach der ersten
Zeile (oder Spalte) entwickelt, weist man leicht nach, daß die charakteristische
Gleichung einer n×n–Matrix auf ein Polynom n–ten Grades in λ führt. Lösungen
der charakteristischen Gleichung können daher i.a. komplex sein. Solche Lösungen
sind für uns natürlich nicht interessant. Im Falle ungerader n, also insbesondere
in unserem Fall n = 3, besitzt jede Polynomgleichung aber mindestens eine reelle
74
Lösung λ mit einem nicht trivialen Eigenvektor x. Vektoren, die in die Richtung
von x zeigen, behalten also bei einer Transformation mit A ihre Richtung bei.
Nun ist es eine Besonderheit der orthogonalen Transformationen, daß sie Skalarprodukte (und damit Entfernungen) invariant lassen26 . Wir können den Beweis
in prägnanter Form führen, wenn wir das Skalarprodukt als Matrizenprodukt von
Zeilenvektoren27 und Spaltenvektoren auffassen und uns den trivialen Zusammenhang
(AB)∗ = B∗ A∗
(159)
klarmachen. Aus
x0 = Ax und y0 = Ay
folgt dann nämlich
0
x0 · y0 = x ∗ y0 = (Ax)∗ Ay = x∗ A∗ Ay = x∗ y = x · y .
(160)
Hierbei haben wir in der Form
A∗ A = 1 = AA∗
(161)
von unserer früheren Feststellung [vgl. Gl. (153)] Gebrauch gemacht, daß die
Umkehrtransformation einer orthogonalen Transformation A durch die Matrix
A∗ beschrieben wird. (Die entsprechende Gleichung
X
aij akj = δik
j
in Koeffizientenschreibweise faßt unsere Gln. (148) und (149) zusammen.)
Insbesondere bleibt bei orthogonalen Transformationen also die Norm jedes Vektors erhalten:
x0 · x0 = x · x .
Da für einen Eigenvektor x zu dem (reellen) Eigewertλ außerdem
x0 = λx
gilt, folgt λ2 = 1. Für orthogonale Matrizen sind also nur die reelen Eigenwerte
λ = 1 und λ = −1 möglich. Für die Ausgangsmatrix A(0) = 1 ist trivialerweise jeder Vektor Eigenvektor zum Eigenwert λ = +1. Mit den Koeefizienten der Matrix
A(t) sind aber auch die Eigenwerte stetige Funktionen der Zeit. Wenn sich nun
λ(t) stetig aus λ(0) = 1 entwickeln soll und überhaupt nur die Werte +1 und −1
26
Wir haben hiervon bereits in naiver Unschuld implizit Gebrauch gemacht, als wir die
Zwangsbedingungen (145) aufgestellt und das körpereigene Koordinatensystem eingeführt haben!
27
Die Zeilenvektoren sind mathematisch die Elemente des Dual raums zum Vektorraum der
Spaltenvektoren.
75
infrage kommen, so bleibt λ = +1 als einzige Möglichkeit über28 . Zu jeder orthogonalen Transformation, die die Orientierung eines starren Körpers beschreibt,
gibt es also eine ausgezeichnete Richtung, eine Drehachse, deren Vektoren bei der
Transformation invariant bleiben.
Gibt es noch mehrere solche Richtungen? Wenn ja, dann muß — wie man in der
linearen Algebra zeigt — λ = 1 mehrfacher Eigenwert von A sein. Nun tauchen
komplexe Lösungen der charakteristischen Gleichung immer nur in konjugiert
komplexen Paaren auf. Unser charakteristisches Polynom hat also genau eine oder
gleich drei reelle Lösungen. Ist λ = +1 dreifacher Eigenwert, dann gibt es auch
drei linear unabhängige Eigenvektoren. Da auch jede Linearkombination wieder
ein Eigenvektor ist, bleibt in diesem Fall jeder Vektor invariant, d.h. wir haben
die identische Transformation A = 1. Zu jeder nicht identischen orthogonalen
Transformation gibt es also genau eine invariante Drehachse.
Wir wollen uns das an dem Beispiel der Drehungen eines Buchs von S. 23 verdeutlichen:
z
z
z
y
y

e01
 e02 
e03

e02 = e3
= A

x
x
x
Das Endresultat e01 = e2
y
e03 = e1 notieren wir in der Form

e1
 e2 
e3
mit A =

0 1 0
 0 0 1 
1 0 0

.
Nach S. 23 können wir A durch zwei Drehungen D1 und D2 erzeugen. [Wenn wir
beachten, daß D2 im körpereigen System des Buchs formuliert werden muß,
erhalten wir dafür die Matrizen

1 0 0
D1 =  0 0 1 
0 −1 0

und

0 0 −1
D2 =  0 1 0 
1 0 0

und überzeugen uns, daß tatsächlich D2 D1 = A gilt.] Um das selbe Resultat
durch eine Drehung zu erhalten, lösen wir das Eigenwertproblem von A. Zunächst
erhalten wir die charakteristische Gleichung
det(A − λ1) =
−λ 1
0
0 −λ 1
1
0 −λ
= 1 − λ3 = 0,
die — was von vornherein klar war — λ = +1 als einzigen reellen Eigenwert
liefert. Der zugehörige Eigenvektor muß das Gleichungssystem
28
Daneben kann auf dem Umweg über die komplexe Ebene ein doppelter Eigenwert −1 auftreten (z.B. eine Drehung um π um die z–Achse, bei der sowohl x als auch y ihr Vorzeichen
wechseln).
76



−1 1
0
x1
 0 −1 1   x2 
1
0 −1
x3
=


−x1 + x2
 −x2 + x3 
x1 − x 3
=


0
 0 
0
erfüllen. Die Gleichungen sind natürlich nicht unabhängig, man erhält beispielsweise die dritte Gleichung durch Addition der ersten beiden. Wir wählen daher
eine Komponente beliebig, z.B. x3 = 1. Daraus folgt dann x1 = x2 = 1. Wir
erhalten die gewünschte Transformation also durch eine Drehung um die Achse,
die in Richtung der Raumdiagonalen x = e1 + e2 + e3 zeigt.
Den abstrakten mathematischen Satz formulieren wir physikalisch als das Eulersche Theorem
• Die allgemeinste Auslenkung eines starren Körpers, der in einem Punkt
festgehalten wird, ist eine Drehung um eine wohldefinierte Achse.
Wenn wir nun noch die Bewegung des Koordinatenursprungs unseres körpereigenen Koordinatensystems hinzunehmen, ergibt sich fast selbstverständlich der
Satz von Cashle
• Die allgemeinste Auslenkung eines starren Körpers setzt sich aus einer
Translation und einer Drehung zusammen.
Wegen dieses Satzes liegt es nahe, das gesamte Bewegungsproblem des starren
Körpers in die separaten Probleme der Translation und der Drehung zu zerlegen.
Eine solche Zerlegung ist auch häufig, aber keineswegs immer möglich.
Sie ist trivialerweise möglich, wenn ein Punkt (oder gar eine ganze Drehachse) des
Körpers festgehalten wird. Man wird dann den (bzw. einen) festgehalten Punkt
als Ursprung des körpereigenen Koordinatensystems benutzen und braucht nur
die Drehung zu beschreiben. In diese Gruppe fallen die meisten Kreiselprobleme.
Die Separation ist aber auch möglich, wenn die potentielle Energie des starren
Körpers nur von seiner Lage (Beispiel: homogenes Schwerefeld) oder nur von
seiner Orientierung (Beispiel: Dipol im homogenen Magnetfeld) abhängt. Denn
im Abschnitt 1.9 haben wir gesehen, daß die kinetische Energie [vgl. Gl. (69)]
und der Drehimpuls [vgl. Gl. (77)] in einen Schwerpunkts– und einen inneren
Anteil aufgespalten werden können. In diesem Fall muß man also den Ursprung
des körpereigenen Koordinatensystems in den Schwerpunkt legen.
Wegen der Komplexität des Gesamtproblems werden wir uns im folgenden ausschließlich mit der Behandlung separierbarer Probleme befassen. (Selbst hierbei
werden wir nur einige besonders einfache Probleme auswählen). Da die Schwerpunktsbewegung als die Bewegung eines Massenpunktes beschreibbar ist, können
wir uns hierbei auf die Dynamik der Drehung beschränken.
77
3.3
Der Trägheitstensor
Um die Untersuchung der Dynamik des starren Körpers vorzubereiten, berechnen
wir zunächst seinen Drehimpuls. Wie erwähnt wollen wir dabei von einer möglichen Translation absehen und beziehen uns auf den Ursprung des körpereigenen
Koordinatensystems. Wir lassen von nun an auch den 0 zur Kennzeichnung dieses
Systems weg, da wir uns im folgenden, wenn nicht ausdrücklich etwas anderes
gesagt wird, immer darauf beziehen. Unter diesen Gegebenheiten erhalten wir
nach Gl. (74) den Drehimpuls
l=
X
i
mi ri × ṙi =
Z
P
r × ṙ dm .
(162)
Z
Das Symbol Σ soll an dieser Stelle auf die verschiedenen Modelle der Massenverteilung im starren Körper hinweisen. Wir verstehen darunter insbesondere
Z
P
. . . dm =
X
(. . .)i mi
(163)
i
bzw. =
Z
. . . ρdV
Z
. . . σdA
bzw. = ,
. . . τ ds
bzw. =
Z
wenn der Körper als ein System von Massenpunkten mi , durch eine räumliche
Verteilung der Massendichte ρ, durch eine flächenhafte Massenverteilung σ (z.B.
Blech) oder durch eine linienhafte Verteilung τ (z.B. Draht) beschrieben wird.
Natürlich können solche Modelle auch kombiniert auftreten (z.B. Draht mit Perlen). Wir verzichten in Zukunft auf diese explizite Erinnerung und benutzen das
Integralzeichen.
Wenn wir uns nun an die Beziehung29
ṙ = ω × r
[vgl. (57)] erinnern, erhalten wir aus (162)
l=
oder in Komponenten
li =
29
Z

Z
r 2 ωi
r × (ω × r) dm =
− ri
X
j

ωj r j 
Z
dm =
(r 2 ω − r ω · r) dm
X
j
ωj
Z
(r 2 δij − ri rj ) dm .
Beachte, wir rechnen im körpereigenen Koordinatensystem. Die zeitliche Ableitung ṙ =
dr/dt in Gl. (162) ist aber im Intertialsystem zu bilden.
78
Mit dem Trägheistensor30
Θij =
Z
(r 2 δij − ri rj ) dm oder Θ =
Z
y 2 +z 2 −xy
−xz

2
2
x +z
−yz 
 dm (164)
 −xy
2
2
−xz
−yz x +y


gilt also
li =
X
Θij ωj
oder l = Θ ω ,
(165)
j
wobei an die Regel “Zeile × Spalte” für das Matrizenprodukt erinnert sei. Wir
stellen also fest, daß wir bei der Berechnung des Drehimpulses l die Massenverteilung durch die symmetrische Matrix Θ repräsentieren können. Der Drehimpuls
l hat im allgemeinen nicht die selbe Richtung wie die Winkelgeschwindigkeit ω,
sondern hängt mit ihr über das Matrizenprodukt Θ ω zusammen.
Auch bei der Berechnung der kinetischen Energie wird die Massenverteilung durch
Θ repräsentiert, es gilt nämlich
1Z 2
1Z
ṙ dm =
ṙ · (ω × r) dm
2
2
Z
1
1
=
ω · r × ṙ dm = ω · l .
2
2
T =
Mit Gl. (165) erhalten wir deshalb die einprägsame Beziehung
T =
1
1
1X
ω · Θ ω = ω∗Θ ω =
Θij ωi ωj ,
2
2
2 ij
(166)
die T als quadratische Form in den Komponenten von ω ausweist.
Wenn eine feste Drehachse n durch den Koordinatenursprung vorgegeben ist,
kann der Trägheitstensor Θ durch das Trägheitsmoment Θn um diese Drehachse
ersetzt werden. Mit ω = ωn folgt nämlich
T =
1
Θn ω 2
2
mit Θn = n · Θn .
(167)
Mit der Definition des Trägheitstensors folgt
Θn = n ·
Z
[r 2 n − (n · r)r] dm =
Z
[r 2 − (n · r)2 ] dm .
Wenn wir im Integranden [r 2 − rk2 ] schließlich noch den Satz des Pythagoras
berücksichtigen, erhalten wir die vertraute Formel
30
Ein Tensor ist mathematisch durch sein Transformationsverhalten definiert. Wir verstehen
darunter einfach eine Matrix.
79
Θn =
Z
2
r⊥
dm ,
(168)
die das Trägheitsmoment durch den senkrechten Abstand r⊥ der Massen von
der Drehachse ausdrückt. Dieser Ausdruck ergibt sich auch aus der elementaren
Anschauung über vrot = ωr⊥ .
Fällt die Drehachse speziell mit einer Koordinatenachse zusammen (n = ei ),
finden wir das zugehörige Trägheitsmoment
Θn = Θii
in der Hauptdiagonalen des Trägheitstensors. Die Elemente Θi6=j außerhalb der
Hauptdiagonalen werden auch Fliehkraft– oder Deviationsmomente genannt. Sie
erzeugen bei einer gleichmäßigen Rotation Drehmomente in den Lagern.
Häufig ist es wünschenswert, einen Koordinatenursprung r0 außerhalb der Drehachse zu wählen. Ausgehend von der Drehachse schreiben wir dann
r⊥ = r0⊥ + r0⊥
und erhalten
Θ =
2
r0⊥
Z
dm + 2r0⊥ ·
2
= M r0⊥
+ 2r0⊥ ·
Z
Z
r0⊥ dm
+
Z
0
r⊥2 dm
r0⊥ dm + Θ0 .
Links steht die gesamte Masse des Körpers multipliziert mit dem Quadrat des Abstandes des Koordinatenursprungs r0 von der Drehachse und rechts das Trägheitsmoment um eine parallele Drehachse durch den Koordinatenursprung. Im allgemeinen verhindert jedoch der Term in der Mitte eine einfache Transformationsformel. Wenn jedoch der Schwerpunkt rS als Koordinatenursprung r0 gewählt
wird, verschwindet das Integral im mittleren Term und wir erhalten den Satz
von Steiner
2
Θ = ΘS + M rS⊥
,
(169)
in Worten:
• Das Trägheitsmoment um eine gegebene Achse ist gleich dem Trägheitsmoment um eine parallele Achse durch den Schwerpunkt plus dem Produkt aus
der Gesamtmasse und dem Quadrat des Abstands des Schwerpunkts von
der Drehachse.
80
Da der Schwerpunkt häufig auch durch eine Symmetrie desKörpers ausgezeichnet
ist, bietet der Steinersche Satz eine nützliche Rechenhilfe zur Bestimmung von
Tägheitsmomenten. Als weitere Rechenhilfe notieren wir für eine ebene Massenverteilung in der x–y–Ebene die Beziehungen
Θzz = Θxx + Θyy
und Θxz = Θyz = 0,
(170)
welche direkt aus Gl. (165) folgen.
Beispiel: Wir betrachten ein physikalisches Pendel, also einen starren Körper, der
sich frei um eine gegebene Achse drehen kann. Θ sei das Trägheitsmoment um
diese Achse und a der Abstand des Schwerpunkts von der Drehachse. Mit der
generalisierten Winkelkoordinate ϕ erhalten wir dann dieLagrangefunktion
1
L = T − V = Θϕ̇2 + M ga cos ϕ
2
und die Bewegungsgleichung
Θϕ̈ + M ga sin ϕ = 0 .
Das entspricht der Gleichung für das mathematische Pendel (vgl. S. 45) mit einer
effektiven Pendellänge
Θ
èff =
.
Ma
Nach dem Steinerschen Satz können wir Θ gemäß
Θ = ΘS + M a2
aus dem Trägheitsmoment ΘS um eine parallele Drehachse durch den Schwerpunkt berechnen. Die effektive Pendellänge
èff = a +
ΘS
Ma
ist daher immer größer als der Abstand a des Schwerpunkts vom Aufhängepunkt.
Hierin zeigt sich der Beitrag der Rotation des starren Körpers um den Schwerpunkt zur gesamten kinetischen Energie.
Als spezielles Beispiel für die Massenverteilung wählen wir eine homogene Kreisscheibe vom Radius R um den Koordinatenursprung in der x–y–Ebene. Dann
wird
ZR
Z
R4
2
2
Θzz = (x + y ) dm = σ r 2 2πr dr = 2πσ
,
4
0
2
oder wegen σ = M/(πR )
1
Θzz = M R2 .
2
81
Mit der Symmetrie und Gl. (170) folgt daraus sofort der gesamte Trägheitstensor


1 0 0
Mr 

Θ=
 0 1 0 .
4
0 0 2
2
Für eine Drehung um die z–Achse durch den Schwerpunkt haben wir das Trägheitsmoment ΘS = Θzz = M R2 /2. Legen wir parallel dazu eine senkrechte Drehachse durch die Peripherie (a = R), so bildet die Kreisscheibe ein physikalisches
Pendel mit der effektiven Pendellänge
3
èff = R .
2
Wählt man dagegen eine tangentiale Drehachse in der Peripherie, so müssen wir
von ΘS = Θxx = M R2 /4 ausgehen und erhalten
5
èff = R .
4
3.4
Trägheitshauptachsen
Über den Drehimpuls und die kinetische Energie ist das dynamische Verhalten
des starren Körpers wesentlich durch seinen Trägheitstensor bestimmt. Für eine
einfache Formulierung der Dynamik stören hierbei die Nicht–Diagonal–Elemente.
Darum fragen wir nach einem speziellen körpereigenen Koordinatensystem, dem
Hauptachsensystem, in dem der Trägheitstensor die Diagonalgestalt


I1 0 0


Θ =  0 I2 0 
0 0 I3
(171)
annimt. Im Hauptachsensystem gelten für den Drehimpuls und die kinetische
Energie die einfachen Beziehungen
li = I i ω i
bzw. l =
X
I i ωi e i
(172)
i
und
T =
1X
Ii ωi2 .
2 i
(173)
Gibt es nun immer so ein schönes Hauptachsensystem? Und wenn ja: Wie finde
ich es? Zur Beantwortung dieser Frage gehen wir von der Beziehung (172) für den
Drehimpuls aus.
82
Wenn es eine Hauptachse e gibt, so gilt bei einer Rotation ω = ωe um diese
Hauptachse
l = Iω ,
l und ω haben also dieselbe Richtung. Vergleichen wir das mit der allgemeinen
Beziehung
l = Θω,
so sehen wir uns mit dem Eigenwertproblem
(Θ − I1)ω = 0
(174)
konfrontiert. Wir müssen insbesondere die Frage beantworten, ob wir drei reelle
Eigenwerte I1 , I2 , I3 und zugehörige linear unabhängige Eigenvektoren finden.
Die Frage nach reellen Lösungen ist im allgemeinen im Reellen viel schwieriger
zu beantworten, als wenn man das Problem in eine komplexe Theorie einbettet.
Wir verallgemeinern darum den Begriff der transponierten Matrix zum Begriff
der adjungierten Matrix, die neben der Spiegelung an der Hauptdiagonalen durch
einen Übergang zu konjugiert komplexen Koeffizienten gekennzeichnet ist:
(. . . aij . . .)∗ = (. . . a∗ji . . .) .
Über einspaltige Matrizen übertragen wir die Begriffsbildung auf Vektoren: Der zu
einem komplexen Spaltenvektor a adjungierte Vektor a∗ ist also ein Zeilenvektor
mit konjugiert komplexen Koeffizienten. Das im Sinne der Matrizenmultiplikation
erklärte Skalarprodukt
a · b = a∗ b = α
b · a = b∗ a = α ∗
liefert eine komplexe Zahl und ist nicht mehr kommutativ. Reell ist dagegen das
Skalarprodukt
x · x = x∗ x = |x|2 ,
das man benutzen kann, um dem Vektor x eine Norm oder Länge zuzuordnen.
Nach diesen Erklärungen sehen wir uns den Trägheitstensor an und stellen fest,
daß er reell und symmetrisch ist. Er ist also sowohl gegen die Spiegelung an der
Hauptdiagonalen als auch gegen die komplexe Konjugierung invariant und erfüllt
die Relation
Θ∗ = Θ .
Matrizen (auch mit komplexen Koeffizienten), die diese Relation erfüllen, heißen
selbstadjungiert.
Mathematisch handelt es sich bei unserer Fragestellung also um das Eigenwertproblem selbstadjungierter Matrizen A. Um das zu untersuchen, gehen wir von
der Eigenwertbeziehung
Axi = λi xi
83
aus und multiplizieren von links mit dem Eigenvektor x∗k :
x∗k Axi = λi x∗k xi .
Nun nutzen wir die Voraussetzung, daß A selbstadjungiert ist, zur Umformung
der linken Seite aus und erhalten
x∗k Axi = (A∗ xk )∗ xi = (Axk )∗ xi = (λk xk )∗ xi = λ∗k x∗k xi .
Durch Vergleich finden wir die Relation
(λ∗k − λi )x∗k xi = 0 ,
aus der wir (für i = k bzw. i 6= k) zwei wichtige Folgerungen ablesen:
1. Alle Eigenwerte selbstadjungierter Matrizen sind reell.
2. Die Eigenvektoren zu verschieden Eigenwerten selbstadjungierter Matrizen
sind orthogonal.
Für eine beliebige n × n – Matrix A hat die charakteristische Gleichung [vgl.
Gl. (158)]S
det(A − λ1) = 0 ,
als Polynomgleichung n–ten Grades grundsätzlich n (möglicherweise komplexe)
Lösungen λi . Bei einer selbstadjungierten Matrix sind diese n Eigenwerte sämtlich
reell. Sind alle Eigenwerte zudem verschieden, so stehen die Eigenvektoren automatisch senkrecht aufeinander und definieren in natürlicher Weise ein Hauptachsensystem.
Im Falle mehrfacher Eigenwerte spricht man von Entartung. Man kann nun zeigen (was anschaulich durch einen stetigen Übergang von verschiedenen zu gleichen Eigenwerten klar ist), daß die Eigenvektoren zu einem ν–fach entarteten
Eigenwert einen ν–dimensionalen Unterraum aufspannen. Aus einer Basis dieses
Unterraums lassen sich dann durch ein geeignetes Orthogonalisierungsverfahren
stets ν orthogonale Eigenvektoren bilden. Wir können also sicher sein, daß wir
zu unserem Satz von n Eigenwerten immer n orthogonale Eigenvektoren angeben
können, die unser Hauptachsensystem aufspannen.
Unser Ausgangsproblem, ein Hauptachsensystem zu finden, in dem der Trägheitstensor Diagonalgestalt annimmt, besitzt also immer eine Lösung, die sich nach
dem folgenden Rezept gewinnen läßt:
1. Benutze ein beliebiges rechnerisch günstiges (z.B. Symmetrie) körpereigenes
Koordinatensystem zur Bestimmung des Trägheitstensors Θ nach Gl. (164).
84
2. Bilde die charakteristische Gleichung
Θ11 −I
Θ12
Θ13
Θ12
Θ22 −I
Θ23
det(Θ − I1) =
Θ13
Θ23
Θ33 −I
= 0.
(175)
Die drei (reellen) Lösungen (Eigenwerte) I1 , I2 und I3 dieser Gleichung sind
die Hauptträgheitsmomente.
3. Bestimme aus den 3 Gleichungsystemen (ν = 1, 2, 3)


Θ11 −Iν
Θ12
Θ13

Θ
Θ
−I
Θ23 
(Θ − Iν 1)eν = 
eν = 0
12
22
ν
Θ13
Θ23
Θ33 −Iν
(176)
drei Eigenvektoren eν . Wegen der verschwindenden Determinante sind die
Lösungen nicht eindeutig und können durch eine Zusatzforderung (z.B. Normierung) festgelegt werden. Wenn alle Hauptträgheitsmomente verschieden
sind, sind die eν automatisch orthogonal und können (ggf. nach einer Umnumerierung) als Basis des Hauptachsensystems benutzt werden. Sind zwei
Hauptträgheitsmomente gleich, kann man aus der Lösungsmenge von (176)
zwei zugehörige orthogonale Eigenvektoren auswählen. [Sind alle drei Eigenwerte gleich, so ist jedes orthogonale Koordinatensystem ein Hauptachsensystem.]
Wir behandeln als Beispiel einen Drahthaken in der x–y–Ebene (siehe Skizze)
mit der homogen Massebelegung τ = M/(4a).
1. Wir bleiben im Koordinatensystem x, y, z und finden durch einfache Rechnungen und/oder Symmetrieüberlegungen
Θyy = τ
Za
−a
2
2
x2 dx = τ a3 = M a2
3
12
85
Θxx = Θyy +
Θxy = −2τ
Za
0
8
M 2
a = M a2
2
12
ax dx = −τ a3 = −
3
M a2 .
12
Aus Gl. (170) lesen wir außerdem
10
M a2 und Θxz = Θyz = 0
12
ab. Damit erhalten wir den Trägheitstensor
Θzz = Θxx + Θyy =


8 −3 0
1

2
Θ = M a  −3 2 0  .
12
0
0 10
2. Mit I = λM a2 /12 folgt daraus die charakteristische Gleichung
8 − λ −3
0
−3 2 − λ
0
0
0
10 − λ
= [(8 − λ)(2 − λ) − 9](10 − λ) = 0 .
Aus der Gleichung [. . .] = λ2 − 10λ + 7 = 0 finden wir
√
√
λ1 = 5 − 3 2 und λ2 = 5 + 3 2 ,
und (. . .) = 0 ergibt sofort
λ3 = 10.
Damit haben wir die Hauptträgheitsmomente Iν = λν M a2 /12 ermittelt.
3. Da alle Eigenwerte verschieden sind, erhalten wir aus den Gleichungen



eν1
8 − λν
−3
0



2 − λν
0
  eν2  = 0
 −3
eν3
0
0
10 − λν
automatisch drei orthogonale Eigenvektoren eν . Zu λ3 = 10 liest man unmittelbar e3 = (0, 0, 1) ab, die alte z–Achse ist also bereits Hauptachse.
Für ν = 1 und 2 folgt sofort eν3 = 0, diese Eigenvektoren liegen also in der
x–y–Ebene. Die beiden Gleichungen
(8 − λν )eν1 − 3eν2 = 0
−3eν1 + (2 − λν )eν2 = 0
sind nicht linear unabhängig. Wir benutzen daher nur die erste und erhalten
die Achsenneigungen
eν2
8 − λν
= tan αν =
eν1
3
oder
√
√
α1 = atn(1 + 2) = 67.5o und α2 = atn(1 − 2) = 157.5o .
Die Hauptachsen mit diesen Richtungen sind in der Skizze bereits eingezeichnet.
86
3.5
Trägheitsellipsoid und Poinsotsche Konstruktion
Die Eigenwerte des Trägheitstensors sind nicht nur reell, sondern sogar positiv,
wie man an der Hauptachsenform (173)
T =
1X
Ii ωi2
2 i
der kinetischen Energie erkennt. Die Fäche T = const beschreibt also ein Ellipsoid
im ω–Raum31 . Das selbe Ellipsoid wird natürlich auch durch die (positiv definite!)
quadratische Form [vgl. (166)]
T =
1X
Θij ωi ωj
2 i,j
(177)
in anderen Koordinatensystemen beschrieben. Die Ellipsoide zu verschiedenen
Werten von T sind einander ähnlich, und es ist üblich (aber nicht notwendig),
das normierte Ellipsoid (setze etwa w = ω/(2T )1/2 )
w · Θw =
X
Θij wi wj = 1
(178)
i,j
als Trägheitsellipsoid zu bezeichnen. Speziell im Hauptachsensystem erfüllt das
Trägheitsellipsoid die Gleichung
X
ν
Iν wν2 = 1 .
(179)
Die Halbachsen aν des Trägheitsellipsoids sind also durch
1
aν = √
Iν
(180)
gegeben; eine große Halbachse entspricht einem kleinen Hauptträgheitsmoment
und umgekehrt. Allgemeiner folgt durch Vergleich der Gln. (167) und (178), daß
der Abstand
|w| = √
1
Θw
(181)
eines Punkts w auf dem Trägheitsellipsoid vom Ursprung das Trägheitsmoment
Θw um die durch w angebene Drehachse charakterisiert.
31
Nur wenn die Massenverteilung ausschließlich auf eine Gerade beschränkt ist, wird ein
Eigenwert Null, und das Ellipsoid entartet zu einem Kreiszylinder.
87
Durch einen Vergleich der Symmetrie eines Ellipsoids mit Symmetrien des starren Körpers folgt, daß die Entartung des Eigenwertproblems des Tägheitstensors
kein seltener Ausnahmefall ist. Vielmehr entartet das Trägheitsellipsoid offenbar
immer zum Rotationsellipsoid, wenn der Körper invariant gegen eine Drehung
um 2π/n mit n ≥ 3 um eine Symmetrieachse ist. Die Symmetrieachse wird dann
selbst Hauptachse32 , und die beiden andern Hauptachsen können in der Ebene senkrecht dazu beliebig gewählt werden. Gibt es eine weitere entsprechende
Symmetrieachse, so entartet das Trägheitellipsoid sogar zur Kugel. In dem Fall
ist jedes beliebige Orthogonalsystem Hauptachsensystem. Wir illustrieren das an
einigen Beispielen:
Gls. Dreieck
Vierkantstab
Würfel
Tetraeder
Zugehöriges Trägheitsellipsoid (schematisch):
Wir verzichten im folgenden auf die (triviale) Normierung und bezeichnen die
Fläche T = const im ω–Raum als Trägheitsellipsoid.
Wegen der fundamentalen Bedeutung des Drehimpulses bilden wir nach Gl. (177)
li =
X
Θij ωj =
j
∂T
∂ωi
oder
l = ∇ω T .
(182)
Der Gradient ∇ω T steht senkrecht auf der Fläche T = const, denn für alle dω aus
der Tangentialebene gilt ja
dT = ∇ω T · dω = 0 .
Daraus folgt, daß der Drehimpulsvektor in die Richtung der Oberflächennormalen
des Trägheitsellipsoids zeigt. Wir können also die Drehimpulsrichtung zu einer
32
Das gilt bereits für n = 2. Dabei liegt aber noch keine Entartung vor.
88
gegebenen Drehachse (ω) finden, indem wir im Punkt ω auf dem Trägheitsellipsoid die Flächennormale errichten (siehe Skizze). Diese geometrische Bestimmung
heißt Poinsotsche Konstruktion.
l
ω
[Wir wenden die Poinsotsche Konstruktion auf die Bewegung des kräftefreien
Kreisels an. Darunter verstehen wir einen starren Körper, der in einem Punkt
festgehalten wird, und auf den keine Kräfte wirken. Wegen V = 0 haben wir die
Integrale
T = const und l = const .
Wir wählen die l–Richtung als raumfeste z–Achse. Dann ist
ωz =
2T
ω·l
=
|l|
|l|
offenbar ebenfalls konstant. Der Bewegung des Kreisels entspricht eine Drehung
des Trägheitsellipsoids um den Ursprung. Diese Drehung erfolgt also so, daß das
Trägheitsellipsoid in jedem Zeitpunkt die “invariable Ebene” ωz = const berührt:
T=const
ω
ωz
ωz =const
z,l
Bei der Bewegung wandert der Berührungspunkt weiter und beschreibt
(a) auf dem Ellipsoid (also im körperfesten Koordinatensystem) die “Polhodie”
und
(b) auf der invariablen Ebene (also im raumfesten Koordinatensystem) die
“Herpolhodie”.
89
Die beiden Wanderungen erfolgen mit der selben Geschwindigkeit, denn wegen
ω × ω = 0 gilt
!
!
dω
dω
=
.
dt Körper
dt Raum
Damit läßt sich die Bewegung des kräftefreien Kreisels wie folgt charakterisieren:
• Das Trägheitsellipsoid rollt bei festgehaltenem Mittelpunkt ohne zu gleiten
über die invariable Ebene. Die momentane Winkelgeschwindigkeit ist dabei
durch den Abstand des Berührungspunktes vom Mittelpunkt gegeben.
Mit dieser geometrischen Beschreibung ist die Bewegung des kräftefreien Kreisels vollständig beschreiben. Die analytische Formulierung (die wir nicht mehr
anstreben) ist jedoch recht verwickelt und führt auf elliptische Integrale.
Beim symmetrischen Kreisel entartet das Trägheitsellipsoid zum Rotationsellipsoid und Polhodie sowie Herpolhodie werden einfache Kreise. Vom Körper aus
betrachtet beschreiben daher die Vektoren ω und l Kegel um die Figurenachse. Diese Bewegung wird Nutation (lat. nutare = nicken, wanken) oder auch
reguläre Präzession33 genannt. Im raumfesten System bewegen sich ω und die
Figurenachse auf Kegeln um den konstanten Drehimpuls l.]
3.6
Die Eulerschen Kreiselgleichungen
Wir hatten im Abschnitt 3.1 gesehen, daß die Eulerschen Winkel geeignete
generalisierte Koordinaten zur Beschreibung der Drehung des starren Körpers
sind. Wegen der recht komplexen Transformationsgleichungen ist es jedoch häufig
günstiger, direkt von der Grundgleichung
d
l=M
dt
(183)
auszugehen, als denLagrangeschen Formalismus auf dieEulerschen Winkel anzuwenden. Gl. (183) bezieht sich natürlich zunächst auf ein raumfestes Koordinatensystem. Den Trägheitstensor — und damit den Zusammenhang zwischen
ω und l — können wir jedoch nur in einem körpereigenen Koordinatensystem
angeben. Wir benutzen also die Beziehungen
d
=
dt
d
dt
!
Körper
+ω×
und
33
dl
dt
!
= Θ ω̇ ,
Körper
Um die Begriffe Nutation und Präzession herrscht eine bedauerliche Sprachverwirrung.
Man muß alt/neu, deutsch/amerikanisch und physikalisch/astronomisch unterscheiden. Vgl.
auch Fußnote 39, S. 97.
90
um Gl. (183) ins körpereigene System zu transformieren und erhalten
Θ ω̇ + ω × Θ ω = M .
Die komponentenweise Anschrift dieser Gleichung wird wesentlich vereinfacht,
wenn wir das Koordinatensystem der Trägheitshauptachsen benutzen:






I1 ω̇1
ω1
I 1 ω1

 
 

I
ω̇
ω
+
×
 2 2   2   I 2 ω2  = M .
I3 ω̇3
ω3
I 3 ω3
Wenn wir schließlich das Kreuzprodukt noch explizit ausmultiplizieren, erhalten
wir die Eulerschen Kreiselgleichungen
I1 ω̇1 + (I3 − I2 )ω2 ω3 = M1
I2 ω̇2 + (I1 − I3 )ω1 ω3 = M2
I3 ω̇3 + (I2 − I1 )ω1 ω2 = M3 .
(184)
Wir weisen nochmals darauf hin, daß sich diese Gleichungen auf das körpereigene
Hauptachsensystem bezieht. Eine dieser Gleichungen — mit unserer speziellen
Festlegung der Koordinaten die dritte — erhält man auch als Lagrangegleichung
zum Eulerschen Winkel ψ. Die beiden andern folgen dann durch zyklische Vertauschung der Indizes.
[Um das zu zeigen, bilden wir die kinetische Energie
1
1
1
T = I1 ω12 + I2 ω22 + I3 ω32
2
2
2
und setzen die Komponenten
ω1 = sin θ sin ψ φ̇ + cos ψ θ̇
ω2 = sin θ cos ψ φ̇ − sin ψ θ̇
ω3 = cos θ φ̇ + ψ̇
aus Gl. (155) ein:
T =
I2
I3
I1
(sin θ sin ψ φ̇+cos ψ θ̇)2 + (sin θ cos ψ φ̇−sin ψ θ̇)2 + (cos θ φ̇+ ψ̇)2 . (185)
2
2
2
Wenn wir damit die Lagrangegleichung
∂T
∂V
d ∂T
−
=−
dt ∂ ψ̇
∂ψ
∂ψ
91
bilden, erhalten wir
I3 ω̇3 − I1 ω1 ω2 + I2 ω2 ω1 = −
∂V
.
∂ψ
Damit bleibt nur noch zu bestätigen, daß −∂V /∂ψ die Komponente M3 des Drehmoments im körpereigenen Koordinatensystem ist. Das folgt aber aus der Figur
auf S. 71, da ψ die Drehung um die körpereigene z–Achse beschreibt.]
3.7
Die kräftefreie Bewegung des starren Körpers
Wir erinnern daran, daß wir annehmen, daß ein Punkt des Körpers festgehalten wird, oder daß wir die Schwerpunktsbewegung als uninteressant abspalten.
Die verbleibende Drehung des kräftefrein Kreisels wird durch die Eulerschen
Gleichungen
I1 ω̇1 = (I2 − I3 )ω2 ω3
I2 ω̇2 = (I3 − I1 )ω1 ω3
I3 ω̇3 = (I1 − I2 )ω1 ω2 .
(186)
beschrieben. Die resultierende Bewegung haben wir im Abschnitt 3.5 mit der
Poinsotschen Konstruktion bereits geometrisch beschrieben. Die analytische Beschreibung ist wegen der Nichtlinearität der Eulerschen Gleichungen im allgemeinen schwierig34 . Wir werden uns daher auf zwei einfache Spezialfälle beschränken, bei denen dieEulerschen Gleichungen linear werden.
1. Stabile Drehachsen des starren Körpers
Wenn alle Hauptträgheitsmomente verschieden sind, ist eine gleichförmige kräftefreie Rotation ω = const des Kreisels nach Gl.(186) nur um die Hauptträgheitsachsen möglich. Wir nehmen an, daß der Körper um die z–Achse rotiert und
fragen nach der Stabilität dieser Rotation. Dazu betrachten wir kleine Abweichungen ω1 , ω2 von der ausgezeichneten Rotationsrichtung. Damit meinen wir,
daß wir quadratische Terme (ω12 , ω22 und hier insbesondere ω1 ω2 ) vernachlässigen
können. Dadurch werden dieEulerschen Gleichungen linearisiert. Aus der letzten Gl. (186) folgt sofort die gleichförmige Rotation ω3 = const. Daher erhalten
wir aus den ersten beiden Gleichungen
ω̇1 = −Ω1 ω2
mit Ω1 =
34
I3 − I 2
ω3 ,
I1
Die Lösung läßt sich zwar generell auf Quadraturen zurückführen, führt jedoch auf nicht–
elementare (elliptische) Funktionen.
92
I3 − I 1
ω3 .
I2
Wenn wir eine dieser Gleichungen noch einmal nach t differenzieren und die andere
einsetzen, folgt
ω̈1,2 = −Ω1 Ω2 ω1,2 .
ω̇2 = Ω2 ω1
mit Ω2 =
Diese Gleichung entspricht einer Schwingungsgleichung
ω̈1,2 + Ω2 ω1,2 = 0 mit Ω2 = Ω1 Ω2 ,
falls Ω1 und Ω2 das selbe Vorzeichen haben. Diese Vorraussetzung ist erfüllt,
wenn I3 das größte oder das kleinste Hauptträgheitsmoment ist. In diesem Fall
reagiert der Kreisel also auf eine kleine Störung mit kleinen Schwingungen um
die Drehachse:
• Eine Rotation um die Drehachse mit dem größten oder kleinsten Hauptträgheitsmoment ist stabil.
Ist I3 dagegen das mittlere Hauptträgheitsmoment, so ist Ω1 Ω2 < 0, und wir
erhalten exponentiell wachsende Störungen
ω1,2 ∼ exp(|Ω1 Ω2 |1/2 t) :
• Eine Rotation um die Hauptachse mit dem mittleren Hauptträgheitsmoment ist labil.
2. Der kräftefreie symmetrische Kreisel
Beim symmetrischen Kreisel werden zwei Hauptträgheitsmomente, etwa I1 und
I2 , gleich. Damit folgt aus der dritten Gl. (186)
ω3 = const ,
d.h. die Projektion der Winkelgeschwindigkeit auf die Symmetrieachse ist konstant. Da ω3 nun eine Integrationskonstante darstellt, werden auch die beiden
übrigenEulerschen Gleichungen linear:
ω̇1 = −Ωω2
ω̇2 = Ωω1
mit
Ω=
I3 − I 1
ω3 .
I1
Die allgemeinen Lösungen dieser Gleichungen sind Kreise
ω1 = ω⊥ cos[Ω(t − t0 )]
ω2 = ω⊥ sin[Ω(t − t0 )] ,
93
(187)
wie man z.B. durch direktes Einsetzen erkennt35 .
Die Spitze des Vektors ω durchläuft also mit der Nutationsfrequenz Ω einen Kreis
um die Figurenachse, die Polhodie (vgl. S. 89). Mit der selben Frequenz rotiert
auch der (raumfeste!) Drehimpuls (im körpereigenen System!) um die Figurenachse.
Die Nutation ist je nach dem Vorzeichen von I3 − I1 vor – oder rück läufig. Sie
verschwindet, wenn (außer I2 auch noch) I3 = I1 wird, wenn also das Trägheitsellipsoid zur Kugel entartet. Für Kugel kreisel ist daher eine gleichförmige Rotation
um jede Achse möglich, wie man auch sofort an Gl. (186) erkennt.
Dies gilt angenähert auch für die rotierende Erde. Die Abplattung führt jedoch
zu einer kleinen Abweichung
I3 − I 1
1
≈
,
I1
300
die einer Nutationsfrequenz
2π
300 Tage
entspricht. Tatsächlich findet man bei der Erdrotation Polschwankungen einer
Amplitude von rund 5 Metern. Der Pol wandert jedoch nicht auf einem Kreis
sondern beschreibt eine eher irreguläre Kurve. Und statt der erwarteten Nutationsperiode von 300 Tagen = 10 Monaten beobachtet man eine gewisse Periodizität mit der Chandlerschen Periode von etwa 14 Monaten. Die Abweichungen
werden auf die Deformierbarkeit des Erdkörpers und auf größere Massenbewegungen zurückgeführt.
Ω=
Die Nutationsfrequenz (187) bezieht sich wohlgemerkt auf die Beobachtung im
körpereigenen Koordinatensystem, das selbst rotiert. Eine Übersetzung ins raumfeste Koordinatensystem, in dem ω und die Figurenachse um den konstanten
Drehimpuls l rotieren (vgl. Abschnitt 3.5), ist wegen der verschiedenen Achsrichtungen etwas unübersichtlich. Fällt die Symmetrieachse annähernd mit der
Drehimpulsrichtung zusammen (ω ≈ ω3 ), sieht ein raumfester Beobachter die
Nutationsfrequenz
I3
ωN ≈ ω + Ω ≈ ω .
(188)
I1
(Eine exakte Beschreibung folgt im nächsten Abschnitt.)
3.8
Der Lagrangeformalismus für den Kreisel
Wegen der Komplexität des Problems beschränken wir uns von vornherein auf
den symmetrischen Kreisel mit I1 = I2 , denn die Symmetrie bewirkt erhebliche
35
Systematisch findet man das am einfachsten über die DGL für w = ω1 + iω2 . Eine andere
Möglichkeit beruht auf dem Nachdifferenzieren, vgl. vorige Seite und Abschnitt 1.7.
94
Vereinfachungen. Zunächst lassen sich in den ersten beiden Termen der kinetischen Energie (185) die Beiträge mit sin ψ und cos ψ entweder zusammenfassen
(Pythagoras) oder sie verschwinden:
1
1
T = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 .
2
2
Bei den Kräften, die auf den Kreisel einwirken, beschränken wir uns auf ein
homogenes Schwerefeld. Auch hier erhalten wir eine wesentliche Vereinfachung
durch die Symmetrie, da der Schwerpunkt auf der Symmetrieachse liegt: Das
zugehörige Potential36
V = V0 cos θ
mit V0 = mgzS
hängt nur vom Winkel θ zwischen der raumfesten und der körpereigenen z–Achse
ab.
Die Symmetrievoraussetzung hat nicht nur die Anschrift
1
1
L = T − V = I1 (sin2 θ φ̇2 + θ̇ 2 ) + I3 (cos θ φ̇ + ψ̇)2 − V0 cos θ
2
2
(189)
derLagrangefunktion vereinfacht, ihr ist auch zu verdanken, daß neben der
Koordinate φ auch noch ψ zyklisch geworden ist. Wir lesen aus (189) daher die
beiden Erhaltungsgrößen
pψ = I3 (cos θ φ̇ + ψ̇) und
pφ = I1 sin2 θ φ̇ + pψ cos θ
(190)
(191)
ab. pψ und pφ sind (nicht orthogonale) Komponenten des Drehimpulses. Die Komponente [vgl. (155)]
p ψ = I 3 ω3
(192)
in Richtung der körpereigenen z–Achse ist konstant, da der Kraftarm der Gewichtskraft in diese Richtung weist und folglich das entsprechende Moment verschwindet. Ebenso ist die Drehimpulskomponete pφ in Richtung der raumfesten
z–Achse konstant, denn die Kraft selbst zeigt in diese Richtung, und daher verschwindet das entsprechende Moment. Während also die Existenz der Erhaltungsgrößen (190) und (191) auch aus der physikalischen Anschauung nachvollziehbar
ist, wird die explizite Formulierung durch denLagrangeformalismus zumindest
wesentlich erleichtert.
36
Die selbe Abhängigkeit (mit V0 = µB) ergibt sich auch für einen Kreisel mit konstantem
Dipolmoment µ im homogenen Magnetfeld B.
95
Die Zahlenwerte von pφ und pψ ergeben sich aus den Anfangsbedingungen. Damit
lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) gewinnen, wenn
θ(t) bekannt ist. θ(t) läßt sich aus der Lagrangegleichung
I1 θ̈ − I1 sin θ cos θ φ̇2 + pψ sin θ φ̇ − V0 sin θ = 0
(193)
bestimmen, wenn man φ̇ mit Gl. (191) eliminiert. Damit läßt sich die Lösung
im Prinzip auf Quadraturen zurückführen. Dieser systematische Weg ist jedoch
ziemlich aufwendig und wenig instruktiv. Wir wollen daher versuchen, die Charakteristika der Bewegung mit geringerem Aufwand zu erkennen. Dazu unterscheiden
wir noch einmal den kräftefreien und den schweren Kreisel.
1. Der kräftefreie symmetrische Kreisel
Hier haben wir V0 =0, und im raumfesten Koordinatensystem ist keine Richtung
mehr a priori ausgezeichnet. Da der Drehimpuls nun konstant wird, ist es günstig,
die raumfeste z–Achse in seine Richtung zu legen. Damit gilt
pφ = j und
pψ = j cos θ ,
(194)
(195)
wenn j den Betrag des Drehimpulses bezeichnet. Bei der Bewegung bleibt also
auch der Winkel θ zwischen Figurenachse und Drehimpuls konstant:
Die Figurenachse bewegt sich auf dem Mantel des Nutationskegels (vgl. Abschnitt
3.5, S. 90). Setzen wir (194) und (195) in (191) ein37 , so erhalten wir
j = I1 sin2 θ φ̇ + j cos2 θ
oder
φ̇ = ωN =
j
.
I1
(196)
Die Knotenlinie — und damit auch die Figurenachse — läuft also mit konstanter
Winkelgeschwindigkeit φ̇ um die Drehimpulsrichtung. Damit haben wir Gl. (188)
präzisiert und die Nutation im raumfesten System exakt beschrieben.
Zusätzlich rotiert der der Körper mit der Winkelgeschwindigkeit ψ̇ um seine Figurenachse. Für diese Rotation erhalten wir aus Gl. (190)
I3 ψ̇ = pψ − I3 cos θ φ̇ ,
oder mit (195) und (196)
37
Das selbe Ergebnis folgt mit θ = const 6= 0 auch aus den Gln. (193) und (191).
96
ψ̇ =
1
1
−
j cos θ .
I3 I1
(197)
Die gesamte momentane Winkelgeschwindigkeit
ω = ψ̇e3 + φ̇el
setzt sich additiv aus den beiden Rotationen mit ψ̇ und φ̇ zusammen und liegt
in der Ebene, die von der Figurenachse e3 und dem Drehimpuls l aufgespannt
wird. ω läuft also ebenfalls mit der konstanten Winkelgeschwindigkeit φ̇ auf einem
Kegelmantel um den konstanten Drehimpuls.
2. Der schwere symmetrische Kreisel
Im Gegensatz zum kräftefreien Kreisel ist nun der gesamte Drehimpuls l nicht
mehr konstant38 , und die z–Richtung des raumfesten Systems ist durch das Schwerefeld von außen vorgegeben. Trotzdem existieren auch beim schweren Kreisel partikuläre Lösungen mit θ = const und φ̇ = const, bei denen also die Figurenachse
mit konstanter Winkelgeschwindigkeit auf einen Kegelmantel um die raumfeste
z–Achse läuft. Diese Bewegung der Figurenachse des schweren Kreisels nennt
man Präzession39 (lat. praecedere = vorangehen).
Wenn wir θ = const in Gl. (193) einsetzen, erhalten wir für φ̇ die quadratische
Gleichung
−I1 cos θ φ̇2 + pψ φ̇ − V0 = 0 .
(198)
Ihre Lösung
1 I 3 ω3
φ̇ =
1∓
2 I1 cos θ
s
4V0 I1 cos θ
1−
I32 ω32
!
(199)
(bei der wir von der Gl. (192) pψ = I3 ω3 Gebrauch gemacht haben) zeigt zunächst,
daß die gleichförmige Präzession einen Mindestwert ω3 für die Rotation um die
Figurenachse erfordert. Diese Bedingung ist trivial erfüllt, wenn wir uns für den
“schnellen” Kreisel interessieren, der so rasch um seine Symmetrieachse rotiert,
daß I3 ω3 bzw. I3 ω32 groß gegen alle konkurrierenden Drehimpulse bzw. Energien
ist. Für den schnellen Kreisel gilt insbesondere
pψ = I3 ω3 I1 φ̇ und I3 ω32 V0 .
38
Wohl aber die Komponenten pφ und pψ , vgl. (190) und (191).
Auf der mathematischen Analogie beruht die alternative Bezeichnung “reguläre Präzession”
für die Nutation des kräftefreien Kreisels. Physikalisch stellt die Präzession des schweren Kreisels
ein von der Nutation grundlegend verschiedenes Phänomen dar. Vgl. auch die beiden folgebden
Fußnoten.
39
97
Damit scheidet das untere Vorzeichen in Gl. (199) aus. Durch Entwicklung der
Wurzel oder durch direkte Vernachlässigung des quadratischen Terms in Gl. (198)
erhalten wir für die Präzession eine gleichförmige Winkelgeschwindigkeit
V0
V0
=
,
pψ
I 3 ω3
φ̇ = ωP =
(200)
die nicht von der Neigung θ der Figureanchse gegen das Schwerefeld abhängt. Die
Präzession erfolgt um so langsamer, je schneller der Kreisel rotiert.
Diese gleichförmige Präzession ist nur eine partikuläre Lösung des Problems. Um
die grundsätzliche Struktur der allgemeinen Lösung aufzuzeigen, nehmen wir kleine Abweichungen
θ = θ0 + δ
von der speziellen Lösung θ = θ0 an. Dann folgt aus (191) eine ungleichförmige
Präzessionsgeschwindigkeit
pφ − pψ cos θ
I1 sin2 θ
pψ sin θ0
pφ − pψ cos θ0
pφ − pψ cos θ0
≈
+δ
− 2δ
cos θ0
2
2
I1 sin θ0
I1 sin θ0
I1 sin3 θ0
pψ
= ωP +
δ − 2ωP tan θ0 δ .
I1 sin θ0
φ̇ =
Hierbei haben wir bereits für θ = θ0 die gleichförmige Präzession ωP des schnellen
Kreisels nach Gl. (200) eingesetzt. Für kleine δ können wir schließlich noch den
dritten Term gegen den ersten vernachls̈sigen und erhalten
φ̇ = ωP +
pψ
δ.
I1 sin θ0
(201)
Wenn wir dies in die Lagrangegleichung (193) einsetzen und gleichzeitig für den
schnellen Kreisel (pψ I1 φ̇) den zweiten gegen den dritten Term vernachlässigen,
erhalten wir
p2
δ̈ + ψ2 δ = 0 .
(202)
I1
δ und damit θ oszilliert also mit der selben Frequenz40
j
pψ
≈
= ωN ,
I1
I1
40
Man beachte die verschiedenen Koordinatensysteme bei der Beschreibung des kräftefreien
und des schweren Kreisels. Daß der Eulersche Winkel φ einmal die Nutation und einmal die
Präzession beschreibt, mag wesentlich zu der sprachlichen Verwirrung beigetragen haben!
98
die nach Gl. (196) die Nutation des kräftefreien Kreisels beschreibt. Mit der selben
Frequenz schwankt daher nach Gl. (201) auch die Präzessionsgeschwindigkeit φ̇
um ihren Mittelwert ωP . Wir schließen daraus, daß die allgemeine Bewegung des
schnellen schweren Kreisels durch eine gleichförmige Präzession mit überlagerter
Nutation41 beschrieben wird.
Je nach der Amplitude δmax der Nutation kann die Bewegung eines Punktes auf
der Kreiselachse (etwa des sogenannten Locus mit dem Abstand 1 von der festgehaltenen Kreiselspitze) wellig verlaufen oder mit zeitweise rückläufiger Präzession
Schleifen bilden (siehe Skizze). Der Grenzfall einer zykloidischen Bahn mit Spitzen
entspricht den Anfangsbedingungen θ̇(0) = 0 und φ̇(0) = 0. Dies ist kein akademischer Spezialfall, sondern beschreibt die Bewegung eines schweren Kreisels, der
zunächst festgehalten, und dann plötzlich dem Schwerefeld ausgesetzt wird.
Bahn des Locus eines schweren symmetrischen Kreisels (nach Goldstein)
Der Vollständigkeit halber erwähnen wir, daß sich der schwere symmetrische Kreisel auch ohne
weitere Vorraussetzungen und Näherungen exakt beschreiben läßt. Dazu ergänzt man die beiden
Integrale (190) und (191) durch den Energiesatz [vgl. (189)]
T +V =
1
1
I1 (sin2 θ φ̇2 + θ̇2 ) + I3 (cos θ φ̇ + ψ̇)2 + V0 cos θ = E .
2
2
Eliminieren wir hier ψ̇ und φ̇ durch (190) und (191), so erhalten wir
1 2
I1 θ̇ + Veff (θ) = E
2
mit dem effektiven Potential
Veff (θ) =
p2ψ
(pφ − pψ cos θ)2
+
+ V0 cos θ .
2I3
2I1 sin2 θ
41
Da die überlagerte Nutation bei einem hinreichend schnellen Kreisel kaum zu beobachten
ist, spricht man auch von pseudoregulärer Präzession.
99
Da das effektive Potential für θ = 0 und θ = π unendlich wird, muß sich θ zwischen zwei
Umkehrpunkten θ1 und θ2 bewegen. Hierin erkennen wir die Nutation wieder. Ihre exakte mathematische Beschreibung gemäß
r
I1
dθ
p
= dt
2 E − Veff (θ)
führt mit der Substitution u = cos θ auf das elliptische Integral
Z
I1 du
t=− q
p2ψ
2I1 (1 − u2 )(E − 2I3 − V0 u) − (pφ − pψ u)2
mit einem Polynom dritten Grades (für V0 6= 0) in u unter der Wurzel im Nenner. Nach
der Bestimmung von θ(t) lassen sich φ(t) und ψ(t) durch Integration von (190) und (191)
bestimmen.
3.9
Zum elementaren Verständnis des Kreisels
Der Kreisel findet nicht nur zahlreiche technische Anwendungen sondern ist auch
ein zeitlos beliebtes Spielzeug. Seine scheinbar paradoxe Reaktion auf äußere
Kräfte stellt dabei eine nicht ganz triviale Aufgabe an die physikalische Anschauung. Wenn wir nun elementare Betrachtungen nachtragen, so zielen wir damit auf
das anschauliche Verständnis der Präzession. Denn die überlagerte Nutation ist
mehr oder weniger selbsverständlich, wenn die Richtung des Drehimpulses nicht
mit einer Hauptachse (der Symmetrieachse) zusammenfällt (vgl. Abschnitt 3.5).
Die einfachste elementare Begründung der Präzession des schnellen Kreisels geht
direkt vom Drehimpulssatz aus. Auf den Kreisel wirkt eine Kraft vom Betrag
F = mg
längs der raumfesten zR –Achse. Diese Kraft greift im Schwerpunkt mit dem Kraftarm zS in Richtung der körpereigenen zK –Achse an und erzeugt ein Drehmoment
vom Betrag
M = mgzS sin θ = V0 sin θ .
Es steht senkrecht auf beiden z–Achsen, zeigt also in die Richtung der Knotenlinie
(vgl. Skizze und die Figur auf S. 71).
zR
M
θ
zS
100
F
zK
Dieses Drehmoment verändert nun den Drehimpuls l, der für den schnellen Kreisel
angenähert durch l = I3 ω3 e3 gegeben ist. Seine raumfeste zR –Komponente pφ ≈
I3 ω3 cos θ bleibt konstant, da das Drehmoment keine zR –Komponente besitzt. Die
Projektion l⊥ in die raumfeste x–y–Ebene steht senkrecht auf der Knotenlinie,
der Betrag
l⊥ = I3 ω3 sin θ
bleibt daher ebenfalls konstant. Durch das Drehmoment wird l⊥ jedoch gemäß
l⊥ dφ = M dt
gedreht. Damit erhalten wir in Übereinstimmung mit (200) eine Präzessionsgeschwindigkeit
dφ
M
V0 sin θ
=
=
= ωP ,
dt
l⊥
I3 ω3 sin θ
aus der sich die Abhängigkeit vom Neigungswinkel θ herauskürzt.
Die soweit skizzierte Betrachtung ist zwar mathematisch besonders einfach, aber
noch wenig hilfreich für das anschauliche Verständnis. Sie geht nämlich von dem
integralen Drehimpulssatz aus und sagt nichts darüber aus, welche Kräfte an
welchen Massenpunkten des Kreisels die Wirkung der Schwerkraft kompensieren
und das Kippen des Kreisels verhindern. Eine in dieser Hinsicht aufschlußreichere
Interpretation der Präzession ergibt sich in dem Koordinatensystem, das mit ωP
um die zR –Achse rotiert, das also der Präzession (nicht aber der Rotation) der
Kreiselachse folgt. In diesem System erfahren die Massenpunkte des rotierenden
Kreisels eine Corioliskraft FC1 , die senkrecht zur zR –Achse gerichtet ist (siehe
Skizze).
ZR
FC1
ωp
FC1
Speziell bei den Massenpunkten am ’oberen’ Kreiselrand zeigt diese Kraft nach
’innen’, bei denen am ’unteren’ Rand nach ’außen’. Dadurch entsteht ein Drehmoment M1 , das den Kreisel aufzurichten versucht. Dieses Drehmoment kompensiert
das entgegengesetzte Moment der Gewichtskraft.
101
Auch diese Interpretation kann noch nicht voll befriedigen, da sie bereits von der
Präzession ausgeht statt sie zu erklären. Welche Kraft zwingt also den Kreisel
senkrecht auszuweichen, wenn er dem Schwerefeld ausgesetzt wird?
Gar keine! Der Kreisel beginnt zu kippen, wie jeder Körper, der in einem Punkt
festgehalten wird, im Schwerefeld kippt. Dabei erlangt er eine wachsende Winkelgeschwindigkeit θ̇ um die Knotenlinie. Und diese Drehung erzeugt nun ebenfalls
eine Corioliskraft FC2 (siehe Skizze).
zR
Fc2
Fc2
θ
Sie steht senkrecht auf der Knotenlinie und ist am ’rechten’ Kreiselrand nach
’innen’, am ’linken’ nach ’außen’ gerichtet. Dadurch entsteht ein Drehmoment
M2 , dem der Kreisel ebenfalls folgt: Er beginnt zu präzedieren.
Die Präzession erzeugt nun ihrerseits das oben beschriebene Drehmoment M1 ,
das dem Moment der Schwerkraft entgegenwirkt und es schließlich kompensiert.
Aufgrund der Trägheit schießt der Kreisel aber über dieses ’Ziel’ hinaus, er kippt
weiter und erfährt durch FC2 bzw. M2 eine weitere Beschleunigung der Präzession,
bis schließlich das wachsende Moment M1 die Kippbewegung zur Umkehr zwingt.
Nun wird θ̇ < 0 und M2 wechselt das Vorzeichen. Dadurch wird die Präzession
verlangsamt, bis sie schließlich ganz zum Stillstand kommt.
In diesem Punkt beginnt ein neuer Nutationszyklus. Die Kreiselachse führt also
insgesamt die Bewegung aus, die in der mittleren Figur von S. 99 skizziert ist.
Die Nutation ist daher am Aufbau der Präzession wesentlich beteiligt, ja, wir
können die Präzession als eine Folge von Versetzungen durch Nutationszyklen
auffassen. Erst wenn durch Reibung (die in unserer Analyse nicht enthalten ist)
die Amplitude der Nutation weggedämpft ist, erhalten wir die reine (reguläre)
Präzession mit der oben skizzierten Kompensation von Schweremoment und M1 .
102
4
Stabilität und kleine Schwingungen
In diesem Kapitel befassen wir uns mit einer Anwendung des Lagrangeformalismus auf die Untersuchung der Bewegung in der Nähe von “Gleichgewichtszuständen”, d.h. von Ruhelagen des Systems. Reagiert das System mit Oszillationen auf kleine Störungen der Ruhelage (z.B. Kugel in einer Potentialmulde) , so
heißt der Gleichgewichtszustand stabil. Ein labiler Gleichgewichtszustand dagegen
(z.B. Kugel auf einem Potentialberg) wird endgültig verlassen, wenn die Ruhelage
gestört wird. Methodisch benutzen wir in diesem Kapitel das wichtige Werkzeug
der Linearisierung. Wir behandeln das Problem hier im Anschluß an die Dynamik des starren Körpers, weil wir dabei von unserer mathematischen Vorarbeit
bei der Hauptachsentransformation des Trägheitstensors profitieren können.
Da es sich bei dem Problem – wie gesagt – um eine Anwendungen und nicht um
Grundlagen handelt, kann dieses Kapitel ohne Schaden für das folgende ausgelassen werden.
4.1
Gleichgewichte und kleine Abweichungen
Wir betrachten ein mechanisches System mit holonomen Zwangsbedingungen,
das wir durch die generalisierten Koordinaten q1 , . . . qf beschreiben. Wenn wir
uns außerdem auf skleronome42 Zwangsbedingungen beschränken, erhalten wir
aus der Rücktransformation
xν = hν (q)
die kinetische Energie (vgl. S. 60)
T = T2 =
f
n
X
1X
∂hν ∂hν
mν
q̇i q̇j .
2 ν=1
i,j=1 ∂qi ∂qj
Wir wollen schließlich noch annehmen, daß alle Kräfte aus einem Potential herleitbar sind. Dann erhalten wir die Lagrangefunktion
f
1 X
L=
Tij (q)q̇i q̇j − V (q)
2 i,j=1
mit
Tij (q) =
n
X
mν
ν=1
42
∂hν ∂hν
.
∂qi ∂qj
Über ein effektives Potential lassen sich auch viele Systeme mit rheonomen Zwangsbedingungen nach dem gleichen Schema behandeln. Im allgemeinen erfordert jedoch ein Anteil L1
(vgl. S. 60) in der Lagrangefunktion einen größeren mathematischen Aufwand, wie man am
Beispiel des Facaultschen Pendels oder des harmonischen Oszillators im Magnetfeld sieht.
103
Aus den Ableitungen
X
∂L
Tik q̇i ,
=
∂ q̇k
i
und
X ∂Tik
X
d ∂L
Tik q̈i +
=
q̇i q̇j
dt ∂ q̇k
i,j ∂qj
i
∂L
1 X ∂Tij
∂V
=
q̇i q̇j −
∂qk
2 i,j ∂qk
∂qk
folgen dann die Bewegungsgleichungen
X
i
Tik q̈i +
X
i,j
∂Tik 1 ∂Tij
−
∂qj
2 ∂qk
!
q̇i q̇j +
∂V
= 0.
∂qk
(203)
Wir interessieren uns nun speziell für Gleichgewichte q = q0 , q̇ = q̈ = 0. Hierfür
muß offenbar
∂V =0
(204)
∂qk q=q0
gelten, d.h. die generalisierte Kraft im Gleichgewichtspunkt muß verschwinden.
Wir nehmen o.B.d.A. (etwa, indem wir q durch q − q0 ersetzen) q0 = 0 an und
betrachten kleine Abweichungen vom Gleichgewicht. Damit meinen wir, daß wir
alle Glieder von höher als
• linearer Ordnung in q, q̇ und q̈ in den Bewegungsgleichungen bzw.
• quadratischer Ordnung in q und q̇ in der Lagrangefunktion
vernachlässigen. Damit entfällt der mittlere Term in der Bewegungsgleichung
(203). Außerdem können wir die kinetische Energie durch die symmetrische quadratische Form
f
1 X
T =
Tij q̇i q̇j
2 i,j=1
mit Tij = Tji = Tij (0)
(205)
in q̇ repräsentieren. Entsprechend können wir
V (q) = V (0) +
X
i
∂V 1 X ∂ 2 V qi +
qi qj
∂qi 0
2 i,j ∂qi ∂qj 0
bis zur quadratischen Ordnung in q entwickeln. Die bedeutungslose Konstante
V0 können wir o.B.d.A. gleich Null setzen. Im Gleichgewicht gilt nach Gl. (204)
außerdem ∂V /∂qi |0 = 0. Daher wird das Potential durch die symmetrische quadratische Form
104
f
1 X
V =
Vij qi qj
2 i,j=1
∂ 2 V mit Vij = Vji =
∂qi ∂qj 0
(206)
in q repräsentiert. Kleine Abweichungen vom Gleichgewicht werden also durch
die Lagrangefunktion
L=
1X
1
1X
1
Tij q̇i q̇j −
Vij qi qj = q̇∗ Tq̇ − q∗ Vq
2 i,j
2 i,j
2
2
(207)
und die Bewegungsgleichungen
X
(Tik q̈i + Vik qi ) = 0 oder Tq̈ + Vq = 0
(208)
i
mit symmetrischen f×f –Matrizen
T = (Tik ) und V = (Vik )
beschrieben.
4.2
Eigenfrequenzen und Stabilität
Gl. (208) ist ein linear homogenes Differentialgleichungssystem mit konstanten
Koeffizienten, das grundsätzlich elementar lösbar ist. Die einzige Schwierigkeit
liegt darin, daß die Gleichungen gekoppelt sind. Wir streben daher an, die Gleichungen durch eine Transformation
q = Aξ
oder qi =
X
ail ξl
(209)
l
zu entkoppeln, so daß Gl. (208) in
ξ¨l + λl ξl = 0
(210)
übergeht. Die entkoppelten Koordinaten ξl heißen Normalkoordinaten. Die
Eigenwerte λl erhalten wir, wenn wir
d2
→ −λ
dt2
in Gl. (208) einsetzen:
f
X
i=1
(Vik − λTik )qk = 0 oder (V − λT)q = 0
105
Dieses linear homogene Gleichungssystem für q besitzt nur dann nicht–triviale
Lösungen, wenn
det(V − λT) = 0
(211)
gilt. Wir werden im nächsten Abschnitt zeigen, daß dieses Polynom f –ten Grades
in λ tatsächlich f reelle Lösungen besitzt.
Für Eigenwerte λl > 0 erhalten wir harmonische Eigenschwingungen
ξl = cl cos ωl t + dl sin ωl t mit ωl =
q
λl .
Wir nennen ωl eine Eigenfrequenz oder Normalfrequenz des Systems.
Für Eigenwerte λl < 0 erhalten wir dagegen exponentielle Lösungen
ξl = cl exp(γl t) + dl exp(−γl t) mit γl =
q
−λl .
Der Sonderfall λl = 0 führt auf eine gleichförmige Variation
ξl = c l + d l t .
Dieser Fall erfordert im allgemeinen eine gesonderte Untersuchung, bei der höhere
Terme in den Abweichungen vom Gleichgewicht berücksichtigt werden müssen.
Zur Klassifizierung des Gleichgewichts können wir daher die folgenden Fälle unterscheiden:
• Alle λl > 0:
Das System führt bei einer kleinen Störung kleine Schwingungen um die
Gleichgewichtslage aus, das Gleichgewicht ist stabil.
• Mindestens ein λl < 0:
Das System läuft bei einer Störung exponentiell aus dem Gleichgewicht, das
Gleichgewicht ist labil.
• Alle λl ≥ 0 und mindestens ein λl = 0:
Das Gleichgewicht ist zunächst indifferent. In diesem Sonderfall kommen
jedoch im allgemeinen höhere Entwicklungsglieder zum Tragen und entscheiden letzendlich über die Stabilität.
Die folgende Analyse wird zeigen, daß diese Klassifizierung mit der elementaren
Anschauung übereinstimmt, die man aus der Beurteilung des Potentials in der
Umgebung des Gleichgewichts (Minimum, Sattelpunkt, Maximum) gewinnt:
106
Quadratische Form q∗ Vq
positiv definit
positiv semidefinit
negativ– oder indefinit
4.3
Gleichgewicht
stabil
indifferent
labil
Transformation auf Normalkoordinaten
Mit der Transformation (209) erhalten wir die kinetische Energie
1 ∗
T = ξ˙ T̂ξ˙ mit T̂ = A∗ TA
2
und die potentielle Energie
1
V = ξ ∗ V̂ξ mit V̂ = A∗ VA .
2
Wenn wir angenommen haben, mit dieser Transformation entkoppelte Bewegungsgleichungen (210) zu erhalten, so ist das gleichbedeutend mit der optimistischen
Erwartung, mit ein und derselben Transformation A sowohl T als auch V diagonalisieren zu können:
Vl
T̂kl = Tl δkl , V̂kl = Vl δkl und λl = .
Tl
Bei entsprechender Dehnung oder Stauchung der Achsen können wir dann sogar
T̂ = 1 verlangen.
Bevor wir diese überraschende Aussage beweisen, erinnern wir daran, daß T und
V reell symmetrische und damit selbstadjungierte Matrizen sind, und weisen auf
das im Abschnitt 3.4 zusammengestellte mathematische Rüstzeug hin. Danach
ist zunächst klar, das sowohl T als auch V einzeln mit verschiedenen orthogonalen Matrizen diagonalisiert werden können. Wir werden hiervon bei unserem
Existenzbeweis Gebrauch machen. Als Ergebnis werden wir eine nicht orthogonale
Matrix A finden, die das Gewünschte leistet.
Zum Beweis geben wir in schematischer Form Einzeltransformationen an und
verdeutlichen ihr Wesen anhand kleiner Skizzen:
Die Ausgangssituation sei durch
1
T = q̇Tq̇ ,
2
q2
1
V = qVq
2
mit nicht diagonalen Matrizen T und V
charakterisiert. (Wir skizzieren rechts die
Flächen T = const und V = const schematisch für ein zweidimensionales stabiles
System.)
107
q2
q1
q1
1. Schritt: Wir diagonalisieren T durch eine orthogonale Matrix A1 :
q = A1 η ,
1
T = η̇ ∗ T1 η̇ ,
2
1
V = η ∗ V1 η ,
2

η2
η2

τ1 · · · 0

. ..
. 
T1 = A∗1 TA1 = 
. .. 
 ..

0 · · · τf
η1
η1
V1 = A∗1 VA1 .
Da die kinetische Energie positiv definit
ist, sind alle Eigenwerte τi > 0. Dies bietet
die Grundlage für den zweiten Schritt.
2. Schritt: Wir dehnen oder stauchen das
Ellipsoid T = const durch eine Transformation mit der Matrix


A2 = 

−1/2
τ1
..
.
0

···
0
.. 
..
.
. 

−1/2
· · · τf
ζ2
ζ2
zur Einheitskugel:
η = A2 ζ ,
1 ∗
T = ζ̇ T2 ζ̇ ,
2
1
V = ζ ∗ V2 ζ ,
2
ζ1
ζ1
T2 = 1 ,
V2 = A∗2 VA2 .
In dieser Stauchung liegt der nicht orthogonale Kern der Gesamttransformation.
3. Schritt: Diagonalisieren wir nun V
durch eine orthogonale Matrix A3 . Da
T2 = 1 gegen orthogonale Transformationen invariant ist, erhalten wir
ζ = A3 ξ ,
1 ∗
T = ξ˙ T3 ξ˙ ,
2
ξ2
1
V = ξ ∗ V3 ξ ,
2
T3 = A∗3 T2 A3 = 1 ,

ξ2
ξ1

λ1 · · · 0

 . .
∗

. . ... 
V3 = A3 V2 A3 =  ..
.
0 · · · λf
108
ξ1
Mit A = A1 A2 A3 erhalten wir also die angestrebte Gesamttransformation
q = Aξ ,
(212)
durch welche die Matrizen T und V in
T̂ = A∗ TA = 1
und

(213)

λ1 · · · 0
 .

∗

V̂ = A VA =  .. . . . ... 

0 · · · λf
(214)
übergehen. Damit erhalten wir die einfache Lagrangefunktion
1 X ˙2 1 X
ξ −
λi ξi2 ,
2 i i
2 i
L=
die zu den Bewegungsgleichungen (210) führt.
Zur Berechnung der Transformationsmatrix A brauchen wir nicht von der Zerlegung des Existenzbeweises in Einzelschritte auszugehen, sondern können sogleich
die Gesamttransformation in einem Schritt konstruieren. Dazu setzen wir A in
der Form
A = (a1 , . . . , af )
(215)
aus Spaltenvektoren al zusammen und notieren die Transformation in der Form
q = Aξ =
X
ξ l al .
l
Mit den Bewegungsgleichungen Tq̈ + Vq = 0 [vgl. Gl. (208)] und ξ¨l = −λl ξl [vgl.
Gl. (210)] erhalten wir dann
X
l
ξl (V − λl T)al = 0 .
Da die Koordinaten ξl unabhängig sind, erhalten wir für die gesuchten al das
linear homogene Gleichungssystem
(V − λl T)al = 0 .
109
(216)
Die Vektoren al erfüllen also eine Beziehung, die die Definition von Eigenvektoren
verallgemeinert. Die Bedingung, daß nicht–triviale Lösungen existieren, führt wieder auf Gl. (211). Unser Existenzbeweis stellt sicher, daß diese Polynomgleichung
tatsächlich f reelle Werte λl liefert.
Natürlich ist al durch Gl. (216) nur bis auf einen konstanten Faktor bestimmt.
Im Prinzip sollte dieser Faktor durch die Normierung [vgl. (213)]
a∗l Tal = 1
(217)
festgelegt werden. Tatsächlich kann auf die Normierung aber verzichtet werden43 ,
wenn die Umkehrtransformation
A−1 = A∗ T
(218)
nach Gl. (213) nicht benötigt wird.
4.4
Die formale Durchführung
Wir fassen die obigen Überlegungen in dem folgenden Rechenprogramm zusammen. Dabei setzen wir zunächst voraus, daß keine Entartung vorliegt, d.h. daß
alle λl verschieden sind.
1. Suche die fragliche Gleichgewichtslage q̃0 und benutze die Abweichungen
qk = q̃k − q̃k0 als generaliesierte Koordinaten.
2. Entwickle T und V in der Umgebung der Gleichgewichtslage bis zur quadratischen Ordnung und bringe sie in die Form
T =
1X
1
Tij q̇i q̇j = q̇∗ Tq̇ ,
2 i,j
2
V =
1X
1
Vij qi qj = q∗ Tq .
2 i,j
2
Dabei ist unbedingt darauf zu achten, daß T und V symmetrisch gewählt
werden (Tij = Tji und Vij = Vji )!
3. Bilde das charakteristische Polynom [vgl. (211)]
det(V − λT) = 0 .
43
Das bedeutet, daß die Achsen zum Schluß noch einmal gestaucht werden. Hierbei bleibt die
Entkoppelung erhalten. Natürlich spielt auch das Vorzeichen von al keine Rolle.
110
Es besitzt f relle Lösungen λl deren Vorzeichen Auskunft über die Stabilität
des Gleichgewichts geben: Sind alle λl > 0, so ist das System stabil, ist mindestens ein λl < 0, labil. Indifferentes Gleichgewicht (das aber i.a. genauer
untersucht werden muß) liegt vor, wenn alle λl ≥ 0 sind und mindestens ein
λl = 0 ist. Für stabile Systeme erhält man die Eigenfrequenzen
ωl =
q
λl .
4. Bestimme für jedes λl einen Eigenvektor al aus der Beziehung [vgl. (216)]
(V − λl T)al = 0 .
Eine Normierung der Eigenvektoren nach Gl. (217) ist nur dann erforderlich,wenn die Umkehrtransformation (218) benötigt wird.
5. Die Normalkoordinaten erfüllen die einfachen Bewegungsgleichungen [vgl.
(210)]
ξ¨l + λl ξl = 0 .
Ihre Lösungen lassen sich mit der Matrix [vgl. (215)]
A = (a1 , . . . , af )
gemäß [vgl. (212)]
q = Aξ
oder qk =
X
alk ξl
l
auf die alten Koordinaten q übertragen. Nimmt man insbesondere an, daß
nur eine “mode”, d.h. eine isolierte Eigenschwingung ξl , angeregt ist (ξi = 0
für i 6= l), so erhält man durch
q(l) = ξl al
eine Beschreibung des Bewegungsablaufs dieser isolierten Mode.
6. Ist der Bewegungsablauf durch Anfangsbedingungen q(0) und q̇(0) vorgege˙
ben, so erhält man die entsprechenden Anfangsbedingungen ξ(0) und ξ(0)
aus der Umkehrtransformation
ξ = A−1 q .
Hat man die Eigenvektoren nach Gl. (217) normiert (vgl. Punkt 4.), so
erhält man A−1 aus Gl. (218).
[Abschließend müssen wir in unserem Konzept noch den Sonderfall der Entartung
erörtern. Dieser stellt eher ein Problem für die theoretische Begründung als für die
praktische Auswertung dar. Wenn nämlich zwei oder mehr Eigenwerte des charakteristischen Polynoms (211) gleich werden, so brauchen wir nur den Punkt 4 unseres
Programms zu modifizieren:
Ist λl eine m–fache Nullstelle von Gl. (211), so spannen die Lösungen von Gl. (216)
einen m–dimensionalen Unterraum U m auf.
111
• Wenn die Umkehrtransformation (218) nicht benötigt wird, können wir einfach
(1)
(m)
m beliebige linear unabhängige Vektoren al , . . . , al aus Um auswählen.
• Wollen wir jedoch die Umkehrtransformation nach Gl. (218) bilden (vgl. 6.), so
müssen wir m Vektoren a1l , . . . , am
l konstruieren, die im Einklang mit Gl. (217)
den “Orthogonalitätsrelationen”
µ
aν∗
l Tal = δνµ
genügen. Hierzu kann man wieder von einem beliebigen linear unabhängigen Sy(1)
(m)
stem al , . . . , al
ausgehen und etwa nach dem Schmidtschen Verfahren orthogonalisieren: Dabei setzt man
(1)
(1)
a1l = α11 al , a2l = α21 al
(2)
+ α22 al
...
und bestimmt die α’s sukzessive so, daß
1
1∗
2
2∗
2
a1∗
l Tal = 1, al Tal = 0, al Tal = 1, . . .
gilt.]
4.5
Gekoppelte Pendel
Zur Illustration des Verfahrens betrachten
wir das einfache Beispiel zweier gleicher mathematischer Pendel (Masse m, Länge `), die
durch eine (schwache) Feder (k) gekoppelt
sind. Die Länge der entspannten Kopplungsfeder sei gleich dem Abstand d der Aufhängepunkte (siehe Skizze), so daß die Gleichgewichtslage nicht verändert wird.
y
Von S. 47 übernehmen wir die Ausdrücke
d
ϑ2 l
ϑ1
m
l
m
x
m 2 2
` ϑ̇ und V = −mg` cos ϑ
x20 x2
x10
x1
2
für die kinetische und die potentielle Energie eines Pendels. Bei unseren gekoppelten Pendeln müssen wir nun die entsprechenden Terme für beide Pendel addieren.
Außerdem ist die potentielle Energie durch die Kopplungsenergie
T =
Vk ≈
k
k
(x2 − x1 − d)2 = `2 (sin ϑ1 − sin ϑ2 )2
2
2
zu ergänzen. Damit erhalten wir
T =
m 2 2
` (ϑ̇1 + ϑ̇22 )
2
112
und
k
V = −mg`(cos ϑ1 + cos ϑ2 ) + `2 (sin ϑ1 − sin ϑ2 )2 .
2
Wir gehen nun nach den Programmpunkten des vorigen Abschnitts vor:
1. Die Gleichgewichtslage liegt nach Konstruktion bei ϑ1 = ϑ2 = 0. (Natürlich
kann man das auch aus ∂V /∂ϑi = 0 ausrechnen.)
2. Wir sehen nun ϑi (und ϑ̇i ) als klein an und entwickeln bis zur quadratischen
Ordnung, d.h. wir setzen
sin ϑi ≈ ϑi
1
cos ϑi ≈ 1 − ϑ2i
2
und
und erhalten
m 2 2
` (ϑ̇1 + ϑ̇22 )
2
k
m
V = V0 + g`(ϑ21 + ϑ22 ) + `2 (ϑ1 − ϑ2 )2 .
2
2
Dabei ist die Konstante V0 = −2mg` ohne Bedeutung und kann weggelassen
werden. Wir können T und V deshalb mit den Matrizen
T =
T = m`
2
!
1 0
0 1
und V = m`
g
`
2
k
+m
k
−m
k
−m
g
k
+m
`
!
in der Form
1
T = (ϑ̇1 , ϑ̇2 )T
2
ϑ̇1
ϑ̇2
!
1
und V = (ϑ1 , ϑ2 )V
2
ϑ1
ϑ2
!
schreiben.
3. Das charakteristische Polynom
det(V − λT) = 0
oder
g
`
k
+m
−λ
k
−m
g
`
− mk
k
+m
−λ
=
k
g
+
−λ
` m
!2
−
k2
= 0
m2
besitzt die beiden positiven Lösungen
g
g
k
und λ2 = + 2 .
`
`
m
Das Gleichgewicht ist also (natürlich) stabil. Das Pendelsystem führt bei
einer Störung Schwingungen der Eigenfrequenzen
λ1 =
ω1 =
r
g
`
und/oder ω2 =
aus.
113
s
g
k
+2
`
m
4. Wir bestimmen die Eigenvektoren al aus
(V − λl T)al = 0 .
Für l = 1, d.h. λl = g/`, erhalten wir
k
m
1 −1
−1
1
!
!
a11
a12
= 0,
α
α
also a1 =
!
mit beliebigem α. Entsprechend folgt für l = 2, d.h. λl = g/` + 2k/m
k
−
m
1 1
1 1
!
!
a21
a22
= 0,
also a2 =
α
−α
!
.
Da T bis auf den Vorfaktor m`2 gleich der Einheitsmatrix ist, sind a1 und
a2 bereits
√ orthogonal. Eine Normierung nach der formalen Vorschrift würde
α = 1/ 2m`2 erfordern. Wir verzichten darauf und wählen der Einfachheit
halber α = 1.
5. Die Normalkoordinaten ξl führen harmonische Schwingungen der Frequenz
ωl aus. Mit der Matrix
1
1
1 −1
A = (a1 , a2 ) =
!
lassen sich daraus die ursprünglichen Koordinaten
ϑ1
ϑ2
!
ξ1
ξ2
=A
!
=
ξ1 + ξ 2
ξ1 − ξ 2
!
berechnen.
Führt das System insbesondere nur die Eigenschwingung 1 aus (ξ2 = 0), so
folgt
ϑ1 = ϑ 2 .
Beide Pendel schwingen also gleichsinnnig mit gleicher Amplitude, so daß
die Koppelfeder gar nicht gedehnt wird. Daher erhalten wir die ungestörte
Pendelfrequenz
q
ω1 = g/` .
Für die Eigenschwingung 2 (ξ1 = 0) erhalten wir dagegen
ϑ1 = −ϑ2 .
Die Pendel schwingen also gegensinnig mit gleicher Amplitude, so daß die
Koppelfeder maximal beansprucht wird. Da ihr Mittelpunkt bei dieser Mode
in Ruhe bleibt, kann sie durch zwei Federn halber Länge und doppelter
Federkonstante ersetzt werden. Dies erklärt die Eigenfrequenz
ω2 =
q
g/` + 2k/m .
114
6. Unter Beachtung der Orthogonalität und der Normierung erhalten wir die
Matrix
!
1 ∗ 1 1
1
−1
A = A =
2
2 1 −1
der Umkehrtransformation. Daher gilt
1
1
ξ1 = (ϑ1 + ϑ2 ) und ξ2 = (ϑ1 − ϑ2 ) .
2
2
Wenn wir die Pendel beispielsweise mit den Anfangsbedingungen
ϑ1 (0) = 2c ,
ϑ2 (0) = ϑ̇1 (0) = ϑ̇2 (0) = 0
starten, so folgt
ξ1 (0) = ξ2 (0) = c ,
ξ˙1 (0) = ξ˙2 (0) = 0 .
Wir erhalten also die spezielle Lösung
ξ1 = c cos ω1 t ,
ξ2 = c cos ω2 t
oder nach Rücktransformation
c
1
1
t cos ω2 +ω
t
cos ω2 −ω
2
2
2
c
1
1
= c(cos ω1 t − cos ω2 t) =
t sin ω2 +ω
t.
sin ω2 −ω
2
2
2
ϑ1 = c(cos ω1 t + cos ω2 t) =
ϑ2
Für schwache Kopplung (d.h. k/m g/` oder ω2 ≈ ω1 ) ergibt dies die bekannte Schwebung, bei der die gesamte Schwingungsenergie mit der kleinen
Differenzfrequenz zwischen den beiden Pendeln ausgetauscht wird.
115
5
Spezielle Relativitätstheorie
5.1
Galileisches und Einsteinsches Relativitätsprinzip
Wir betrachten ein Koordinatensystem K0 , das sich gegenüber unserem Inertialsystem K mit der konstanten Geschwindigkeit v bewegt. Der Zusammenhang44
r0 = r − vt
(219)
zwischen den Ortskoordinaten (x, y, z) in K und den entsprechenden Koordinaten
(x0 , y 0 , z 0 ) in K0 heißt Galileitransformation.
Wir hatten bereits in den Abschnitten 1.1 und 1.8 festgestellt, daß die Grundgesetze der Mechanik “Galileiinvariant”, d.h. invariant gegen Galileitransformationen, sind. Denn wegen v̇ = 0 folgt aus
(219)
mi r̈0i = mi r̈i = Fi .
(220)
Die Newtonschen Bewegungsgleichungen bieten also keine Möglichkeit, zwischen
den Koordinatensystemen K und K0 zu unterscheiden, ⇒
• Galileisches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit,
durch mechanische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen.
Im Rahmen der klassischen Mechanik kann also prinzipiell nicht entschieden werden, ob sich ein System im Zustand der ‘Ruhe’ oder der ‘gleichförmigen Bewegung’
(wogegen eigentlich?) befindet45 . Es liegt nun einmal aus philosophisch–ästhetischen Gründen, mehr noch aber aufgrund der experimentellen Erfahung, die um
die Wende zum 20. Jahrhundert gewonnen wurde, nahe, dieses Relativitätsprinzip
auf die gesamte Physik zu übertragen. Wir postulieren daher
• Einsteinsches Relativitätsprinzip: Alle gleichförmig gegeneinander bewegten Koordinatensysteme sind äquivalent. Es gibt keine Möglichkeit,
durch physikalische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen.
Mit diesem Postulat kommen wir aber sogleich in Schwierigkeiten mit den Grundlagen der Elektrodynamik, wenn wir an der Galileitransformation festhalten.
44
Wir setzen hier und im folgenden voraus, daß die Koordinatenursprüge von K und K0 zur
Zeit t = 0 zusammenfallen.
45
Man kann nicht einmal immer zwischen Scheinkräften in Nicht–Inertialsystemen und “wahren” (was ist das?) Kräften in Inertialsystemen unterscheiden! Vgl. dazu auch Abschnitt 5.11.
116
Denn nach dem Relativitätsprinzip erhalten wir in jedem Inertialsystem eine
Lichtgeschwindigkeit c = (ε0 µ0 )−1/2 . Nach Gl. (219) müssen wir dagegen in K0
die anisotrope Lichtgeschwindigkeit
c0 = c − v cos α
(221)
erwarten, wenn α den Winkel bezeichnet, der zwischen v und der Ausbreitungsrichtung des Lichts liegt.
Wenn wir also am Relativitätsprinzip festhalten, müssen wir die Galileitransformation abändern. Ändern wir die aber ab, sind die Newtonschen Bewegungsgleichungen nicht mehr transformationsinvarint und müssen ebenfalls abgeändert
werden. Wir stehen also vor der grundsätzlichen Frage, ob wir an den Newtonschen Bewegungsgleichungen oder (lat. ‘aut’, nicht ‘vel’ !) am Relativitätsprinzip festhalten wollen. Wegen der fundamentalen Bedeutung für die Grundlagen der gesamten Physik und Naturphilosophie soll das historische experimentum
crucis (Michelson 1881, Michelson und Morley 1887, Morley und Miller 1904, Joos 1930) zu dieser Frage im folgenden in seinen Grundgedanken
skizziert werden.
5.2
Das Michelson–Experiment
Das Experiment zielt auf einen Vergleich der Lichtgeschwindigkeit in verschiedenen Koordinatensystemen K und K0 , und der erste Grundgedanke liegt darin, die
große – und doch gegen c so kleine! – Geschwindigkeit
v ≈ 30 km/s ≈ 10−4 c
der Erde auf ihrer Bahn um die Sonne auszunutzen.
Eine hinreichend genaue Bestimmung der Lichtgeschwindigkeit (mit den damaligen Mitteln!) durch die Messung der Laufzeit über eine bestimmte Strecke scheidet aus, weil die erforderliche Synchronisation am Start– und am Zielpunkt selbst
von der Lichtgeschwindigkeit abhängt. Man muß also den Hin– und Rückweg eines
Lichtstrahls verfolgen. Dabei hebt sich der Einfluß von v aber in erster Nähererung weg. Der verbleibende Einfluß der Größenordnung
v 2 /c2 ∼ 10−8
ist aber so klein, daß nur ein Interferenzversuch infrage kommt. Hierzu brauchen
wir noch einen zweiten Hin– und Rückweg. Nach dieser Vorklärung können wir
den grundsätzlichen Aufbau des Experiments schematisch skizzieren:
Das Licht einer monochromatischen Lichtquelle L wird durch einen halbdurchlässigen Spiegel S0 in zwei Strahlen (x– und y–Richtung) aufgespalten, die nach
Reflexion an den Spiegeln Sx und Sy auf dem Schirm Sch interferieren. Die Wege
lx und ly sind dabei etwa gleich lang (siehe Skizze).
117
Sy
ly
S0
lx
L
Sx
Sch
Wir nehmen nun an, daß Gl. (221) gilt und daß sich die Lichtgeschwindigkeit c
auf einen ruhenden “Äther” bezieht. Die Apparatur bewege sich mit einer Geschwindigkeit v in x–Richtung gegen den Äther. Dann braucht das Licht für den
Weg S0 –Sx –S0 die Laufzeit
tx =
lx
2lx
lx
+
=
,
c−v c+v
c(1 − β 2 )
wenn wir hier und im folgenden die übliche Abkürzung
β = v/c
(222)
benutzen. Für die konkurrierende Laufzeit ty auf dem Weg S0 –Sy –S0 gilt (nach
Pythagoras) die Beziehung
q
cty = 2 ly2 + ( 21 vty )2 =
q
4ly2 + v 2 t2y .
Lösen wir nach ty auf, so erhalten wir (5.2)
2ly
ty = √
.
c 1 − β2
Insgesamt folgt also eine Laufzeitdifferenz
"
lx
ly
2
√
−
δtk = tx − ty =
c 1 − β2
1 − β2
#
Und nun kommt der entscheidende Schritt: Drehen wir die Apparatur um 90o , so
vertauschen x und y ihre Rollen, und wir erhalten
"
#
l
ly
2
√ x 2−
.
δt⊥ =
c
1 − β2
1−β
118
Die Differenz
#
"
lx + l y 2
1
2(lx + ly )
1
≈
−√
β
∆t = δtk − δt⊥ =
2
2
c
1−β
c
1−β
sollte man als Verschiebung des Interferenzmusters beobachten können. Um allerding einen Gangunterschied von
c∆t ∼ 5 · 10−7 m ,
der der Wellenlänge von gelbem Licht entspricht, zu erzielen, benötigt man für
β = 10−4 Wegstrecken
lx + ly ∼ 50m ,
die im Sub–µm–Bereich stabil sind! Dies ist mit verschiedenen technischen Tricks
tatsächlich erreicht worden.
Man hat den Versuch unter verschiedenen Bedingungen und Annahmen mehrfach mit steigender Genauigkeit wiederholt und immer ein negatives Ergebnis
gefunden:
• Die Lichtgeschwindigkeit ist unter allen Bedingungen isotrop und gleich c.
Wir müssen daraus schließen, daß die Galileitransformation und die Galileiinvarianten Newtonschen Bewegungsgleichungen für hohe Geschwindigkeiten zu korrigieren sind.
5.3
Die Lorentztransformationen
Die Ausbreitung eines Lichtblitzes, der zur Zeit t = 0 im Ursprung erzeugt wurde,
folgt im System K der Gleichung
x2 + y 2 + z 2 = c 2 t 2 .
Da wir festgestellt haben, daß auch in K0 eine isotrope Lichtausbreitung mit der
Geschwindigkeit c beobachtet wird, liegt es zunächst nahe, anzunehmen, daß dort
2
2
2
x0 + y 0 + z 0 = c 2 t 2
gilt. Das heißt aber, daß K0 und K durch eine orthogonale Transformation im R3
verknüpft sind: r0 geht durch eine reine Drehung aus r hervor. Daß eine isotrope
Kugelwelle bei einer reinen Drehung des Koordinatensystems invariant bleibt, ist
trivial. Eine solche Drehung beschreibt aber offensichtlich nicht die gewünschte
Relativbewegung der Koordinatensysteme. Das Fatale ist nun, daß die Drehung
die einzige Möglichkeit ist, unseren ersten Ansatz zu befriedigen.
119
Wir stehen deshalb vor der befremdlichen Notwendigkeit, unseren Ansatz zu modifizieren und neben der Transformation r → r0 auch eine Transformation t → t0
der Zeit zuzulassen. Die Konstanz der Lichtgeschwindigkeit wird dann durch die
Gleichung
2
2
2
x2 + y 2 + z 2 − c 2 t 2 = x 0 + y 0 + z 0 − c 2 t 0
2
= 0
(223)
beschrieben. Die rein formale Anschrift dieser Beziehung legt es nahe, einen vierdimensionalen Raum mit den Koordinaten
x1 = x ,
x2 = y ,
x3 = z ,
x4 = ict
einzuführen. Die Konstanz der Lichtgeschwindigkeit schreibt sich dann in der
Form46
4
X
x2ν =
4
X
2
x0 ν = 0 .
(224)
ν=1
ν=1
Hierbei ist allerdings störend, daß wir eine imaginäre Koordinate x4 = ict benutzen, die zu recht seltsamen Konsequenzen führt. Beispielsweise kann die Summe
von Quadraten negativ werden, und wir können rechtwinklig gleichschenklige
Dreiecke mit der Hypothenuse Null bilden. Wir bewegen uns also nicht mehr in
dem vertrauten euklidischen Raum, sondern in einem vierdimensionalen Raum
mit einer ungewohnten Metrik, im Minkowskiraum.
Es gibt nun verschiedene Argumente, eine lineare Transformation
x0ν
=
4
X
ανµ xµ
oder kurz x0 = Ax
(225)
µ=1
zwischen den Koordinaten in K und K0 zu fordern. Einmal soll für kleine v c
die lineare Galileitransformation reproduziert werden. Gewichtiger aber ist, daß
nicht–lineare Terme die Homogenität von Raum und Zeit verletzen würden. Denn
wir erwarten, daß die Koeffizienten
ανµ =
∂x0µ
∂xν
nicht von x, also von der Lage r und der Zeit t, abhängen. Sie sollen dagegen
allein von der Geschwindigkeit v zwischen K und K0 abhängen.
46
Wir folgen in diesem Kapitel dem allgemeinen Gebrauch, im vier dimensionalen Raum griechische Indizes, im dreidimensionalen Ortsraum dagegen lateinische Indizes zu verwenden.
120
Eine invertierbare lineare Transformation (225), die Gl. (224) erfüllt, ist aber
notwendigerweise eine orthogonale47 Transformation im vierdimensionalen Minkowskiraum. Eine solche Transformation heißt Lorentztransformation.
Orthogonale Transformationen lassen sich vorteilhaft als Drehungen veranschaulichen. Bei der Interpretation einer Lorentztransformation als Drehung sollten wir aber vorsichtig sein, weniger wegen der Schwierigkeit, unsere Anschauung auf vier Dimensionen auszudehnen, als wegen des imaginären Charakters
der Koordinate x4 (oder besser: wegen der nicht–euklidischen Metrik des Minkowskiraumes). Aber selbstverständlich sind reine Drehungen im R3 (s.o.) auch
Lorentztransformationen. Sie drücken die Isotropie des Raumes und speziell
der Lichtausbreitung aus.
Wegen der Isotropie können wir o.B.d.A. annehmen, daß v in der x3 –Richtung
liegt. Wir sprechen nun von einer speziellen Lorentztransformation, wenn sie
keine räumliche Drehung enthält. Da keine Drehachse vorliegt, ist x3 dabei die
einzige ausgezeichnete Raumrichtung.
Die Koordinaten x1 und x2 sind daher im wesentlichen an der Transformation
unbeteiligt. Insbesondere wird die Zugehörigkeit eines Punktes zur x2 –x3 –Ebene
(x1 = 0) oder zur x1 –x3 –Ebene (x2 = 0) nicht berührt, es gilt also
x01 = ax1
und x02 = ax2
oder
α11 = α22 = a und
α12 = α13 = α14 = α21 = α23 = α24 = 0 .
Der Koeffizient a kann nur vom Betrag der Geschwindigkeit v abhängen. Darum
gilt umgekehrt nach dem Äuivalenzprinzip auch
x1 = ax01
und x2 = ax02 ,
und wir folgern
a = 1.
Die Koordinaten x03 und x04 dürfen natürlich auch nicht von x1 und x2 abhängen,
es gilt also
α31 = α32 = α41 = α42 = 0
Die spezielle Lorentztransformation wird also durch eine Matrix der Form




As = 
47
1
0
0
0
0 0
0
1 0
0
0 α33 α34
0 α43 α44





(226)
Wir benutzen imaginäre Zahlen nur als formales Hilfsmittel. Daher meinen wir wirklich
‘orthogonal’ und nicht ‘unitär’.
121
beschrieben. Die allgemeine Lorentztransformation erhält man durch Kombination von (226) mit räumlichen Drehungen48 . Wegen dieses Zusammenhangs interessieren wir uns nur für die speziellen Lorentztransformationen. Dabei können
wir uns auf den zweidimensionalen Unterraum (x3 , x4 ) beschränken und die vereinfachte zweidimensionale(!) Anschrift
x03
x04
!
=A
!
x3
x4
mit A =
α33 α34
α43 α44
!
(227)
benutzen. Zur Bestimmung der vier Koeffizienten steht uns erstens die Aussage
zur Verfügung, daß sich der Koordinatenursprung von K0 mit der Geschwindigkeit
v längs der z–Achse bewegt, also
x03 = 0 f ür x3 = vt = −iβx4 .
Mit x03 = α33 x3 + α34 x4 [vgl. Gl. (227)] folgt daraus −α33 iβ + α34 = 0 oder
α34 = iβα33 .
(228)
Damit ist die Herleitung schon fast abgeschlossen, denn der Rest folgt einfach aus
den drei Orthogonalitätsbeziehungen
2
2
α33
+ α34
= 1
2
α43 + α44 = 1
α33 α43 + α34 α44 = 0 .
(229)
2
Aus Gl. (228) und der ersten Gl. (229) folgt sofort (1 − β 2 )α33
= 1, also
α33 = √
1
1 − β2
und α34 = √
iβ
.
1 − β2
Nach den beiden andern Gln. (229) ist der Zeilenvektor (α43 , α44 ) zum Vektor
(α33 , α34 ) orthogonal und hat den selben Betrag, bei richtiger Wahl des Vorzeichens gilt also
α43 = −α34 und α44 = α33 .
Damit ist die Matrix

A=

√1
1−β 2
−iβ
√
1−β 2
√ iβ
1−β 2
√1
1−β 2



(230)
der spezielle Lorentztransformation bereits eindeutig festgelegt.
48
Die allgemeine Form ist A = D2 As D1 . Dabei bezeichnet D1 eine räumliche Drehung in K
und D2 eine in K0 .
122
Die elegante mathematische Herleitung birgt die Gefahr in sich, daß der physikalische Hintergrund nicht mehr deutlich genug gesehen wird. Wir wollen deshalb
zusätzlich eine elementare Herleitung der Lorentztransformation anfügen, die
unmittelbar an unsere Grundprinzipien anknüpft, ohne explizit auf die lineare Algebra zurückzugreifen. Zur Stützung der Anschauung benutzen wir hierbei auch
die ursprünglichen Bezeichnungen und vermeiden imaginäre Größen. Wir suchen
also die Koeffizienten der Transformation
z 0 = Az + Bt ,
t0 = Cz + Dt
und benutzen dazu vier unabhängige Forderungen:
1. Wie oben spezifizieren wir die Bewegung des Koordinatenursprungs z 0 = 0
von K0 durch z = vt in K und erhalten entsprechend Gl. (228)
B = −Av .
2. Die Lichtgeschwindigkeit in positiver z–Richtung ist in beiden Koordinatensystemen gleich:
z = ct =⇒ z 0 = ct0 .
Mit den Transformationsgleichungen erhalten wir daraus
Ac + B = Cc2 + Dc .
3. Das selbe gilt für die negative z–Richtung:
z = −ct
=⇒
z 0 = −ct0 .
Wir finden entsprechend
Ac − B = −Cc2 + Dc .
Wir können nun die Beziehungen aus 2. und 3. addieren und subtrahieren und
erhalten
B
D = A und C = 2 .
c
Mit 1. nimmt dann unsere Transformation bereits die Gestalt
z 0 = (z − vt)A ,
t0 = (− cv2 z + t)A
an. Lediglich der Faktor A kann noch nicht festgelegt werden. Das ist auch
verständlich, da ein gemeinsamer Faktor in der Transformation von Ort und Zeit
die Lichtgeschwindigkeit nicht beeinflußt. Wir brauchen also noch eine vierte Bedingung, und die finden wir im
123
4. Relativitätsprinzip: K und K0 sind äquivalent, die Transformation zwischen
K und K0 muß abgesehen von dem Vorzeichen von v symmetrisch sein.
Lösen wir die Transformation nach z und t auf, erhalten wir
z=
1
(z 0 + vt0 )
v2
(1 − c2 )A
t=
Das Relativitätsprinzip verlangt also
1
( cv2 z 0 + t0 ).
v2
(1 − c2 )A
1
2
(1 − vc2 )A
A=
oder
A= q
1
1−
v2
c2
.
Auf diese Weise sehen wir ohne Anleihen bei der linearen Algebra, daß die grundlegenden Postulate, welche die Erfahrungen entsprechender Experimente zusammenfassen, notwendig auf die Transformationsgleichungen
0
z =
z − vt
q
1−
v2
c2
0
,
− cv2 z + t
t = q
1−
v2
c2
(231)
mit den Umkehrungen
v
z 0 + vt0
z=q
,
2
1 − vc2
c2
t= q
z 0 + t0
1−
v2
c2
(232)
führen. Man überzeugt sich leicht, daß die Transformation (231) mit den Gln.
(227) und (230) übereinstimmt.
5.4
Die Zeitdilatation
Für unsere Anschauung bleibt es eine äußerst befremdliche Eigenschaft der Lorentztransformation, daß wir keine universelle Zeit einführen können, sondern
die Zeiten t und t0 unterscheiden müssen. Gleichzeitige Ereignisse an verschiedenen Orten in K sind in K0 nicht mehr gleichzeitig, und umgekehrt. Die Uhren in K
und in K0 gehen außerdem verschieden schnell. Und welche geht dabei schneller?
Eine Uhr bei z = z0 in K gebe die Zeitsignale t1 und t2 . Dann erscheint das
Zeitintervall
t2 − t 1
t02 − t01 = √
1 − β2
(233)
√
in K0 um den Faktor 1/ 1 − β 2 gegenüber dem Zeitintervall t2 − t1 in K gedehnt.
124
Wir wollen das formale Ergebnis direkt auf die Konstanz der Lichtgeschwindigkeit
zurückführen. Zur Zeit t1 = 0 werde in K am Ort z0 = 0 ein Lichtblitz in y–
Richtung ausgesandt, an einem Spiegel Sy im Abstand ly reflektiert und zur Zeit
t2 = 2ly /c wieder am Ort z = 0 empfangen. Ein Beobachter in K0 registriert
das Aussenden des Lichtblitzes am Ort z10 = 0 zur Zeit t01 = 0. Er empfängt das
reflektierte Licht aber an einem anderen Ort z20 = −vt02 (siehe Skizze).
y
ly
0
y
K
Sy
ly
z
0
0
K’
Sy
z’
−vt’2
0
In K0 hat das Licht also nicht den Weg 2ly , sondern den längeren Weg
q
2 ly2 + ( 12 vt02 )2
zurückgelegt und dafür eine längere Zeit gebraucht. Die Auswertung können wir
direkt vom Lichtweg cty im Michelson–Experiment (S. 118) übernehmen, wir
erhalten Gl. (233).
Ein Beobachter in K0 stellt also fest, daß die Uhren in K nachgehen. Woher kommt
diese Unsymmetrie? Kann ich nun doch zwischen ’ruhenden’ und ’bewegten’ Koordinatensystemen unterscheiden? Ist etwa dasjenige System absolut ruhend, in
dem die Uhren am allerlangsamsten gehen?
Natürlich nicht! Das Ergebnis ist inhaltlich auch gar nicht unsymmetrisch, denn
ein Beobachter in K wird genauso feststellen, daß die Uhren in K0 nachgehen!
Die formale Unsymmetrie wird ausschließlich durch unsymmetrische Beobachtungsbedingungen erzeugt. Wir haben oben nämlich eine Uhr an einem bestimmten Ort in K mit zwei synchronisierten Uhren an verschiedenen Orten in K0 verglichen. Langsamer geht also immer die eine Uhr, die in ihrem Koordinatensystem
ruht.
Eine natürliche Uhr, die das illustriert, finden wir in den Myonen, welche die
kosmische Strahlung am Rand der Atmosphäre, also in etwa 10 km Höhe bildet.
Während seiner typischen Lebensdauer von τµ = 2.2 · 10−6 s kann ein Myon
nämlich höchstens die Strecke cτµ = 660 m zurücklegen. Wenn wir an der Erdoberfläche trotzdem solche Myonen finden, so bedeutet das, daß unsere Uhren
schneller gehen als die innere Uhr des Myons. Denn zwischen der Erzeugung des
125
Myons und seinem Nachweis vergeht auf der schnellebigen Erde eine Zeit von
etwa 15τµ . Man beachte hier wieder die Unsymmetrie einer Uhr (τµ ) im System
des Myons und zweier räumlich getrennter Uhren (Erzeugung und Nachweis) auf
der Erde.
Von der ruhenden Erde aus gesehen kann ein schnelles Myon also ein biblisches
Alter von mehr als 15τµ erreichen. Und von diesem Gedanken aus ist nur noch
ein kurzer Schritt zum Zwillingsparadoxon.
Der Zwilling, der seinen Bruder im schnellen Raumschiff ins All geschickt hat,
findet nämlich, daß dessen Uhr, Herzschlag, Gedanken, Gefühle und schließlich
der gesamte Alterungprozeß verlangsamt ablaufen. Ein leicht vergessener Haken
hierbei ist allerding zunächst, daß der Zwilling im Raumschiff das selbe über
seinen Bruder auf der Erde feststellt. Zum Paradoxon wird diese Science fiction
story erst, wenn der jugendliche Raumfahrer zur Erde zurückkeht und nun im
selben Bezugssystem seinem greisen Bruder gegenübersteht. Die Äquivalenz der
beiden Systeme ist nun durch die Umkehr des Raumschiffes aufgehoben.
5.5
Die Lorentzkontraktion
Im Bezugssystem K seien zwei Meilensteine bei z1 und z2 aufgestellt. Diese Meilensteine werden nun von K0 aus zu einer Zeit t0 vermessen. Da wir beide Meilensteine zur gleichen Zeit t0 (und nicht t !) beobachten, gehen wir von der Umkehr transformation (232) aus und erhalten den Zusammenhang
z20 − z10 =
q
1 − β 2 (z2 − z1 ) .
(234)
√
Wegstrecken und Maßstäbe in K erscheinen also in K0 um den Faktor 1 − β 2
verkürzt. Man nennt diesen Effekt Lorentzkontraktion oder Lorentz–Fitzgeraldsche Längenkontraktion.
Wir brauchen kaum noch zu erläutern, daß wir wieder nur eine scheinbare Unsymmetrie zwischen K und K0 haben. Ein in K0 ruhender Maßstab erscheint von
K aus gemessen genau so verkürzt, wie der in K ruhende von K0 aus. Formal
haben wir eine Unsymmetrie durch die Forderung der Gleichzeitigkeit t01 = t02 in
K0 erzeugt.
In Wirklichkeit ist immer nur dasjenige System ausgezeichnet, in dem der Maßstab ruht. In diesem System ist der Maßstab länger als in allen anderen Systemen.
Entsprechend war bei der Zeitdilatation dasjenige Koordinatensystem ausgezeichnet, in dem die beobachtete Uhr ruht: In diesem System geht die Uhr langsamer
als in allen andern Koordinatensystemen.
Nun sind Raum und Zeit als Komponenten einer zusammengehörigen Raum–
Zeit im Minkowskiraum im wesentlichen gleichberechtigt, und auch die Lor126
entztransformation spiegelt die wesentliche Symmetrie von Raum und Zeit wider. Woher kommt denn dann die Unsymmetrie einer Zeitdehnung und einer Längenkontraktion, wenn man das durch die Versuchsbedingungen ausgezeichnete
Eigensystem, in dem Uhr und Maßstab ruhen, verläßt?
Diese Unsymmetrie zwischen Raum und Zeit ist in der unsymmetrischen Meßvorschrift begründet:
• Bei der Zeitdilatation messen wir zwei Zeitmarken einer Uhr, die in K
lokalisiert ist. Die beiden Zeitmessungen in K0 erfolgen also bei gleichen
Ortskoordinaten in K.
• Bei der Lorentzkontraktion führen wir dagegen die beiden Ortsmessungen
in K0 gleichzeitig, d.h. bei gleichen Zeitkoordinaten in K0 aus.
Tatsächlich besteht ein enger innerer Zusammenhang zwischen der Lorentzkontraktion und der Zeitdilation, wie man sofort an einer Uminterpretation der
Myonenbeobachtung aus dem vorigen Abschnitt erkennt: Der Abstand zwischen
dem Erzeugungsort (Atmosphärenrand) und dem Nachweisort (Erdoberfläche)
definiert einen Maßstab, der im System der Erde ruht. Vom System eines schnellen
Myons aus gesehen erscheint dieser Abstand (∼ 10 km) so verkürzt (< 660 m),
daß es ihn während seiner kurzen Lebensdauer τµ durchlaufen kann.
Aufgrund der Lorentzkontraktion erwartet man typische Verzerrungen der Gestalt schnell bewegter Objekte auf der Photoplatte oder auf der Netzhaut. Denn
gerade der Verschluß des Fotoapparats demonstriert uns anschaulich die Bedingung der Gleichzeitigkeit in K0 . Natürlich ist eine experimentelle Überprüfung
wegen der Kleinheit des Effekts bei realistischen Fotoobjekten nicht möglich.
Darum war die Menschheit in dieser Frage auch lange einem Irrtum erlegen. In
Wirklichkeit machen nämlich konkurrierende Laufzeiteffekte des Lichts die Lorentzkontraktion (lokal) unsichtbar !
Wir zeigen das beispielhaft an einem achsenparallelen Würfel (in der Skizze durch
das Quadrat ABCD repräsentiert), der sich mit der Geschwindigkeit v in z–
Richtung bewegt, und durch ein paralleles Lichtbündel auf eine Fotoplatte in
der xy-Ebene abgebildet wird (siehe Skizze auf der folgenden Seite). Das Bild
A0 B0 der Grundseite AB erscheint zwar auf der Photoplatte wegen der Lorentzkontraktion mit der verkürzten Länge
q
l2 = l 1 − β 2 .
Wegen der Endlichkeit der Lichtgeschwindigkeit erreicht aber zum gleichen Zeitpunkt auch noch Licht die Photoplatte, das zu früheren Zeitpunkten von Punkten
der Seite DA ausgesandt wurde. Das Bild D0 A0 dieser Seite hat die Länge
l1 =
vl
= βl .
c
127
D
C
D
C
C
D
B
l
α
l
v
l
A
A’
l
A
B
l
A
B’
l1
D’
α
B
l2
A’
B’
D’
l1
l2
A’
B’
Auf dem Bild sieht man folglich ein unverzerrtes Quadrat der unveränderten
Seitenlänge l, das aufgrund der Lorentzkontraktion und der endlichen Laufzeit
des Lichts um einen Winkel α mit
sin α = β
gedreht erscheint. Entsprechende Verhältnisse findet man bei parallelen Lichtbündeln (kleinen Raumwinkeln) für alle Beobachtungsrichtungen. Da der Drehwinkel
jedoch von der Richtung abhängt, erscheinen größere Objekte verbogen.
5.6
Die Gruppeneigenschaft der Lorentztransformation
Wir gehen mit einer Lorentztransformation
x03
x04
!
x3
x4
=A
!
mit A = q
1
1 − β12
1
iβ1
−iβ1 1
!
von einem Koordinatensystem K zu einem System K0 und von da aus mit einer
zweiten Lorentztransformation
x003
x004
!
x03
x04
=B
!
mit B = q
1
1 − β22
1
iβ2
−iβ2 1
!
zu einem Kordinatensystem K00 über. Wie sieht dann die Gesamttransformation
x003
x004
!
=C
x3
x4
!
mit C = BA
aus? Zur Beantwortung dieser Frage rechnen wir
BA = AB = q
1
(1 − β12 )(1 − β22 )
128
1 + β 1 β2
i(β1 + β2 )
−i(β1 + β2 ) 1 + β1 β2
!
1
1 + β 1 β2
= q
1 − β12 − β22 + β12 β22
= q
(1 + β1 β2 )2 − 2β1 β2 − β12 − β22
= q
(1 + β1 β2 )2 − (β1 + β2 )2
= q
β1 +β2
−i 1+β
1 β2
1 + β 1 β2
1 + β 1 β2
1
(1 − β 2
1 iβ
−iβ 1
!
β1 +β2
i 1+β
1 β2
1
!
1 iβ
−iβ 1
1 iβ
−iβ 1
mit β =
!
!
β1 + β 2
.
1 + β 1 β2
Die Hintereinderausführung zweier spezieller Lorentztransformationen mit β1 =
v1 /c und β2 = v2 /c ergibt also wieder eine Lorentztransformation mit
β=
β1 + β 2
1 + β 1 β2
oder v = βc =
v1 + v 2
.
1 + v1c2v2
(235)
Die Lorentztransformationen bilden also eine em Gruppe49 . Dieses Ergebnis
ist nicht überraschend. Physikalisch hätten wir es eigentlich sofort aus dem Relativitätsprinzip postulieren können, und mathematisch lassen sich sich die Lorentztransformationen der x3 –x4 –Ebene eineindeutig auf die Drehungen in der
Ebene abbilden, die ebenfalls eine Gruppe bilden.
Wichtiger als die Feststellung, daß die Hintereinanderausführung von Lorentztransformationen wieder eine Lorentztransformation ergibt, ist für uns die Aussage, wie wir die Gesamttransformation erhalten. Die Vorschrift (235), nach der
die Gesamtgeschwindigkeit v zu bilden ist, nennt man das Einsteinsche Additionstheorem der Geschwindigkeiten.
Die Tatsache, daß sich Geschwindigkeiten nicht einfach additiv zusammensetzen,
kann uns nach der Relativierung von Raum und Zeit kaum noch überraschen.
Das additive Gesetz unserer Alltagserfahrung ergibt sich lediglich im Grenzfall
v1/c, v2/c → 0, sonst gilt für v1 , v2 > 0 immer v < v1 + v2 .
Eine wichtige Konsequenz von Gl. (235) ist die prinzipielle Unmöglichkeit, durch
Addition von Geschwindigkeiten v1 < c und v2 < c Überlichtgeschwindigkeiten
v > c zu erhalten. Denn für 0 < β1 < 1 und 0 < β2 < 1 folgt
1 + β1 β2 = (1 − β1 )(1 − β2 ) + β1 + β2 > β1 + β2 ,
also
β < 1.
49
Hierzu muß außerdem das Assoziationsgesetz, das Einselement und die Umkehrtransformation nachgewiesen werden. Die Ausführung spezieller Lorentztransformationen ist nach der
obigen Rechnung sogar kommutativ, sie bilden also eine abelsche Gruppe.
129
Für v2 = c wird v = c unabhängig von v1 . Dies zeigt noch einmal die Lorentzinvarianz der Lichtgeschwindigkeit.
Wir kommen noch einmal darauf zurück, daß wir eine Transformationsmatrix

A=

√1
1−β 2
√−iβ
1−β 2
√ iβ
1−β 2
√1
1−β 2



als Drehung in der Ebene auffassen können. Der Drehwinkel ϕ = iϑ ist dabei allerdings imaginär. Wir können dem Rechnung tragen, indem wir die von Drehungen
in der Ebene vertrauten Kreisfunktionen durch Hyperbelfunktionen ersetzen. Mit
β=
v
= tanh ϑ
c
folgt dann
A=
cosh ϑ i sinh ϑ
−i sinh ϑ cosh ϑ
!
.
Das Additionstheorem (235) entspricht der Additionsformel
tanh (ϑ1 + ϑ2 ) =
tanh ϑ1 + tanh ϑ2
1 + tanh ϑ1 tanh ϑ2
des Hyperbeltangens und zeigt, daß die Hintereinanderausführung zweier Transformationen mit ϑ1 und ϑ2 einer Gesamttransformation mit ϑ = ϑ1 +ϑ2 entspricht.
Damit wird auch die Unerreichbarkeit der Lichtgeschwindigkeit noch einmal illustriert (siehe Skizze).
c
v
ϑ
v2
ϑ2
v1
ϑ1
ϑ1
c tanh ϑ
0
5.7
0
1
ϑ
2
Kovariante Formulierung einer Theorie
Das Relativitätsprinzip verlangt, daß Naturgesetze Lorentz–invariant sind, daß
sie also in gleicher Form in K und in K0 gelten, wenn K und K0 durch eine
Lorentztransformation verknüpft sind. Wie stellen wir die Lorentzinvarianz
sicher?
130
Der Vierervektor
x = (xν ) = (x, y, z, ict)
transformiert sich bei einer Lorentztransformation gemäß der Beziehung
x0 = Ax oder x0ν =
X
aνµ xµ ,
µ
wobei die Matrix A = (aνµ ) eine Drehung des Minkowskiraums beschreibt. Alle
andern Vektoren y = (yν ) des Minkowskiraums transformieren sich daher nach
dem selben Schema
X
aνµ yµ ,
y0 = Ay oder yν0 =
µ
ihre Koeffizienten yν ändern sich kovariant mit den Koeefizienten xν . Da die
Lorentztransformationen A orthogonal sind, lassen sie Skalarprodukte50 zwischen den Vektoren des Minkowskiraums invariant.
Wir brauchen uns um die Lorentzinvarianz eines physikalischen Gesetzes also
gar nicht mehr zu kümmern, wenn wir es konsistent als Beziehung
a=b
zwischen Vektoren a = (aν ) und b = (bν ) oder als Beziehung
a=b
zwischen Skalaren a und b des Minkowskiraums formulieren. Die entsprechende
Feststellung für Vektoren und Skalare im dreidimensionalen Euklidischen Raum
erscheint uns so selbstverstänlich, daß wir sie nie explizit erwähnt haben. Newtons Lex secunda ṗ = F und der Energiesatz E = const beispielsweise gelten
unabhängig von der Orientierung des Koordinatensystems. (Beachte dabei aber,
daß eine Vektorkomponente, etwa Fz , kein Skalar ist!)
Eine solche konsistente Formulierung heißt kovariant, ihre Elemente51 nennen
wir Vierer–Vektoren und Vierer–Skalare oder Lorentz–Skalare. Nicht kovariant ist also z.B. eine Beziehung a3 = b zwischen einer Vektorkomponente und
einem Skalar, denn der Skalar bleibt bei einer Lorentztransformation invariant,
während die Vektorkomponente sich ändert.
Nun ist natürlich nicht jedes Schema von vier Zahlen (z.B. [Länge, Breite, Höhe,
Gewicht]) ein Vektor des Minkowskiraums, und — was für uns besonders wichtig ist — nicht jeder Vektor des R3 läßt sich zu einem Vierer–Vektor ergänzen.
Vektorbeziehungen im R3 müssen vor einer vierdimensionalen Ergänzung also im
allgemeinen abgeändert werden.
50
Wir erinnern an Fußnote 47, S. 121. Skalarprodukte sind also ebenfalls ohne komplexe
Konjugation zu verstehen!
51
Eine Verallgemeinerung auf Vierer–Tensoren sparen wir uns hier. Neben der hier bevorzugten Terminologie werden auch die Bezeichnung Welt–Vektoren und Welt–Skalare verwendet.
131
Wie finde ich dann Vierer–Vektoren?
Erstens, indem ich von bekannten Vierer–Vektoren a, b, . . . ausgehe und mich
überzeuge, daß damit auch
a ± b und ca
Vierer–Vektoren sind, wenn nur c einen Skalar ist. Und Skalare sind neben reinen Zahlwerten und physikalischen Konstanten (Lichtgeschwindigkeit, Ladung,
(Ruh–)Masse usw.) insbesondere die Skalarprodukte
a·b=
4
X
a ν bν
ν=1
von Vierer–Vektoren.
Die zweite Möglichkeit besteht darin, eine als Lorentz–invariant erkannte (oder
postulierte) Größe a als Skalarprodukt mit einem bereits bekannten Vierervektor zu deuten. Hiervon wird insbesondere bei der kovarianten Formulierung der
Elektrodynamik Gebrauch gemacht52 .
Wir nutzen hier die erste Möglichkeit und gehen von dem Vierer–Ortsvektor
x = (x, y, z, ict)
aus, der uns ein Punkt–Ereignis (Ort, Zeitpunkt) im Minkowskiraum lokalisiert.
Als ersten neuen Vierer–Vektor bilden wir den Differenzvektor
d = x 2 − x1 ,
der den Abstand zweier Punktereignisse x1 und x2 im Minkowskiraum repräsentiert.
Sein Abstandsquadrat
2
d =
3
X
i=1
2
(x2i − x1i )2 − c2 (t2 − t1 )2 = r12
− c2 (t2 − t1 )2
kann kleiner oder größer als Null sein, je nachdem die räumliche Distanz r12 in
der Zeitspanne |t2 − t1 | durch Licht überbrückt werden kann oder nicht, oder —
salopp ausgedrückt — je nachdem die zeitliche oder räumliche Distanz überwiegt.
Finden die Ereignisse x1 und x2 insbesondere am selben Ort statt, so wird
d2 = −c2 (t2 − t1 )2 < 0,
52
Ein Beispiel: Der Vierer–Vektor (Aν ) = (Ax , Ay , Az , iϕ/c) wird eingeführt, indem man die
als Lorentz–invariant
postulierte Lorentzeichung div A + c−2 ∂ϕ/∂t = 0 über das SkalarproP
dukt
∂Aν /∂xν mit dem Vierer–Vektor ∇4 = (d/dxν ) deutet.
132
der Abstand ist “zeitartig”. Finden sie dagegen zur gleichen Zeit statt, so ist der
Abstand “raumartig” und es gilt
2
d2 = r12
> 0.
Wir verallgemeinern die Begriffe und nennen
• Vierervektoren mit negativem Betragsquadrat zeitartig und
• Vierervektoren mit positivem Betragsquadrat raumartig.
Man kann durch eine räumliche Drehung im R3 stets erreichen, daß der räumliche
Anteil des Abstandes in x3 = z–Richtung fällt. Mit Gl. (231) lassen sich dann die
folgenden beiden Aussagen leicht beweisen: Ist der Abstand d = x2 − x1 zweier
Punktereignisse x1 und x2
• zeitartig, so läßt sich immer eine Lorentztransformation mit v < c in ein
Koordinatensystem K0 angeben, in dem die beiden Ereignisse am gleichen
Ort stattfinden.
• raumartig, so läßt sich immer eine Lorentztransformation mit v < c in
ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse gleichzeitig
stattfinden.
Der Minkowskiraum wird durch den Lichtkegel (seine Projektion auf den R3
ist die Lichtkugel)
r 2 = c 2 t2
in zeit– und raumartige Gebiete geteilt (siehe Skizze). Dabei ist wichtig, daß all
diese Begriffe wegen der Definition über ein Skalarprodukt Lorentz–invariant
sind.
ct
l
Li
e
eg
ch
tk
tk
ch
eg
e
l
Li
Zukunft
zeitartig
Gegenwart
Gegenwart
raumartig
raumartig
Vergangenheit
zeitartig
133
z
Die Gegenwart wird im Minkowskiraum durch die Hyperebene t = 0 (also durch
die z–Achse in der Skizze) repräsentiert. Da sich alle raumartigen Vektoren so
transformieren lassen, daß die Zeitkomponente t0 = 0 wird, ist es sinnvoll, den
gesamten raumartigen Bereich als Gegenwart zu bezeichnen. Die Gegenwart
teilt den zeitartigen Bereich in die Zukunft und in die Vergangenheit. Hängt das
Ereignis 2 kausal von Ereignis 1 ab, so liegt x2 von x1 aus gesehen in der Zukunft.
Der Abstand x2 − x1 ist also zeitartig und es gilt (in allen Koordinatensystemen)
t2 > t 1 .
Wir betrachten nun insbesondere Punktereignisse, die zur Bahn eines Teilchens im
Minkowskiraum gehören. Ihr Abstand ist wegen v < c auf jeden Fall zeitartig,
und wir benutzen ihn, um das Lorentz–invariante Differential dτ der Eigenzeit
zu definieren:
2
2
c dτ = −
4
X
ν=1
2
2
3
X
2
(dxν ) = c dt −
oder
dτ =
i=1
q
(dxi )2 = (c2 − v 2 )dt2
1 − β 2 dt .
(236)
Offenbar ist die Eigenzeit τ die Zeit, welche in einem System abläuft, in dem
das Teilchen (momentan) ruht (β = 0). Sie verläuft langsamer als die Zeit in
jedem andern Kordinatensystem. Wir können hier unmittelbar an die Diskussionen im Abschnitt 5.5 anknüpfen: Die Eigenzeit τ ist ein Maß für die Zahl der
Herzschläge des Raumfahrers im Zwillingsparadoxon, und sie mißt die myonische
Lebenserwartung τµ im System des Myons. In der Anschrift
dt = √
dτ
1 − β2
sehen wir auch unmittelbar die Zeitdilatation, mit der ein äußerer (also gegenüber
dem Teilchen bewegter !) Beobachter die innere Uhr des Teilchens registriert.
Da das Differential dτ der Eigenzeit Lorentz–invariant ist, wäre es verlockend,
hiervon ausgehend eine Weltzeit τ zu definieren. Das ist aber nicht möglich, da
die im System gemessene Zeitspanne
∆τ =
Z
dτ
Weg
nach Ausweis des Zwillingparadoxonsnicht wegunabhängig ist.
Aus dem Vierer–Vektor x und dem Lorentz–Skalar dτ können wir den Vektor
der Vierer–Geschwindigkeit
u=
dx
dτ
oder
uν =
134
dxν
1
dxν
=√
dτ
1 − β 2 dt
(237)
bilden. Aus der expliziten Anschrift
ui = √
vi
(i = 1, 2, 3)
1 − β2
und
u4 = √
ic
1 − β2
(238)
lesen wir erstens ab, daß seine räumlichen Komponenten für β → 0 in die gewöhnlichen Geschwindigkeiten53 vi übergehen, während als vierte Komponente
die Lichtgeschwindigkeit c erscheint. Zweitens finden wir, daß sein Betragsquadrat
X
ν
u2ν =
c2
v2
−
= −c2
1 − β2 1 − β2
(239)
konstant und negativ ist. u ist also ein zeitartiger Vierer–Vektor.
Schließlich liegt es noch nahe, durch Multiplikation mit der Masse m0 den Vierer–
Impuls
p = m0 u oder pν = m0 uν
(240)
mit den expliziten Koeffizienten
m0 v i
pi = √
= mr vi (i = 1, 2, 3)
1 − β2
und
im0 c
p4 = √
= imr c
1 − β2
(241)
zu bilden. Durch die Einführung der “relativistischen Masse”
mr = √
m0
1 − β2
(242)
wird diese Beziehung besonders suggestiv. Um Verwechslungen auszuschließen,
haben wir die Lorentz-invariante Masse m0 mit dem Index 0 versehen und
bezeichnen sie als Ruhmasse.
Im Gegensatz zu m0 wächst mr also mit der Geschwindigkeit und hängt damit
vom Bezugssystem ab. Über die Frage, ob die Ruhmasse oder die relativistische
Masse54 als die eigentliche Masse m angesehen werden soll, ist gelegentlich mit
Eifer gestritten worden. Während die Unabhängigkeit vom Bezugssystem für m0
spricht, liefert der folgende Abschnitt auch starke Argumente für mr . Wir sehen in
dem Problem letztlich eine Geschmacksfrage und vermeiden die mißverständliche
Bezeichnung m ohne Index 0 oder r.
Damit haben wir die Elemente zusammengetragen, die wir für eine relativistische
Korrektur der klassischen Mechanik benötigen.
53
Beachte: v selbst läßt sich für β 6= 0 nicht zu einem Vierer–Vektor ergänzen!
In älteren Darstellungen findet man daneben auch noch longitudinale und transversale
Massen, vgl. Gl. (258) und Fußnote 55 auf S. 141.
54
135
5.8
Relativistische Mechanik
Daß die drei Komponenten der Vektoren ṗ = m0 v̇ und F aus Newtons Lex
secunda
dpi
= Fi
dt
(243)
sich nicht zu einem Vierer–Vektor ergänzen lassen, wissen wir bereits. Denn die
Lex secunda ist Galilei– und nicht Lorentz–invariant. Wir haben aber bereits
den kovarianten Vierer–Impuls p eingeführt [Gln. (240, 241)]. Seine Ableitung
nach der Lorentz–invarianten Eigenzeit τ ist wieder ein Vierervektor. In Anlehnung an die Lex secunda bezeichnen wir diesen Vierer–Vektor als Minkowski–
Kraft
K=
dp
dτ
oder Kν =
dpν
.
dτ
(244)
Wie hängen nun die räumlichen Komponenten Ki mit den Newtonschen Kraftkomponenten Fi zusammen?
Um das zu entscheiden, brauchen wir eine kovariante Formulierung der Kraft. Die
steht zwar eigentlich nur für elektromagnetische Kräfte zur Verfügung, man kann
jedoch argumentieren, daß andere Kräfte sich ebenso transformieren müssen wie
elektromagnetische. Denn der Begriff des Gleichgewichts muß Lorentz–invariant
sein.
Wir verzichten hier auf diese Anleihe bei der kovarianten Elektrodynamik, verlassen uns auf die “prophetische Sicherheit” der Newtonschon Formulierung
(Sommerfeld, vgl. S. 3) und definieren die Newtonsche Kraft F durch Gl. (243).
Allerdings soll dabei pi nicht m0 vi , sondern im Einklang mit den Gln. (241) und
(244) die räumlichen Komponenten
m0 v i
pi = m r vi = √
1 − β2
√
des Viererimpulses bezeichnen. Wegen dτ = 1 − β 2 dt folgt so der Zusammenhang
Ki = √
Fi
(i = 1, 2, 3) ,
1 − β2
(245)
der natürlich mit der elektrodynamischen Formulierung übereinstimmt.
Wir könnten nun an dieser Stelle das ganze Raum–Zeit–Gefüge der Speziellen
Relativitätstheorie vergessen, den Minkowskiraum verlassen und als einzige relativistische Korrektur die veränderliche Masse mr in Newtons Lex secunda
136
aufnehmen:
d
(mr vi ) = Fi .
dt
(246)
So werden wir im nächsten Abschnitt verfahren.
Im Augenblick bleiben wir jedoch noch im Minkowskiraum und fragen nach der
vierten Komponente der Minkowski–Kraft. Dazu bilden wir nach Gln. (240) und
(244)
du
m0 d 2
K · u = m0 u ·
=
u = 0,
dτ
2 dτ
denn u2 ist nach Gl. (239) konstant. Die Minkowski–Kraft steht also stets senkrecht auf der Vierer–Geschwindigkeit. Damit läßt sich die Komponente K4 aus
K1 , K2 , K3 berechnen, denn aus
X
ν
3
X
1
√
Kν uν =
Ki vi + icK4 = 0
1 − β 2 i=1
!
folgt wegen Gl. (245)
i F·v
K4 = √
.
c 1 − β2
(247)
K4 hängt also eng mit der von der Kraft F je Zeiteinheit geleisteten Arbeit F · v
zusammen. Sehen wir uns dazu die vierte Komponente der “Bewegungsgleichung”
(244) an [vgl. auch (241)]:
dmr
dp4
i F·v
√
=
ic
.
=
K
=
4
c 1 − β2
dτ
dτ
Mit dτ =
√
1 − β 2 dt folgt also
d
mr c 2 = F · v .
dt
Der Zusammenhang
dA = F · vdt = dT
zwischen der durch die Kraft F geleisteten Arbeit dA und der Zunahme dT der
kinetischen Energie zwingt uns also, den Ausdruck
m0 c 2
T = m r c2 = √
1 − β2
(248)
— abgesehen von einer zunächst bedeutungslosen additiven Konstanten — als die
relativistische kinetische Energie anzusehen. Durch Entwicklung der Wurzel
folgt
137
T → m0 c
2
β2
1+
2
!
1
= m 0 c 2 + m0 v 2
2
(β → 0) .
(249)
Damit ist der Zusammenhang mit der nicht-relativistischen Energie T = m0 v 2 /2
hergestellt. Die willkürlich erscheinende additive Konstante
E0 = m 0 c2 ,
(250)
die Ruhenergie des Teilchens, ziehen wir nicht ab, weil T nur mit dieser Konstanten als vierte Komponente des Vierer-Impulses [vgl. Gl. (241)] angesehen
werden kann:
m0 v i
= mr vi (i = 1, 2, 3)
pi = √
1 − β2
und
i
p4 = T .
c
(251)
Der Vierer–Vektor p wird darum auch als Energie–Impuls–Vektor bezeichnet.
Wegen p = m0 u ist sein Betragsquadrat konstant und es gilt [vgl. Gl. (239)]
p2 = −m20 c2 =
X
i
p2i −
T2
.
c2
Daraus folgt die häufig benutzte relativistische Beziehung
2
T =
m20 c4
+c
2
3
X
p2i
(252)
i=1
zwischen kinetischer Energie und Impuls.
Die Bewegungsgleichungen (244) im Minkowskiraum lassen sich mit den Gln.
(245), (247) und (251) in der klassischen Form
dpi
= Fi
dt
und
dT
=F·v
dt
(253)
schreiben, der man ihren relativistischen Hintergrund gar nicht mehr ansieht.
Speziell für die kräftefreie Bewegung mit F = 0 folgt auch wieder, daß sowohl
p als auch T konstant sind. Im Gegensatz zur nicht–relativistischen Mechanik
ist nun aber T keine sekundäre, abgeleitete Größe mehr, sondern der Impuls p
und die kinetische Energie T gehören nun a priori zu einem einheitlichen Ganzen
zusammen. Das hat für Systeme mit inneren Freiheitsgraden Konsequenzen von
fundamentaler Bedeutung:
Während es in der nicht–relativistischen Mechanik — etwa bei inelastischen Stoßprozessen — sehr wohl Situationen gibt, in denen der Impuls, nicht aber die kinetische Energie erhalten bleibt, verlangt die Lorentz–invarianz nach Ausweis der
138
kovarianten Formulierung, daß bei Impulserhaltung auch die kinetische Energie
T = mr c2 erhalten bleibt. Das ist in voller Allgemeinheit offenbar nur möglich,
wenn die Masse m0 nicht generell konstant ist, sondern über die berühmte Einsteinsche Beziehung
∆E = ∆m0 c2
(254)
mit einer eventuellen Änderung ∆E der inneren Energie verknüpft ist. Betrachten
wir etwa den Zerfallsprozeß eines ruhenden Teilchens der Masse m0 , so haben wir
vor bzw. nach dem Zerfall die kinetische Energien
T0 = m 0 c 2
bzw. T1 =
X
mir c2 =
X
(mi0 c2 + i ),
wenn mi0 die Massen und i die Bewegungsenergien der Zerfallsprodukte bezeichnet. Da wegen der Impulserhatung aber T1 = T0 gelten muß, folgt
m0 =
X
mi0 + ∆E/c2 ,
wobei der “Massendefekt” ∆E/c2 der Änderung ∆E =
entspricht.
P
i der inneren Energie
Für unsere alltägliche Erfahrung ist diese Massenänderung allerdings nicht sehr
groß: Das Äquivalent einer Kilowattstunde beträgt
∆m(1kWh) =
3.6 · 106 Ws
= 0.4 · 10−10 kg = 4 · 10−8 g ,
9 · 1016 m2 /s2
oder anders ausgedrckt: Der Preis von 16 ct für Energie aus der Steckdose entspricht einem Preis von 4 Mio. EUR für 1g Materie!
Als Einstein im Jahr 1905 die Äquivalenz von Masse und Energie formulierte,
war es noch nicht möglich, diese fundamentale Aussage experimentell zu überprüfen. Heute ist die Bestätigung bekanntlich keine Frage mehr.
5.9
Die relativistische Bewegungsgleichung
Wie bereits angkündigt, verlassen wir nun den Minkowskiraum und wenden uns
den praktischen Problemen der relativistischen Bewegungsgleichung [vgl. (246)]
d
m0
mr v = F mit mr = q
dt
1−
v2
c2
(255)
zu. Der einzige Unterschied zur nicht–relativistischen Mechanik zeigt sich also
darin, daß sich die zeitliche Ableitung auch auf die veränderliche Masse mr erstreckt. Die Auswirkung demonstrieren wir an einem einfachen Beispiel:
139
Wir berechnen die Bewegung z(t) eines zur Zeit t = 0 ruhenden Elektrons in
einem konstanten elektrischen Feld E = Eez . Die Bewegungsgleichung
d m0 v
√
= eE
dt 1 − β 2
läßt sich sofort einmal integrieren:
√
m0 v
= eEt .
1 − β2
Wenn wir nach v auflösen, erhalten wir
v=q
ceEt
m20 c2 + e2 E 2 t2
=q
cvnr
mit vnr =
2
c2 + vnr
e
Et .
m0
(256)
Für kleine Zeiten eEt/m0 c folgt also wie erwartet das nicht–relativistische
Ergebnis v → vnr . Im Gegensatz zu vnr bleibt v aber immer kleiner als c und
strebt für große Zeiten gegen c. Wenn wir Gl. (256) in der Form
c dq 2 2
dz
=
m 0 c + e 2 E 2 t2
dt
eE dt
schreiben, können wir sogleich nochmals integrieren und erhalten
s
m0 c 2
z=
eE
!
e 2 E 2 t2
1+
−1 .
m20 c2
Auch hier läßt sich das Grenzverhalten z →
große Zeiten wieder leicht interpretieren.
1 eE 2
t
2 m0
für kleine bzw. z → ct für
Wenn wir das Ergebnis in der Form
s
eEz + m0 c2 = m0 c2 1 +
2
vnr
c2
schreiben und Gl. (256) nach
1+
2
vnr
1
=
.
2
c
1 − v 2 /c2
umformen, sehen wir, daß die Bewegung den Energiesatz
erfüllt.
m c2
√ 0 2 − eEz = T + V = m0 c2 = const
1−β
140
(257)
In diesem einfachen Beispiel haben wir eine eindimensionale Bewegung betrachtet. Allgemein erhalten wir aus Gl. (255)
m0
v · v̇
m0 v · v̇
v= √
v
v̇ + 2
F = mr v̇ +
v 2 3/2
2
c (1 − β 2 )
1−β
(1 − c2 )
!
.
F und v̇ haben also im allgemeinen nicht mehr die selbe Richtung55 . Für die
Komponenten parallel (k) und senkrecht (⊥) zu v erhalten wir
m0
v̇k = Fk
(1 − β 2 )3/2
√
und
m0
v̇⊥ = F⊥ .
1 − β2
(258)
[Zur Vertiefung unseres Verständnisses wollen wir Gl. (258) aus der unterschiedlichen
Sicht verschiedener Koordinatensysteme interpretieren. K 0 sei das Koordinatensystem,
in dem das Teilchen momentan ruht. Die Beschleunigung wird in K 0 also durch Newtons Lex secunda
dvk0
dv 0
m0 0 = Fk0 und m0 ⊥0 = F⊥0
dt
dt
beschrieben. Nach dem Additionstheorem (235) gilt
v + dvk =
v + dvk0
1 + vdvk0 /c2
= (v + dvk0 )(1 − vdvk0 /c2 ) = v + (1 − v 2 /c2 )dvk0 ,
also
dvk
.
1 − β2
Für die ⊥–Bewegung gilt x0 = x, also haben wir
dt
0
v⊥
= 0 v⊥ .
dt
dvk0 =
Mit dt0 =
p
1 − β 2 dt folgt also
m0
v̇k = Fk0
(1 − β 2 )3/2
m0
v̇⊥ = F⊥0 .
1 − β2
und
(259)
Zur Transformation der Kraft beziehen wir uns zunächst auf die kovariante Minkowskikraft F. Wegen v 0 = 0 in K0 erhalten wir nach (245) und (247)
Ki0 = Fi0
und K40 = 0 .
Ki0 transformiert sich nun mit der selben Lorentztransformation wie x 0i , also
Kk = p
Fk
1
(Kk0 − iβK40 ) = p
2
1−β
1 − β2
Im System K gilt schließlich nach (245) F i =
Fk = Fk0
0
und K⊥ = K⊥
= F⊥0 .
p
und F⊥ =
1 − β 2 Ki , also
q
1 − β 2 F⊥0 .
(260)
Damit geht die Bewegungsgleichung (259) in (258) über.]
55
Aufgrund dieser Tatsache sprach man früher der Masse einen Tensorcharakter zu und unterschied entsprechend Gl. (258) insbesondere die longitudinale und die transversale Masse.
141
5.10
Relativistischer Lagrangeformalismus
Ausgehend von der Bewegungsgleichung (255) kann man wie im nicht–relativistischen Fall einen Lagrangeformalismus aufbauen: Der relativistische Impuls
m0 v i
pi = √
1 − β2
läßt sich als Ableitung eines kinetischen Potentials G schreiben:
∂G
pi =
∂vi
mit G = −m0 c
2
s
1−
v2
.
c2
(261)
Ist die Kraft in der Form
∂V
∂xi
aus einem Potential V herleitbar, können wir daher die relativistische Lagrangefunktion
Fi = −
L = G − V = −m0 c
2
q
1 − β2 − V
(262)
einführen und erhalten die Bewegungsgleichung (255) in der Form
d ∂L
∂L
−
= 0.
dt ∂ ẋi ∂xi
(263)
Wir können auch wieder eine Hamiltonfunktion
H=
X
i
pi ẋi − L mit pi =
∂G
∂L
=
∂ ẋi
∂ ẋi
(264)
bilden, deren Wert
q
m0 v 2
m0 c 2
2
2
√
√
H=
+ m0 c 1 − β + V =
+V =T +V
1 − β2
1 − β2
(265)
die Gesamtenergie repräsentiert. Wenn wir hier noch β durch die pi ausdrücken,
erhalten wir die Bewegungsgleichungen in der kanonischen Form
ṗi = −
∂H
∂xi
und ẋi =
142
∂H
.
∂pi
(266)
Wir können auch Systeme von Massenpunkten betrachten, generalisierte Koordinaten einführen und erhalten wie im nicht–relativistischen Fall die Lagrangegleichungen
d ∂L
∂L
−
= 0.
dt ∂ q̇k ∂qk
(267)
Es gilt auch weiterhin, daß der zu einer zyklischen Variblen konjugierte Impuls
konstant ist, und daß aus
∂L
∂H
=−
=0
∂t
∂t
der Energiesatz in der Form
H = T + V = const
(268)
folgt. Schließlich können wir wie früher die elektromagnetischen Kräfte in den
Formalismus einbinden, indem wir V durch ein generalisietes Potential (vgl. Abschnitt 2.4)
U = eΦ − ev · A
(269)
ersetzen.
Obwohl die Rechnung im Detail wesentlich komplizierter sein kann, läuft das
Verfahren im Prinzip also wie im nicht–relativistischen Fall ab. Trotzdem sind
einige kritischen Punkte zu erwähnen.
• Zunächst ist aus systematischer Sicht zu bemängeln, daß der Formalismus
zwar die relativistisch korrekten Bewegungsgleichungen liefert, aber nicht
kovariant formuliert ist. Vielmehr bezieht er sich auf ein festes System K
und benutzt die Zeit t in K als Parameter. Dies macht es schwierig, die
Ergebnisse in ein anderes System zu übertragen.
Nun ist es zwar grundsätzlich nicht schwierig, einen kovarianten Lagrangeformalismus aufzubauen, der direkt von der vierdimensionalen Bewegungsgleichung
(244) ausgeht und mit u und τ statt mit v und t arbeitet (vgl. z.B. Goldstein
Abschnitt 6-6). Es muß aber darauf hingewiesen werden, daß eine konsistente
kovariante Beschreibung von Kräften nur in der Elektrodynamik zur Verfügung
steht. Damit kommen wir bereits zu den wesentlichen Defiziten unserer speziellrelativistischen Theorie:
• Statische Kräfte mit einer instantanen Fernwirkung (Wechselwirkungspotentiale Vij (rij ), Gravitation!) können nicht Lorentz–invariant formuliert
werden, denn eine Wechselwirkung kann höchstens mit Lichtgeschwindigkeit übertragen werden.
143
• Aus dem selben Grund sind die meisten Zwangsbedingungen nicht mit der
Lorentzinvarianz verträglich. Das gilt insbesondere für das gesamte Konzept des starren Körpers.
• Beschleunigte Bezugssysteme, (insbesondere rotierende) Koordinatensysteme können nicht problemlos in eine speziell-relativistische Theorie integriert
werden.
Mit diesen Bemerkungen stehen wir bereits an der Schwelle zur allgemeinen
Relativitätstheorie. Wenn wir diese umfassendere Theorie hier auch nicht mehr
behandeln können, so wollen wir ihren Grundgedanken doch zur Überleitung in
das letzte Kapitel dieser Vorlesung aufgreifen:
5.11
Grundgedanken zur allgemeinen Relativitätstheorie
Wir hatten bereits im Zusammenhang mit dem Relativitätsprinzip (Fußnote 45
auf S. 116) die Schwierigkeit angedeutet, wahre und Scheinkräfte zu unterscheiden. Aus solchen Überlegungen heraus verallgemeinerte Einstein das Relativitätsprinzip bewegter Inertialsysteme zum allgemein relativistischen Äquivalenzprinzip beschleunigter Bezugssysteme: Mit der grundsätzlichen Äquivalenz
von träger und schwerer Masse postulierte er, daß die Scheinkräfte in beschleunigten Koordinatensystem prinzipiell nicht von der Gravitation unterschieden
werden können.
Dieses Postulat hat die Konsequenz, daß der ohnehin schon befremdliche Minkowskiraum in der Nähe großer Massen auch noch gekrümmt ist. Damit ist
beispielsweise gemeint, daß die Erdoberfläche (unmeßbar) kleiner ist als 4πrE2 .
Die Krümmung betrifft aber auch die Zeit:
• Uhren im Tal gehen langsamer als Uhren auf dem Berg!
Darum ist es nicht gleichgültig, ob man erst eine Stunde das Tal entlang geht
und dann eine Stunde lang aufsteigt oder ob man erst aufsteigt und dann einen
Höhenweg benutzt. Die Differenz der Endpunkte dieser verschiedenen Wege in
der Raum–Zeit deutet auf eine Krümmung der x3 –x4 –Ebene.
Das Maß der Zeitdehnung findet man am leichtesten aus der Frequenzverstimmung
h̄ω (1 + φ/c2 ) = h̄ω0 ,
welche der Energiesatz für Photonen im Gravitationspotential φ verlangt. Addieren wir versuchsweise die entsprechende Zeitverstimmung mit der Zeitdilation
der speziellen Relativitätstheorie, so erhalten wir
144
q
dτ = ( 1 − β 2 + φ/c2 )dt
(270)
als Differential der Eigenzeit.
Und nun kommen wir noch einmal auf das Zwillingsparadoxon zurück: Der Bruder, der im gravitationsfreien Fall in seinem unbeschleunigten Inertialsystem bleibt,
der also immer Newtons Lex prima ṗ = 0 erfüllt, altert schneller als sein Bruder, der irgendeinen andern Weg im Minkowskiraum wählt. Die gleichförmige
Bewegung der Lex prima Newtons ist also im kräftefreien Fall dadurch ausgezeichnet, daß die Zeitspanne
τ12 =
Z(2)
dτ
(1)
größer wird als bei jeder anderen Bewegung.
Sollen nun Gravitation und Beschleunigung wirklich äquivalent sein, dann muß
auch das “schwerelose” System K0 , das einem frei fallenden Körper folgt, ein
kräftefreies Inertialsystem sein. Der frei fallende Körper, der nach der Lex prima
in K0 ruht, muß also ebenfalls durch ein maximales τ12 ausgezeichnet sein.
In dem nicht–schwerelosen “festen” System K ist dτ durch Gl. (270) gegeben. Mit
der Lagrangefunktion [vgl Gl. (262]
q
L = −m0 c2 1 − β 2 − m0 φ
finden wir den Zusammenhang
dτ = −
L
dt .
m0 c 2
Das Äquivalenzprinzip verlangt also für die Bewegung im Gravitationsfeld eine
maximale Eigenzeit
τ12
1
=−
m0 c 2
Z(2)
L dt .
(271)
(1)
Wird diese Forderung von den Bewegungsgleichungen der Lex secunda erfüllt?
Mit dieser Frage kommen wir zum Hamiltonschen Prinzip, mit dem wir nun
das Schlußkapitel einleiten.
145
6
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip
Wir haben das letzte Kapitel mit der Frage beendet, ob die Bewegung im Schwerefeld so verläuft, daß die Eigenzeit maximal wird. Wir fragen nun allgemeiner
nach den Bedingungungen dafür, daß das Integral
J=
Z(2)
F (q, q̇, t)dt
(272)
(1)
extremal — oder genauer: stationär — wird. Mit dieser Frage soll präziser das
folgende Problem charakterisiert werden:
Wie muß bei
• vorgebenem Startpunkt q(t1 ) = q1 zur Zeit t = t1 und bei
• vorgebenem Endpunkt q(t2 ) = q2 zur Zeit t = t2
die Bahn q(t) im Konfigurationsraum gewählt werden, damit das Integral J ein
Extremum annimmt?
Dieses Problem stellt die Grundaufgabe der Variationsrechnung dar. Sie erinnert
an das Aufsuchen von Extrema in der Differentialrechnung und läßt sich auch in
der Tat darauf zurückführen. Wenn wir nämlich die (noch unbekannte) Lösung
mit q(t) bezeichnen, setzen wir
qk0 (t) = qk (t) + εηk (t) = qk + δqk
(273)
mit beliebigen Variationen ηk (t), die allein der Bedingung
ηk (t1 ) = ηk (t2 ) = 0
unterworfen sind. Damit wird J eine Funktion von ε, die für ε = 0 ein Extremum
annehmen soll. Das führt auf die Bedingung
dJ δJ = ε
=
dε ε=0
Z(2) X
f (
(1) k=1
)
∂F
∂F
δqk +
δ q̇k dt = 0 .
∂qk
∂ q̇k
(274)
Ehe wir Gl. (274) auswerten, machen wir uns klar, daß wir notwendige Bedingungen für Extrema herleiten, die keineswegs hinreichend sind. Statt von extremalem
146
Verhalten sollten wir daher besser von stationärem Verhalten sprechen: δJ = 0
bedeutet, daß sich J bei einer infinitesimalen Variation der Bahn nicht ändert.
Falls wirklich ein Extremum vorliegt, ist das im allgemeinen lokal zu verstehen.
Außerdem können wir nicht zwischen einem Maximum und einem Minimum unterscheiden.
Wegen der wichtigen Unterscheidung zu anderen Variationsprinzipien der Mechanik weisen wir auch nochmals auf unsere Variationsregeln hin:
• Die Variationen δq beziehen sich ausschließlich auf die Bahn q(t) zwischen
zwei festen Endpunkten q1 (t1 ) und q2 (t2 ) im Konfigurationsraum.
• Die Zeit wird nicht variiert: δt = 0.
Damit ist auch klar, was die Variationen δ q̇k der Geschwingkeiten in Gl. (274)
bedeuten: Wenn wir Gl. (273) nach t differenzieren, erhalten wir nämlich
q̇k0 (t) = q̇k (t) + εη̇k (t) = q̇k + δ q̇k
oder
d
(δqk ) .
(275)
dt
Die generalisierten Geschwindigkeiten können also nicht unabhängig variiert werden. Um diesen Zusammenhang einzuarbeiten, integrieren wir Gl. (274) partiell
und erhalten
δ q̇k = εη̇k =
δJ =
Z(2)X (
(1)
k
∂F
d ∂F
−
∂qk dt ∂ q̇k
)
δqk dt +
X
k
t=t
2
∂F
δqk .
∂ q̇k t=t1
Der letzte Term dieser Gleichung verschwindet, weil wir die Randpunkte nicht
variieren dürfen. Davon abgesehen sind die δqk = εηk (t) aber beliebige Bahnvariationen. Wir können deshalb insbesondere
ηi = 0 f ür i 6= k
und ηk (t0 ) = 0 f ür t0 6∈ (t − τ, t + τ ) (τ → 0)
wählen und daraus schließen, daß die Klammern{} einzeln und in jedem Bahnpunkt verschwinden müssen:
Bedingung dafür, daß das Integral (272) ein Extremum annimmt (stationär wird)
ist also, daß q(t) die Euler– Lagrange–Gleichungen
∂F
d ∂F
−
=0
dt ∂ q̇k ∂qk
(276)
erfüllt. Die Form dieser Gleichungen ist uns von den Lagrangeschen Gleichungen vertraut. Die Bewegung in konservativen Systemen mit holonomen Zwangsbedingungen läuft also so ab, daß die Hamiltonsche Prinzipalfunktion oder kurz
das Wirkungsintegral
147
S=
Z(2)
Ldt
(277)
(1)
stationär wird. Die Stationaritätsbedingung
δS = δ
Z(2)
Ldt = 0
(278)
(1)
wird als Hamiltonsches Prinzip der kleinsten56 Wirkung bezeichnet.
Für den Spezialfall der Gravitation sehen wir im Hamiltonschen Prinzip das
relativistische Postulat (271) der maximalen Eigenzeit bestätigt. Das Prinzip gilt
aber allgemeiner und besitzt dabei kein Korrelat relativistischer Äquivalenzpostulate mehr.
Eine allgemeine anschauliche Interpretation gewinnt das Hamiltonsche Prinzip
aber beim Übergang zur Quantenmechanik. Dort wird ein Teilchen nicht durch
seine Bahn beschrieben, sondern durch eine Wellenfunktion, welche die Aufenthaltswahrscheinlichkeit repräsentiert. Man kann nun zeigen, daß
S
1
=
h̄
h̄
Z
Ldt
die Phase der Wellenfunktion beschreibt. Die Stationarität δS = 0 besagt dann,
daß sich in der Nähe des klassischen Weges die Wellenamplituden nicht durch
Interferenz weglöschen. Das Teilchen folgt danach nicht einfach der Bahn, sondern
es “riecht” alle Wege der Nachbarschaft (Feynman Lectures, Bd. II, Kap. 19).
Versperrt man die benachbarten Konkurrenzwege, so stört man die Bewegung
(Beugung!). Diese Interpretation macht auch deutlich, daß die Stationarität des
Wirkungsintegrals und nicht ein minimaler oder maximaler Wert entscheidend
ist.
6.2
Das Hamiltonsche Prinzip im Phasenraum
Das Hamiltonsche Prinzip ermöglicht einen eleganten (allerdings recht abstrakten) Aufbau der Mechanik: Wir können dieses Prinzip statt der Newtonschen
Axiome an die Spitze stellen und die Lagrangegleichungen deduktiv daraus herleiten (siehe z.B. Landau–Lifshitz). Aus den Lagrangegleichungen folgen
56
Es sei nochmals ausdrücklich darauf hingewiesen, daß die Behauptung eines Minimums
weder bewiesen noch allgemein gültig ist. Hier liegt offenbar noch ein Rest mittelalterlich teleologischer Denkweise verborgen.
148
weiter die völlig äquivalenten Hamiltonschen Bewegungsgleichungen oder kanonischen Gleichungen (siehe Abschnitt 2.8).
Wir wollen nun versuchen, die kanonischen Gleichung ohne den Umweg über die
Lagrangeschen Gleichungen direkt aus dem Hamiltonschen Prinzip herzuleiten. Dazu gehen wir von
L(q, q̇, t) =
X
k
pk q̇k − H(p, q, t) mit pk =
∂L
∂ q̇k
aus und bilden
δS = δ
Z(2)(X
(1)
k
)
pk q̇k − H(p, q, t) dt = 0 .
(279)
Wenn wir die Variation schematisch ausführen, erhalten wir
Z(2)X (
(1)
k
)
∂H
∂H
δpk −
δqk dt = 0
pk δ q̇k + q̇k δpk −
∂pk
∂qk
oder nach partieller Integration des ersten Terms
Z(2)X (
(1)
k
!
∂H
∂H
δpk − ṗk +
q̇k −
∂pk
∂qk
!
)
δqk dt = 0 .
(280)
Ehe wir voreilig versuchen, die kanonischen Gleichungen
q̇k =
∂H
∂pk
und ṗk = −
∂H
∂qk
(281)
aus dem Verschwinden der Klammern () in Gl. (280) abzulesen, müssen wir uns
überlegen, was unter den Variationen δpk denn überhaupt zu verstehen ist. Im
Prinzip müssen wir die δpk über δ q̇k aus den Variationen δqk im Konfigurationsraum berechnen. Diese Variationen sind also zunächst nicht unabhängig, und
daher dürfen wir nicht ohne weiteres auf die Gültigkeit der Gleichungen (281)
schließen. Andererseits kennen wir aber bereits die Gültigkeit der kanonischen
Gleichungen und können daraus umgekehrt folgern57 :
• Das Hamiltonsche Prinzip gilt sogar unter der erweiterten Konkurrenz
beliebiger Variationen δqk und δpk im Phasenraum.
57
Man beachte dazu, daß die Beziehungen q̇k = ∂H/∂pk , die eine unabhängige Variation
der δpk gestatten, bereits ohne die Bewegungsgleichungen aus der Konstruktion der Hamiltonfunktion folgen (vgl. S. 67 und Fußnote 23).
149
Umgekehrt können wir aus dem erweiterten Hamiltonprinzip im Phasenraum
die kanonischen Gleichungen deduzieren.
6.3
Kanonische Transformationen
Aus dem erweiterten Hamiltonsche Prinzip im Phasenraum folgt, daß die pk
des Hamiltonformalislismus im Gegensatz zu den q̇k der Lagrangeschen Formulierung eine eigenständige, den qk gleichwertige Bedeutung haben.
Die Gleichwertigkeit der pk und qk läßt es sinnvoll erscheinen, ganz auf die
grundsätzliche Unterscheidung von Koordinaten und Impulsen zu verzichten.
Statt generalisierte Koordinaten ausschließlich durch Punkttransformationen qk =
hk (xi , t) im Konfigurationsraum zu gewinnen, kann man dann durch allgemeinere
Transformationen
Qk = Qk (p, q, t) und Pk = Pk (p, q, t)
(282)
im Phasenraum zu neuen Sätzen von verallgemeinerten Koordinaten und Impulsen
übergehen. Die Transformationen (281) heißen kanonisch, wenn für die Qk und
die Pk wieder kanonische Gleichungen
∂K
∂K
und Ṗk = −
(283)
∂Pk
∂Qk
mit einer geeignet transformierten Hamiltonfunktion K(P, Q, t) gelten. Um das
sicherzustellen, brauchen wir nur zu fordern, daß für die neuen Koordinaten ein
Hamiltonsches Prinzip
Q̇k =
δ
Z(2)(X
(1)
k
)
Pk Q̇k − K(P, Q, t) dt = 0
(284)
gilt. Wegen unserer Vorschrift, die Randpunkte nicht zu variieren, ist das aber
sicher gewährleistet, wenn sich die Integranden von (279) und (284) nur um eine
totale Zeitableitung unterscheiden, etwa
X
k
Pk Q̇k − K(P, Q, t) =
X
k
pk q̇k − H(p, q, t) −
dΦ
.
dt
(285)
Φ kann dabei außer von der Zeit etwa von q und p abhängen. Wir können uns aber
auch denken, daß (nach Ausführung der Transformation) p durch einen Halbsatz
der neuen Koordinaten ersetzt wird und schreiben
Φ(q, p, t) = R1 (q, Q, t) .
150
Setzen wir
!
dΦ X ∂R1
∂R1
∂R1
Q̇k +
=
q̇k +
dt
∂qk
∂Qk
∂t
k
in Gl. (285) ein, so erhalten wir
X
k
!
!
X
∂R1
∂R1
∂R1
Pk +
q̇k = K − H −
pk −
Q̇k −
∂Qk
∂qk
∂t
k
!
.
Diese Gleichung können wir am einfachsten erfüllen, wenn wir die Transformation
so ausführen, daß alle Klammern () einzeln verschwinden. Wir erhalten damit die
Transformationsgleichungen
und
∂R1
,
∂qk
∂R1
,
= −
∂Qk
pk =
(286)
Pk
(287)
K(P, Q, t) = H(p, q, t) +
∂R1
.
∂t
(288)
R1 (q, Q, t) heißt die Erzeugende der kanonischen Transformation (286-288). Die
Gln. (286) liefern die erste Hälfte der Transformationsgleichungen. Sie legen in
impliziter Form fest, wie die neuen Koordinaten Qk von den alten Koordinaten
q und Impulsen p abhängen. Hat man sie nach den Qk aufgelöst, so erhält man
die konjugierten Impulse Pk explizit durch die Gln. (287). Aus Gl. (288) liest man
zudem die neue Hamiltonfunktion K ab, mit der die kanonischen Gleichungen
(283) gelten. Sie stimmt mit der alten Hamiltonfunktion überein, wenn die
Transformationsgleichungen die Zeit nicht explizit58 enthält.
Die formale Sonderstellung, die wir den Koordinaten q und Q bei der Konstruktion der Erzeugenden R1 zugewiesen haben, war rein willkürlich. Tatsächlich
können wir Koordinaten und Impulse völlig gleichwertig behandeln. Um zu Transformationsgleichungen zu gelangen, müssen wir nur darauf achten, daß wir von
einer Erzeugenden ausgehen, die von einem Halbsatz der alten und einem Halbsatz
der neuen Variablen abhängt. Um das zu sehen machen wir von einer Legendretransformation (siehe Abschnitt 2.8) Gebrauch und bilden eine neue Erzeugende
R2 (p, Q, t) = R1 (q, Q, t) −
X
p k qk .
k
Aus ihrem Differential
58
Bei explizit zeitabhängigen Transformationen läßt sich die Änderung der Hamiltonfunktion durch Pseudopotentiale von Scheinkräften interpretieren. Vgl. dazu S. (62).
151
dR2 =
X
k
(
!
)
∂R1
∂R1
∂R1
− pk dqk +
dQk − qk dpk +
dt
∂qk
∂Qk
∂t
und den Gl. (286-288) lesen wir sofort die partiellen Ableitungen
∂R2
∂R1
=
= −Pk
∂Qk
∂Qk
∂R2
= −qk ,
∂pk
und
∂R2
∂R1
=
=K−H
∂t
∂t
ab. In voller Analogie zu Gln. (286-288) ergibt das die Transformationsgleichungen
qk = −
∂R2
,
∂pk
Pk = −
∂R2
∂Qk
und K = H +
∂R2
.
∂t
(289)
Nach dem selben Schema können wir Q durch P ersetzen, indem wir von der
Erzeugenden
R3 (q, P, t) = R1 (q, Q, t) +
X
Pk Q k
k
ausgehen. Wir erhalten dann entsprechend die Transformationsgleichungen
pk =
∂R3
,
∂qk
Qk =
∂R3
∂Pk
und K = H +
∂R3
.
∂t
(290)
Schließlich können wir noch beide Halbsätze von Variablen austauschen und aus
der Erzeugenden
R4 (p, P, t) = R1 (q, Q, t) −
X
k
p k qk +
X
Pk Q k
k
die Transformationsgleichungen
qk = −
∂R4
,
∂pk
Qk =
∂R4
∂Pk
und K = H +
∂R4
.
∂t
(291)
gewinnen.
Wir wollen die vier Fälle der besseren Übersicht wegen in einer Tabelle zusammenfassen. Dabei verzichten wir in den Transformationsgleichungen auf eine Kennzeichnung der Erzeugenden durch Indizes:
152
..
.
..
.
Q
q
R1 (q, Q, t)
∂R
· · · · · · Pk = − ∂Q
k
p
R2 (p, Q, t)
P
∂R
∂qk
pk =
..
.
R3 (q, P, t)
···+···
..
.
Qk =
∂R
qk = − ∂p
k
..
.
∂R
∂Pk
···
R4 (p, P, t)
K = H + ∂R/∂t
In jedem Fall gehen wir also von einer Erzeugenden R aus, die von einem alten
und einem neuen Variablen–Halbsatz abhängt. Der jeweils konjugierte Halbsatz
ist dann durch die partiellen Ableitungen von R gegeben. Das richtige Vorzeichen erhält man aus der Merkregel, daß Ableitungen nach neuen Variablen und
Ableitungen nach Impulsen jeweils ein Minuszeichen bringen.
6.4
Beispiele für kanonische Transformationen
Wir beginnen mit einem trivialen Beispiel: Die Erzeugende
R1 (q, Q) =
X
qi Q i
(292)
i
führt auf die Transformationsgleichungen
pk =
∂R1
= Qk
∂qk
und Pk = −
∂R1
= −qk .
∂Qk
(293)
Abgesehen von einer Vorzeichenänderung, die zur unveränderten Anschrift der
kanonischen Gleichungen nötig ist, werden durch diese Transformation also Koordinaten und Impulse vertauscht. So trivial und nutzlos diese Operation auch ist,
so führt sie uns doch die Gleichwertigkeit von Koordinaten und Impulsen deutlich
vor Augen.
Die selbe Vertauschung Qk = pk und Pk = −qk von Koordinaten und Impulsen erhalten wir auch aus der Erzeugenden
R4 (p, P) =
X
p i Pi .
(294)
i
Es ist also nicht möglich, einer vorgebenen Transformation eindeutig eine Erzeugende zuzuordnen.
153
Ebenfalls einfach, aber bereits nützlicher ist die Erzeugende
R2 (p, Q) = −
X
pi fi (Q).
(295)
i
Sie erzeugt Punkttransformationen
qk = −
∂R2
= fk (Q)
∂pk
(296)
zwischen einem alten (q) und einem neuen (Q) Satz generalisierter Koordinaten.
Die zweite Hälfte
X
∂R2
∂fi
Pk = −
pi
=
(297)
∂Qk
∂Qk
i
liefert die zugehörigen neuen Impulse Pk .
Auch die Erzeugende
R3 (q, P) =
X
Pi gi (q) .
(298)
i
mit den Transformationsgleichungen
Qk =
∂R3 X ∂gi
∂R3
Pi
= gk (q) und pk =
=
∂Pk
∂qk
∂qk
i
(299)
liefert Punkttransformationen. Im Gegensatz zur Darstellung durch R2 erhält
man hierbei die neuen Koordinaten Qk jedoch explizit, dafür aber die neuen Impulse Pk nur noch implizit.
Eine triviale Punkttransformation stellt die identische Transformation
Qk = q k
und Pk = pk
(300)
dar. Wir können sie gleichwertig aus den aus den Erzeugenden
R2 id = −
X
pi Qi
oder R3 id =
i
X
Pi q i
(301)
i
gewinnen. Trotz der Trivialität sind diese Darstellungen ein nützlicher Ausgangspunkt zur Erzeugung infinitesimaler kanonischer Transformationen (siehe Abschnitt 6.6).
Nach diesen mehr oder weniger trivialen Beispielen wollen wir die Lösung eines
konkreten Problems durch eine nicht–triviale kanonischen Transformation demonstrieren: Zur Behandlung des harmonischen Oszillators bildet man gern die
Erzeugende
k 2
x cot ωQ mit ω 2 = k/m .
(302)
R1 (x, Q) =
2ω
Sie generiert die Transformationsgleichungen
p=
k
∂R1
= x cot ωQ und
∂x
ω
154
sin ωQ cos2 ωQ
k
∂R1
= x2
+
P =−
∂Q
2
sin ωQ sin2 ωQ
!
=
kx2
.
2 sin2 ωQ
Lösen wir die zweite Gleichung nach x auf und setzen sie anschließend in die erste
Gleichung ein, so erhalten wir
s
√
2 1/2
2k 1/2
x=
P sin ωQ
und
p=
P cos ωQ .
(303)
k
ω
Mit dieser Transformation geht die Hamiltonfunktion
H(p, x) =
p2
k
+ x2
2m 2
des harmonischen Oszillators in
K(P, Q) = H =
!
k
cos2 ωQ + sin2 ωQ P
2
mω
über. Mit ω 2 = k/m erhalten wir also die besonders einfache Hamiltonfunktion
K = P,
(304)
und die einzige Variable Q wird zyklisch. Darum ist P konstant, und es gilt
offenbar
P =K =H =E.
Die kanonische Gleichung
Q̇ =
∂K
=1
∂P
zeigt, daß die neue Koordinate
Q = t − t0
(305)
die Zeit beschreibt. Mit P = E und Q = t − t0 liefern die Transformationsgleichungen (303) explizit den Bewegungsablauf.
Die kanonische Transformation gestattet also in der Tat eine überaus elegante
Problemlösung — vorausgesetzt man hat Glück, und der Himmel verrät eine
geeignete Erzeugende. Was aber macht man, wenn man kein Glück hat und der
Himmel schweigt?
6.5
Die Hamiltonsche partielle Differentialgleichung
Wie bereits angedeutet, ist es nicht sehr befriedigend, bei der Suche nach einer
geeigneten kanonischen Transformation auf den Zufall oder die Intuition angewiesen zu sein. Wir suchen daher nach einem systematischen Weg, besonders
155
vorteilhafte Erzeugende zu finden. Der günstigste Fall liegt sicher vor, wenn die
neue Hamiltonfunktion K überhaupt nicht mehr von den neuen Variablen Pk
und Qk abhängt. Dann folgt nämlich
∂K
= 0,
∂Qk
∂K
Q̇k =
= 0,
∂Pk
Ṗk = −
also
P k = αk
also
Q k = βk
und
(306)
(307)
mit geigneten Integrationskonstanten αk und βk . Die neue Hamiltonfunktion ist
selbst konstant und kann gleich Null gewählt werden. Diese ’ideale’ Transformation auf einen vollständigen Satz von 2f Integrationskonstanten wollen wir dem
allgemeinen Brauch folgend aus einer Erzeugenden vom Typ R3 gewinnen, die wir
mit S bezeichnen und Wirkungsfunktion nennen. Mit (306) und (307) gelten
dann die Transformationsgleichungen
∂
S(q, α, t) und
∂qk
∂
=
S(q, α, t) .
∂αk
pk =
(308)
βk
(309)
In diesen Transformationsgleichungen ist bereits die gesamte Problemlösung enthalten (Satz von Jacobi): Bei vorgegebenen Integrationskonstanten αk , βk sind
die Koordinaten qk (t) implizit durch Gl. (309) bestimmt. Gl. (308) liefert die zugehörigen Impulse pk (t). Die 2f Integrationskonstanten αk und βk folgen mit den
selben Gleichungen aus den Anfangsbedingungen qk (0) und pk (0).
Existiert eine so wunderbare Erzeugende denn wirklich? Wenn ja: Hat sie eine
physikalische Bedeutung? Wie finde ich sie?
Wir hatten verlangt, daß S die neue Hamiltonfunktion zum Verschwinden bringt:
K = H(p, q, t) +
Setzen wir hierin
∂S
= 0.
∂t
(310)
dS X ∂S
∂S
=
−
q̇k
∂t
dt
∂qk
k
ein, so erhalten wir mit Gl. (308)
X
dS
=
pk q̇k − H = L .
dt
k
156
(311)
Die Wirkungsfunktion S ist also identisch mit dem im Abschnitt 6.1 [Gl. (277)]
definierten Wirkungsintegral. Bei der Diskussion des Hamiltonschen Prinzips
hatten wir erwähnt, daß S/h̄ die Phase der quantenmechanischen Wellenfunktion beschreibt. Die Gleichung S = const beschreibt also Wellenflächen gleicher
Phase. Auf diesen Wellenflächen steht der generalisierte Impuls nach Gl. (308)
senkrecht. Betrachten wir speziell ein Teilchen in kartesischen Koordinaten, so
sind die Wellenflächen S(x, α, t) = const also die orthogonalen Trajektorien aller
mit den Integrationskonstanten α verträglichen Teilchenbahnen. Oder umgekehrt:
Man erhält die möglichen Teilchenbahnen als orthogonale Trajektorien der Wellenflächen.
Damit läßt sich ein Bündel möglicher Teilchenbahnen mit einem Bündel von Lichtstrahlen in der geometrischen Optik vergleichen, und man kann tatsächlich zeigen, daß die Gleichungen der Wellenmechanik in der Näherung der geometrischen
Optik (λ → 0) auf die Hamilton–Jacobi–Theorie führen: Die klassische Mechanik unterscheidet sich von der Quantenmechanik genau durch das Fehlen von
Interferenz– und Beugungseffekten.
So ästhetisch schön und inhaltsschwanger die Beziehung (311) auch sein mag, so
wenig ist sie allerdings zur Berechnung von S geeignet. Denn die Integration von
Gl. (311) setzt ja bereits die Kenntnis der Teilchenbahnen, also die Lösung des
Problems, voraus. Zu einer Bestimmungsgleichung für S kommen wir aber, wenn
wir die Transformationsgleichungen (308) in Gl. (310) einsetzen. Wir erhalten
dann die Hamiltonsche partielle Differentialgleichung
H
!
∂S
∂S
, q, t +
=0
∂q
∂t
(312)
und sehen, welch hohen Preis wir für die wunderbare Erzeugende zu zahlen haben:
Während uns das Bewegungsproblem selbst ’nur’ mit einem System gewöhnlicher
Differentialgleichungen der Ordnung 2f konfrontiert, müssen wir zur Bestimmung
von S ein vollständiges Integral der partiellen Differentialgleichung finden, das 2f
freie Integrationskonstanten59 αk enthält.
Für diesen hohen Preis wird allerdings auch eine adäquat hohe Leistung geboten.
Denn die eine Funktion S enthält bereits die vollständige und fertig ausintegrierte
Information über sämtliche Lösungen des Bewegungsproblems für beliebige Anfangsbedingungen.
Der hohe Preis – und hier wird es wieder unbefriedigend – ist jedoch nur selten
bezahlbar. Praktisch kommt man nur in den Fällen zu der erwünschten Wirkungs59
Wegen der f + 1 partiellen Ableitungen gehören zur allgemeinen Lösung von Gl. (312)
eigentlich f +1 Integrationskonstanten. Eine davon ist jedoch die triviale additive Konstante,
die in den Transformationsgleichungen nicht auftaucht.
157
funktion S, in denen die Hamiltonsche partielle Differentialgleichung durch Separation gelöst werden kann. Damit meinen wir, daß S in eine Summe
S=
X
Sk (qk , α) + St (t, α)
(313)
k
zerfällt. Dieser glückliche Umstand beschränkt sich aber auch wieder auf diejenigen Fälle, in denen das Bewegungsproblem auch ohne Hamilton–Jacobi–
Theorie in allgemeiner Form lösbar ist60 .
Der zeitliche Anteil St läßt sich immer abseparieren, wenn die Hamiltonfunktion
nicht explizit von t abhängt. Dann gilt nämlich H = Ê = const61 und aus Gl.
(312) folgt
∂S
= −Ê ,
∂t
also
S = S0 (q, α) − Êt .
(314)
Die Hamiltonsche charakteristische Funktion (oder ’verkürzte Wikungsfunktion’) S0 ist nun aus der (“verkürzten”) Hamiltonschen partiellen Differentialgleichung
H
!
∂S0
, q = Ê
∂q
(315)
zu bestimmen. Dabei ist zu beachten, daß Ê selbst eine Integrationskonstante ist,
die von den αk abhängt oder mit einem der α’s identisch ist. Es ist üblich,
α1 = Ê
(316)
zu verfügen. Damit zerfällt Gl. (309) in die beiden Gleichungen
βk =
∂
S0 (q, Ê, α) (k ≥ 2)
∂αk
und
β1 =
∂S0
− t,
∂ Ê
(317)
welche die Bahn und den “Fahrplan” getrennt beschreiben.
6.6
Der harmonische Oszillator als Beispiel
Aus der Hamiltonfunktion
H=
p2
k
+ x2
2m 2
60
Ob die Hamiltonsche partielle Differentialgleichung separierbar ist, hängt außerdem von
den verwendeten Koordinaten ab.
61
Zur Frage, wann Ê die Gesamtenergie des Systems ist, siehe Abschnitt 2.7
158
des harmonischen Oszillators erhalten wir die Hamiltonsche partielle Differentialgleichung [vgl. Gl. (312)]
∂S
∂x
1
2m
!2
k
∂S
+ x2 +
= 0.
2
∂t
(318)
Da die Hamiltonfunktion die Zeit nicht explizit enthält und H = E = α gilt,
können wir die Zeitabhängigkeit abseparieren und setzen gemäß (314)
S(x, E, t) = S0 (x, E) − Et .
Die charakteristische Funktion S0 genügt dann der Gleichung [vgl. Gl. (315)]
1
2m
∂S0
∂x
!2
k
+ x2 = E .
2
(319)
Daraus erhalten wir durch Integration
S0 (x, E) =
Z
s
k
2m(E − x2 ) dx .
2
Die Integration ist elementar (siehe unten), wir brauchen sie aber gar nicht auszuführen, da die Transformationsgleichungen nur Ableitungen von S0 enthalten:
∂S0
∂S
=
=
p=
∂x
∂x
s
k
2m(E − x2 ) ,
2
Z
∂S
∂S0
m dx
−t.
β=
=
−t= q
∂α
∂E
2m(E − k2 x2 )
Die erste Gleichung liefert uns (in der Form des Energiesatzes) die Gleichung der
Bahn des harmonischen Oszillators. Die zweite Gleichung, die den “Fahrplan”
liefern soll, müssen wir weiter auswerten:
t+β =
r
m
2E
Z
dx
q
1−
k 2
x
2E
=
r
m
k
Z
√
du
,
1 − u2
u=
q
k
2E
x.
Mit einer Formelsammlung oder einer zweiten Substitution u = sin v finden wir
die Lösung
r
q
m
1
k
arcsin u = arcsin 2E
t+β =
x
k
ω
oder
s
2E
x=
sin[ω(t + β)] .
(320)
k
[Obwohl das Problem damit vollständig gelöst ist, wollen wir zur Vertiefung die charakteristische Funktion S0 (x, E) selbst noch einmal als Erzeugende einer kanonischen
159
Transformation betrachten. Um diesen Aspekt zu verdeutlichen, benutzen wir auch die
Bezeichnungen
E → P und S0 (x, E) → R3 (x, P )
und schreiben
R3 (x, P ) =
Z q
2m(P − k2 x2 ) dx .
Die formale Rechnung ist natürlich identisch mit der oben und liefert die Transformationsgleichungen
∂R3 q
p=
= 2m(P − k2 x2 )
∂x
und
q
1
∂R3
k
= arcsin
Q=
2P x .
∂P
ω
Wegen K=H=P folgt die Beziehung Q = t + β nun aus der kanonischen Gleichung
Q̇ =
∂K
= 1.
∂P
Die Erzeugende R3 (x, P ) = S0 (x, P ) liefert also die selben neuen Variablen P = E und
Q = t+ const wie die Erzeugende R1 (x, Q) nach Gl. (302). Um den Zusammenhang
zwischen R3 und R1 zu untersuchen, rechnen wir R3 nun doch explizit aus:
R3 (x, P ) =
Z q
√
2mP
1−
= 2
=
r
m
P
k
Z p
k
2P
x2 dx
1 − u2 du
P p
(u 1 − u2 + arcsin u)
ω
(u =
q
k
2P
x) .
Nun führen wir eine Legendretransformation
R1 (x, Q) = R3 (x, P ) − P Q
aus. Mit den Beziehungen
P =
kx2
,
2u2
arcsin u = ωQ
und u = sin ωQ
erhalten wir
R1 (x, Q) =
=
P
(sin ωQ cos ωQ + ωQ) − P Q
ω
kx2
kx2 sin ωQ cos ωQ
cot ωQ .
=
2ω
2ω
sin2 ωQ
Damit verliert die Erzeugende R1 (x, Q) aus Gl. (302) den magischen Zauber eines
gnädigen Himmelsgeschenks und entpuppt sich als biederes Produkt zielstrebigen Fleißes.]
160
6.7
Ergänzende Bemerkungen
Wir beenden an dieser Stelle die Einführung in die Hamilton–Jacobi–Theorie
und weisen nur noch andeutungsweise auf die folgenden wichtigen Ergänzungen
hin:
1. Zur Verdeutlichung der Zusammenhänge ist es nützlich, infinitesimale kanonische Transformationen
Qk = qk + δqk () ,
Pk = pk + δpk ()
mit δqk , δpk = O() ,
(321)
→0
zu betrachten. Ausgehend von der identischen Transformation (300,301) kann
man sie zum Beispiel durch
R3 (q, P) =
X
qk Pk + G(q, P) =
k
X
qk Pk + G(q, p) + O(2 )
(322)
k
erzeugen und findet gemäß Qk = ∂R3 /∂Pk und pk = ∂R3 /∂qk in erster Ordnung
in δqk = ∂
∂
G(q, p) und δpk = −
G(q, p) .
∂pk
∂qk
(323)
Man nennt G(q, p) die Erzeugende der infinitesimalen kanonischen Transformation (323). Wählt man speziell die Hamiltonfunktion H als Erzeugende, so folgt
mit den kanonischen Gleichungen
δqk = q̇k
und δpk = ṗk .
Die Hamiltonfunktion ist also die Erzeugende einer infinitesimalen Zeitverschiebung = δt. Daraus folgt die wichtige Feststellung, daß der Bewegungsablauf
selbst als Folge infinitesimaler kanonischer Transformationen oder als kanonische
Transformation aufgefaßt werden kann62 .
Auf ähnliche Weise sieht man, daß der Impuls und der Drehimpuls die Erzeugenden infinitesimaler Translationen bzw. Drehungen sind. Man kann dies zum
Ausgangspunkt der Diskussion von Symmetrien und Erhaltungssätzen machen,
die wir im Abschnitt 2.7 geführt haben.
62
Diese Folgerung kann man auch aus der Transformation auf die Konstanten αk und βk im
Abschnitt 6.5 ziehen.
161
2. Kanonische Transformationen bilden Gebiete des Phasenraums volumentreu
ab. Da auch der Bewegungsablauf durch kanonische Transformationen beschrieben werden kann, folgt daraus, daß das Phasenraum–Volumen, das ein Ensemble
von gleichartigen mechanischen Systemen im Phasenraum einnimmt, im Lauf der
Zeit erhalten bleibt (Satz von Liouville). Das Phasenraumvolumen kann allerdings durch die Bewegung wie Zuckerwatte in feine Fäden gezogen und zu
hochkomplexen, scheinbar voluminöseren Strukturen verwickelt werden.
Der Satz von Liouville spielt eine wichtige Rolle in der Statistischen Mechanik. Es besteht ein enger Zusammenhang zwischen dem Phasenraumvolumen und
der Entropie.
3. Neben dem Phasenraumvolumen und den kanonischen Gleichungen gibt es
zahlreiche weitere Invarianten kanonischer Transformationen. Wir erwähnen hier
noch die Invarianz der Poissonklammern63
{A, B} =
X
k
∂A ∂B
∂A ∂B
−
∂qk ∂pk ∂pk ∂qk
!
=
X
k
∂A ∂B
∂A ∂B
−
∂Qk ∂Pk ∂Pk ∂Qk
!
.
(324)
Mit Hilfe der Poissonklammern und der kanonischen Gleichungen erhält man
die zeitliche Variation einer dynamischen Größe A(q, p, t) in der knappen Form
!
X ∂A
dA
∂A
∂A
∂A
=
q̇k +
ṗk +
= {A, H} +
.
dt
∂qk
∂pk
∂t
∂t
k
(325)
Die tiefere Bedeutung dieser Notation liegt im Korrespondenzprinzip, nach dem
die Poissonklammern beim Übergang zur Quantenmechanik in die Kommutatorklammern übergehen:
{A, B} →
1
[A, B] .
ih̄
(326)
Aus der klassischen Gleichung (325) ensteht so die quantenmechanische Heisenberggleichung
dA
1
∂A
=
[A, H] +
.
dt
ih̄
∂t
63
(327)
Das Vorzeichen wird gelegentlich (z. B. im Lehrbuch der Quantenmechanik von E. Fick)
umgekehrt definiert.
162
Literaturhinweise
Alle üblichen Lehrbücher gehen im Umfang wesentlich über den Inhalt dieser
Vorlesung hinaus, eignen sich aber, einzelne Probleme nachzulesen und zu vertiefen. Dabei richtet sich die optimale Wahl nicht zuletzt nach dem persönlichen
Geschmack. Die folgende Aufstellung ist deshalb nicht als Empfehlung zu verstehen, sondern gibt die Quellen an, die ich bei der Ausarbeitung der Vorlesung
vornehmlich benutzt habe.
a) H. Goldstein: Klassische Mechanik,
Akademische Verlagsgesellschaft, Frankfurt
Ein älteres Standardlehrbuch, das an Vollständigkeit unübertroffen ist. Leider vermittelt es ein wenig den falschen Eindruck, als wären die meisten
Probleme mit den Mitteln der analytischen Mechanik analytisch lösbar.
b) W. Greiner: Theoretische Physik, Band 1 Mechanik I und Band II Mechanik II
Verlag Harri Deutsch, Thun und Frankfurt
Stark didaktisch ausgerichtete, für meinen Geschmack etwas langatmige
Einführung in die Mechanik, die erst im letzten Drittel des zweiten Bandes
den Lagrange- und Hamiltonformalismus behandelt.
c) A. Sommerfeld: Mechanik
(Bd. I der Vorlesungen über Theoretische Physik), VAG Leipzig bzw. Teubner.
Eine ausgezeichnete Darstellung, die tiefsinnig und spielerisch (Exkurse
über das Billardspiel und das Radfahren) die physikalischen Grundideen
herausarbeitet und verständlich und elegant mit der Mathematik umgeht.
Leider ist Sommerfelds Darstellung viel zu unsystematisch, um die Vorlesung zu begleiten. Das Lehrbuch eignet aber hervorragend, um den Stoff zu
vertiefen.
d) Feynman/Leighton/Sands: Vorlesungen über Physik, Bd. 1 und
2, R. Oldenbourg Verlag München
Diese ausgezeichnete Darstellung der gesamten Physik weicht stark von der
üblichen Gliederung in Teilgebiete ab. Sie legt großen Wert auf die Didaktik
und vermittelt ein tiefes Verständnis der Grundlagen. Wegen der Gliederung
ist das Werk zur direkten Begleitung der Vorlesung weniger geeignet, ich
empfehle aber einzelne Kapitel daraus zur Ergänzung und Vertiefung.
163

Grundlagen der Mechanik und Elektrodynamik

Transcription

Similar documents

Anwendungen der Tensorrechnung in der technischen Mechanik

Mathematical Continuum Mechanics Exercises

Allgemeine Relativitätstheorie Allgemeine Relativitätstheorie

Kleine Formelsammlung zur Klausur - Physik 1

Österreichische Zeitschrift für Vermessungswesen, Heft 5/1969

Bildschirm

Wurf 2

Die spezielle Relativitätstheorie - Physics at the University Of Virginia

Drehungen, Drehmoment, Drehimpuls und Gleichgewicht