JOHDATUS SUHTEELLISUUSTEORIAAN 763102P

Transcription

JOHDATUS SUHTEELLISUUSTEORIAAN 763102P
JOHDATUS SUHTEELLISUUSTEORIAAN
763102P
Petri Mutka
Fysikaalisten tieteiden laitos
Oulun yliopisto
2005
1. Johdanto
Tiede on itse itseään korjaavaa, ja tieteellinen tieto on
jatkuvan tarkastelun ja kritiikin kohteena. Tämän takia
avoimuus ja riippumattomuus ovat hyvin tärkeitä.
Tieteen ja sen tekijöiden tuottamien tulosten luonne
täytyy olla riippumattomia ulkoisista auktoriteeteistä. Viimekädessä tieteen tuottama tieto saa riippua ainoastaan
tehdyistä havainnoista, joihin havaitsijan omat näkemykset
tai ulkoiset auktoriteetit eivät saa vaikuttaa.
Tiede on edistyvää, eli vanhojen näkemysten ja tulkintojen osoittautuessa jollain tavoin vääriksi tai vajavaisiksi,
ne pyritään korvaamaan uusilla.
Entä käytännössä? Mieti esimerkkejä tilanteista joissa
neljä edellä lueteltua tieteen ominaisuutta voisivat tulla
esille? Kuinka niistä poikkeaminen ilmenee ja mitä siitä
seuraa?
Suhteellisuusteoria, joka koostuu kahdesta erillisestä teoriasta, on toinen modernin fysiikan perusteorioista. Erikoinen tai suppea suhteellisuusteoria käsittelee aikaa ja paikkaa tasaisen liikkeen tapauksessa. Teorian laajennettu versio – yleinen suhteellisuusteoria on gravitaataatioteoria, joka käsittelee kiihtyvää liikettä.
Suhteellisuusteoria laajentaa klassisen Galilein ja Newtonin mekaniikan suurille energioille ja nopeuksille. Erikoisen
suhteellisuusteorian tapauksessa tämä tarkoittaa nopeuksia, jotka ovat merkittävän lähellä valonnopeuden asettamaa ylärajaa. Tällöin ajan ja paikan käsitteet eivät ole
enää klassisessa mielessä yksiselitteisiä.
Tällä kurssilla käsitellään erikoista suhteellisuusteoriaa.
Kurssilla opitaan, kuinka suhteellisuusteoria rakentuu kahden peruspostulaatin pohjalta ja johtaa Lorentzin koordinaatistomuunnokseen, kun koordinaatistojen välinen nopeus on vakio. Suhteellisuusteoriaa pyritään ymmärtämään
neliulotteisen aika-avaruusjatkumon ominaisuuksien pohjalta.
Samanaikaisuuden suhteellisuus, pituuden kontraktio ja
ajan dilataatio saadaan teorian välittöminä seurauksina.
Fysiikan lakien liiketilariippumattomuus on yksinkertaisinta esittää nelivektorein, joihin kurssilla tutustutaan. Kurssi
johdattelee myös suhteellisuusteorian tärkeään sovellutusalueeseen, hiukkasten kinematiikkaan sironta- ja tuottoprosesseissa.
Kurssin tavoitteena on, että sen jälkeen opiskelija:
Mikä on tieteellinen teoria?
Käytännössä tieteen kehitys on jatkuvaa havaintojen ja
teorian vuoropuhelua. Uudet havainnot ja mittaukset luovat uutta teoriaa ja päinvastoin. Tieteellinen teoria on malli, joka pyrkii selittämään havainnot. Teoria kertoo ainoastaan siitä ilmiömaailmasta, jonka kuvaamiseksi se on laadittu.
Tieteellistä teoriaa ei voida koskaan todistaa oikeaksi ainoastaan vääräksi todistaminen on mahdollista.
Karkeasti tieteen kehitystä voidaan kuvata seuraavanlaisella jatkuvasti toistuvalla syklillä.
Tiede uusiutuu tieteellisten kriisien kautta, jotka syntyvät uusista havainnoista, joita vallitseva teoria ei pysty
1. Tunnistaa fysikaaliset tilanteet, jotka johtavat suhteel- selittämään oikein. Tämä ilmenee eri teorioiden tai niiden
lisuusteoreettisiin efekteihin.
osa-alueiden välisinä ristiriitaisuuksina tai väärinä ennusteina käsiteltävistä ilmiöistä.
2. Ymmärtää mitä nämä efektit ovat.
Uusien havaintojen selittämiseksi pyritään luomaan hy3. Pystyy käytännössä käsittelemään osaa niistä.
poteesejä, jotka selittävät sekä vanhat että uudet, ristiriitaiset havainnot. Hypoteesien tasolla eri selitysmallit sekä
teoriat kilpailevat keskenään.
Kirjoja
Parhaalla hypoteesilla, joka korvaa vallitsevan teorian tai
Suhteellisuusteoriasta on kirjoitettu lukuisia oppikirjoja,
laajentaa sitä, on seuraavat ominaisuudet:
tässä muutama lähdeteos joihin kurssi osittain perustuu
• Se selittää teorian kattaman ilmiömaailman sekä kaik• Suhonen, E. Johdatus Suhteellisuusteoriaan luentomoki havainnot mahdollisimman laajasti.
niste, 1991
• Occamin partaveitsi: se on yksinkertaisin.
• French, A. P. Special Relativity, 1968
Tämän jälkeen vallitsevaksi teoriaksi päässyt paras hy• Taylor, E. F. and Wheeler, J. A. Spacetime Physics
poteesi on jatkuvan kritiikin ja testaamisen kohteena, kun(5th ed.), 1998
nes tehdään havaintoja, jotka ovat sen kanssa ristiriidassa
ja sykli alkaa uudelleen.
Kuinka edellä luetellut tieteen neljä tunnusmerkkiä liit1.1 Kuinka tiede toimii?
tyvät edellä kuvattuun tieteen kehityksen kiertokulkuun?
Tieteen yleisiä tunnusmerkkejä ovat
Keksitkö käytännön esimerkkejä? Tämä sykli on toistunut
• Objektiivisuus.
monissa mittakaavoissa useita kertoja tieteen historiassa,
muistatko yhtään esimerkkiä? Millä muilla tavoilla tiede
• Kriittisyys.
voi kehittyä ja miksi tämä on karkea yksinkertaistus?
• Autonomisuus.
1.2 Käytännön esimerkki
• Edistyvyys.
Klassinen fysiikka vuonna 1880...
Tieteellinen tieto perustuu tosiasioihin, joiden täytyy olla
1800-luvun loppupuolella ajateltiin, että klassisen fysiiaina tarkistettavissa ja testattavissa. Tämän takia tieteen
kan avulla voidaan selittää kaikki luonnonilmiöt. Tämän
tuottaman tiedon täytyy olla avointa ja julkista.
1
käsityksen mukaan ainostaan muutama yksityiskohta oli
enää selvittämättä.
Myöhemmin nämä valon liikkeeseen ja materian perusolemukseen liittyvät kysymykset kuitenkin muuttivat kaiken.
Klassinen Galilein-Newtonin mekaniikka käsittelee kappaleiden liikkeisiin ja dynamiikkaan liittyviä ongelmia, kuten esimerkiksi planeettojen liikettä.
Maxwellin sähkömagnetismi selittää sähköön ja magnetismiin liittyvät ilmiöt, mistä esimerkkinä valo ja
sähkömagneettisen säteilyn luonne.
Termodynamiikka käsittelee kaasujen ja nesteiden olemusta makroskooppisessa mittakaavassa.
Boltzmannin statistinen mekaniikka käsittelee ainetta ja sen eri olomuotoja mikroskooppisista lähtökohdista
lähtien.
Klassisen fysiikan luomassa maailmankuvassa oli kaksi keskeistä selvittämätöntä ongelmaa. Maxwellin teorian
mukaisen sähkömagneettisen säteilyn (aaltoliikkeen) hypoteettisen väliaineen, eli eetterin, olemusta ei ymmärretty.
Toinen ongelmakohta oli aineen säteilemän spektrin selittäminen.
Suhteellisuusteoria on teoria ajasta ja paikasta. Teorian pohjalta on myöhemmin kehitelty gravitaatioteorioita
eteenpäin, mutta perusmuodossaan se on Albert Einsteinin
luoma (1905,1915).
1.3 Suhteellisuusteoria
Suppea tai erikoinen suhteellisuusteoria, jonka Albert
Einstein julkaisi vuonna 1905, käsittelee vapaasti liikkuvia
havaitsijoita. Teoria on erikoistapaus myöhemmin julkaistusta yleisestä suhteellisuusteoriasta (1915).
Suhteellisuusteoria romuttaa klassisen ajan ja paikan
käsitteen, ja sitoo ne havaisijan liiketilaan. Teoria perustuu oletuksille, joiden mukaan valon tyhjiönopeus (suurin
mahdollinen nopeus) on vakio ja fysiikan lait ovat samat
kaikille havaitsijoille.
Teorian taustalla on neliulotteinen kuva aikaavaruusjatkumosta, jossa aika rinnastetaan paikkakoordinaatteihin. Käytännössä erikoinen suhteellisuusteoria on
varsin yksinkertainen, vaikkakin se johtaa arkiajattelulle
vieraisiin tilanteisiin.
Yleinen suhteellisuusteoria laajentaa erikoisen suhteellisuusteorian käsitteet myös kiihtyvässä liikkeessä oleviin
havaitsijoihin. Käytännössä tämä johtaa teoriaan gravitaatiosta.
Teorian perusajatuksen mukaisesti painovoima syntyy neliulotteisen aika-avaruusjatkumon kaareutumisesta.
Tätä kaareutumista kuvaa Einsteinin kenttäyhtälö, joka
määrää kuinka aine (=massa, energia) vaikuttaa kaarevuuteen. Vastaavasti avaruuden kaarevuus määrää sen, kuinka
aine siellä liikkuu.
Kaarevien avaruuksien käsittely johtaa matemaattisesti
melko vaativaan yleiseen vektorilaskentaan, ja aihe onkin
huomattavasti erikoista suhteellisuusteoriaa vaativampi ja
raskaampi.
... ja sen jälkeen.
Vuosisadan vaihtuessa tehtiin nopeaan tahtiin lukuisia
havaintoja, jotka olivat ristiriidassa klassisen fysiikan tuottamien ennusteiden kanssa:
• Röntgensäteet (Röntgen, 1895), joiden tuottaminen
on kvantti-ilmiö. Vasta vuonna 1912 osoitettiin, että
röntgensäteet ovat lyhytaaltoista sähkömagneettista
säteilyä.
• Elektroni (Thomson, 1895), jonka sähkövaraus muodostaa alkeisvarauksen. Alkeisvarauksen olemassaoloa
oli epäilty aiemminkin.
1.4 Suhteellisuusteoria ja klassinen fysiikka
• Radioaktiivisuus (Becquerel, 1896), jossa atomiytimet
säteilevät hiukkas- tai sähkömagneettista säteilyä hajotessaan.
Edellä kuvailtu modernin fysiikan perusteorioiden synty ei tarkoita sitä, että klassinen fysiikka olisi hylättävä.
• Valosähköinen ilmiö (Hertz, Hallwachs, Lenard, 1887- Klassisen fysiikan teoriat toimivat hyvin tarkasti omilla
1899), jossa sähkömagneettinen säteily irrottaa elekt- pätevyysalueillaan.
roneja metallista oikeissa olosuhteissa. Klassinen fyIlmiöiden energiatiheys määrää sen, ovatko relativistiset
siikka antaa tässä täysin vääriä ennusteita. Einstein efektit merkittäviä. Tämä ei ole aina itsestäänselvä tilanne,
sai valosähköisen ilmiön selittämisestä Nobelin palkin- sillä energiaa voi olla monessa muodossa, kuten esimerkiknon vuonna 1921.
si:
• Michelsonin ja Morleyn koe (Michelson, Morley
1887), jolla pyrittiin selvittämään maapallon liiketilaa
sähkömagneettisen säteilyn hypoteettisen väliaineen,
eetterin, suhteen.
• Liike-energia: jos kappaleelle annetaan tarpeeksi liikeenergiaa, sen nopeus nousee tarpeeksi lähelle valonnopeutta (relativistiseksi) ja klassisen mekaniikan mukainen kuvaus tilanteelle pettää.
Näiden havaintojen lisäksi selvät ristiriidat klassisen fysiikan teorian sisällä johtivat myöhemmin modernin fysiikan kahteen perusteoriaan:
Kvanttimekaniikka käsittelee mikroskooppisen mittakaavan ilmiöitä. Kaikki modernit aineen rakenteen teoriat perustuvat kvanttimekaniikkaan. Kvanttimekaniikan syntyyn
vaikutti useita henkilöitä, joista mainittakoon deBroglie,
Bohr, Heisenberg, Born, Planck, Jordan, Schrödinger, Dirac, Pauli jne. (likimain 1924-1930).
• Massa: Massa on energiaa ja päinvastoin. Jos kappaleen tiheys on tarpeeksi suuri, se alkaa kaareuttamaan
avaruutta hyvin voimakkaasti. Tämä voi johtaa voimakkaisiin kiihtyvyyksiin ja relativistiin nopeuksiin.
• Lämpötila: lämpötila on liikettä, johon on sitoutuneena energiaa. Tarpeeksi korkeat lämpötilat vaativat relativististen efektien huomioonottamista.
2
• Paine: paine ja lämpötila liittyvät läheisesti toisiinsa. Energiaa voi olla varastoituneena myös staattisiin
jännityksiin, mika voi periaatteessa johtaa myös relativistisiin ilmiöihin.
• Yleisen suhteellisuusteorian mukainen valon kaareutuminen painovoimakentässä on havaittiin ensimmäisen
kerran Auringon lähettyvillä. Nykyään tämä ilmiö
nähdään monien astrofysikaalisten kohteiden yhteydessä.
Matalaenergisellä rajalla relativististen efektien tulee
hävitä ja suhteellisuusteorian täytyy tällöin tuottaa klassisen fysiikan mukaisia tuloksia.
Keksitkö todellisia fysikaalisia tilanteita, jotka voivat
johtaa relativistisiin efekteihin? Entäpä esimerkkejä edellä
luetelluista energian olomuodoista?
• Merkuriuksen radan (perihelin) kiertyminen on mitattu ilmiö, joka vastaa hyvin tarkasti yleisen suhteellisuusteorian ennustetta. Suurin osa radan kiertymisestä selittyy klassisen mekaniikan avulla, mutta sen
ylitse jäävä osa on tarkasti suhteellisuusteorian mukainen.
1.5 Suhteellisuusteorian testit
• Yleinen suhteellisuusteoria ennustaa, että neliulotteisessa aika-avaruusjatkumossa voi liikkua aaltoja, jotka syntyvät nopeasti muuttuvan gravitaatiokentän yhteydessä. Näistä aalloista on toistaiseksi
vain epäsuoria havaintoja, mutta meneillään on useita
havaintoprojekteja, jotka pyrkivät gravitaatioaaltojen
suoraan havaitsemiseen.
Kun kahta modernin fysiikan perusteoriaa yritetään soveltaa yhtäaikaa, päädytään ongelmiin. Suhteellisuusteoria
ja kvanttimekaniikka eivät sovi yhteen.
Pitkään on jo epäilty, että taustalla olisi yksi teoria joka kattaa sekä kvanttimekaniikan että suhteellisuusteorian.
Tämän vuoksi teorioiden testaaminen on hyvin tärkeää,
sillä niiden ennusteista poikkeavat havainnot antavat vihjeitä uudesta fysiikasta!
• Gravitaation aiheuttama punasiirtymä on mitattu
maapallon pinnalla ja se havaitaan myös monien astrofysikaalisten kohteiden yhteydessä.
Erikoinen suhteellisuusteoria
Erikoista suhteellisuusteoriaa on testattu paljon, ja
tähän mennessä kaikki sen antamat ennusteet ovat olleet
hyvin tarkkoja:
• Eetterikokeet, joissa yritetään löytää absoluuttista lepokoordinaatistoa mittaamalla valon tyhjiönopeutta
eri suunnissa interferometrillä.
• Modernit eetteritestit, jotka perustuvat laserin tai maserin käyttöön.
• Mitataan valonnopeutta hyvin tarkasti, esimerkiksi tasaisesti liikkuvassa, kiihtyvässä, pyörivässä tms. koordinaatistossa, ja yritetään löytää poikkeamia valon
tyhjiönopeudessa.
• Punasiirtymämittaukset, joissa etsitään poikkeamia suhteellisuusteorian ennustamasta relativistisesta doppler-siirtymästä (liikkuvan valonlähteen
säteilemän sähkömagneettisen säteilyn aallonpituuden
muutos).
• Ajanmittaustestit. Suhteellisuusteoria ennakoi liikkuvien kellojen käyvän eri tahtiin kuin levossa olevien.
Tästä on etsitty poikkeamia lennättämällä hyvin tarkkoja kelloja esimerkiksi satelliiteissa.
Yleinen suhteellisuusteoria
Yleisen suhteellisuusteorian testaaminen on huomattavan paljon vaikeampaa kuin erikoisen suhteellisuusteorian.
Tämä johtuu siitä, että yleistä suhteellisuusteoriaa vaativat relativistiset ilmiöt syntyvät yleensä suurien massojen
lähettyvillä.
Niinpä useimmat yleisen suhteellisuusteorian testit ovat
käytännössä havaintoja astrofysikaalisista kohteista joissa
relativistiset efektit ovat voimakkaina näkyvissä.
Tälläisiä testejä ovat esimerkiksi:
3
2. Koordinaatistojärjestelmät
Sama pallo!
Sama paikka!
Sama aika!
Klassisesti kappaleen liikkeen kuvaamiseksi tarvitaan
koordinaatistojärjestelmä (frame tai frame of reference),
joka koostuu seuraavista käsitteistä:
• Piste, jonka suhteen paikkaa mitataan, eli origo.
• Sopimus tavasta, jolla paikkaa origon suhteen mitataan.
• Kello, joka kertoo millä ajanhetkellä kappale on kussakin paikassa.
Koska suhteellisuusteorian kannalta aika ja paikka eivät
ole yksikäsitteisiä klassisessa mielessä, muutamia koordinaatistojärjestelmiin liittyviä käsitteitä joudutaan tarkentamaan.
Kuva 1: Heitetyn pallon lentoradan muoto on havaitsijan
liiketilasta riippuva. Molemmissa taloissa pallon paikka ja
nopeus, sekä itse talon paikka, on heittohetkellä sama. Vasemmassa talossa, joka pysyy maan suhteen paikallaan, lentorata on paraabeli. Pallon lähtöhetkellä vapaasti tippuvan
talon suhteen rata on suoraviivainen.
Kello liittyy jokaiseen koordinaatiston pisteeseen, ja samassa koordinaatistossa olevat kellot ovat synkronoitu
keskenään. Käytännössä tämä synkronointi tehdään
seuraavasti: valitaan referenssipiste, jossa oleva kello
nollataan. Lähetetään tästä pisteestä radiaalisesti laajeneva valorintama. Jokaisessa valorintaman saavuttamassa pisteessä oleva kello asetetaan aikaan, joka
on valorintaman mukana kulkevan referenssikellon sen
hetkisestä ajasta vähennettynä valorintaman laajenemiseen kulunut aika.
Keksitkö todellisia tilanteita, joissa pyörivän tai liikkuvan koordinaatiston käytöstä voisi olla hyötyä?
2.1 Vapaa koordinaatisto
Tapahtuma on tietty aika ja paikka avaruudessa, joka
Miksi maan pinnalta heitetty pallo lentää paraabeliramääritellään esimerkiksi yhden aika- ja kolmen paik- dalla? Tarkastellaan seuraavanlaista tilannetta uhkarohkakoordinaatin avulla (t, x, y, z).
keasti kallion kielekkeelle rakennetussa talossa (kuva 1).
Havaitsija on olio, joka pystyy mystisesti lukemaan kaikMaanpinnan suhteen levossa olevassa talossa pallo lentää
kia koordinaatiston kelloja välittömästi ilman valonparaabeliradalla,
ja vapaasti tippuvassa talossa lentorata
nopeuteen liittyvää signaaliviivettä.
on suoraviivainen. Jokapäiväisen kokemuksen mukaisesti
Koordinaatistojärjestelmä on yksinkertaisesti sopimus pallon paraabelirata on seurausta painovoimasta.
siitä kuinka aikaa ja paikkaa ilmaistaan. SuhteellisuusTilannetta voidaan tarkastella myös toisin. Pallon hateorian vahvuus on koordinaattivapaa ilmaisu, jossa luon- vaittu paraabelirata on seurausta havaitsijan “epäluonnolnonlait määritellään valitusta koordinaatistojärjestelmästä lisesta” koordinaatistosta, jossa esiintyy huonosta koordiriippumattomalla – invariantilla – tavalla.
naatiston valinnasta johtuvia ylimääräisiä kiihtyvyyksiä.
Itseasiassa valitulla koordinaatistojärjestelmällä mitaVapaassa pudotuksessa oleva havaitsija näkee pallon liiktaan abstraktimpaa matemaattista käsitettä, eli monistoa, kuvan “luonnollisen” suoraviivaisesti. Gravitaatio on hajoka voidaan tässä yhteydessä mieltää “jatkuvaksi avaruu- vaitsijan liiketilasta johtuvaa “harhaa” – aina voidaan
deksi”. Monisto itsessään voi olla kaareva, kuten koordi- määritellä hetkeksi paikallinen koordinaatisto, jossa sitä ei
naatistokin. Tästä esimerkkinä maapallon kartta, jota ei ole.
voi esittää tasossa ilman mittakaavavirheitä, koska maan
2.2 Vapaan koordinaatiston paikallinen
pinta on kaareva pallon pinta.
Erilaisia koordinaatistoja, joilla voidaan kuvata samaa luonne
tilannetta on ääretön määrä. Pelkästään tutusta karteesiPainovoimaa ei voida hävittää mielivaltaisen pitkäksi aisesta koordinaatistosta on monia muunnelmia (oikea- tai kaa mielivaltaiselta alueelta. Ammutaan esimerkinomaisesvasenkätinen, vino- eli skewed -koordinaatisto, ortogonaali- ti avaruusalus ja kaksi VR:n junavaunua Maata kiertävälle
nen jne.). Muista koordinaatistoista mainittakoon esimer- radalle.
kiksi napa-, sylinteri- tai vaikkapa elliptinen koordinaatisKuvan 2 avaruusaluksessa olevat testikappaleet liikkuvat
to.
kuten vapaassa koordinaatistossa. Käytännössä niihin ei
Myös itse koordinaatisto voi olla liikkeessä tai vaikkapa vaikuta koordinaatiston valinnasta johtuvia voimia, mikäli
pyöriä, jolloin itse koordinaatisto on ajasta riippuvainen.
tarkastelu rajoitetaan tarpeeksi pienelle alueelle (aluksen
Sopivan koordinaatiston valinta on hyvin tärkeää on- sisäosaan).
gelman ratkaisussa, sillä joissain koordinaatistoissa sen
Jos koordinaatistoa levennetään tarpeeksi sivusuunnaskäsittely voi muuttua hyvin yksinkertaiseksi ja joissain taas sa, kuten vaakalennossa radallaan etenevässä junavaunusäärimmäisen hankalaksi!
sa (kuva 3), vaunun eri päissä oleviin testikappaleisiin vai4
Kuva 2: Avaruusaluksen sisällä tarpeeksi pienellä, vapaasti liikkuvalla alueella Maan kiertoradalla gravitaatiota ei
voida havaita.
Kuva 4: Vaapaasti liikkuvan alueen ollessa laaja radiaalisessa suunnassa, voimien suuruudet muuttuvat, koska gravitaatiovoima on kääntäen verrannollinen etäisyyden neliöön.
Inertiaalilain voimassaolo riippuu valitusta koordinaatistosta. Koordinaatistoa, jossa Newtonin inertiaalilaki on
voimassa, kutsutaan inertiaalikoordinaatistoksi.
Inertiaalikoordinaatisto on idealisaatio, jota ei todellisuudessa ole olemassa. Käytännössä koordinaatistoa voidaan aina laajentaa siten, että siihen sisältyy (epätasaisia)
gravitaatiokenttiä, jotka tuottavat sisäisiä koordinaatiston
valinnasta johtuvia kiihtyvyyksiä.
Käytännössä kuitenkin lähes aina voidaan määritellä sopivan kokoinen vapaa koordinaatisto, jota voidaan käsitellä
halutulla tarkkuudella, kuten inertiaalikoordinaatistoa.
Koordinaatistoja, jotka eivät ole inertiaalikoordinaatistoja, ja joissa on sisäisiä kiihtyvyyksiä, kutsutaan epäinertiaalikoordinaatistoiksi. Jos voitaisiin tehdä mielivaltaisen
pitkiä ja tarkkoja mittauksia, kaikki reaalimaailman koordinaatistot olisivat todellisuudessa epäinertiaalikoordinaatistoja.
Kuva 3: Jos vapaasti liikkuva alue on tarpeeksi suuri sivusuunnassa, kuten tässä VR:n junavaunussa, gravitaatiovoimien suunta vaunun eri osissa muuttuu.
kuttavat hieman erisuuntaiset voimat ja koordinaatistossa
esiintyy sen valinnasta johtuvia sisäisiä voimia.
Vastaavasti radiaalisessa suunnassa (kuva 4), pystyssä
olevassa vaunussa testikappaleisiin vaikuttavat voimat ovat
erisuuria vaunun eri päissä. Näin ollen tässäkin koordinaatistossa esiintyy sen valinnasta johtuvia sisäisiä voimia.
Jos vapaassa koordinaatistossa tarkasteltava alue on tarpeeksi pieni ja aikaväli on tarpeeksi lyhyt, painovoimaa ei
ole. Koska gravitaatiokenttä ei ole tasainen, tarpeeksi suurella alueella (tai pitkänä aikana) sen vaikutukset tulevat
esille myös vapaassa koordinaatistossa.
Se, mitä tarpeeksi pieni alue ja lyhyt aikaväli tarkoittaa, riippuu täysin tarkasteltavasta ongelmasta. Joka tapauksessa koordinaatisto täytyy erikoisen suhteellisuusteorian ongelmissa rajata sopivalle alueelle aikaavaruusjatkumossa.
Jos tämä ehto rikkoutuu, tarvitaan yleistä suhteellisuusteoriaa, jossa ongelmaa käsitellään (periaatteessa)
määrittelemällä sarja paikallisia koordinaatistoja sekä
sääntö siitä, kuinka niiden välillä liikutaan.
2.4 Fysiikan lait inertiaalikoordinaatistossa
Kahdesta toistensa suhteen liikkuvasta inertiaalikoordinaatistosta on mahdotonta sanoa, kumpi on levossa ja
kumpi liikkeessä. Kaikki inertiaalikoordinaatistot ovat samanarvoisia.
Periaatteessa tämä on Galilein esittämä suhteellisuusperiaate hieman laajennetussa muodossa:
Fysiikan lait ovat samat kaikissa
inertiaalikoordinaatistoissa!
Einstein laajensi suhteellisuusperiaatteen Galileon
esittämästä suoraviivaisesta liikkeestä koskemaan myös
vapaata liikettä (ks. edellä käsitelty vapaa koordinaatisto).
2.3 Inertiaalikoordinaatisto
Olkoot kaksi inertiaalikoordinaatistoa A ja A’, joista A’
Newtonin ensimmäinen laki, eli inertiaalilaki, kuuluu liikkuu A:n suhteen vakionopeudella v suuntaan x. Hetkellä
seuraavasti:
t = t′ = 0 koordinaatistojen origot ovat samassa pisteessä.
Koordinaatistosta A siirrytään koordinaatistoon A’
a) Levossa oleva kappale pysyy levossa, jos siihen ei vaimuunnoksella
′
kuta ulkoisia voimia ja
x = x − vt
(1)
t′ = t
b) liikkuva kappale jatkaa liikettään vakionopeudella, jos
siihen ei vaikuta ulkoisia voimia.
Muunnosta (1) kutsutaan Galilein koordinaatistomuun5
nokseksi.
Esimerkki: Newtonin toinen laki
Newtonin toinen laki
F = ma ⇔ a =
F
m
(2)
kertoo, että kappaleen kiihtyvyys a on suoraan verrannollinen siihen vaikuttavaan voimaan F ja kääntäen verrannollinen sen massaan m.
Tämä on voimassa kaikissa inertiaalikoordinaatistoissa,
koska derivoitaessa muunnosyhtälöitä (1) ajan suhteen, nopeudet edellämainituissa inertiaalikoordinaatistoissa A ja
A’ muuntuvat kuten
u′ = u − v.
(3)
Koska kiihtyvyys on nopeuden muutos ajan funktiona, ja
koordinaatistojen A ja A’ välinen nopeus v on vakio, saadaan uudelleen ajan suhteen derivoimalla kiihtyvyyksille
a′ = a.
(4)
Eli Newtonin toinen laki (2) on voimassa kaikissa inertiaalikoordinaatistoissa.
2.5 Fysiikan lait epäinertiaalikoordinaatistoissa
Newtonin toinen laki ei ole voimassa sellaisenaan epäinertiaalikoordinaatistossa.
Esimerkiksi maata kiertävään avaruusalukseen sidottu
tarpeeksi laaja koordinaatisto on tälläinen epäinertiaalikoordinaatisto. Vaikka aluksen sisällä olevaan testikappaleeseen vaikuttaa Maan vetovoima, se pysyy avaruusaluksen suhteen paikallaan.
Tämä voidaan ymmärtää määrittelemällä kiihtyvässä
liikkeessä olevasta koordinaatistosta johtuva keinotekoinen
voima - keskipakoisvoima - joka kumoaa Maan vetovoiman.
Epäinertiaalikoordinaatistoja voidaankin käsitellä määrittelemällä keinotekoisia koordinaatistoon liittyviä voimia.
Tälläisiä inertiaalivoimia ovat esimerkiksi keskipakois- ja
Coriolisvoima.
On tärkeää ymmärtää, missä ja millaisessa koordinaatistossa ongelmaa käsitellään, sillä epäinertiaalikoordinaatistoja täytyy käsitellä eri tavalla kuin inertiaalikoordinaatistoja!
6
3. Suhteellisuusteorian perusperiaatteet
Erikoinen suhteellisuusteoria (ja tämä kurssi) käsittelee
ajan ja paikan käsitettä kappaleilla, joiden suhteelliset nopeudet ovat merkittävä osa valon tyhjiönopeudesta c ≈
3.0 × 108 m/s. Teoria käsittelee tasaista liikettä eli erilaisia
inertiaalikoordinaatistoja.
Epäinertiaalikoordinaatiston tapauksessa voidaan joutua turvautumaan yleiseen suhteellisuusteoriaan, joka menee käsittelemämme ongelmakentän sekä tämän kurssin ulkopuolelle.
nopeus v
v≪c
v<
∼c
Inertiaalikoordinaatisto
Newtonin lait
Suppea
suhteellisuusteoria
Epäinertiaalikoordinaatisto
Newtonin lait +
inertiaalivoimat
Yleinen
suhteellisuusteoria
Kuva 5: Michelson ja Morley mittasivat valonnopeutta
interferometrillä maapallon ratanopeuden suuntaan sekä
Modernia fysiikkaa edeltävä klassinen fysiikka perustuu sitä vastaan kohtisuorassa suunnassa. Nopeuksien oletettiin muuttuvan (vasen puoli), mutta mittaustuloksen (oipitkälti kahdelle perusteorialle:
kea puoli) mukaan valonnopeus oli suunnasta riippumaton.
• Klassinen mekaniikka, joka sai alkunsa 1500 - 1600 luvun aikana (Newton ja Galilei).
ja heijastuu peilistä P1 ilmaisimelle T. Vastaavasti toinen
• Maxwellin sähkömagnetismin teoria 1800-luvulta.
valonsäde kulkee ensin matkan l2 ja heijastuu peilistä P2
Klassinen mekaniikka lepää vahvasti Galileo Galilein puoliläpäisevän peilin P kautta samalle ilmaisimelle T, jolaikoinaan muotoileman suhteellisuusperiaatteen varassa, la molemmat valonsäteet interferoivat.
Syntynyt interferenssikuvio riippuu molempien vajonka mukaan fysiikan lait ovat liiketilasta riippumattolonsäteiden
matkaan käyttämästä ajasta. Laitetta
mat.
pyöritettäessä,
eetterin suhteen vakionopeudella liikkuvan
Maxwellin sähkömagnetismiä kuvaavat yhtälöt kuitenvalon
nopeuden
tulisi muuttua maan rataliikkeen sekä
8
kin ennustavat valolle nopeuden c ≈ 3.0 × 10 m/s. Klasmittaussuunnan
mukaisesti
ja interferenssikuvion tulisi
sisen fysiikan kriittiseksi kysymykseksi 1800-luvun lopulla
muuttua
vastaavasti.
tuli, minkä suhteen Maxwellin teorian tuottama valonnoOletetaan, että maapallon nopeus on hypoteettisen eetpeus on määritelty?
terin
suhteen v, ja valonnopeus vastaavasti c. Tarkastellaan
On helppo osoittaa, että Maxwellin yhtälöt eivät ole
ensin
tapausta, jossa haara S-P-P2 on maan rataliikkeen
invariantteja Galilein koordinaatistomuunnoksen suhteen.
suunnassa.
Maxwellin sähkömagnetismi ja klassinen Galilein ja NewPeilin P2 kautta kukevan valonsäteen nopeus on Galilein
tonin mekaniikka ovat ristiriidassa.
muunnosten
mukaisesti
1800-luvun lopulla valon tiedettiin olevan aaltoliikettä.
3.1 Historiaa
Koska aaltoliike tapahtuu (yleensä) väliaineessa, pääteltiin
suunnassa P-P2 ⇒ c + v
,
että Maxwellin yhtälöt antavat valonnopeuden tuntematsuunnassa P2 -P ⇒ c − v
toman hypoteettisen väliaineen, eetterin suhteen.
Tästä voitiin edelleen päätellä, että valonnopeuden ol- jolloin matkaan P-P2-P kuluu valolta aika
lessa vakio eetterin suhteen määritellyssä inertiaalikoordil2
l2
2cl2
naatistossa, täytyy valonnopeuden muuttua Galilein koort2 =
+
= 2
c
−
v
c
+
v
c
− v2
dinaatistomuunnosten mukaiseksi muissa inertiaalikoordinaatistoissa.
2l2 γ 2
1
Michelsonin ja Morleyn kokessa (1881,1887) yritettiin
⇔ t2 =
, γ= p
.
(5)
mitata valonnopeuden muutoksia eri suuntiin eetterin suhc
1 − (v/c)2
teen liikkuvien havaitsijoiden koordinaatistoissa (kuva 5).
Vastaavasti peilin P1 kautta kulkevalle valonsäteelle
√
3.2 Michelsonin ja Morleyn koe
suunnassa P-P1 ⇒ √c2 − v 2
,
Koejärjestelyssä mitataan kahden toisiaan vastaan kohc2 − v 2
suunnassa P1 -P ⇒
tisuoraan liikkuvan valonsäteen nopeutta interferometrin
avulla (kuva 6).
jolloin matkaan P-P1-P kuluu valolta aika
Interferometrissä monokromaattisesta valonlähteestä
l1
2l1
lähtevä valonsäde jakautuu puoliläpäisevässä peilissä P
t1 = 2 √
γ.
(6)
=
2
2
c
kahteen osaan. Ensimmäinen valonsäde kulkee matkan l1
c −v
7
P1
Kuitenkaan minkäänlaista muutosta ei havaittu. Tämän
jälkeen Michelsonin ja Morleyn jälkeen koe on uusittu huomattavasti suuremmilla mittaustarkkuuksilla, eikä muutoksia valonnopeudessa ole havaittu.
Valon tyhjiönopeus on sama kaikissa
koordinaatistoissa!
Useiden epäonnistuneiden selitysyritysten jälkeen tämän
ristiriidan Maxwellin sähkömagnetismin ja klassisen Galilein ja Newtonin mekaniikan välillä ratkaisi Einstein vuonna 1905 erikoisella suhteellisuusteoriallaan.
Einsteinin elegantti ratkaisu perustuu yksinkertaiselle oivallukselle. Jos valonnopeus on vakio kaikissa koordinaatistoissa, täytyy ajan olla koordinaatistosta riippuva!
Peili
l1
P
Peili
P2
Puoliläpäisevä
peili
Valonlähde
l2
T
Ilmaisin
v<
~c
Absoluuttinen aika
Galilein koordinaatistomuunnos
Kuva 6: Michelson ja Morley kokeessa valonlähteestä
lähtevä, eetterin suhteen vakionopeudella liikkuva, kahteen
osaan jaettu valonsäde kulkee kahta toisiaan vastaan kohtisuoraan olevaa haaraa pitkin ja interferoi sen jälkeen ilmaisimella. Laitetta pyöritettäessä tulisi mittaussuunnan
muuttua maapallon rataliikkeen suhteen ja interferenssikuvion muuttua vastaavasti.
Nyt eri reittejä kulkeville valonsäteille (5) ja (6) aika-ero
on
2γ
(γl2 − l1 ).
(7)
∆t = t2 − t1 =
c
Kun laitetta käännetään siten että P1 -P-T on rataliikkeen suunnassa, kuluu matkoihin aikaa t̄1 = t2 ja t̄2 = t1 3.3 Suhteellisuusteorian peruspostulaatit
ja
Erikoinen suhteellisuusteoria rakentuu kahden peruspos2γ
tulaatin
varaan:
(l2 − γl1 ).
(8)
∆t̄ = t̄2 − t̄1 =
c
1. Kaikki inertiaalikoordinaatistot ovat samanarvoisia
Näin ollen ilmaisimella T havaittu interferenssikuvion
fysiikan lakien suhteen. Absoluuttista lepokoordinaasiirtymä on verrannollinen aikojen (7) ja (8) erotukseen
tistoa ei ole olemassa.
2γ
(γl2 − l1 − l2 + γl1 )
∆ = ∆t − ∆t̄ =
2. Valon tyhjiönopeus on sama (vakio) kaikissa koordic
naatistoissa.
2γ
=
(γ − 1)(l1 + l2 ).
(9)
Ensimmäistä postulaattia kutsutaan suhteellisuusperic
aatteeksi. Sen mukaan jotkut mitattavat suureet voivat olla
Jos T = λ/c on säteilyjakson kesto, jossa λ on säteilyn
koordinaatistoriippuvaisia, sen sijaan fysiikka sellaisenaan
aallonpituus, on siirtymä
on aina sama kaikille havaitsijoille.
Suhteellisia, tai havaitsijan koordinaatiston liiketilasta
∆
2γ
S=
=
(γ − 1)(l1 + l2 ).
(10) riippuvaisia, suureita voivat olla mm.
T
λ
Koska maan ratanopeus on merkittävästi alle valonnopeuden (v/c ≪ 1), voidaan γ kehittää sarjaksi
1 v2
γ= p
+ ... ,
=1+
2 c2
1 − (v/c)2
1
• Spatiaaliset etäisyydet.
• Aikavälit.
(11)
• Kiihtyvyydet, koska ne ovat aikariippuvaisia.
• Voimat, koska nekin ovat riippuvaisia ajasta.
joka katkaistaan toisen asteen termin jälkeen (v 4 /c4 ≈ 0).
• Kentät, jotka aiheuttavat voimia.
Tällöin
l1 + l2 v 2
S≈
.
(12)
Suhteellisuusperiaatteen mukaisesti muuttumattomia tai
λ c2
invariantteja
ovat mm.
Michelson ja Morleyllä oli l1 +l2 ≈ 22m, λ = 5.5×10−7m
ja maan ratanopeus on v ≈ 30km/s. Näillä arvoilla tulee
• Fysiikan lainalaisuudet.
siirtymäksi yhtälön (12) mukaisesti S = 0.4. Näin suuri siir• Luonnonvakiot.
tymä olisi varmasti havaittu jo 1800-luvun mittalaitteilla.
8
Vastaavasti ehdosta 2. tulee u′ = −v ⇒ u = 0, ja
• Tapahtumien väliset syy- ja seuraussuhteet.
β
Näistä kahdesta postulaatista on suorana seurauksena
−v = ⇔ β = −δv.
(17)
δ
Lorentz-muunnos, joka korvaa relativistisessa tapauksessa
klassisen Galilein koordinaatistomuunnoksen.
Nyt yhtälöistä (16) ja (17) saadaan
Olkoot kaksi koordinaatistoa A ja A’, joiden akselit ja
δ = α.
(18)
origo ovat päällekkäin hetkellä t = t′ = 0. Koordinaatisto A’ liikkuu nopeudella v koordinaatiston A suhteen xEhdosta 3. saadaan u′ = c ⇔ u = c, jolloin
akselin suuntaan.
αc − αv
α(c − v)
αc + β
Tällöin koordinaatistosta voidaan siirtyä toiseen
=
=
c=
γc + δ
γc + α
γc + α
edellämainitun Lorentz muunnoksen avulla
 ′
⇔ c(γc + α) = α(c − v)
x = √ x−vt


1−v 2 /c2


 y′ = y
α(c − v)
αv
(13)
′
⇔ γc =
(19)
−α⇔γ =− 2
 z = z

c
c

t−vx/c2

′
√
 t =
Huomaa, että δ 6= −γv ⇔ v 2 6= c2 , eli koordinaatistojen
1−v 2 /c2
välinen nopeus ei voi olla valonnopeus!
Tässä c on koordinaatistosta riippumaton valon tyhNyt yhtälöiden (17), (18) ja (19) avulla muunnoksiksi
jiönopeus c ≈ 3.0 × 108 m/s.
(14) saadaan
′
x = αx − αvt
= α(x − vt)
3.4 Lorentz-muunnos
.
(20)
′
2
t
=
−αvx/c
+
αt
= α(t − vx/c2 )
Johdetaan Lorentz -muunnos lähtien peruspostulaateista. Olkoot kaksi koordinaatistoa O ja O’. O’ liikkuu O:n
Määritellään kerroin α lähettämällä hetkellä t = t′ = 0
suhteen vakionopeudella v x-akselin suuntaan. Hetkellä valorintama, joka etenee joka suuntaan nopeudella c. Valo
t = t′ = 0 koordinaatistojen origot ja akselit yhtyvät.
kulkee ajassa t matkan r = ct, näinollen
Jos joku piste liikkuu O:ssa tasaisella nopeudella, täytyy
x2 + y 2 + z 2 = c2 t2 ⇔ x2 + y 2 + z 2 − c2 t2 = 0.
sen liikkua tasaisesti myös koordinaatistossa O’. Näinollen
muunnoksen koordinaatistojen välillä täytyy olla lineaariKoska valo liikkuu samalla tavalla kaikissa koordinaatisnen:
′
toissa, täytyy olla myös
′
x = x (x, t) = αx + βt
,
(14)
′
′
t = t (x, t) = γx + δt
(x′ )2 + (y ′ )2 + (z ′ )2 − c2 (t′ )2 = 0.
jossa α, β, γ ja δ ovat vakioita. Muunnoksessa (14) Näinollen tätyy olla voimassa
on jätetty kirjoittamatta muunnoksessa säilyvät y- ja zx2 + y 2 + z 2 − c2 t2 = A2 {(x′ )2 + (y ′ )2 + (z ′ )2 − c2 (t′ )2 }
komponenttien muunnokset (y ′ = y sekä z ′ = z).
Muunnoksessa täytyy päteä
= A2 {(x′ )2 + y 2 + z 2 − c2 (t′ )2 },
1. Piste levossa O’:ssa liikkuu nopeudella v O:ssa.
missä A on jokin vakio. Tästä seuraa, että
2. Piste levossa O:ssa liikkuu nopeudella −v O’:ssa.
⇔ (1 − A2 )(y 2 + z 2 ) + x2 − c2 t2 = A2 (x′ )2 − c2 (t′ )2 .
3. Valonnopeus c on sama molemmissa koordinaatistois- Tämän perusteella täytyy olla A2 = 1 ja
sa.
x2 − c2 t2 = (x′ )2 − c2 (t′ )2 .
(21)
O:ssa nopeudella u = dx/dt liikkuva piste liikkuu O’:ssa
Kun sijoitetaan yhtälöön (21) muunnos (20),saadaan
nopeudella u′ = dx′ /dt′ . Differentioimalla muunnosyhtälöt
2
(14) saadaan
x2 − c2 t2 = α2 (x − vt)2 − c2 α2 t − vx/c2
v
v
dx′ = αdx + βdt
2
1
+
=1
1
−
⇔
α
c
c
dt′ = γdx + δdt
⇔ u′ =
αdx + βdt
αdx/dt + β
dx′
=
=
′
dt
γdx + δdt
γdx/dt + δ
αu + β
=
.
γu + δ
Ehdosta 1. saadaan u′ = 0 ⇒ u = v, jolloin
αv + β
= 0 ⇔ β = −αv, δ 6= −γv.
γv + δ
1
.
α= p
1 − v 2 /c2
(22)
Tässä täytyy valita positiivinen juuri neliöidystä lausek(15) keesta, jotta ajan suunta säilyy. Lopulliseksi muunnokseksi
tulee siis yhtälön (22) avulla muunnoksesta (20)
 ′
x = √ x−vt


1−v 2 /c2


 y′ = y
(16)
(23)
′
 z = z

2


 t′ = √t−vx/c
2
2
1−v /c
9
ja vastaava käänteismuunnos saadaan vaihtamalla muuttujien paikkaa ja korvaamalla v → −v:

′
′
x = √x +vt


2 /c2
1−v


 y = y′
.
(24)
z = z′


′
′
2

t +vx /c

 t = √
2
2
y − akselina on ct ajan t sijaan, jolloin
valo kulkee 45 asteen kulmassa.
ct
Valon kulkee 45
asteen kulmassa.
ct’
Aika t’ on vakio x’−akselin
suuntaisilla suorilla.
Aika t on vakio x−akselin
suuntaisilla suorilla.
cT’ on valon kulkema matka ajassa
T’ (x’,t’)−koordinaatistossa.
1−v /c
cT’
Usein Lorentz-muunnoksessa
käytetään lyhennysmerp
kintöjä β = v/c tai γ = 1/ 1 − v 2 /c2 .
Edellisessä kappaleessa johdetut muunnosyhtälöt eri
inertiaalikoordinaatistojen välillä voidaan kuvata graafisesti käyttäen Minkowskin diagrammaa. Tämä on erittäin
hyödyllinen työkalu analysoitaessa relativistisiä efektejä
erilaisissa tilanteissa.
Minkowskin diagramma on kuvaaja neliulotteisestä aikaavaruusjatkumosta, jossa y-koordinaatti vastaa aika- ja xkoordinaatti kaikkia avaruuskoordinaatteja.
Kuvassa 7. on esitetty Minkowskin diagramma. Kuvaajassa on y-akselilla aika normitettuna valonnopeudella ja
x-akselilla paikka. Tällä tavalla valo kulkee diagrammassa
aina 45◦ kulmassa.
Lorentz-muunnetut koordinaattiakselit (’) ovat kiertyneet saman kulman verran kohti 45◦ valon maailmanviivaa.
Kun koordinaatistojen välinen nopeus lähestyy valonnopeutta, lähestyvät muunnetut koordinaattiakselit em. valon maailmanviivaa.
Kukin Minkowskin diagramman piste vastaa tapahtumaa, eli paikkaa ajassa sekä avaruudessa. Koordinaattistomuunnokset eivät vaikuta itse tapahtumiin, ainoastaan
koordinaattiakseleihin, joilta aika ja paikka luetaan.
Kuvaajassa tärkeitä ovat samanaikaisuuden viivat, jotka ovat aina (paikka) x-akselin suuntaisia viivoja koordinaatistoissa. Huomaa, että muunnetun koordinaatiston (’)
samanaikaisuuden viivat ovat kiertyneet koordinaattiakseleiden tavoin kohti valon maailmanviivaa.
Siirryttäessä koordinaatistosta toiseen, sekä aika että
paikka muuttuvat Lorentz-muunnoksen mukaisesti! Tutustu kuvaan 7 huolellisesti ja varmista, että ymmärrät, mistä
on kysymys.
3.6 Samanaikaisuuden suhteellisuus
Aika muuttuu siirryttäessä inertiaalikoordinaatistosta
toiseen Lorentz muunnoksella, t′ 6= t. Keskeinen seuraus
tästä on se, että
toisistaan riippumattomien tapahtumien havaittu
järjestys riippuu havaitsijan liiketilasta!
Havainnollistetaan tätä kuvan 8. mukaisella ajatuskokeella. Liikkukoon junavaunu relativistisella nopeudella rataa eteenpäin kuvan mukaisesti. Täsmälleen keskellä junavaunua on valonlähde, josta lähtee samanaikaisesti valonsäteet kohti vaunun päätyjä.
Junavaunussa olevan havaitsijan mielestä valonsäteet
osuvat vaunun päätyihin yhtäaikaa (ylin kuva).
Radan varrella olevan havaisijan näkökulmasta (keskimmäinen kuva) valo liikkuu Einsteinin 2. postulaatin mu-
cT’
cT
3.5 Lorentz-muunnos ja Minkowskin diagramma
Paikka x on vakio ct−akselin
suuntaisilla suorilla.
Paikka x’ on vakio ct’−akselin
suuntaisilla suorilla.
x’
x
cT on valon kulkema matka ajassa
T (x,t)−koordinaatistossa.
cT
* Galilein transformaatio kiertää ainoastaan aika−akselia t.
* Lorentz transformaatio kiertää akseleita ct ja x.
Kuva 7:
Minkowskin diagrammalla voidaan esittää
Lorentz-muunnos graafisesti. Tämänkaltaisten diagrammojen avulla paradoksaalisilta vaikuttavien relativististen
tilanteiden selvittely onnistuu helpommin.
kaisesti täsmälleen samalla nopeudella kuin junavaunussa
olevan havaisijan mittaamana.
Radan varrelta katsoen myös junavaunu liikkuu lyhyen matkan sinä aikana, kun valonsäde etenee kohti vaunun päätyjä. Tämän vuoksi valonsäteiltä menee vaunun
päätyjen saavuttamiseen hieman eri aika, ja valonsäde osuu
ensin vaunun takaosaan ja sitten vasta keulaan (radan varrelta katsottuna).
Liikuttaessa junavaunua nopeammin (alin kuva), valo
liikkuu edelleen kaikille havaitsijoille samalla vakionopeudella ja vaunu ehtii loitontua havaitsijasta hieman sinä aikana, kun valo matkaa kohti vaunun päitä. Siksi autosta
katsottuna etuosaan osuva valonsäde on perillä hieman ennen vaunun takaosaan osuvaa valonsädettä.
Eli kaikki kolme havaitsijaa (vaunussa, radan varrella ja nopeammassa autossa) ovat eri mieltä tapahtumien järjestyksestä. Tämä on täysin mahdollista, sillä valonsäteiden osumisella vaunun päätyihin ei ole kausaalista
(syy ja seuraus) yhteyttä. Samanaikaisuus on suhteellista!
Tarkastellaan tilannetta vielä Minkowski-diagrammojen
ja puhtaasti matemaattisten Lorentz-muunnosten avulla.
Junavaunut Minkowski diagrammoina
Oheisissa kuvissa 9. ja 10. on kuvattuna sama tilanne
Minkowski diagrammoina kuin kuvassa 8. Molemmissa diagrammoissa valo kulkee 45◦ asteen kulmassa.
Kuvan 9. Minkowski diagramma vastaa kuvan 8. keskimmäistä osaa, jossa (x, ct)-koordinaatisto on sidottu junarataan ja (x′ , ct′ )-koordinaatisto junavaunuun.
Junavaunussa samanaikaisesti vaunun päihin osuvien valonsäteiden (tapahtumat A ja B) samanaikaisuuden viiva
on kiertynyt kohti valon maailmanviivaa samalla tavalla
kuin Lorentz-muunnettu x′ -akseli. Näin ollen (x, ct) koordinaatistossa tapahtumat A (t1 ) ja B (t2 ) eivät ole enää
samanaikaiset. Valonsäde osuu ensin vaunun perään (t1 )
10
Junan koordinaatistossa valon−
säteet osuvat vaunun päätyihin
yhtäaikaa.
ct
akse
li
V
al
on
sä
de
un a
ika−
vaun
Maahan kiinnitetyssä koordinaa−
tistossa valonsäde osuu ensin
junan takaosaan ja sen jälkeen
etuosaan.
c
ct’
c
radan aika−akseli
c
c
t2
t1
Junaa nopeammin liikkuvassa
koordinaatistossa valonsäde osuu
ensin junan etuosaan ja sitten
takaosaan.
c
B
A
t’1 = t’2
x’
c
x
Kuva 8: Valonlähde relativistisella nopeudella liikkuvassa
junavaunussa.
Vaunun perä
ja sen jälkeen vaunun keulaan (t2 ).
Samalla tavalla kuvan 10. Minkowski diagramma vastaa
kuvan 8. alimmaista osaa, jossa (x, ct)-koordinaatisto on
sidottu radan suhteen liikkuvaan junavaunuun ja (x′ , ct′ )koordinaatisto sitä nopeammin liikkuvaan autoon.
Junavaunussa samanaikaisesti vaunun päihin osuvien valonsäteiden (tapahtumat A ja B) samanaikaisuuden viiva
on kiertynyt auton koordinaatistossa (x′ , ct′ ) kohti valon
maailmanviivaa samalla tavalla kuin Lorentz-muunnettu
x′ -akseli. Siksi myös tässä tapauksessa (x′ , ct′ ) koordinaatistossa tapahtumat A (t′1 ) ja B (t′2 ) eivät ole enää samanaikaiset. Valonsäde osuu ensin vaunun perään (t′2 ) ja sen
jälkeen vaunun keulaan (t′1 ).
Junavaunut Lorentz-muunnoksina
Olkoon tapahtuma A valonsäteen osuminen l-pituisen
junavaunun takapäähän, vaunun koordinaatistossa
(ct1 , x1) = (ct1 , 0). Merkitään tapahtumalla B valonsäteen
osumista junavaunun keulaan (ct2 , x2 ) = (ct2 , l). Junan
koordinaatistossa siis t1 = t2 .
Kuvan 8. keskimmäisessä osassa rata liikkuu x-akselin
suunnassa vaunun suhteen nopeudella −v. Tällöin tilannetta voidaan käsitellä Lorentz-muunnosten (23) avulla
Lamppu
Vaunun keula
Kuva 9: Minkowski diagramma valonlähteestä relativistisella nopeudella liikkuvassa junavaunussa (keskimmäinen
osio kuvasta 8). (x, ct)-koordinaatisto on kiinnitetty radan
varteen, ja (x′ , ct′ ) on tasaisella nopeudella liikkuvan junavaunun koordinaatisto.
muunnosten (23) avulla auton koordinaatistossa tapahtumilla on aikaväli
∆t′ = t′1 − t′2 =
=
c2
t1 − t2 − (x1 − x2 )v/c2
p
1 − v 2 /c2
vl
p
> 0.
1 − v 2 /c2
Nyt siis t′1 > t′2 ja valonsäde osuu ensin vaunun etuosaan
auton koordinaatistosta katsoen.
3.7 Tapahtumien synkronointi
Samanaikaisuuden suhteellisuuden suora seuraus on se,
että yhdessä inertiaalikoordinaatistossa synkronoidut kellot eivät ole välttämättä synkronoituja toisessa inertiaalikoorinaatistossa.
Tämä voidaan ymmärtää kuvien 11. ja 12. avulla. Siir2
2
ryttäessä
inertiaalikoordinaatistosta toiseen, aika ja paikt2 + vx2 /c
t1 + vx1 /c
ja t′2 = p
,
t′1 = p
ka
menevät
relativistisilla nopeuksilla tavallaan “sekaisin”.
1 − v 2 /c2
1 − v 2 /c2
Kukin eri nopeudella liikkuva inertiaalihavaitsija “siivuttaa” neliulotteista aika-avaruusjatkumoa hieman eri tavaleli radan koordinaatistossa tapahtumilla on aikaväli
la.
t1 − t2 + (x1 − x2 )v/c2
Minkowski diagrammassa tämä nähdään liikkuvan koor′
′
′
p
∆t = t1 − t2 =
2
2
dinaatiston
(kuvissa (x′ , ct′ )-koordinaatistot) samanaikai1 − v /c
suuden viivojen kiertymisenä paikallaan olevan koordinaavl
tiston suhteen.
< 0.
=− p
Sama nähdään myös tarkasteltaessa Lorentzc2 1 − v 2 /c2
muunnoksia
(23). Siirryttäessä koordinaatistosta O
Nyt siis t′1 < t′2 ja valonsäde osuu ensin vaunun takaosaan. nopeudella v liikkuvaan koordinaatistoon O’ ja piVastaavasti kuvan 8. alimmassa osassa auto liikkuu vau- dettäessä aika t vakiona, on muunnettu aikakoordinaatti
nun suhteen nopeudella v x-akselin suuntaan. Lorentz t′ riippuvainen myös paikasta.
11
ct
ct
akse
li
vaunun aika−akseli
ct’
ct’
V
al
on
auto
n
sä
de
aika
−
Höpö höpö!
t’1
x’
x’
t1 = t2
Kaikki kelloni ovat
synkronoitu!
t’2
x
Vaunun perä
Lamppu
x
Vaunun keula
Kuva 10: Minkowski diagramma valonlähteestä relativistisella nopeudella liikkuvassa junavaunussa (alimmainen osio
kuvasta 8). (x, ct)-koordinaatisto on kiinnitetty junavaunuun, ja (x′ , ct′ ) on tasaisella nopeudella liikkuvan auton
koordinaatisto.
Kuva 11: Tien varrella, (x, ct)-koordinaatistossa olevan havaitsijan synkronoidut kellot eivät ole synkronoituja relativistisesti liikkuvan autoilijan ((x′ , ct′ )koordinaatisto) näkökulmasta. Tämä johtuu siitä, että
(x′ , ct′ )-koordinaatiston samanaikaisuuden viivat ovat kiertyneet (x, ct)-koordinaatiston suhteen.
dinaatistoon O’ Lorentz muunnoksen (23) avulla kuten
3.8 Ajan dilataatio
t2 − vx/c2
t1 − vx/c2
t2 − t1
Toinen seuraus samanaikaisuuden suhteellisuudesta on
∆t′ = p
−p
=p
2
2
2
2
1 − v /c
1 − v /c
1 − v 2 /c2
se, että kellot käyvät eri tahtiin eri nopeudella liikkuvissa
koordinaatistoissa.
∆t
Olkoot kaksi koordinaatistoa O sekä O’, joka liikkuu
.
(26)
= p
1 − v 2 /c2
koordinaatiston O suhteen nopeudella v positiivisen xakselin suuntaan. Hetkellä t = t′ = 0 koordinaatistojen
Kun tästä ratkaistaan ∆t ∆t′ :n avulla, saadaan
origot yhtyvät.
p
Tarkastellaan hetkellä t = t′ = 0 synkronoituja kello(27)
∆t = ∆t′ 1 − v 2 /c2 .
ja eri koordinaatistoissa samaan aikaan myöhemmin, kuva
13. Koska käsitteet samaan aikaan ja myöhemmin riip- Toisaalta taas käänteismuunnoksesta ∆t′ = t′2 −t′1 saadaan
puvat havaisijan liiketilasta, eri inertiaalikoordinaatistoist′ + vx/c2
t′ + vx/c2
t′ − t′1
sa olevien havaitsijoiden mielestä toisessa koordinaatistos∆t = p2
− p1
= p 2
sa oleva havaitsija lukee omassa koordinaatistossa olevaa
1 − v 2 /c2
1 − v 2 /c2
1 − v 2 /c2
kelloa menneisyydessä.
Lorentz-muunnoksesta nähdään, että aikavälit ∆t ja ∆t′
∆t′
= p
.
(28)
eri koordinaatistojen välillä muuntuvat kuten
1 − v 2 /c2
∆t
.
∆t′ = p
1 − v 2 /c2
Nyt selkeästi (27) on erisuuri kuin (28). Mitä tapahtui??
Eroavuutena näiden kahden tuloksen välillä on se, että
aikaa ei ole mitattu samoissa paikoissa, koska x′ riippuu
Tätä ilmiötä kutsutaan ajan dilataatioksi.
myös ajasta! Jotta tilanne olisi symmetrinen täytyy enTässä yhteydessä kannattaa olla hieman varuillaan ja simmäisessä muunnoksessa myös paikat muuntaa, eli kun
tarkkana, että aika muunnetaan samoissa paikoissa. Ajan

 x′1 = √ −vt21 2
dilataatiolausekkeen soveltaminen sellaisenaan voi joskus
1−v /c
,
johtaa vääriin lopputuloksiin.
 x′2 = √ −vt22 2
1−v
/c
Tarkastellaan edellä mainituissa koordinaatistoissa O
ja O’ muuntuvaa aikaväliä lähtien Lorentz-muunnoksesta
saadaan aikavälille muunnoksesta (23):
(23) ja sen käänteismuunnoksesta (24).
Aikaväli ∆t = t2 −t1 muuntuu koordinaatistosta O koort′1 + vx′1 /c2
t′2 + vx′2 /c2
−p
∆t = p
1 − v 2 /c2
1 − v 2 /c2
(25)
12
ct
ct’
ct’
ct
Sinä vertaat omaa kelloasi
minun kellooni menneisyydessä!
Eipäs, kun sinä vertaat
kelloasi nyt minun
kellooni menneisyydessä!
Nyt ne kellot ovat
kunnolla synkronoitu!
Sinun kellosi kulkee
hitaammin kuin minun!
x’
x’
Meidän kellome ovat
nyt synkronoitu!
Puhu pukille!
x
x
Kuva 13: Liikkuva kello käy hitaammin. Tämä johtuu
siitä, että paikallaan oleva havaisija vertaa kelloaan liikKuva 12: Vastaavasti, jos kellot synkronoidaan autoilijan kuvasta koordinaatistosta katsoen liikkuvaan kelloon menkoordinaatistossa (x′ , ct′ ), ne eivät enää ole synkronoituja neisyydessä!
tienvarren (x, ct) koordinaatistossa.
t′2 1 − v 2 /c2 − t′1 1 − v 2 /c2
p
=
1 − v 2 /c2
p
= ∆t′ 1 − v 2 /c2 .
Nyt tulokset ovat yhtäpitäviä, kun aikavälit mitataan samoissa paikoissa. Koska aika ja paikka muodostavat kokonaisuuden relativistisissa ongelmissa, kannattaa muuttuvia aikavälejä käsitellä tarkastelemalla tapahtumia joko
Lorentz-muunnosten tai Minkowskin diagrammojen kautta, eikä lauseketta (25) mekaanisesti soveltamalla.
3.9 Pituuden kontraktio
Myös tässä tapauksessa käänteismuunnosta soveltaen
havaitaan samankaltainen symmetria kuin ajan dilataatiota käsiteltäessä edellisessä kappaleessa. Eli yhtälön (29)
mekaanisen soveltamisen sijaan on tärkeää, että huomioidaan milloin kappaleiden päiden paikkaa mitataan
missäkin koordinaatistossa!
Edelleen kannattaa muistaa, että kontraktion havaitsemiseen tarvitaan aikaisemmin määritelty suhteellisuusteoreettinen havaitsija, joka pystyy tekemään mittauksia koordinaatistossa ilman signaaliviivettä.
Jos kuvassa 14. sijoitettaisiin kamera ct-akselille, junavaunua ei nähtäisi lyhentyneenä, koska kameraan muodostuu kuva kohteesta siitä heijastuvien valonsäteiden avulla.
Kameraan muodostuvan kuvan matemaattinen käsittely
ei ole aivan yksioikoista, mutta se on mahdollista. Todellisuudessa relativistinen objekti nähtäisiin kameran avulla
kiertyneenä (vääristyneenä), siten että sen takaosaa voitaisiin nähdä enemmän kuin normaalin geometrian mukaan
on mahdollista.
Kolmas seuraus samanaikaisuuden suhteellisuudesta on
fyysisten pituuksien muuttuminen. Kappaleen pituus on
sen päiden välinen etäisyys samalla hetkellä. Edelleen, koska samalla hetkellä on riippuvainen havaitsijan liiketilasta,
myös pituudet muuntuvat.
Olkoot kaksi koordinaatistoa O ja O’, joista O’ liikkuu
O:n suhteen nopeudella v positiivisen x-akselin suhteen. 3.10 Inertiaalikoordinaatistojen samanarHetkellä t = t′ = 0 koordinaatistojen origot yhtyvät.
voisuus
Olkoon kappaleella pituus L′ = x′2 −x′1 lepokoordinaatisErikoisen suhteellisuusteorian ensimmäinen postulaattossaan O’ hetkellä t′ . Tällöin koordinaatistossa O Lorentz- ti asettaa kaikki inertiaalikoordinaatistot samanarvoisiksi.
muunnoksia (23) soveltaen sen pituudeksi L havaitaan
Siksi aikavälien ja pituuksien muuttuessa erilaisten inertiaalikoordinaatistojen välillä, täytyy muutosten tapahtua
x′ − vt′
x′1 − vt′
x′2 − x′1
myös toisinpäin.
L = x2 − x1 = p
−p
= p
1 − v 2 /c2
1 − v 2 /c2
1 − v 2 /c2
Kuvan 15. relativistisella nopeudella liikkuvassa junavaunussa
aikavälit ja pituudet muuntuvat radanvarrelta
p
L′
′
havaittuna.
Koska vaunuun sidotusta inertiaalikoordinaa2
2
⇔ L = L 1 − v /c .
=p
(29)
1 − v 2 /c2
tistosta katsoen muu maailma liikkuu, täytyy vastaavat
muutokset tapahtua myös vaunun ulkopuolella vaunusta
Huomaa että nyt t1 6= t2 . Relaatiota (29) kutsutaan pikatsoen.
tuuden kontraktioiksi tai Lorentz-Fitzgerald-kontraktioksi.
Puhtaasti erikoisen suhteellisuusteorian tapauksessa reTilannetta kuvaava Minkowski diagramma on esitetty kulativistiset efektit ovat aina symmetrisiä!
vassa 14.
3.11 Nopeuksien muunnos
13
T’
T
v
L’
L
L’
T’
T
L’
−v
L
ct
ct’
tit. Esimerkiksi nopeuden x-komponentti muuntuu kuten
vau
nun
et
vau
nun
ta
uos
a
kao
s
a
Kuva 15: Inertiaalikoordinaatistot ovat samanarvoisia, eli
relativistiset muutokset ovat symmetrisiä. Radan varrelta
havaittavat relativistiset muutokset liikkuvassa vaunussa
ovat samat kuin vaunusta havaitut ulkomaailman muutokset.
dx′
dx/dt − v
γdx − vγdt
=
=
2)
dx
dt′
γdt − vγ
1
−
(dx/dt)(v/c
c2
x’
⇔ u′x =
x
v
v
L
ux − v
.
1 − vux /c2
Käsittelemällä nopeuden y- ja z-komponentit vastaavasti,
saadaan nopeuden muunnokseksi inertiaalikoordinaatistojen O ja O’ välillä
 ′
ux −v
ux = 1−vu


√ x /c2

uy 1−v 2 /c2
′
uy =
.
(31)
2
1−vu
√ x /c


2 /c2
u
1−v
 ′
z
uz =
1−vux /c2
Huomaa, että koordinaatistojen välisen nopeuden ollessa
tarpeeksi
pieni (v ≪ c), muunnos (31) lähestyy klassista
Kuva 14: Liikkuvat kappaleet lyhenevät liikesuunnassa.
nopeuksien
muunnosta.
Tämäkin on seurausta samanaikaisuuden suhteellisuudesta, eli mitattaessa kappaleen päiden paikat samaan aikaan
3.12 Nopeuden suuntakulman muunnos
koordinaatistoita (x, ct) ja (x′ , ct′ ) katsoen mittaukset taTarkastellaan sellaista liikettä, jolla on nollasta poikkeapahtuvat eri pisteissä aika-avaruusjatkumossa.
va nopeuskomponentti myös koordinaatistojen välistä nopeutta vastaan kohtisuorassa suunnassa (uy 6= 0), edellä
esitellyissä
koordinaatistoissa O ja O’.
Nopeus on paikan derivaatta ajan suhteen: kun derivoiKun
kirjoitetaan
xy- ja x′ y ′ -tasossa nopeuskomponendaan Lorentz-muunnokset (23) ajan suhteen, saadaan vastit (31) napakoordinaatistossa, voidaan ratkaista nopeuden
taava nopeuksien muunnos.
Olkoot O ja O’ kaksi koordinaatistoa, joista O’ liik- suuntakulman muunnos.
Huomaa, että nopeus on kääntäen verrannollinen aikaan,
kuu koordinaatiston O suhteen nopeudella v positiivisen
x-akselin suuntaan. Hetkellä t = t′ = 0 koordinaatistojen jolloin pelkkä suuntakulman muuntaminen antaa väärän
tuloksen. Aikadilataatio täytyy ottaa huomioon nopeuden
origot ja akselit yhtyvät.
Olkoot nopeus u = (ux , uy , uz ) koordinaatistossa O ja Lorentz-muunnosten (31) kautta.
Kirjoitetaan nopeuden muunnosyhtälöiden (31) x- ja yvastaava nopeus u′ = (u′x , u′y , u′z ) koordinaatistossa O’.
komponentit napakoordinaatiston
Differentioimalla Lorentz-muunnokset (23) saadaan

′
x = r cos θ
dx
=
γdx
−
vγdt



′
y = r sin θ
dy = dy
.
(30)
′
dz = dz


avulla:
 ′
dt = γdt − vγ
c2 dx
( ′
u cos θ−v
ux = u′ cos θ′ = 1−(vu
cos θ)/c2
√
Differentiaaleista (30) voidaan laskea nopeuskomponen(32)
1−v 2 /c2 .
u
sin
θ
u′y = u′ sin θ′ = 1−(vu cos θ)/c2
14
Jaettaessa nämä nopeuskomponentit toisillaan saadaan
p
u′y
sin θ 1 − v 2 /c2
tan θ′ = ′ =
.
(33)
uz
cos θ − v/u
Esimerkki: liikkuvan hiukkasen valoemissio
Laboratoriokoordinaatiston O suhteen nopeudella v liikkuva hiukkanen emittoi omassa lepokoordinaatistossaan O’
valoa kulmassa θ′ nopeuttaan vastaan. Valonnopeus on molemmissa koordinaatistoissa u = u′ = c.
Muunnoksen (31) y-komponentin lausekkeesta napakoordinaatistossa saadaan kulmaksi laboratoriokoordinaatistossa
p
sin θ′ 1 − v 2 /c2
.
sin θ =
1 + v cos θ′ /c
Laboratoriossa mitattu suuntakulma on esitetty kuvassa 16. muutamilla nopeuksilla v. Kuvasta nähdään, että
hiukkasen nopeuden lähestyessä valonnopeutta, valo pyrkii ohjautumaan etenemissuunnassa olevaan kartioon.
Kuva 16: Laboratoriokoordinaatistossa O mitattu emission suuntakulma θ, hiukkasen lepokoordinaatistossa O’
tapahtuvan emission suuntakulman θ′ funktiona.
15
4. Lorentz-Minkowski avaruuden
kausaali rakenne
Kausaliteetti: tapahtumien välinen syy-seuraus suhde.
Kuten jo edellä on useamman kerran todettu, valonnopeus tyhjiössä on suurin mahdollinen nopeus, jolla informaatiota voidaan välittää. Minkowski-diagrammassa
(ct, x)-koordinaatisto on normitettu siten, että valonsäteet
kulkevat aina 45◦ kulmassa.
Lähettämällä valonsäteet Minkowski-diagramman origosta, Lorentz-Minkowski avaruus voidaan jakaa origossa
olevan tapahtuman suhteen kolmeen eri kausaaliseen alueeseen kuvan 17 mukaisesti.
va
ct
tapahtumien väliset kausaaliset suhteet ovat
kaikille havaitsijoille samat!
Toisin sanoen, jos tapahtuma B on seurausta tapahtumasta A, tapahtuu se kaikissa koordinaatistoissa A:n
jälkeen!
Tarkastellaan tilannetta, jossa hetkellä t = t′ = 0 A:sta
lähtee valorintama. Samalla hetkellä nopeudella v liikkuvan koordinaatiston A’ origo on koordinaatiston A origon
kanssa päällekkäin. Miten koordinaatistossa A’ oleva havaitsija näkee valorintaman, kuva 18?
valorintama
n
lo
Q
d
sä
e
va
lo
ns
äd
e
Absoluuttinen
tulevaisuus
A
S
P
v
Epämääräisyysalue
Epämääräisyysalue
A’
ns
lo
va
e
äd
ns
R
lo
va
äd
e
x
Absoluuttinen
menneisyys
Kuva 18: Valorintama havaitsijan A koordinaatistossa.
Kuva 17: Laakean Lorentz-Minkowski avaruuden kausaaKoska valonnopeus on kaikille havaitsijoille sama, tulisi
liset alueet.
koordinaatistossa A’ origossa olevan havaitsijan nähdä itsensä myöskin valorintaman keskellä! Tämä näennäisesti
Kuvan origossa oleva tapahtuma P voi olla seurausta ai- paradoksaalinen tilanne voidaan helposti havainnollistaa
noastaan tapahtumille, jotka ovat sen absoluuttisessa men- kuvan 19. Minkowski-diagramman avulla.
neisyydessä (esim. R).
Koordinaatistojen välisestä nopeuserosta johtuen, A’:n
Vastaavasti tapahtuma P voi olla syynä ainoastaan sen samanaikaisuuden viivat ovat kiertyneet Minkowskiabsoluuttisessa tulevaisuudessa oleville tapahtumille (esim diagrammassa siten, että myös A’ mittaa olevansa valoQ). Tapahtumalla P ei voi olla minkäänlaista kausaalista kartion keskellä.
yhteyttä epämääräisyysalueella oleviin tapahtumiin (esim.
Eli A:lla ja A’:lla on samat kausaaliset alueet koordinaaS).
tistojen välisistä nopeuksista riippumatta. Kausaalinen raKun sarja kausaalisesti toisiinsa yhteydessä olevia tapah- kenne on Lorentz-invariantti!
tumia yhdistetään viivaksi, saadaan maailmanviiva. Tämä
voi olla vaikkapa hiukkasen rata ajan funktiona. Huomaa
Valoa nopeampi matkustaminen
kuitenkin että maailmanviivan täytyy pysyä kaikissa pisValoa nopeampi matkustaminen tai edes informaation
teissään poissa epämääräisyysalueelta.
välitys ei ole suhteellisuusteorian näkökulmasta mahdollisAbsoluuttinen tulevaisuus muodostaa tapahtuman P ta. Oletetaan kuitenkin hetkeksi, että suhteellisuusteoria
suhteen kartion. Aluetta kutsutaankin joskus tulevaisuu- sallisi valoa suuremmat nopeudet ja tarkastellaan mihin se
den valokartioksi. Vastaavasti absoluuttisen menneisyyden johtaisi.
aluetta kutsutaan menneisyyden valokartioksi.
Kuvan 20. Minkowski diagrammassa jousimies pisteessä
Koska kausaalisten alueiden rajat määrittää valonsäde, A ampuu valoa nopeamman nuolen pisteeseen B. Tällöin
ja koska valonnopeus on kaikille havaitsijoille sama, voi- nuolen maailmanviiva on valonnopeutta loivemmassa kuldaan todeta:
massa. Tapahtumia A ja B havainnoivat ampuja (ct, x)Valonnopeuden invariantista luonteesta johtuen,
koordinaatistosta, autoilija (ct′ , x′ )-koordinaatistossa ja
16
ct
ct
ct’
ct’’
ct’
Valoa nopeampi nuoli!
va
n
lo
A’
e
d
sä
A
lo
n
e
sä
d
B
va
ct B
x’
ct A
ct’’
A
B tapahtui ennen A:ta!!?
A
ct’A = ct’B ct’’
B
x’’
A=A’
x
A ja B tapahtuivat yhtäaikaa!
x’
x
Kuva 19: Valorintama Minkowski-diagrammana. Molemmat havaitsijat näkevät itsensä valorintaman keskellä, eri
havaitsijat ainoastaan “siivuttavat” aika-avaruutta eri tavalla. Valokartioiden sisällä olevien kausaalisesti toisistaan
A
B
riippuvien tapahtumien järjestys on kaikille havaitsijoille
sama.
Kuva 20: Valoa nopeampi nuoli ammutaan (A) jousella
omenaan (B). Eri nopeuksilla liikkuvat havaitsijat näkevät
′′
′′
tapahtumat eri järjestyksessä. Sallimalla valoa suuremmat
toinen autoilija (ct , x )-koordinaatistossa.
Jousimiehen samanaikaisuuden viivat ovat diagrammas- nopeudet voi joissain koordinaatistoissa seuraus edeltää
sa vaakatasossa, joten hän havaitsee nuolen lähtevän het- syytä ja kausaliteetti rikkoutua!
kellä tA ja osuvan omenaan hetkellä tB . Nuoli osuu omenaan hetkellä tB sen jälkeen kun se on ammuttu hetkellä
tistossa junavaunun samanaikaisuuden viivat, jotka ovat
tA .
kiertyneet kohti valonnopeuden maailmanviivaa, vievät
Jousimiehen suhteen liikkuvalla autoilijalla koordinaatissignaalia ajassa taaksepäin radanvarrelta katsottuna!
tossa (ct′ , x′ ) on sellainen nopeus, että koordinaatiston saEli ilman signaaliviivettä, lippumies A voi saada
manaikaisuuden viivat ovat samassa kulmassa kuin nuolen
lähettämänsä
viestin ennen sen lähettämistä. Jos lippumaailmanviiva. Näin ollen koordinaatistossa (ct′ , x′ ) nuoli
mies A päättää signaalin saatuaan olla lähettämättä sitä,
′
′
ammutaan ja se osuu maaliinsa samalla hetkellä tA = tB .
tai vaikkapa rikkoa laitteen, päädytään mahdottomaan tiKoordinaatistossa (ct′′ , x′′ ) olevan autoilijan samanaikailanteeseen.
suuden viivat ovat jyrkemmässä kulmassa, kuin valoa noJoissain tapauksissa on spekuloitu valoa nopeamman
peamman nuolen maailmanviiva. Tällöin nuolen maaliin
matkustamisen tai kommunikoinnin mahdollisuudesta.
′′
osuminen (tapahtuma B hetkellä tB ) tapahtuu ennen nuoTässä yhteydessä on kehitelty yleiseen suhteellisuusteolen ampumista (tapahtuma A hetkellä t′′A )! Tämä johtaa
riaan perustuvia teorioita madonrei’istä, erilaisista aikakausaliteetin rikkoutumiseen, eli tilanteisiin, joissa syy voi
avaruuden poimutuksista ja niin edelleen.
edeltää seurausta, mikä on mahdotonta.
Nämä teoriat eivät poista edellä kuvattua ongelmaa.
Kausaliteettirikkomusten salliminen johtaa mahdottoVaikka ylivalonnopeudet tehtäisiin mahdolliseksi kaarevan
miin tilanteisiin. Tähän riittää jo valoa nopeampi kommuavaruuden avulla, tarkastelemalla pelkkiä alku- ja lopputinikointi. Havainnollistetaan tätä kuvan 21. ajatuskokeella.
loja, edelläolevia vastaavat ajatuskokeet ovat mahdollisia
Oletetaan, että hullu tiedemies on keksinyt tavan viestiä
ja päädytään samankaltaisiin ongelmiin.
ilman signaaliviivettä. Yksi tälläinen viestilaite on sijoitetNäinollen suhteellisuusteorian kannalta ylivalonnopeutuna junaan, joka liikkuu relativistisella nopeudella pitkin
det eivät ole missään tilanteessa eivätkä millään keinoilla
rataa. Radan varrella on toinen vastaava viestilaite kuvan
fysikaalisesti sallittuja, koska ne johtavat aina kausaliteet21. mukaisesti.
tirikkomusten mahdollisuuteen.
Kun junassa ja radan varrella olevat havaitsijat ovat
Näitä ongelmia ei synny, jos valoa suurempia nopeuksia
samalla kohdalla, A lähettää lipulla signaalin B:lle. Juei sallita.
nan keulassa B lähettää signaalin (välittömästi) junan
loppupäähän C:lle. Saatuaan signaalin, C viestittää li4.1 Tapahtumien väliset etäisyydet
pulla siitä radan varteen D:lle, joka lähettää signaalin
Olkoon meillä kaksi samassa koordinaatistossa olevaa ta(välittömästi) takaisin A:lle.
pahtumaa. Tapahtumalla A on koordinaatit (ct1 , x1 ) ja taTarkasteltaessa kuvan 21. tilannetta Minkowskipahtumalla B koordinaatit (ct2 , x2 ) em. koordinaatistossa.
diagramman avulla, nähdään että radanvarren koordinaaTapahtumien A ja B välimatka ∆s aika-
17
ct
• (∆s)2 = 0 : Aikakoordinaattien erotus on yhtäsuuri
kuin spatiaalisten komponenttien. Tällöin tapahtumat
ovat valokartion reunalla, ja ne voidaan yhdistää ainoastaan valosignaalilla. Etäisyys on valonkaltainen.
ct’
an
jun
k
si
i i ke
rata
C:n
l
itön
Väl
ali
gna
sa
stos
aati
din
oor
• (∆s)2 < 0 : Aikakoordinaattien erotus on pienempi
kuin spatiaalisten komponenttien, ja tapahtumilla ei
voi olla kausaalista yhteyttä. Tapahtumat eivät ole
samassa valokartiossa, ja etäisyys on avaruudenkaltainen.
B:n
l
i i ke
rata
A lähettää signaalin B:lle
joka lähettää sen välittömästi
C:lle.
x’
Välitön signaali maan koordinaatistossa
C saa signaalin B:ltä ja
välittää sen D:lle joka
lähettää sen välittömästi
takaisin A:lle.
4.2 Invariantti hyperbeli
A saa signaalin ennen
kuin lähettää sen!!!
Tapahtuman P→
etäisyys origosta on
(ct, x, y, z)
(Lorentz-invariantti)
(∆s)2 = c2 t2 − x2 − y 2 − z 2 ,
ja se määrittelee laakean Lorentz-Minkowski avaruuden
ominaisuudet sekä sen “rakenteen”. Laakea tarkoittaa
tässä yhteydessä tasaista, eli avaruus ei ole kaareva ja erikoinen suhteellisuusteoria toimii globaalisti.
x
C
Välitön signaali
B
Välitön signaali
D
(35)
Merkinnöistä
Etäisyyden määritelmässä (35) on käytössä kaksi toisistaan poikkeavaa merkkisopimusta:
A
Kuva 21: Relativistisesti liikkuvassa junassa ja radan varrella on kaksi valoa nopeampaa viestilaitetta. Lippumies A
voi saada lähettämänsä signaalin ennen sen lähettämistä,
jos valoa nopeampi (tässä tapauksessa välitön) signaalinopeus sallitaan. Tämä johtaa umpikujaan, jota ei voida
sallia, joten suhteellisuusteorian mukaan valoa nopeampi
kommunikointi (tai matkustaminen) täytyy olla mahdotonta!
(∆s)2 = c2 t2 − x2 − y 2 − z 2 (+ − −−)
tai
(∆s)2 = −c2 t2 + x2 + y 2 + z 2 (− + ++).
Kirjallisuudessa käytetään vaihtelevasti molempia merkkisopimuksia. Oleellista tässä on se, että viivaelementissä
aika- ja spatiaalikomponenteilla on vastakkaiset merkit,
jotta negatiiviset etäisyydet tulevat mahdollisiksi.
Edellisessä kappaleessa esitetty etäisyyksien luokittelu
avaruuskoordinaatistossa on
muuttuu merkkisopimusta vastaavasti, joten on tärkeää ol(∆s)2 = c2 (t1 − t2 )2 − (x1 − x2 )2 = c2 (∆t)2 − (∆x)2 . (34) la selvillä oletetusta järjestelmästä käytettäessä useita eri
lähteitä aiheesta!
Välimatka (34) on Lorentz invariantti, eli sen suuruus ei
Oletetaan että spatiaalikoordinaatit y = z = 0, ja tarriipu käytetystä koordinaatistosta. Toisin sanoen, A:n ja kastellaan etäisyyttä
B:n koordinaateille voidaan tehdä mielivaltainen Lorentzmuunnos ja silti etäisyys ∆s säilyy samana.
(∆s)2 = c2 t2 − x2
(36)
Vastaavaa differentiaalia
origosta. Olkoot
ds2 = c2 dt2 − dx2
kutsutaan viivaelementin neliöksi.
Huomaa, että välimatka ∆s voi olla nolla vaikka A:n
ja B:n koordinaatit ovat erisuuret. Myös negatiiviset
etäisyydet ovat mahdollisia. Tämä on tärkeä LorentzMinkowski avaruuden perustavaa laatua oleva ominaisuus, joka erottaa sen normaalista Euklidisesta
avaruudesta jossa etäisyydet ovat aina positiivisia!
Tapahtumien väliset etäisyydet voidaankin luokitella
∆s:n, yhtälö (34), etumerkin avulla:
c2 t2 − x2 = a2 (vakio).
(37)
Tämä on itseasiassa hyperbelin yhtälö; eli niiden pisteiden
muodostaman käyrän yhtälö, joiden ajankaltainen (a2 > 0)
etäisyys origosta on a2 .
Vastaavasti
c2 t2 − x2 = −b2 (vakio).
(38)
muodostaa hyperbelin, joka muodostuu niistä pisteistä joi2
• (∆s) > 0 : Aikakoordinaattien erotus on suurempi den etäisyys origosta on avaruudenkaltainen −b < 0.
Nämä käyrät (37) ja (38) ovat asymptoottisia käyrille
kuin spatiaalisten komponenttien, jolloin tapahtumat
joiden
kulmakerroin on yksi (origon kautta kulkevien vavoidaan yhdistää signaalilla ja molemmat pisteet ovat
lonsäteiden
maailmanviivoille), kuva 22.
saman valokartion sisällä. Tällöin etäisyys on ajankaltainen.
2
18
ct
ct
ct’
a
2
x’
a
2
b
2
x
a
x
2
b
2
b
2
Kuva 23: Lorentz-muunnetut koordinaattiakselit (ct′ , x′ )
skaalautuvat invarianttien hyperbelien mukaisesti.
Kuva 22: Invariantit hyperbelit.
Koska hyperbelien yhtälöt tulevat Lorentz-invariantin
etäisyyden neliöstä, ovat ne samoja kaikissa koordinaatistoissa. Koordinaatistomuunnoksissa akselit skaalautuvat
invariantin hyperbelin mukaisesti, kuva 23.
Huomautus: ict
Joissain kirjoissa on käytössä merkintätapa, jossa aikakoordinaatti on imaginäärinen. Tämä siksi, että
• Imaginaarinen aikakoordinaatti ei toimi kaarevassa
avaruudessa, mikä tekee erikoisesta suhteellisuusteoriasta yhteensopimattoman yleisen suhteellisuusteorian kanssa.
Eli:
ict ⇒ EI!
4.3 Suhteellisuusteorian paradoksit
• Aika-avaruusgeometrian käsittely näytää formaalisti
Suhteellisuusteorian sovellusalue on jossain määrin arEuklidiselta.
kiajattelun ulkopuolella, sillä jokapäiväisessä elämässä ei
tarvitse käsitellä valonnopeutta lähellä olevia nopeuksia.
• Lorentz-muunnos voidaan esittää (hyperbolisena)
Tämä johtaa moniin paradoksaalisen tuntuisiin tilanteisiin.
koordinaatiston kiertona.
Todellisuudessa suhteellisuusteorian näkökulmasta
• Vektorien rinnalla ei tarvita yksimuotoja (yksimuo- mitään ristiriitaa ei ole, vaan kyse on virheellisestä tilanteen tulkinnasta. Yleensä paradoksaaliset tilanteet
doista puhutaan myöhemmin).
suhteellisuusteoriassa johtuvat:
Tämä vanhahtava esitysmuoto on pahasta siksi, että
• Samanaikaisuus riippuu havaitsijasta, jolloin tapahtu• Kaikki edellisen listan kohdat; aika-avaruuden geometmat eivät ole(kaan) samanaikaisia kaikkien havaitsiria ei ole Euklidinen, Lorentz-transformaatio ei ole
joiden mielestä.
koordinaatiston kierto ja yksimuodot ovat hyvin kes• Tilanne on määritelty siten, että esimerkiksi inertiaalikeisessä osassa määriteltäessä vektorilaskennan peruskoordinaatistoehto, tai joku muu perusoletus, rikkouteita Lorentz-Minkowski avaruudessa!
tuu.
• Periodinen kiertokulma hyperbolisessa koordinaatis• Kausaliteetti on ymmärretty väärin tai se on rikkoonton kierrossa on täysin eri asia kuin asymptoottisesti
tunut.
käyttäytyvä nopeusparametri.
Useimmiten tilanteen pystyy selvittämään piirtämällä
• Imaginäärinen aika tekee keskeisen eron Euklidisen
Minkowskin
aika-avaruus diagramman aiheesta!
(+++) Lorentz-Minkowski (-+++) geometrian välillä
Käydään
vielä
esimerkinomaisesti läpi yksi kuuluisimhankalaksi havaita: Euklidisessa geometriassa kahden
mista
suhteellisuusteorian
paradokseista.
pisteen välinen etäisyys on nolla vain, jos pisteet
ovat samat, kun taas Lorentz-Minkowski avaruudesKaksosparadoksi
sa etäisyys on nolla jos, pisteiden välimatka on valonkaltainen!
19
Tervetuloa kotiin! Einstein
oli oikeassa, sinä olet
minua nuorempi!
Kiitoksia, se johtuu siitä että
jotain kummallista tapahtui pisteessä
C joutuessani kiihdyttämään
siirtyäkseni koordinaatistosta
toiseen!
ct
t ka
ma
Me
nom
atk
an
aik
a−a
k
uu
Pal
sel
i
ct’
Hmm... aika raketissa kulkee
hitaammin kuin Maapallolla,
sisareni on minua nuorempi
kun hän tulee takaisin!
Oho! Mitä tapahtui, aika
Maapallolla hyppäsi A:sta
B:hen!!?? Minä olen sittenkin
nuorempi!?
B
ct’’
Pal
x’
a
atk
nom
va
na
seli
sak
ruu
Me
nom
atk
a
i
sel
Aika Maapallolla kulkee hitaammin
kuin raketissa, sisareni on minua
nuorempi kun pääsen takaisin!
A
Maapallon aika−akseli
k
a−a
aik
an
atk
uum
C
Me
Maapallon avaruusakseli
Pal
uum
Hyvää matkaa!
x
atk
an
ava
ruu
sak
seli
x’’
Kuva 24: Kaksosparadoksi.
Samanikäisistä kaksosista toinen jää maahan ja toinen
lähtee relativistisella nopeudella liikkuvalla raketilla avaruusmatkalle. Takaisin tullessaan matkustanut sisar on
maahan jäänyttä sisarta nuorempi. Miksi?
Koska inertiaalikoordinaatistot ovat samanarvoisia, sisarusten ikäero näyttäisi aiheuttavan ristiriidan. Matkan
Minkowski-diagramma on esitetty kuvassa 24.
Paradoksin selitys on inertiaalikoordinaatistoehdon rikkoutuminen. Kuvan raketin kääntyessä takaisin pisteessä
C, sen täytyy ensin pysähtyä ja kiihdyttää paluumatkalle,
jonka ajan se on epäintertiaalikoordinaatistossa.
Tätä ei voida tarkalleenottaen käsitellä erikoisen suhteellisuusteorian avulla.
Kuitenkin, jos oletetaan että takaisin kääntyminen tapahtuu nopeasti, eli pisteessä C hypätään välittömästi inertiaalikoordinaatistosta (ct′ , x′ ) inertiaalikoordinaatistoon
(ct′′ , x′′ ), tilannetta voidaan käsitellä ilman yleistä suhteellisuusteoriaa.
Itse meno- ja paluumatkoilla tilanne on, kuten inertiaalikoordinaatistoehdon mukaan täytyy ollakin, symmetrinen. Pisteessä C, hypättäessä inertiaalikoordinaatistosta (ct′ , x′ ) inertiaalikoordinaatistoon (ct′′ , x′′ ), raketin samanaikaisuuden viiva kiertyy välittömästi pisteestä A pisteeseen B. Tällöin raketin matkustaja näkee Maapallolle
jääneen sisaren vanhenevan nopeasti!
Sisarusten ikäero voidaan laskea yksinkertaisesti aikadilataatiota soveltamalla.
20
5. Vektorilaskenta
missä α = 0, 1, 2, 3, eli vektorin komponentit ovat ∆x0 ,
∆x1 , ∆x2 , ∆x3 . Vastaavasti samalla vektorilla on kompo5.1 Uudet yksiköt
nentit jossain toisessa koordinaatistossa Ō
Luodaan uusi yksikköjärjestelmä siten, että valon
x → ∆xᾱ .
nopeudesta tulee dimensioton, eli c = 1. Tälläistä
Ō
yksikköjärjestelmää kutsutaan geometrisoiduksi yksikköjärjestelmäksi. Tällöin kaikista yhtälöistä voidaan Tässä vektori ∆x on sama, mutta käytetty koordinaatisjättää valonnopeuden potenssit pois, ja ajan yksiköksi to on O:n sijaan Ō, jolloin vektorin komponentit muuttuvat. Uudet komponentit saadaan vaikkapa Lorentztulee metri. Tällöin valonnopeus on
muunnoksen avulla.
matka jonka valo kulkee aikayksikössä
Esimerkiksi aikakomponentille
c=
aikayksikkö
3
X
v∆x1
∆x0
−√
=
Λ0̄β ∆xβ ,
∆x0̄ = √
1m
1m
1 − v2
1 − v2
=
= 1.
=
β=0
aika jossa valo kulkee metrin
1m
Tästä seuraa mm. seuraavat konversioyhtälöt

 3 × 108 m/s = 1
1 s = 3 × 108 m ,

1
1 m = 3×10
8 s
missä {Λ0̄β } ovat neljä numeroa:
Λ0̄0
Λ0̄1
Λ0̄2
Λ0̄3
ja esimerkiksi seuraavat johdannaisyksiköt
[energia]
[liikemäärä]
[kiihtyvyys]
[voima]
=
=
=
=
kg
kg
.
m−1
kg/m
1
= √1−v
2
v
= − √1−v
2
.
= 0
= 0
Yleisesti vektorin komponenttien Lorentz-muunnos voidaan siis kirjoittaa
∆xᾱ =
3
X
Λᾱβ ∆xβ ,
β=0
Näin relativistiset yhtälöt voidaan kirjoittaa yksinkertaisemmin, kun valonnopeutta c ei tarvitse kuljettaa koko missä {Λαβ } on 16 numeroa, jotka muodostavat Lorentzajan mukana. On kuitenkin tärkeää osata siirtyä geometri- muunnosmatriisin.
soiduista yksiköistä normaaleihin yksiköihin ja päinvastoin
Lorentz-muunnosmatriisit ovat x-akselin suuntaan
tarvittaessa. Jatkossa käytetään geometrisoituja yksiköitä


γ
−vγ 0 0
mikäli toisin ei mainita.
 −vγ
γ
0 0 
,
(39)
Λαβ = 
 0
0
1 0 
5.2 Nelivektorit
0
0
0 1
Nelivektori on esimerkiksi
∆x →(∆t, ∆x, ∆y, ∆z),
y-akselin suuntaan
O

γ
 0
α
Λβ = 
 −vγ
0
0
1
0
0
−vγ
0
γ
0

0
0 

0 
1
joka osoittaa yhdestä tapahtumasta toiseen, jolloin sen
(40)
komponentit ovat näiden tapahtumien koordinaattien erotukset. Huomaa, että ∆t:n kertoimena on tässä valonnopeus (c = 1), koska kaikilla komponenteilla täytyy olla saja z-akselin suuntaan
ma yksikkö!


Vektorin komponentit transformoituvat, kuten koordiγ
0 0 −vγ
naatit koordinaatistomuunnoksessa. Tässä käytetty mer 0
1 0
0 
.
(41)
Λαβ = 
kintä ’→’ viittaa vektorin komponentteihin O koordinaa
0
0 1
0 
O
tistossa.
−vγ 0 0
γ
Merkinnällä ’→’ pyritään korostamaan sitä, että vektori
√
O
2
on itsenäinen ja riippumaton geometrinen olio. Sen sijaan Tässä γ = 1/ 1 − v .
Otetaan vielä käyttöön Einsteinin summaussääntö, jonvektorin komponentit riippuvat valitusta koordinaatistosta. Eli vektori ∆x voidaan tulkita nuolena tapahtumasta A ka mukaan summataan aina automaattisesti samojen ylätapahtumaan B ja ∆x →(∆t, ∆x, ∆y, ∆z) ovat neljä koor- ja alaindeksinä olevien symbolien yli. Esimerkiksi
O
dinaatiston valinnasta riippuvaa lukuarvoa!
Toinen tapa merkitä sama asia on
x → {∆xα } ,
O
∆xᾱ =
3
X
Λᾱβ ∆xβ = Λᾱβ ∆xβ = Λᾱγ ∆xγ ,
β=0
eli summausindeksin β voi vaihtaa toiseksi (γ) muuttamatta lopputulosta.
21
Huomaa: Kreikkalaiset aakkoset α, β, δ, γ, ... viittaa- Tässä siis Aᾱ 6= Aα ja eᾱ 6= eα , mutta
vat aina nelikomponentteihin 0, 1, 2, 3. Latinalaiset aakkoA = Aᾱ eᾱ = Aα eα
set i, j, k, ... viittaavat vektorin spatiaalikomponentteihin
1, 2, 3. Toisinsanoen
koska vektori geometrisena oliona ei muutu koordinaatistomuunnoksessa.
Λᾱβ ∆xβ 6= Λᾱi ∆xi .
Tästä voidaan johtaa kantavektoreiden koordinaatistoHuomaa: Yhtälöissä vapaiden indeksien, eli siis nii- muunnokselle
den indeksien joiden yli ei summata, täytyy olla samat
Λᾱβ Aβ eᾱ = Aα eα ⇔ Aβ Λᾱβ eᾱ = Aα eα
yhtäsuuruusmerkin molemmin puolin. Summausindeksit
häviävät summatessa.
⇔ Aα Λᾱα eᾱ = Aα eα
Yleisesti siis nelivektori on
A → {Aα } = A0 , A1 , A2 , A3 ,
⇔ eα = Λβ̄α eβ̄ .
(43)
O
Toisin sanoen muunnos (43) antaa koordinaatiston Ō kantavektorit koordinaatiston O kantavektoreiden avulla.
Huomaa: Koordinaatiston Ō kantavektorit eβ̄ transforAᾱ = Λᾱβ Aβ .
moituvat koordinaatistoon O päinvastaisella tavalla (43)
Nelivektorit summautuvat ja ne voidaan kertoa skalaa- kuin vektorin komponentit, joille siis
rilla normaalien vektoreiden tapaan:
Aβ̄ = Λβ̄α Aα .
α
α
A + B → {A + B }
ja sen komponentit koordinaatistossa Ō ovat
O
Esimerkki
Koordinaatisto Ō liikkuu nopeudella v positiivisen xja
akselin suuntaan koordinaatiston O suhteen. Yhtälön (39)
µA → {µAα } = µA0 , µA1 , µA2 , µA3 .
mukaisesti Lorentz-muunnosmatriisi on silloin
O


γ
−vγ 0 0
 −vγ
γ
0 0 
5.3 Kantavektorit
,
Λαβ = 
 0
0
1 0 
Koordinaatiston määrittelee geometrisesti sen akseleiden
0
0
0 1
suuntaiset yksikkövektorit, eli kantavektorit. Ortonormaalissa koordinaatistossa O kantavektorit ovat
√
missä γ = 1/ 1 − v 2 . Nyt nelivektori A →(5, 0, 0, 2), jol
O
e
→
(1,
0,
0,
0)
 0 O

loin sen komponentit koordinaatistossa Ō ovat


 e1 → (0, 1, 0, 0)
O
A0̄ = Λ0̄0 A0 + Λ0̄1 A1 + Λ0̄2 A2 + Λ0̄3 A3
e2 → (0, 0, 1, 0)


O


 e3 → (0, 0, 0, 1)
= γ5 + (−vγ) · 0 + 0 · 0 + 0 · 0 = 5γ.
O
= A0 + B 0 , A1 + B 1 , A2 + B 2 , A3 + B 3
Vastaasti koordinaatistossa Ō esimerkiksi ajan kantavektorille e0̄ →(1, 0, 0, 0) ja niin edelleen. Yleisesti e0 6= e0̄ ,
Vastaavasti muille komponenteille
A1̄ = −5vγ
O
koska kantavektorit määrittelevät eri koordinaatiston.
A2̄ = 0
Kantavektoreille (α:nnen kantavektorin β:nnelle kompoA3̄ = 2
nentille)
(eα )β = δαβ
eli nelivektorilla A on koordinaatistossa Ō komponentit
missä
δαβ
=
1,
0,
A →(5γ, −5vγ, 0, 2).
α=β
.
α 6= β
Ō
Muunnetaan vielä kantavektorit muunnoksen (43) mukaiKantavektoreiden avulla nelivektori A on koordinaatti- sesti:
vapaana geometrisena oliona
e0 = Λ0̄0 e0̄ + Λ1̄0 e1̄ + Λ2̄0 e2̄ + Λ3̄0 e3̄
A = Aα eα = A0 e0 + A1 e1 + A2 e2 + A3 e3 .
(42)
= γe0̄ − vγe1̄ ,
ja vastaavasti muille kantavektoreille
5.4 Kantavektoreiden transformointi
Vastaavasti edellämainitulle vektorille (42) koordinaatistossa Ō
A = Aᾱ eᾱ .
22
e1
e2
e3
= −vγe0̄ + γe1̄
= e2̄
.
= e3̄
Eli kyseessä on kantavektori e0 kappaleen omassa koordinaatistossa.
Toisinsanoen, kappaleen lepokoordinaatistossa Ō nelinopeus voidaan kirjoittaa
U = e0 → U ᾱ = (1, 0, 0, 0).
t
e0
e0
Ō
e1
Vastaavasti nopeudella v liikkuvan kappaleen nelinopeus
saadaan Lorentz transformoimalla nelinopeus U lepokoordinaatistosta Ō liikkuvaan koordinaatistoon O:
U β = Λβᾱ U ᾱ → U 0 , U 1 , U 2 , U 3 .
x
e1
O
t
e
0
=U
Kuva 25: Muunnetut kantavektorit.
e1
5.5 Käänteismuunnokset
A
Lorentz-muunnos on ainoastaan nopeuden funktio Λβ̄α =
β̄
Λ α (v), joka muuntaa kantavektorit kuten
eα =
x
Λβ̄α (v)eβ̄ .
Koska kanta O saadaan Ō:sta nopeuden v funktiona tapahtuvalla transformaatiolla, täytyy käänteismuunnoksessa
nopeuden olla −v, eli
eµ̄ = Λνµ̄ (−v)eν ,
jossa voidaan vapaa indeksi vaihtaa β̄:ksi:
eβ̄ = Λνβ̄ (−v)eν ,
Kuva 26: Kappaleen nelinopeus on sen maailmanviivan
tangentti, jonka pituus on yksi aikayksikkö kyseisen kappaleen lepokoordinaatistossa.
Nelinopeuden spatiaalikomponentit (α = 1, 2, 3) ovat hyvin läheisesti sidoksissa kappaleen normaaliin (kolmi-) noEli
peuteen.
Λβ̄α (v)Λνβ̄ (−v) = δ να ,
Luonnollisestikaan kiihtyvässä liikkeessä olevalla kappaleella
ei ole koordinaatistoa, jossa se olisi aina levossa. Voitoisin sanoen käänteismuunnosmatriisi on alkuperäisen
daan
kuitenkin
määritellä kullakin hetkellä koordinaatisto,
muunnoksen käänteismatriisi! Eli, vektorille Aβ̄ =
joka
liikkuu
kuten
kiihtyvässä liikkeessä oleva kappale kulΛβ̄α (v)Aα on käänteismuunnos
lakin hetkellä.
Tälläistä
koordinaatistoa
kutsutaan
MCRFΛνβ̄ (−v)Aβ̄ = Λνβ̄ (−v)Λβ̄α (v)Aα = δ να Aα = Aν ,
koordinaatistoksi (Momentarily Comoving Reference
joka muuntaa jo muunnetut komponentit takaisin alku- Frame). Tällöin nelinopeus kiihtyvässä liikkeessä olevalla
kappaleella on sen MCRF-koordinaatiston kantavektori
peräisiksi.
Käänteismuunnosmatriisi on siis alkuperäisen muun- e0 .
nosmatriisin käänteismatriisi. Käytännössä Lorentzmuunnosmatriisin käänteismatriisi saadaan vaihtamalla 5.7 Neliliikemäärä (-impulssi)
Kappaleen neliliikemäärä määritellään P = m0 U, missä
nopeuden v etumerkkiä, jolloin muunnetut koordinaam
0 on kappaleen massa sen omassa koordinaatistossa (letit palaavat takaisin alkuperäisiksi käänteismuunnoksen
pomassa).
Eli kappaleeseen sidotussa lepokoordinaatistosjälkeen.
sa O neliliikemäärä on
⇒ eα = Λβ̄α (v)eβ̄ = Λβ̄α (v)Λνβ̄ (−v)eν = δ να eν .
5.6 Nelinopeus
P = m0 U = m0 e0 →(m0 , 0, 0, 0).
Nelinopeus U on kappaleen maailmanviivan tangentti,
O
O
jonka pituus on yksi aikayksikkö kyseisen kappaleen lepoVastaavasti kappaleen suhteen liikkuvassa koordinaatistoskoordinaatistossa.
Tasaisesti liikkuvan kappaleen koordinaatistossa nelino- sa Ō on neliliikemäärä
peus on aika-akselin suuntainen ja aikayksikön pituinen.
P = m0 U →(P 0 = E, P 1 , P 2 , P 3 ),
Ō
23
Epärelativistisella rajalla säilymislaki (44) pelkistyy
missä aikakomponentti P 0 vastaa kappaleen kokonaisenergiaa E ja spatiaalikomponentit P i lineaarista liikemäärää. klassisiksi energian ja liikemäärän säilymislaeiksi. Energian
säilymisessä täytyy kuitenkin ottaa mukaan kappaleiden leEsimerkki
pomassat.
Kappale, jonka lepomassa on m0 liikkuu nopeudella v
Kuitenkin, kuten kurssin alkupuolella on opittu,
x-akselin suuntaisesti O-koordinaatistossa. Lasketaan sen käsitteet “ennen” ja “jälkeen” riippuvat havaitsijan liiketinelinopeuden ja neliliikemäärän komponentit.
lasta. Yksittäiset nelinopeudet voivat siten riippua havaitLepokoordinaatistossaan Ō ajan kantavektori on e0̄ , jol- sijasta, mutta niiden summa on vakio kaikissa koordinaaloin nelinopeus U = e0̄ ja neliliikemäärä P = mU. Nelino- tistoissa.
peuden komponenteille
Määritellään hyvin käyttökelpoinen koordinaatisto. CMkoordinaatisto (Center of Momentum), joka on inertiaaliU α = Λαβ̄ (e0̄ )β̄ = Λα0̄ ,
koordinaatisto, jossa
X
jolloin vastaavasti neliliikemäärälle P α = m0 Λα0̄ . Eli neliP(i) → (Etotal , 0, 0, 0).
CM
nopeudella on komponentit
i
U0
U1
U2
U3
=
=
=
=
(1 − v 2 )−1/2
v(1 − v 2 )−1/2
0
0
5.9 Nelivektoreiden sisätulo
Tästä eteenpäin viivalementin neliössä ja sisätulossa
käytetään merkkisopimusta (-+++), jolloin vektorin suuruus on
ja vastaavasti neliliikemäärällä
P0
P1
P2
P3
=
=
=
=
A2 = −(A0 )2 + (A1 )2 + (A2 )2 + (A3 )2 .
m0 (1 − v 2 )−1/2
m0 v(1 − v 2 )−1/2
.
0
0
Nyt on voimassa kaikissa koordinaatistoissa O ja Ō
−(A0 )2 + (A1 )2 + (A2 )2 + (A3 )2
= −(A0̄ )2 + (A1̄ )2 + (A2̄ )2 + (A3̄ )2 ,
Pienillä nopeuksilla v ≪ c, saadaan {U i } = (v, 0, 0), mistä
tulee nimitys nelinopeus. Vastaavasti pienillä nopeuksilla sillä vektorin suuruus ei riipu käytetystä koordinaatistosneliliikemäärälle {P i } = (m0 v, 0, 0) ja kappaleen energialle ta. Vektorit voidaan luokitella suuruutensa A2 mukaisesti
kuten tapahtumien välimatkat ∆s2 :
1
0
2 −1/2
2
E ≡ P = m0 (1 − v )
≈ m0 + m0 v .
2
• A2 > 0, A on avaruudenkaltainen vektori.
Toisin sanoen kappaleen energia on pienillä nopeuksilla
(v ≪ c) sen massaa vastaavan energian ja liike-energian
summa.
5.8 Neliliikemäärän säilymislaki
Galilein ja Newtonin klassisessa mekaniikassa
• Energia säilyy.
• Liikemäärä säilyy.
• A2 < 0, A on ajankaltainen vektori.
• A2 = 0, A on valonkaltainen vektori (null vector ).
Tässä on tärkeää huomata, että valonkaltainen vektori (null vector ) EI ole nollavektori, toisinsanoen Aα 6= 0,
ainoastaan A2 = 0.
Koordinaatistossa O kahden nelivektorin A ja B sisätulo
on
A · B = −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 .
Vastaavasti erikoisessa suhteellisuusteoriassa neli-impulssi Myös sisätulo A · B on vektorin suuruuden tavoin koordisäilyy kokonaisuutena, jossa siis aikakomponentit vastaa- naatistosta riippumaton, eli invariantti.
vat energiaa ja spatiaalikomponentit klassista liikemäärää.
Kantavektoreille eα
Määritellään relativistinen neliliikemäärän säilymislaki:
e0 · e0 = −1
Neliliikemäärä P säilyy, eli useampien kappaleiden vuoe1 · e1 = e2 · e2 = e3 · e3 = 1
rovaikuttaessa kokonaisneliliikemäärä
eα · eβ = 0 jos α 6= β
X
P≡
Pi
(44)
Nämä kantavektorit muodostava siis ortonormaalin kankaikki
nan, jossa kantavektorit ovat kohtisuorassa toisiaan vaskappaleet
taan ja normalisoitu yksikkövektoreiksi.
(i)
Yksikkövektoreiden sisätulot voidaan kirjoittaa lyhyesti
eα · eβ = ηαβ , missä
on sama ennen ja jälkeen vuorovaikutuksen.

Tämä on tärkeä säilymislaki etenkin hiukkasten kinemaα 6= β
 0,
tiikkaa tutkittaessa, ja sen paikkaansapitävyyttä on testat−1, α = β = 0 ,
ηαβ =

tu paljon.
1,
α=β
24
tai toisin ilmaistuna
Tarkastellaan aikaa t laboratoriokoordinaatistossa sekä
sen suhteen liikkuvan kappaleen lepokoordinaatistossa.
η00 = −1, η11 = η22 = η33 = 1
.
Olkoon kappale laboratoriokoordinaatiston pisteessä
ηαβ = 0,
josα 6= β
x, josta se siirtyy infinitesimaalisesti siirroksen dx =
Edellä esitelty viivaelementin merkkikonventio on siis itsea- (dt, dx, dy, dz) verran. Siirroksen suuruus on siten
siassa lähtöisin ηαβ :n diagonaalikomponenttien merkeistä.
ds2 ≡ dx · dx = −dt2 + dx2 + dy 2 + dz 2 .
Itseasiassa ηαβ on vektorilaskennassa hyvin keskeisellä
sijalla oleva metrinen tensori, joka määrittelee sisätulon
Ajankaltaiselle siirrokselle tämä on negatiivinen. Kappaja sen kuinka kahden pisteen välinen etäisyys lasketaan.
leen lepokoordinaatistossa paikka ei muutu, joten dx =
Tämä taas määrittelee avaruuden “rakenteen”.
dy = dz = 0. Siksi
Metrisen tensorin avulla edellä ollut sisätulo voidaan kirjoittaa
ds2 = −dt2 = −dτ 2 ,
(45)
A · B = −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3
missä τ on kappaleen ominaisaika, ts. aika lepokoordinaatistossa.
Kappaleen liikkuessa nopeudella v laboratorio= A B ηαβ .
koordinaatistossa, voidaan ominaisajalle kirjoittaa
p
Esimerkki
dτ 2 = −ds2 ⇔ dτ = dt2 − dx2 − dy 2 − dz 2
Myös koordinaatistossa Ō sisätulo eᾱ · eβ̄ = ηᾱβ̄ , ja e0̄ ·
r
e1̄ = 0, kuva 27.
p
dx2 + dy 2 + dz 2
⇔ dτ = dt 1 −
= dt 1 − v 2 .
2
dt
t
Eli ominaisajan ja laboratoriokoordinaatiston ajan välinen
relaatio on
p
dt
dτ = dt 1 − v 2 = .
(46)
γ
α
β
e0
Jos tämä integroidaan puolittain, saadaan aikaväleille
φ
φ
τ2 − τ1 =
e1
x
Zt2
t1
dt
p
1 − v2 .
Vielä, jos oletetaan koordinaatistojen välinen nopeus vakioksi, on
p
τ2 − τ1 = (t2 − t1 ) 1 − v 2 ,
mikä on käytännössä ajan dilataation lauseke. Tästä
nähdään myös, että tapahtumien välinen ominaisaika on
Kuva 27: Kantavektorit e0̄ ja e1̄ koordinaatistossa O.
verrannollinen niiden välisen maailmanviivan pituuteen.
Edelleen, koska ds2 on invariantti, voidaan ominaisajalle
Koordinaatistoon piirretyt kantavektorit eivät näytä ole- kirjoittaa
van kohtisuorassa, kuitenkin niiden sisätulo on nolla! Tässä
dτ 2 = −dx · dx,
taas nähdään, että jokapäiväisen Euklidiseen avaruuteen
nähdään, että vektori dx/dτ , missä siis dτ =
harjaantuneen intuition käyttäminen Lorentz-Minkowski josta
√
−dx
· dx, on tangentti maailmanviivalle. Vektorin suuavaruudessa voi johtaa harhaan.
ruus
on
Vektorit ovat Lorentz-Minkowski avaruudessa ortogodx · dx
dx dx
= −1,
·
=
naalisia, jos niiden kulmat 45◦ kulmaan nähden ovat sadτ dτ
(dτ )2
mat. Tästä nähdään myös, että valon maailmanviivan tanjoka on normaaleissa yksiköissä valonnopeuden neliö. Toigentti on kohtisuorassa itse itseään vastaan!
sinsanoen dx/dτ on ajankaltainen vektori, jonka suuruus
on −1 ja joka on tangentti maailmanviivalle.
Esimerkki
Kappaleen MCRF koordinaatistossa siirrosvektorilla dx
Kappaleen nelinopeus U on ajan kantavektori sen omassa lepokoordinaatistossa (MCRF), joten U·U = −1. Tämä on komponentit
pitää paikkansa sisätulon invarianssin nojalla kaikissa koor(dt, 0, 0, 0),
dx
→
dinaatistoissa! Toisin sanoen aina on
MCRF
dτ = dt
U2 = U · U = U α U β ηαβ
= −U 0 U 0 + U 1 U 1 + U 2 U 2 + U 3 U 3 = −1.
joten
5.10 Ominaisaika
25
dx
→ (1, 0, 0, 0)
dτ MCRF
Klassisessa dynamiikassa voima f määritellään liikeyhtälön
dx
= (e0 )MCRF .
dp
dτ
f=
dt
Nämä ovat edellä jo esitellyn nelinopeuden ominaisuuksia,
eli nelinopeus on paikan ominaisaikaderivaatta
avulla. Vastaava neliyhtälö on
tai
U=
dx
.
dτ
F=
(47)
dP
dt dP
dP
=
=γ
.
dτ
dτ dt
dt
(49)
Liikkuvassa koordinaatistossa O neliliikemäärällä on komponentit
Esimerkki: Lepomassa ja liikemassa
P →(E, p1 , p2 , p3 ),
Tarkastellaan nopeudella v liikkuvan kappaleen massaa
O
laboratoriokoordinaatistossa O sekä kappaleeseen sidotusjoten nelivoiman spatiaalikomponenteille
sa lepokoordinaatistossa Ō.
Lepokoordinaatistossa Ō kappaleen massa on tietenkin
dpi
i
= γf i
F
=
γ
m0 (lepomassa). Vastaavasti neliliikemäärän komponentit
dt
ovat
ja aikakomponentille
P → {U α } = (m0 , 0, 0, 0).
Ō
dt d
dm
F0 =
(m0 γ) = γ
.
Kun tämä neliliikemäärä Lorentz-muunnetaan laboratoriodτ dt
dt
koordinaatistoon O saadaan komponenteille
Toisinsanoen, nelivoiman aikakomponentti on sidoksissa
α
α β
massan muutokseen ajan funktiona. Yleensä massa oleteP → U = Λ βU
= m0 γ(1, vx , vy , vz )
O
taan aina vakioksi, jolloin aikakomponentti on nolla. Eli
nelivoiman komponentit ovat koordinaatistossa O
= (E ≡ m, γpx , γpy , γpz ).
(48)
dm i
(50)
,f .
F→γ
Nyt voidaan assosioida laboratoriokoordinaatistossa liikO
dt
kuvan kappaleen kokonaisenergia E vastaavaan (liike)massaan m. Neliliikemäärän aikakomponenteista (48)
Esimerkki: Lepomassan vakioisuus
lähtien voidaan kirjoittaa liikemassan ja lepomassan
Kun lähdetään liikkeelle neliliikeyhtälöstä (49), on
väliseksi relaatioksi
dP
dU
d
dm0
m0
F=
=
(m0 U) =
U + m0
.
m = m0 γ = √
.
2
dτ
dτ
dτ
dτ
1−v
5.11 Nelikiihtyvyys ja liikeyhtälö
Tarkastellaan nelinopeuden U ominaisaikaderivaattaa
d2 x
dU
=
dτ
dτ 2
differentioimalla nelinopeuden neliö
U·U⇒
dU
d
(U · U) = 2U ·
.
dτ
dτ
Kun tästä otetaan puolittain sisätulo nelinopeuden U kanssa, saadaan
dU
dm0
·U
U + m0
F·U=
dτ
dτ
dm0
dU
U · U + m0 U ·
.
dτ
dτ
Koska U · U = −1 ja U · (dU/dτ ) = 0, saadaan
=
F·U =−
dm0
.
dτ
Koska nelinopeuden sisätulo U · U = −1 on aina vakio, Kappaleen lepomassa on siten vakio, mikäli nelivoima on
täytyy olla
kohtisuorassa hiukkasen maailmanviivaa vastaan.
dU
d
(U · U) = 2U ·
= 0.
dτ
dτ
Esimerkki: Massan ja energian vastaavuus
Tarkastellaan tapausta, jossa lepomassa m0 on vakio, eli
Toisin sanoen nelinopeus on aina nelikiihtyvyyttä vastaan
kohtisuorassa. Koska MCRF:ssä nelinopeudella U on ai- F · U = 0. Nyt F i = γf i ja F 0 = γ(dm/dt). Näinollen
noastaan aikakomponentti, nelinopeuden ja nelikiihtyvyydm
den kohtisuoruus tarkoittaa, että
= γf j U i ηij .
F · U = 0 ⇔ U 0γ
dt
dU
Koska nelinopeuden komponentit ovat lepokoordinaatis→ (0, A1 , A2 , A3 ).
dτ MCRF
tossa U → (1, 0, 0, 0) ja liikkuvassa koordinaatistossa
MCRF
Kutsutaan tätä nelivektoria nelikiihtyyvydeksi, jolle
A=
U → γ(1, vx , vy , vz ), on
O
dU
⇔ U · A = 0.
dτ
γ2
26
dm
dm
= γ 2 f j v j ηij = γ 2 f · v ⇔
= f · v.
dt
dt
(51)
Tästä seuraa myös se, että ei ole olemassa sellaista ykKun hiukkanen liikkuu voiman f vaikutuksesta matkan dr,
tehty työ on f · dr, joka on toisaalta hiukkasen saama ener- sikkövektoria e0 , joka olisi tangentti valon maailmanviivalgialisä dE. Näinollen
le. Tangenttivektori voidaan kyllä määrittää, mutta se ei
voi olla yksikkövektori.
dE
dr
dm
Neliliikemäärä ei ole yksikkövektori, vaan se antaa enerdE = f · dr ⇔
=f·
=f ·v =
dt
dt
dt
gian ja liikemäärän valitussa koordinaatistossa. Jos xyhtälön (51) nojalla. Kun tämä integroidaan saadaan
m = akselia pitkin liikkuvalla fotonilla on jossain koordinaatis√
E + vakio. Eli energia E = m = γm0 = m0 / 1 − v 2 ja tossa energia E, niin kyseisessä koordinaatistossa sen neli0
kappaleen energia on sen liikemassa. Olkoon kappaleen le- nopeuden aikakomponentti on P = E. Koska liike tapah2
3
pokoordinaatistossa E0 = m0 , eli kappaleen lepomassaan tuu x-akselilla, täytyy olla P = P = 0. Jotta vektori olisi
1
liittyy energia. Toisaalta myös käänteisesti: energiaan liit- valonkaltainen, täytyy olla P = E, eli
tyy massa, johon myös gravitaatio vaikuttaa!
P · P = −E 2 + E 2 = 0.
Kokonaisenergian E ja lepoenergian E0 erotus on kappaleen kineettinen energia
Eli fotonien liikemäärä vastaa aina sen energiaa!
Kvanttimekaniikasta tiedetään, että fotonin energia on
T = E − E0 = m − m0 = (γ − 1)m0 .
E = hν, missä h = 6.6256 × 10−34 Js on Planckin vakio,
ja ν on fotonin taajuus. Tarkastelemalla fotonin energian
Lorentz-muunnosta voidaan johtaa relativistinen DopplerEsimerkki: Energia ja liikemäärä
Tarkastellaan kappaletta, jonka neliliikemäärä on P. siirtymä fotoneille.
Tarkastellaan laboratoriokoordinaatistossa O positiiviTällöin neliliikemäärän neliölle P · P = m20 U · U = −m20 .
sen
x-akselin suuntaan liikkuvaa fotonia, jonka taajuus on
Toisaalta
ν. Tällöin laboratoriokoordinaatiston x-akselia pitkin postitiiviseen suuntaan nopeudella v liikkuvassa koordinaatisP · P = −E 2 + (P 1 )2 + (P 2 )2 + (P 3 )2 ,
tossa Ō sillä on energia Ē = P 0̄ sekä taajuus ν̄. Tällöin
jolloin kappaleen kokonaisenergian täytyy olla
neliliikemäärille koordinaatistoissa O ja Ō voidaan lausua
E 2 = m20 +
3
X
P 0̄ = Λ0̄α P α ,
(P i )2 .
jolloin
i=1
P 1v
hν
hνv
E
−√
= √
−√
= hν̄.
Ē = √
Esimerkki: Liikkuva havaitsija
2
2
2
1−v
1−v
1−v
1 − v2
Olkoot kappaleella neliliikemäärä P ja liikkukoon havaitsija nelinopeudella UO . Tällöin
Tästä saadaan fotonin taajuuksien suhteeksi koordinaatistoissa O ja Ō
P · UO = P · e0 ,
r
1−v
1−v
ν̄
=
,
⇒ = √
missä e0 on havaitsijan koordinaatiston O ajan kantavekν
1+v
1 − v2
tori. Samassa koordinaatistossa kappaleen neliliikemäärällä
mikä on siis relativistisen Doppler siirtymän lauseke. Huoon komponentit
maa, että tässä yhteydessä oletettiin että fotoni ja laboP →(E, P 1 , P 2 , P 3 ),
ratorikoordinaatiston O suhteen liikkuva koordinaatisto Ō
O
liikkuvat samaan suuntaan. Jos koordinaatistolla Ō on nojoten
peuskomponentteja fotonin liikesuuntaa vastaan, Doppler−P · UO = E.
siirtymän lauseke muuttuu hieman.
Kuten aiemmin on opittu, hiukkasen neliliikemäärän
Kappaleen energia E havaitsijan O suhteen voidaan laskea missä tahansa koordinaatistossa skalaaritulon P · UO neliöstä saadaan sen lepomassa. Koska fotonin neliliikemäärän neliön täytyy olla nolla, jotta se liikkuisi vaavulla.
lon kaltaisia geodeesejä pitkin, on fotonin lepomassa
välttämättä nolla. Eli fotonille
5.12 Fotonit ja massattomat kappaleet
Fotoneille ei ole määritelty nelinopeutta! Fotonit liikkum20 = −P · P = 0.
vat valonkaltaisilla suorilla, joten valolle
Tämä pätee fotonien lisäksi myös kaikille muille massattodx · dx = 0.
mille hiukkasille.
Vain lepomassattomat kappaleet voivat kulkea valonTästä ja ominaisajan lausekkeesta (45) nähdään, että dτ =
nopeudella,
koska massalliselta kappaleelta valonnopeuden
0, ja nelinopeutta ei voida määritellä. Käytännössä tämä
saavuttamiseen
vaaditaan ääretön energia.
tarkoittaa sitä, että ei ole mahdollista valita sellaista koorEli
valonnopeudella
liikkuvalle kappaleelle
dinaatistoa, jonka suhteen valo olisi levossa. Näin ollen
myöskään MCRF-koordinaatistoa ei valon tapauksessa ole
olemassa.
27
P1
= 1,
P0
6. Tensorit
kun taas m0 lepomassaiselle kappaleelle
s
m2
P1
2
P · P = −m0 , ja 0 = 1 −
< 1.
P
(P 0 )2
6.1 Metrinen tensori
Olemme jo tavanneet yhden tensorin, eli metrisen tensorin, joka määrittelee kahden nelivektorin välisen sisätulon.
Olkoot nelivektorit A ja B kannassa {eα } koordinaatisHuomaa! Kappaleelle, jolle m 6= 0 voidaan aina
tossa
O:
määrittää MCRF-koordinaatisto (inertiaalikoordinaatisto,
A = Aα eα , B = B β eβ .
jossa se on levossa), mutta fotonilla ja muilla massattomilla
kappaleilla ei ole olemassa lepokoordinaatistoa!
Näiden vektoreiden välinen skalaaritulo on
A · B = (Aα eα ) · (B β eβ ) = Aα B β (eα · eβ )
= Aα B β ηαβ .
Tämä on sama asia kirjoitettuna koordinaatistosta riippumattomalla tavalla kuin
−A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 .
Tässä luvut ηαβ ovat metrisen tensorin komponentit ! Metriikka antaa “säännön” siitä, kuinka kahdesta vektorista
saadaan luku.
0
Tensori tyyppiä (N
) on lineaarinen N :n vektorin funktio, joka palauttaa reaaliluvun.
Esimerkiksi alussa esitelty metrinen tensori ηαβ on (02 )
tensori, joka ottaa kaksi vektoria argumenteikseen ja palauttaa reaaliluvun. Merkinnät
Aα B β ηαβ = Aα Bβ = A · B = η(A, B)
ovat ekvivalentteja.
Tensorien lineaarisuus tarkoittaa sitä, että (α, β ∈ ℜ)
(αA) · B
= α(A · B)
(A + B) · C = A · C + B · C
tai
A · (βB)
=
A · (B + C) =
β(A · B)
A·B+A·C
Symbolilla ηαβ merkitään laakean Lorentz-Minkowski
avaruuden metristä tensoria. Laakea avaruus tarkoittaa
sitä, että inertiaalikoordinaatistoehto on voimassa. Yleisesti metristä tensoria merkitään
gαβ = g( , ),
eli sisätulo A · B = g(A, B) = Aα B β gαβ ∈ ℜ. Lineaarisuus
vastaavasti tarkoittaa sitä, että
g(αA + βB, C) = αg(A, C) + βg(B, C).
Huomautus!
Tensorit ovat invariantteja koordinaatistomuunnosten
suhteen! Eli tensori on itse vektoreiden, koordinaatistosta
ja yksittäisistä komponenteista riippumattomien olentojen
funktio.
Huomautus!
Paikan funktio f (t, x, y, z) on reaaliluvun palauttava
funktio, jonka argumentteina ei ole vektoreita. Funktio on
siten (00 )-tensori.
Huomatus: Funktion käsite
Merkinnässä y = f (x)
28
= A0 p0 + A1 p1 + A2 p2 + A3 p3
• y on reaaliluku.
ovat ekvivalentteja. Huomaa, että viimeisessä muodossa
kaikkien komponenttien edessä on ’+’-merkit, toisin kuin
• f ( ) on “sääntö“ (mapping) reaaliluvusta toiseen reaa- kahden vektorin välisessä sisätulossa!
lilukuun.
Operaatio Aα pα on vektorin A ja yksimuodon p̃ kontNämä ovat kolme eri asiaa. Vastaavasti tensoreiden tapauk- raktio (contraction), joka voidaan suorittaa minkä tahansa
vektorin ja yksimuodon kanssa ilman muita tensoreita.
sessa
Yksimuodon p̃ komponentit Lorentz-muunnetussa kan• A ja B ovat nelivektoreita.
nassa {eβ̄ } ovat
• A · B on reaaliluku.
pβ̄ ≡ p̃(eβ̄ ) = p̃(Λαβ̄ eα ) = Λαβ̄ p̃(eα ) = Λαβ̄ pα .
• g( , ) on “sääntö“, joka liittää vektorit A, B sekä reKun verrataan tätä kantavektoreiden transformointiin
aaliluvun A · B toisiinsa!
• x on reaaliluku.
Tensorin komponentit
Samoin kuin nelivektoreilla, myös tensoreilla on komponentit:
0
(N
) tensorin komponentit koordinaatistossa O ovat sen
arvot, kun tensorin argumentteina ovat koordinaatiston O
kantavektorit {eα }.
Esimerkki
Metrisen tensorin komponentit koordinaatistossa O ovat
g(eα , eβ ) = eα · eβ = ηαβ .
6.2 (01)-tensorit: yksimuodot (one-form)
Tyypin (01 )-tensorit ovat erikoisasemassa, sillä ne muodostavat normaalien nelivektoreiden rinnalle duaalisen
kannan. Duaalisella kannalla tarkoitetaan rinnakkaista vektoriavaruutta, jossa jokaista vektoria vastaa yksikäsitteisesti (01 )-tensori ja päinvastoin. Siksi niillä on oma
nimensä, eli yksimuoto. Joissain vanhemmissa lähteissä yksimuotoja kutsutaan kovarianteiksi vektoreiksi.
Englannin kielellä yksimuotoja kutsutaan: covector, covariant vector tai one-form.
Merkitään yksimuotoa aaltoviivalla p̃, ja koska kyseessä
on (01 ) tensori, ottaa yksimuoto argumentikseen yhden vektorin ja palauttaa reaaliluvun. Eli p̃(A) ∈ ℜ.
Olkoot q̃ toinen yksimuoto, tällöin tensorien laskusäännöt pätevät ja kun
s̃ = p̃ + q̃
,
r̃ = αp̃
on
s̃(A) =
r̃(A) =
p̃(A) + q̃(A)
.
αp̃(A)
Yksimuodot täyttävät vektoriavaruuden määritelmän,
niinpä ne muodostavat normaalien nelivektoreiden rinnalle
edellä mainitun duaalisen vektoriavaruuden.
Yksimuotojen komponentit muodostetaan samalla tavalla kuin tensoreidenkin komponentit, eli
eβ̄ = Λαβ̄ eα ,
nähdään, että yksimuotojen komponentit transformoituvat
kuten kantavektorit, ja vastakkaisella tavalla kuin vektorien komponentit.
On helppo osoittaa, että kontraktio Aα pα on koordinaatistosta riippumaton:
Aᾱ pᾱ = Λᾱβ Aβ (Λµᾱ pµ ) = Λᾱβ Λµᾱ Aβ pµ
= δ µβ Aβ pµ = Aβ pβ .
Tämä on suoraaan rinnastettavissa siihen, että vektori A =
Aα eα on koordinaatistosta riippumaton geometrinen olio.
6.3 Kantayksimuodot
Nelivektoreiden tapaan neljä lineaarisesti riippumatonta yksimuotoa virittävät kannan. Mistä tahansa vektorikannasta voidaan määritellä vastaava yksimuotokanta
{ω̃α , α = 0, ...3}, joka on duaali vektorikannalle {eα }.
Eli yksimuoto voidaan kirjoittaa kantayksimuotojen
avulla kuten
p̃ = pα ω̃ α ,
missä ω̃ α ovat neljä eri kantayksimuotoa.
Kun tarkastellaan vektorin A ja yksimuodon p̃ kontraktiota
p̃(A) = pα ω̃α (A) = pα ω̃ α (Aβ eβ ) = pα Aβ ω̃ α (eβ )
nähdään, että
⇒ ω̃ α (eβ ) = δ αβ .
(52)
Kantayksimuodoilla on koordinaatistossa O komponentit
ω̃ 0 → (1, 0, 0, 0)
pα ≡ p̃(eα ).
ω̃ 1
ω̃ 2
ω̃ 3
O
→ (0, 1, 0, 0)
O
→ (0, 0, 1, 0)
O
→ (0, 0, 0, 1)
O
Huomautus!
Relaatio (52) määrittää kantavektoreiden {eα } avulla
Komponenttimuodossa yksimuodon indeksi on alhaalla,
yksikäsitteisen
yksimuotokannan {ω̃α }.
kun taas vektoreilla indeksi on ylhäällä. Eli seuraavat merkinnät
Huomautus!
p̃(A) = p̃(Aα eα ) = Aα p̃(eα ) = Aα pα
29
Vaikka sekä vektori että yksimuoto voidaan kuvata
neljällä eri komponentilla, on niillä täysin erilainen geometrinen merkitys!
Kantayksimuodot transformoituvat kuten vektoreiden
komponentit:
ω̃ᾱ = Λᾱβ ω̃ β .
τ=2
t
U
τ=1
Yksimuodon geometrinen merkitys
Kun vektori mielletään yleensä nuoleksi, yksimuodolla
on vastaava toisenlainen geometrinen merkitys. Yksimuoto ei ole nuoli. Matemaattisesti yksimuoto kuvaa vektorit
luvuiksi.
Yksimuoto on sarja pintoja, ja sen suuruus riippuu pintojen välimatkoista, kuva 28.
φ(τ)=φ[ t (τ), x (τ), y (τ), z (τ)]
τ=0
x
Kuva 29: Ominaisajalla τ parametrisoitu maailmanviiva.
(a)
(b)
(c)
Toisinsanoen dφ/dτ on U:n lineaarinen funktio ja kyseessä on yksimuoto, jonka komponentit ovat
∂φ ∂φ ∂φ ∂φ
.
d̃φ →
,
,
,
O
∂t ∂x ∂y ∂z
Kuva 28: Yksimuodon geometrinen merkitys. (a) Yksimuoto on “sarja” pintoja. (b) Yksimuodon antama luku Eli d̃φ on funktion φ gradientti, ja sen geometrinen merkivektorista vastaa niiden pintojen määrää, jotka “nuoli” tys on sama kuin yksimuodolla.
lävistää. (c) Pienempi yksimuoto samasta vektorista vastaa vähempää määrää pintoja!
Huomautus!
Vektori on suora, ja myös yksimuodon pinnat ovat suoHuomaa, että 4-ulotteisessa aika-avaruusjatkumossa yk- ria ja yhdensuuntaisia, koska yksimuoto on paikallisesti
simuotojen määrittämät pinnat ovat kolmiulotteisia. Yk- määritelty kussakin koordinaatiston pisteessä!
simuoto ei siis määritä suuntaa, vaan tavan “viipaloida”
avaruutta. Pintojen välimatka on kääntäen verrannollinen
Huomautus!
yksimuodon suuruuteen.
Gradientti sellaisenaan ei ole vektori, vaan tarvitaan
Esimerkiksi gradientti on yksimuoto.
metriikka, jotta gradienttiin voitaisiin liittää vektori. Geometrisesti gradientti (yksinään) on yksimuoto!
Funktion derivaatta = yksimuoto!
Tarkastellaan vielä, kuinka gradientti transformoituu.
Olkoon jokaisessa aika-avaruuden pisteessä määritelty Yksimuodolle
skalaarikenttä φ(x). Kappaleen maailmanviivalla on kus(d̃φ)ᾱ = Λβᾱ (d̃φ)β ,
sakin pisteessä jokin arvo φ(x), joka muuttuu liikuttaessa
ja toisaalta derivoinnin ketjusäännön perusteella
maailmanviivaa pitkin.
Parametrisoidaan tämän kappaleen maailmanviiva omi∂φ ∂xβ
∂xβ
∂φ
naisajalla τ (kuva 29).
=
⇒
(
d̃φ)
=
(d̃φ)β .
ᾱ
∂xᾱ
∂xβ ∂xᾱ
∂xᾱ
Nyt kappaleen nelinopeus on sen maailmanviivan tangentti, eli
Koska
dt dx dy dz
∂xβ
,
,
,
,
U→
xβ = Λβᾱ xᾱ ⇒
= Λβᾱ ,
O
dτ dτ dτ dτ
∂xᾱ
ja edellämääritelty skalaarikenttä φ muuttuu maailmanvii- ja transformaatio on sama kuin yksimuodoilla muutenkin!
vaa pitkin liikkuttaessa kuten
Huomautus: derivaatta
dφ
∂φ dt
∂φ dx ∂φ dy
∂φ dz
Derivaattaa merkitään usein
=
+
+
+
dτ
∂t dτ
∂x dτ
∂y dτ
∂z dτ
∂φ
∂φ
≡ φ ,α .
≡ φ ,x tai
∂φ 0 ∂φ 1 ∂φ 2 ∂φ 3
∂x
∂xα
U
U +
U +
U .
=
∂t
∂x
∂y
∂z
Yleisesti on voimassa
Tässä siis tuotetaan luku dφ/dτ vektorista U, joka vasxα,β ≡ δ αβ ⇔ d̃xα ≡ ω̃ α ,
taa φ:n muutosta maailmanviivalla, jonka tangentti on U.
30
(02 ) tensori ottaa siis kaksi nelivektoria argumentteina,
joiden järjestys on tärkeä. Näinollen voidaan tarkastella (02 )
tensoreiden symmetriaominaisuuksia.
Symmetrinen tensori:
ja näin ollen mille tahansa funktiolle
d̃f =
∂f
d̃xα .
∂xα
Huomaa, että tämä on tensori, eikä infitesimaalinen muuf (A, B) = f (B, A) ∀ A, B.
tos f :ssä. Tämä täytyisi kontraktoida infinitesimaalisen
vektorin kanssa, jotta saataisiin f :n muutos johonkin suun- Kun asetetaan A = eα ja B = eβ saadaan komponenteille
taan!
fαβ = fβα .
Mielivaltaisesta (02 ) tensorista h saadaan symmetrinen
6.4 (02) tensorit ja ulkotulo
tensori asettamalla
Otsikon mukainen tensori on sellainen, joka ottaa kaksi
1
1
nelivektoria argumenteikseen. Yksinkertaisin mahdollinen
h(s) (A, B) = h(A, B) + h(B, A)
2
2
tensori on kahden yksimuodon (ulko)tulo.
0
Olkoot p̃ ja q̃ yksimuotoja, tällöin ulkotulo p̃ ⊗ q̃ on (2 )
1
⇔ h(s)αβ = h(αβ) = (hαβ + hβα ).
tensori, joka tuottaa kahdella vektorilla luvun p̃(A)q̃(B).
2
Eli kyseessä on (01 ) tensoreiden (yksimuotojen) tuottamien
Antisymmetrinen tensori:
lukujen tulo.
Tätä operaatiota merkitään siis symbolilla ’⊗’.
f (A, B) = −f (B, A) ∀ A, B.
Huomaa!
Kun asetetaan A = eα ja B = eβ saadaan komponenteille
Ulkotulo ’⊗’ EI kommutoi, eli tensorit p̃ ⊗ q̃ 6= q̃ ⊗ p̃, fαβ = −fβα .
toisinsanoen
Vastaavasti mielivaltaisesta (02 ) tensorista h saadaan anp̃(A)q̃(B) 6= p̃(B)q̃(A).
tisymmetrinen tensori asettamalla
h(a) (A, B) =
Komponentit
Yleisesti (02 ) tensori ei ole ulkotulo, mutta se voidaan aina ilmaista ulkotuloista muodostettujen tensoreiden summana. Tensorin f komponentit ovat siis
1
1
h(A, B) − h(B, A)
2
2
⇔ h(a)αβ = h[αβ] =
fαβ ≡ f (eα , eβ ).
1
(hαβ − hβα ).
2
Huomaa!
Mille tahansa tensorille
Tässä molemmat indeksit α ja β voivat saada neljä eri arvoa, joten (02 ) tensorilla on 16 komponenttia, jotka voidaan
ajatella 4x4 matriisina.
Mielivaltaisille vektoreille
hαβ =
1
1
(hαβ + hβα ) + (hαβ − hβα )
2
2
= h(αβ) + h[αβ] .
(02 )
f (A, B) = f (Aα eα , B β eβ ) = Aα B β f (eα , eβ )
= Aα B β fαβ .
Tutkitaan seuraavaksi, voidaanko tälle tensorille muodostaa kanta kuten nelivektoreille tai yksimuodoille siten
että
f = fαβ ω̃ αβ .
Tällöin täytyisi olla
Eli kaikki
tensorit voidaan jakaa symmetriseen ja antisymmetriseen osaan!
Esimerkiksi metrinen tensori g on symmetrinen, eli
g(A, B) = g(B, A).
6.5 Metriikka ja tensorit
Olkoot metriikka g ja nelivektori V. Koska metrinen tensori g vaatii kaksi vektoria argumenteiksi, puuttuu lausekkeesta g(V, ) yksi vektori! Eli
fµν = f (eµ , eν ) = fαβ ω̃ αβ (eµ , eν )
g( , V) = g(V, ) ≡ Ṽ( )
⇒ ω̃ αβ (eµ , eν ) = δ αµ δ βν .
on yksimuoto (metriikka g on symmetrinen) ja kun tällä
operoidaan vektoriin A on
Mutta kuten aiemmin on jo nähty, on δ αµ = ω̃(eµ ), joten
Ṽ(A) ≡ g(V, A) = g(A, V) = A · V.
ω̃ αβ = ω̃α ⊗ ω̃ β .
Toisinsanoen tensorit ω̃α ⊗ ω̃ β muodostavat kannan (02 )
tensorille ja
f = fαβ ω̃ α ⊗ ω̃ β .
Tensoreiden symmetriat
Komponenttimuodossa tämä on
Vα ≡ Ṽ(eα ) = V · eα = eα · V = eα · (V β eβ )
= (eα · eβ )V β ⇒ Vα = ηαβ V β .
Toisinsanoen, metrinen tensori kuvaa vektorit yksimuodoiksi. Huomaa, että vektorin komponentin indeksi on
31
Kuten yksimuoto on kuvaus, joka antaa vektorista reylhäällä (V α ) ja yksimuodon alhaalla (Vα )! Erikoistapauksena laakeassa Lorentz-Minkowski avaruudessa gαβ = ηαβ aaliluvun, voidaan myös vektori käsittää kuvauksena joka
ja
antaa yksimuodosta reaaliluvun, eli
V → (a, b, c, d) ⇔ Ṽ → (−a, b, c, d),
V(p̃) ≡ p̃(V) ≡ pα V α ≡< p̃, V > .
eli siirryttäessä vektoreista yksimuotoihin ainoastaan aikakomponentin etumerkki muuttuu.
Tämä voidaan lyhyellä harppauksella yleistää (M
0 ) tensoreille, joka on siis M :n yksimuodon lineaarinen funktio,
Yksimuodot vektoreiksi
joka palauttaa reaaliluvun.
Kun metrisen tensorin käänteismuoto on η αβ , saadaan
käänteisesti
Esimerkki
Aα ≡ η αβ Aβ .
(2 ) tensori V ⊗ W palauttaa luvun
0
On helppo osoitta, että {η αβ } = {ηαβ }, jolloin yksimuodosta päästään vektoriin vaihtamalla aikakomponentin etumerkkiä.
V(p̃)W(q̃) ≡ p̃(V)q̃(W) = V α pα W β qβ .
sekä tähän liittyvälle vektorille, joka on normaali φ:n tasaarvopintoihin nähden on
Rᾱβ̄ = R(ω̃ ᾱ ; eβ̄ ) = R(Λᾱµ ω̃ µ ; Λνβ̄ eν ) = Λᾱµ Λνβ̄ Rµν .
Tensorilla V ⊗ W on komponentit V α W β ja kantavektorit
eα ⊗ eβ .
Miksi yksimuotoja ja vektoreita??
Yleistetään tätä vielä edelleen siten, että otetaan muTutussa euklidisessa avaruudessa metriikan karteesiset
kaan
argumentteihin myös yksimuodot. Eli (M
N ) tensori on
komponentit ovat {δij }. Tällöin yksimuodoilla ja vektoreilM
:n
yksimuodon
ja
N
:n
vektorin
lineaarinen
funktio, joka
la on samat komponentit.
palauttaa
reaaliluvun.
Erikoisessa suhteellisuusteoriassa näin ei ole, vaan esimerkiksi kentän φ gradientille
Esimerkki
∂φ ∂φ ∂φ ∂φ
Olkoot R (11 ) tensori, ja tarkastellaan sen komponenttien
d̃φ → ( ,
,
,
)
transformaatiota:
∂t ∂x ∂y ∂z
dφ → (−
∂φ ∂φ ∂φ ∂φ
,
,
,
).
∂t ∂x ∂y ∂z
Eli tensorin jokainen indeksi transformoidaan erikseen!
Indeksien nostaminen ja laskeminen
Kuten jo aiemmin nähtiin, metriikka kuvaa vektorin V
Erikoisen suhteellisuusteorian epäeuklidisen metriikan takia yksimuotojen ja vektoreiden välistä eroa ei voida unoh- yksimuodoksi Ṽ, eli
taa! Vastaavanlaisia vektoreiden dualismeja on muuallakin
g(V, ) = Ṽ( ).
fysiikassa, kuten esimerkiksi kvanttimekaniikassa.
Yksimuotojen suuruus ja skalaaritulo
Yleisesti yksimuodoille ja vektoreille on voimassa
p̃2 = p2 = ηαβ pα pβ .
Tämä voidaan yleistää myös tensoreille. Eli, metriikka kuN −1
vaa (N
M ) tensorin (M+1 ) tensoriksi. Vastaavasti käänteinen
+1
N
metriikka kuvaa (M ) tensorin (N
M−1 ) tensoriksi.
Esimerkki
Olkoot (21 ) tensori T αβγ , tällöin
Koska
p̃2 = ηαβ (η αµ pµ )(η βν pν )
α
= ηβµ T αµγ ,
T βγ
ja ηαβ η βν = δ να , on
p̃2 = η αµ pµ pα .
joka on (12 ) tensori. Tässä siis keskimmäinen indeksi laskettiin ylhäältä alas.
Eli yksimuotojen suuruus saadaan käänteisen metrisen tensorin avulla. Toisinsanoen
Esimerkki
Metrikalle
p̃2 = −(p0 )2 + (p1 )2 + (p2 )2 + (p3 )2 ,
η αβ ≡ η αµ ηµβ ≡ δ αβ .
mikä on sama kuin vektoreille, joten yksimuodot voivat
olla kuten vektoritkin ajankaltaisia, avaruudenkaltaisia tai
Tensoreiden differentiointi
valonkaltaisia.
Funktio f on (00 ) tensori, ja sen gradientti d̃f on (01 )
Vastaavasti, kuten vektoreille myös kahden yksimuodon tensori. Toisin sanoen tensorin differentiointi nostaa sen
sisätulolle tulee
kovarianttia luokkaa.
Olkoot (11 ) tensori T, jolla on komponentit {T βα }, jotka
p̃ · q̃ = −p0 q0 + p1 q1 + p2 q2 + p3 q3 .
ovat paikan funktioita. Tensori T voidaan kirjoittaa
T = T βα ω̃ β ⊗ eα .
6.6 (M
N ) tensorit
32
Nyt liikutaan maailmanviivaa pitkin, jolloin
Metriikka määrittää siis sisätulon ja sitä kautta vektorien pituudet. Se kuvaa avaruuden rakenteen, minkä takia
erikoisen suhteellisuusteorian Lorentz-Minkowski avaruudesta puhutaan laakeana avaruutena tai laakeana metriikkana.
T(τ + ∆τ ) − T(τ )
dT
= lim
∆τ →0
dτ
∆τ
ja koska kantayksimuodot ja -vektorit ovat vakioita on
α
dT β
dT
α
ω̃ β ⊗ eα = T β,γ
U γ ω̃β ⊗ eα .
=
dτ
dτ
Eli tensoria differentioitaessa maailmanviivaa pitkin,
täytyy sen derivoidut komponentit kontraktoida maailmanviivan tangentin (nelinopeuden) kanssa. Tämä vastaa
vektorilaskennasta tuttua suunnattua derivaattaa.
Huomaa!
dT/dτ on myös (11 ) tensori, koska
dT α β
= T β,γ ω̃ ⊗ eα U γ .
dτ
Tästä nähdään, että T:n gradientti
α
∇T ≡ T β,γ
ω̃ β ⊗ ω̃ γ ⊗ eα
on (12 ) tensori! Toisinsanoen
α
dT
≡ ∇U T, ∇U T → T β,γ
Uγ .
dτ
Tässä yhteydessä on oletettu, että kantayksimuodot ja
kantavektorit ovat vakoioita. Tämä oletus pitää paikkaansa erikoisen suhteellisuusteorian tapauksessa. Jos avaruus
on kaareva, näin ei enää ole ja kantavektoreiden sekä yksimuotojen muutokset täytyy ottaa huomioon tensoreita
differentioitaessa. Tämä johtaa yleiseen suhteellisuusteoriaan ja siinä käytettyyn yleiseen vektorilaskentaan.
6.7 Metriset ja epämetriset vektorialgebrat
Miksi juuri metrinen tensori kuvaa vektorit yksimuodoiksi ja päinvastoin? Miksi ei joku muu (02 ) tensori? Tarkastellaan näitä kysymyksiä kahdessa eri osassa:
1. Miksi yleensä vektoreiden ja yksimuotojen välillä
on yhteys? Ilman tätä yhteyttä, jossa siis vektori
operoi yksimuotoa tai päinvastoin, sisätuloa ei olisi
määritelty. Fysiikassa sisätulo ja sen kautta avaruudet, joissa voidaan määritellä etäisyys tavalla tai toisella, ovat erittäin käyttökelpoisia. Näin ollen metriikkaa tarvitaan.
2. Miksi metriikka, eikä joku muu tensori? Jos metriikkaa
ei olisi, joku muu symmetrinen tensori tekisi vastaavan
kuvauksen yksimuotojen ja vektoreiden välillä. Tätä
tensoria voitaisiin yhtä hyvin kutsua metriikaksi...
Metriikka on vektorialgebraan kiinteästi kuuluva osa,
joka määrittää avaruuden rakenteen. Eri avaruuksilla on erilaiset rakenteet. Esimerkiksi Riemannin avaruudessa vektoreilla on aina positiivinen pituus. Toisaalta taas pseudo-Riemannin avaruudessa vektorin
pituus voi olla myös negatiivinen (esim. erikoisen
suhteellisuusteorian Lorentz-Minkowski avaruus). Voidaan myös määritellä vaikkapa antisymmetrinen metriikka, joka johtaisi spinori-avaruuteen.
33
7. Relativistinen dynamiikka
2. Liikemäärä säilyy, toisinsanoen spatiaalikomponenNormaaleissa epärelativistisissa tapauksissa klassinen
teista
Galilein ja Newtonin mekaniikka toimii hyvin. Nyt meillä
pν = p′ ⇔ Eν = m′ v
on matemaattiset työkalut rakentaa vastaava formalismi,
Näistä voidaan ratkaista hiukkasen nopeudeksi absorption
jolla käsitellä myös relativistisia ongelmia.
Tässä tapauksessa sovellusalueena ovat lähinnä relativis- jälkeen
Eν
Eν
tiset atomaariset ja alkeishiukkasilmiöt.
v= ′ =
m
m
0 + Eν
Hiukkasprosesseja käsitellään soveltaen kahta jo perusmekaniikasta tuttua periaatetta:
Huomaa!
1. Liikemäärän säilyminen.
Jos Eν ≪ m0 , on v ≈ Eν /m0 , joka vastaa klassista tapausta, jossa m0 vakiomassainen kappale saa fotonilta im2. Energian säilyminen.
pulssin Eν .
Kohdan (1) käsittely muistuttaa hyvin paljon vastaavaa
Emissio
klassisen mekaniikan formalismia. Säilyvänä suurena on reTarkastellaan laboratoriokoordinaatistossa O paikallaan
lativistisessa tapauksessa neliliikemäärä vektorisuureena.
olevaa
m0 massaista atomia, joka emittoi fotonin energialla
Seuraavan kohdan (2) mukaisesti energia säilyy myös
E
positiivisen
x-akselin suuntaan.
ν
relativistisissa hiukkasprosesseissa, mutta se voi ottaa eri
Vuorovaikutuksen
jälkeen fotonilla (f) ja atomilla (h) on
muotoja (esim. massa).
liikemäärää
ja
energiaa.
Tällöin atomin liikemassa on m′
Näitä perusperiaatteita sovelletaan siten, että tarkastel′
sekä
(uusi)
lepomassa
m
laan tilannetta ennen ja jälkeen vuorovaikutuksen. Tämä
0 ja se liikkuu nopeudella v fotonin
liikesuuntaa
vastaan.
mahdollistaa hiukkasprosessien luonnehdinnan, vaikka itse
Atomilla on siis ennen emissiota neliliikemäärä
vuorovaikutuksen yksityiskohtia ei tiedetä.
Relativistisessa formalismissa ei juurikaan tarvita
Ph →(E0 = m0 , 0, 0, 0).
itse Lorentz-muunnosta, vaan se perustuu LorentzO
invarienttien suureiden käsittelyyn.
Vuorovaikutuksen jälkeen syntyneellä fotonilla sekä atomilla on neliliikemäärät
7.1 Massattomat hiukkaset
Tälläisiä hiukkasia ovat esimerkiksi fotonit. Massattomat hiukkaset ovat jossain määrin erikoisasemassa relativistisia hiukkasilmiöitä tarkasteltaessa.
P′h →(E ′ = m′ , p′ , 0, 0)
O
P′f →(Eν′ , p′ν = Eν′ , 0, 0)
.
O
Koska neliliikemäärä säilyy, on Ph = P′h + P′f ja
Absorptio
Tarkastellaan paikallaan olevaa hiukkasta (lepomassa
m0 ), johon osuu laboratoriokoordinaatiston O x-akselia
pitkin liikkuva fotoni (energia Eν ), jonka hiukkanen absorboi.
Vuorovaikutuksen jälkeen hiukkasella (h) on massa m′
ja se liikkuu nopeudella v fotonin (f) liikesuuntaan.
Ennen vuorovaikutusta hiukkasen neliliikemäärä on
1. Energia säilyy, eli aikakomponenteista
E0 = Eν + E ′ ⇔ m0 = Eν + m′ .
(53)
2. Liikemäärän säilyminen saadaan spatiaalikomponenteista
0 = p′ν + p′ ⇔ p′ − Eν = 0.
Ph →(E0 = m0 , 0, 0, 0)
Kohdasta (1) ja (2) saadaan siten yhtälöpari
′
m = m0 − Eν
.
p′ = Eν
O
ja fotonin liikemäärä
Pf →(Eν , pν = Eν , 0, 0).
O
Vuorovaikutuksen jälkeen fotoni häviää, ja hiukkasella on
neliliikemäärä
Kun otetaan atomin neliliikemäärän vektorista sisätulo itsensä kanssa, saadaan
P′h · P′h = −(m′ )2 + (p′ )2 = −(m′0 )2 .
(54)
P′h →(E ′ = m′ , p′ , 0, 0)
Tässä ensimmäinen muoto sisätulolle on laskettu laboratoriokoordinaatistossa ja toinen atomin lepokoordinaatistosNyt neliliikemäärä säilyy hiukkasprosesseissa, eli Ph + sa. Lausekkeet ovat yhtäsuuria, koska sisätulo on LorentzPf = P′h . Kun tarkastellaan eri komponentteja, nähdään invariantti.
että
Sisätulosta (54) ja energian säilymisestä (53) saadaan
O
1. Energia säilyy, eli aikakomponenteista
′
(m′0 )2 = m20 − 2m0 Eν .
′
E0 + Eν = E ⇔ m0 + Eν = m .
(55)
Tässä massat m0 ja m′0 ovat siis hiukkasen lepomassat
ennen ja jälkeen emission. Niiden erotus vastaa energiaa
34
Q = m0 − m′0 . Tästä erotuksesta saadaan m′0 = m0 − Q, kun v/c ≪ 1. Joten E ≈ E ′ (1 + v).
jolloin lausekkeesta (55) tulee
Mössbauer efekti
m20 − 2m0 Q + Q2 = m20 − 2m0 Eν
Joissain olosuhteissa emission tai absorption rekyyli jakautuu
kaikkien kiteen hilassa olevien atomien kesken.
Q
Kiteen hilassa voi olla esim. 1010 atomia, jolloin termi
⇔ Eν = hν = Q 1 −
(56)
Q/(2m0 ) yhtälössä (56) käytännössä häviää ja lähes kaikki
2m0
energia
menee fotonille. Esimerkiksi 1010 atomin iridium
Koska fotonin energia Eν on suoraan verrannollinen taa−17
kiteelle
Q/(2m
.
0 ) ≈ 3 × 10
juuteen ν, lauseketta (56) vastaava taajuus laskee ja aallonJos
atomin
emissiotaajuus
on hyvin terävä, niin sama
pituus kasvaa erotuksen Q kasvaessa. Tämä kuvaa atomin
pätee
myös
absorptiotaajuudelle,
ja pienetkin muutokset
kokemaa rekyyliä fotonin emittoituessa.
energiassa
tekevät
absorption
mahdottomaksi.
Tätä kutHuomaa, että jos emittoiva atomi ei kokisi rekyyliä, kaiksutaan
Mössbauer
ilmiöksi,
jonka
löytämisestä
Rudolf L.
ki energia Q menisi fotonille.
Mössbauer
sai
Nobelin
palkinnon
vuonna
1957.
Lausekkeella (56) on suoria fysikaalisia seurauksia. KosKiteiden tapauksessa ilmiö tulee voimakkaana esille,
ka atomit tai niiden ytimet virittyvät ainoastaan tietyn
ja
absorption voimakkuus riippuu vahvasti emittoivan ja
kokoisilla energiapaketeilla (energiatasot ovat kvantittuabsorpoivan
atomin suhteellisesta nopeudesta. Emissioneet), ne eivät pysty absorboimaan niille ominaista emisabsorptio
resonanssi
on hyvin herkkä gammasäteillä, jopa
siosäteilyä!
0.1
cm/s
nopeusero
voi
tuhota resonanssin.
Toisin sanoen atomin viritystilan laskiessa, sen energia
Jos
joku
efekti
tuhoaa
resonanssin, gammasäteiden taamuuttuu ja se emittoi fotonin. Osa fotonin energiasta mejuutta
muuttamalla
se
voidaan
palauttaa. Muutoksen avulnee kuitenkin atomin kokemaan rekyyliin.
la
efekti
voidaan
mitata
erittäin
tarkasti.
Jos edellä emittoitu fotoni tapaa samanlaisen atomin,
Mössbauer
efekti
on
havaittu
35 eri isotoopilla, joilla
joka on vastaavassa alemmassa energiatilassa, sillä ei ole
on
stabiili
perustila
ja
virittynyt
tila
joka purkautuu gamenää tarpeeksi energiaa, jotta se pystyisi virittämään atomasäteilynä.
min uudelleen.
Käänteisesti, Mössbauer ilmiön avulla voidaan tuottaa
Jos atomien emissioviivat olisivat teräviä (emissio aina
gammasäteitä,
joiden taajuus tiedetään hyvin tarkasti.
täsmälleen samalla energialla) ja emittoivat sekä absorboiKaikenkaikkiaan
Mössbauer ilmiöllä on lukuisia erilaivat atomit olisivat paikallaan, kaasu olisi läpinäkyvää omisia
sovelletuksia.
Ilmiötä
on käytetty esim. gravitaatiopunaissäteilylleen!
nasiirtymän
mittauksissa,
ytimen ja elektronin vuorovaiKäytännössä kuitenkin
kutusten tutkimiseen sekä hilassa olevien ytimien ja hilan
• Energiatasot eivät ole tarkastiottaen teräviä.
vuorovaikutusten tutkimiseen. Mössbauer ilmiötä voidaan
käyttää
myös spektroskopiassa. Ilmiö on hyvin tärkeä eten• Jos absorboivalla atomilla on oikea nopeus, se voi komkin
ydinfysiikassa.
pensoida taajuusmuutoksen Doppler siirtymällä.
• Näkyvälle valolle terminen liike hävittää tämän efektin.
Fotoniraketti
Sähkömagneettinen säteily työntää rakettia eteenpäin.
Koska fotonit liikkuvat valonnopeudella ja työntövoima on
• Korkeampitaajuuksisilla γ-säteillä rekyyli on paljon
suoraan verrannollinen pakokaasujen lähtönopeuteen, olisi
vahvempi ja efekti on siten havaittavissa.
tälläinen raketti hyvin tehokas.
Olkoon m0 raketin lepomassa, ja merkitään f :llä
Esimerkki
hyötykuorman (= f m0 ) osuutta lepomassasta.
Elohopean (Hg) kokema rekyyli on yhtälön (56) muJos raketti (r) lähtee levosta ja antaa hyötykuormalle nokaisesti verrannollinen Q/(2m0 ) = Q/(2m0 c2 ):een. Gam- peuden v, tietty määrä säteilyenergiaa E (f) liikkuu vasr
masäteille, joita viritetty elohopea emittoi, Q = 412keV ja takkaiseen suuntaan.
−25
elohopealle m0 = 198amu = 3.28 × 10 kg.
Raketin neliliikemäärä alussa on
Gammasäteiden tapauksessa Q/(2m0 c2 ) ≈ 10−6 osa
Pr →(m0 , 0, 0, 0)
energiasta menee rekyyliin. Valolle (Q ≈ 2eV) efekti on
O
viisi kertaluokkaa pienempi.
Kun tarkastellaan emissiota ja absorptiota, tulee rekyyli ja lopussa
P′r →(m′ , p′ , 0, 0)
ottaa huomioon kaksi kertaa. Ehto sille, että sekä absorpO
.
tio että emissio ovat mahdollisia on se, että emissiolähde
P′f →(Er , −Er , 0, 0)
O
liikkuu absorptiokohteen suhtee nopeudella
P
Tässä siis neliliikemäärävektori P′f =
Pν edustaa kaikQ
v
′
−6
kien
fotoneiden
liikemäärää.
Kun
muistetaan,
=
2.24
×
10
≈
670m/s.
≈
√että m =
c
m 0 c2
′
′
2
f m γ ja p = m v = f m γv (missä γ = 1/ 1 − v on
0
Koska Doppler-siirtymä nostaa energiaa osalla v/c, nopeuden v ollessa pieni:
r
ν
1+v
1+v
E
= ′ =
= √
≈ 1 + v,
E′
ν
1−v
1 − v2
0
Lorentz-tekijä) saadaan aika- ja spatiaalikomponenteista
säilymisyhtälöt
m0 = m′ + Er = f m0 γ + Er
0
= p′ − Er = f m0 γv − Er
35
elektroni
⇔ m0 = f m0 γ + f m0 γv ⇔ f γ + f vγ = 1.
(57)
Kun
positroni
γ = (1 − v 2 )−1/2 ⇔ γ 2 v 2 = γ 2 − 1,
saadaan yhtälöstä (57)
p
f γ 2 − 1 = 1 − f γ ⇔ f 2 − 2f γ + 1 = 0.
Asetetaan Lorentz-tekijän arvoksi γ = 10, jolloin matkantekoaika raketin koordinaatistossa lyhenee huomattavasti. Tällöin hyötykuorman osuudeksi tulee
p
√
f = γ − γ 2 − 1 = 10 − 99 ≈ 0.05,
mikä on noin 5%.
Jos halutaan pysähtyä kohteessa ja kääntyä takaisin, palaavan massan osuus on f −4 , eli tässä tapauksessa 10−5 m0 .
Tästä nähdään, että relativistisia nopeuksia on hyvin hankala saavuttaa makroskooppisilla kappaleilla.
fotoni
Kuva 30: Kaavakuva elektroni-positroniparin muodostumisen jättämästä jäljestä hiukkasilmaisimessa.
7.2 Parisynty ja annihilaatio
Massa-energia ekvivalenssi
Tietyissä olosuhteissa on mahdollista luoda uusia hiukkasia, jos energiaa on riittävästi tarjolla.
Jos halutaan luoda hiukkanen, jonka lepomassa on m0 ,
vaaditaan siihen energiaa vähintään E = m0 c2 verran. Käytännössä kuitenkin energiaa vaaditaan paljon
enemmän. Tämä johtuu seuraavista seikoista.
Energian ja liikemäärän säilymislakien lisäksi on muita
säilymislakeja, joiden täytyy olla voimassa (esim. varauksen säilyminen). Tämän takia on mahdotonta luoda vain
yksi hiukkanen törmäysprosessissa.
Esimerkiksi elektroni-positronipari voi syntyä γfotonista (energia 1.02Mev) reaktion γ → e− + e+
kautta.
Hiukkasia syntyy tavallisesti törmäytettäessä olemassaolevia hiukkasia. Esimerkiksi π-mesoneja (pioneja) saadaan
aikaan pommittamalla vetyatomien ytimiä energeettisillä
protoneilla reaktioyhtälön P1 + P2 → P + N + π + mukaisesti.
Tässä törmäävistä protoneista syntyy protoni, neutroni ja pioni. Koska liikemäärän täytyy säilyä, on suuri osa
energiasta sidottuna systeemin liiketilaan.
Tarkastellaan fotonien parisyntyä. Kuvassa 30. on kaavakuva hiukkasilmaisimessa havaitusta elektronin ja positronin radasta.
Selvästi fotoni, joka on neutraali, eikä jätä jälkeä ilmaisimeen, on tullut alhaalta. Radat ovat lähes symmetriset,
joten elektronilla ja positronilla on lähes sama energia.
Prosessiin tarvitaan vielä yksi osapuoli lisää, sillä liikemäärän täytyy säilyä. Tämä johtuu siitä, että kahdelle massalliselle hiukkaselle voidaan aina määritellä koordinaatisto, jossa niiden kokonaisliikemäärä on nolla.
Fotonilla on aina liikemäärä kaikissa koordinaatistoissa,
eikä sitä voida hävittää koordinaatistoa vaihtamalla!
Tässä tapauksessa neljäs kappale on atomiydin, joka pystyy ottamaan paljon liikemäärää vastaan viemättä paljoa
energiaa koska ydin on massiivinen.
Myös käänteinen prosessi e− + e+ → γ + γ on mahdollinen. Tätä kutsutaan annihilaatioksi, jossa hiukkanen ja
antihiukkanen muuttuvat säteilyksi. Myös tähän tarvitaan
vähintään kaksi fotonia, sillä liikemäärän täytyy säilyä!
Hiukkasilmaisimet
Hiukkasilmaisimilla havaitaan hiukkaskiihdyttimissä tapahtuvien törmäysprosessien tuottamia hiukkasia. Ilmaisimessa hiukkassuihku törmäytetään joko paikallaan olevaan
kohtioon tai vastakkaiseen suuntaan liikkuvaan hiukkassuihkuun. Vastaavanlaisia ilmaisimia käytetään myös maapallon ulkopuolelta tulevan kosmisen säteilyn ilmaisimissa.
Törmäyttämällä hiukkassuihkuja keskenään laboratoriokoordinaatistossa paikallaan olevan kohtion sijaan, voidaan
törmäysenergioita nostaa huomattavasti.
Ilmaisimissa tapahtuvat törmäykset tuottavat suuren
määrän erilaisia hiukkasia, joiden kaikkien havaitseminen
on hyvin hankalaa. Käytännössä nämä yhä hyvin energeettiset törmäystuotteet sinkoutuvat useassa kerroksessa oleviin ilmaisimiin, joissa mitataan hiukkasten varausta, massaa, energiaa ja liikerataa.
Varautuneet hiukkaset erotetaan sähköisesti neutraaleista hiukkasista magneettikentällä, ja hiukkasten radat mitataan ratailmaisimilla. Kaikki ratailmaisimet perustuvat
siihen, että energeettiset varatut hiukkaset voivat ionisoida
liikeradallaan väliainetta.
Erilaisia ratailmaisintyyppejä ovat mm. kaasu- tai nestetäytteiset ilmaisimet (sumukammiot, kuplakammiot), kipinäkammiot ja lankakammio sekä puolijohdeilmaisimet.
Varsinaisten ilmaisimien lisäksi tarvitaan niiden tuottaman tiedon analysointiin ja tallentamiseen erilaisia
apulaitteita. Ilmaisimesta jännitepulsseina saatu tieto
käsitellään elektronisesti. Jos taas reaktiotuotteet synnyttävän näkyvän jäljen, tutkiminen tapahtuu optisesti.
36
• Sumukammiossa ionisoivat hiukkaset aiheuttavat lii-
menttien sisällä olevaa kaasua aiheuttaen sarjan kipinäpurkauksia anodilangoissa. Nämä radat voidaan
mitata, tallentaa ja analysoida suoraan tietokoneen
avulla.
Kamera
Neste
Käämit
Käämit
7.3 Dopplerin ilmiö
Tarkastellaan fotonin liikettä emissiolähteen suhteen liikkuvan havaitsijan näkökulmasta.
Liikkukoon valonlähde (lepokoordinaatisto Ō) laboratoriokoordinaatiston O x-akselin suuntaisesti nopeudella v.
Laboratoriokoordinaatistossa O valonlähteestä emittoitu
fotoni liikkuu kulmassa θ liikesuuntaa (x-akseli) vastaan.
Tällöin sillä on neliliikemäärä
P → {P α } = (E, px = E cos θ, py = E sin θ, 0),
Hiukkasuihku
O
missä E on fotonin energia laboratoriokoordinaatistossa. Muunnetaan neliliikemäärä hiukkasen lepokoordinaatistoon Ō, jolloin
P → P ᾱ = Λᾱα P α
Ō
Mäntä
= (Ē = γ(E − vpx ), p̄x = γ(−vE + px ), p̄y = γpy , 0).
Muunnetun neliliikemäärän aikakomponentista saadaan fotonin energialle Ē lepokoordinaatistossa
Ē = γ(E − vpx ) = γE(1 − v cos θ).
Magneettikenttä
Koska fotonin energian riippuvuus taajuudesta on Ē = hν̄
ja vastavasti E = hν, saadaan tästä Doppler siirtymäksi
Kuva 31: Donald A. Glaserin vuonna 1952 kehittämä
√
ν̄ 1 − v 2
kuplakammio. Hiukkassuihku ohjataan ylikuumentuneeν=
.
(58)
seen nesteeseen (neste saadaan ylikuumentuneeseen tilaan
1 − v cos θ
pienentämällä painetta nopeasti männän avulla). Nesteen
kiehuminen varattujen hiukkasten kulkuradalla valokuva- Huomaa, että vastaava klassinen Doppler-siirtymän muoto
on ν = ν̄/(1 − v cos θ). Jos valonlähde liikkuu kohti havaittaan.
sijaa, kulma θ = 0 ja
√
ν̄ 1 − v 2
keradallaan ylikylläisessä vesihöyryssä sumujäljen.
,
ν=
Nämä jäljet voidaan havaita optisesti, esimerkiksi va1−v
lokuvaamalla.
eli ν > ν̄ (sinisiirtymä). Vastakkaiseen suuntaan lähtevälle
• Sumukammion syrjäytti helppokäyttöisempi kupla- valonsäteelle θ = π ja
kammio, jossa kriittisessä tilassa oleva ylikuumentu√
ν̄ 1 − v 2
nut neste (vety) kiehuu ionisoivan hiukkasen liikeraν=
,
1+v
dalla. Liikeradat havaitaan kolmiulotteisesti kuvaamalla ne kameralla useasta eri kulmasta.
eli tässä tapauksessa ν < ν̄ ja kyseessä on punasiir• Kipinäkammiossa on sarja jännitee-erossa pidettyjä tymä. Suorassa kulmassa havaitsijaan nähden lähtevälle
metallilevyjä. Kammion läpi kulkeva varattu hiukka- valonsäteelle θ = π/2 ja
nen ionisoi radallaan levyjen välissä olevaa kaasua aip
ν = ν̄ 1 − v 2
heuttaen sarjan kipinäpurkauksia, jotka voidaan havaita. Tälläinen ilmaisin on jatkuvakäyttöinen, eikä
sitä tarvitse virittää uudelleen kupla- ja sumukam- (vrt. tätä ajan dilataation lausekkeeseen!).
mion tavoin.
7.4 Comptonin sironta
• Lankakammiossa on kaasuun upotettuna kahden kaFotoni ja (vapaa) elektroni törmäävät elastisesti. Valitoditason välissä olevia anodilankoja. Peräkkäisien taan koordinaatisto O, jossa fotoni lähestyy levossa olevaa
elementtien langat ovat kohtisuorassa toisiaan vas- elektronia x-akselia pitkin. Fotoni siroaa elektronista xytaan. Kammion läpi kulkeva hiukkanen ionisoi ele- tasossa.
37
Ennen törmäystä elektronilla ja fotonilla on nelilii- ja vastaavasti ilman sirontaa (jos θ = 0) fotonin aallonpituus ei muutu.
kemäärät K ja P:
K
P
→ (m0 , 0, 0, 0)
O
→ (Eν , Eν , 0, 0)
7.5 Atomiytimen sidosenergia ja massakato
.
O
Törmäyksen jälkeen elektroni liikkuu nopeudella
u
ja fotoni, joka siroaa kulmaan θ nopeudella v i
=
(sin θ, cos θ, 0). Tällöin törmäyksen jälkeen neliliikemäärät
ovat
K′ → (E, px , py , 0)
O
.
P′ → (Eν′ , Eν′ cos θ, Eν′ sin θ, 0)
O
Stabiilia atomiydintä pitää koossa ytimessä olevien alkeishiukkasten välillä vaikuttavat voimat. Jos ytimestä
poistetaan protoni tai neutroni, täytyy tehdä työtä sidosenergiaa vastaan.
Tähän työhön sekä siihen liittyvään energiaan liittyy
vastaava massa. Ytimen massa on siis pienempi kuin sen
rakenneosien massojen summa.
Massakato on siten
Fotoni liikkuu laboratoriokoordinaatistossa O kulmaan θ
∆m = Zmp + (A − Z)mn + Zme − MZ,A ,
(62)
törmäyksen jälkeen. Kokonaisneliliikemäärä säilyy prosessisa, eli
missä mp on protonin lepomassa, mn neutronin lepomassa,
K + P = K′ + P′ .
MZ,A Z-protonia ja A − Z neutronia sisältämän ytimen
Koska haluamme päästä eroon Lorentz-tekijästä γ, massa ja me on elektronin massa.
jätetään tässä yhtäsuuruusmerkin toiselle puolelle vain K′ ,
Vastaavat sidosenergiat saadaan kertomalla yhtälö (62)
jolloin
valonnopeuden neliöllä.
K′ = K + P − P′ .
Energian yksikkönä on usein elektronivoltti eV, joka vastaa
elektronin saamaa liikenergiaa, kun se kiihdytetään 1
Kun tästä otetaan sisätulo itsensä kanssa, saadaan
V potentiaalieron läpi.
Tyypillinen sidosenergia on noin 8 MeV nukleonia kohti,
⇔ K′ · K′ = K · K + P · P + P′ · P′
vastaavasti elektronien sidosenergiat ovat noin 10 - 100 eV
luokkaa. Näin ollen elektronien sidosenergian vaikutus on
+2(K · P − K · P′ − P · P′ ).
(59) häviävän pieni.
Tässä P · P = P′ · P′ = 0, koska fotonin neliliikemäärän neliö on kaikissa koordinaatistoissa nolla. Vastaavasti K·K =
K′ · K′ = −m20 , koska hiukkasen neliliikemäärän neliö on
sama kaikissa koordinaatistoissa (myös lepokoordinaatistossa).
Näin ollen yhtälöstä (59) jää jäljelle ainoastaan ristitermit, eli
⇒ K · P − K · P′ − P · P′ = 0.
(60)
7.6 Hiukkasen hajoaminen
Epästabiili hiukkanen, jonka lepomassa on M , hajoaa
kahdeksi tytärhiukkaseksi (lepomassat m1 ja m2 ). Valitaan
koordinaatisto O siten, että hajoava hiukkanan on levossa
(energia E = M ), ja tytärhiukkaset saavat energiat E1 ja
E2 sekä vastaavat liikemäärät p1 ja p2 .
Hiukkasen neliliikemäärä on ennen hajoamista
P →(E, 0, 0, 0),
Jäljelle jäävät sisätulot voidaan laskea:
K·P
K · P′
P · P′
O
ja hajoamisen jälkeen tytärhiukkaset liikkuvat pitkin
x-akselia vastakkaisiin suuntiin. Tytärhiukkasten neliliikemäärät ovat siten
= −m0 Eν
= −m0 Eν′
,
= −Eν Eν′ + Eν Eν′ cos θ = Eν Eν′ (cos θ − 1)
P1 →(E1 , p1 , 0, 0)
jolloin yhtälöstä (60) saadaan
m0 Eν′
m0 Eν −
⇔
+
Eν Eν′ (1
O
− cos θ) = 0
1
h
1
− =
(1 − cos θ),
ν′
ν
m0
Eν′
P2 →(E2 , p2 , 0, 0).
O
(61)
′
Neliliikemäärä säilyy, joten
E =
P = P1 + P2 ⇔
p1 =
M = E1 + E2
−p2
kun Eν = hν ja
= hν .
Yhtälö (61) sitoo siroavan fotonin taajuuden muutok- Toisaalta neliliikemäärävektoreiden neliöt antavat
sen sirontakulmaan. Vastaavsti aallonpituuden avulla (λ =
P1 · P1 = −E12 + p21 = −m21
c/ν = 1/ν)
P2 · P2 = −E22 + p22 = −m22
h
(1 − cos θ).
∆λ =
2
m0
E1 = p21 + m21
⇔
.
Aallonpituuden muutos on suurin kun θ = π, ja fotoni
E22 = p22 + m22
siroaa liikesuuntaansa vastakkaiseen suuntaan. Tällöin
Kun yhtälöt (64) vähennetään toisistaan, saadaan
2h
,
λmax =
E12 − E22 = p21 + m21 − p22 − m22 = m21 − m22
m0
38
(63)
(64)
ja sironnan jälkeen
m21 − m22
m21 + m22
E1 − E2 =
=
.
(65)
P3 → (E ′ , p′ cos θ′ , p′ sin θ′ , 0)
E1 + E2
M
CM
.
P4 → (E ′ , −p′ cos θ′ , −p′ sin θ′ , 0)
Nyt tytärhiukkasten energiat voidaan ratkaista yhtälöistä
CM
(63) ja (65) muodostetun yhtälöparin avulla:
(
Tässä siis sirontakulma on θ′ . Neliliikemäärän säilymisestä
E1 + E2 = E = M
lähtien (P1 +P2 = P3 +P4 ) on helppo osoitaa, että E = E ′
.
m21 −m22
E1 − E2 =
ja p = p′ . Joten sironnan jälkeisiksi nelivektoreiksi tulee
M
Laskemalla nämä yhteen ja vähentämällä toisistaan saadaan
(
M 2 +m21 −m22
E1 =
2M
.
M 2 −m21 +m22
E2 =
2M
Tytärhiukkasten liikemäärät saadaan edellisestä yhtälöstä
ja yhtälöstä (64):
p
(M 2 − m21 − m22 )2 − 4m21 m22
.
p1 = −p2 =
2M
7.7 Elastinen sironta
Tarkastellaan identtisten, m0 lepomassaisten hiukkasten
sirontaa laboratoriokoordinaatistossa O sekä massakeskuskoordinaatistossa CM.
Laboratoriokoordinaatisto
θ
m0
φ
(E, −p cos θ′ , −p sin θ′ , 0)
→
P4
CM
.
Lasketaan systeemin massakeskusenergia E laboratoriossa (koordinaatisto O) kiihdytetyn hiukkasen energian avulla. Ennen sirontaa hiukkasten neliliikemäärän
sisätulo on laboratoriokoordinaatistossa O ja CMkoordinaatistossa
CM
O
P1 · P2 = −E 2 − p2 = −E1 m0 .
(66)
Lisäksi massakeskuskoordinaatistossa
CM
P1 · P1 = −E 2 + p2 = −m20
⇔ p2 = E 2 − m20 .
y
m0
CM
Massakeskuskoordinaatisto (CM)
y
(E, p cos θ′ , p sin θ′ , 0)
→
P3
(67)
Kun yhtälö (67) sijoitetaan sistätulon P1 ·P2 lausekkeeseen
(66), saadaan massakeskuenergiaksi E kiihdytysenergian
E1 avulla
θ’
m0
x
−E1 m0 = −E 2 − E 2 + m20 = −2E 2 + m20
m0
x
θ’
E1 m0 + m20
.
(68)
2
Lausutaan sironneen hiukkasen energia (alaindeksi kolme) sirontakulman θ′ ja kiihdytysenergian E1 avulla. Neliliikemäärien P2 ja P3 sisätulon avulla on
⇔E=
Kuva 32: Elastista sirontaa käsitellään tarkastelemalla tilannetta yhtäaikaa laboratoriokoordinaatistossa ja massakeskuskoordinaatistossa.
r
CM
P2 · P3 = −E 2 − p2 cos θ′ = −m0 E3 .
Laboratoriokoordinaatistossa O liikkuva hiukkanen siro- Sijoittamalla tähän yhtälö (67) saadaan
aa paikallaan olevasta identtisestä kohtiohiukkasesta.
⇔ −E 2 − (E 2 − m20 ) cos θ′ = m0 E3 ,
Kuvan 32 mukaisesti neliliikemääriksi tulee ennen sirontaa
josta yhtälön (68) avulla tulee
P1 → (E1 , p1 , 0, 0)
O
P2 → (E2 = m0 , 0, 0, 0)
E1 m0 + m20
E1 m0 + m20
O
2
⇔ m0 E3 =
+
− m0 cos θ′ .
2
2
ja sironnan jälkeen
P3
P4
→ (E3 , p3 cos θ, p3 sin θ, 0)
O
→ (E4 , p4 cos φ, p4 sin φ, 0)
Tästä vähennettäessä puolittain m20 , saadaan
.
O
Vastaavasti massakeskuskoordinaatistossa CM hiukkaset
lähestyvät toisiaan samalla nopeudella (energialla), ja siroavat symmetrisesti kulmaan θ′ . Kuvan mukaisesti neliliikemääriksi tulee ennen sirontaa
P1
P2
→
CM
→
CM
m0 E3 − m20 =
=
E1 m0 − m20
E1 m0 − m20
+
cos θ′
2
2
θ′
E1 m0 − m20
(1 + cos θ′ ) = (E1 m0 − m20 ) cos2 ,
2
2
koska
(E, p, 0, 0)
θ′
cos =
2
(E, −p, 0, 0)
39
r
θ′
1 + cos θ′
1 + cos θ′
⇔ cos2
=
.
2
2
2
Näin ollen tästä jää jäljelle sironneen hiukkasen energiaksi
Koska protonin leponenergia on E0 = m0 , täytyy kiihE3 sirontakulman θ′ ja kiihdytysenergian E1 avulla lausut- dytetylle protonille antaa kineettistä energiaa määrä T =
tuna
6m0 , jotta protoni-antiprotoni parin synty olisi mahdolli′
2 θ
nen.
⇔ E3 = (E1 − m0 ) cos
+ m0 .
2
Vastaavasti sirontakulma θ laboratoriokoordinaatistossa
Kynnysenergia yleisessä tapauksessa
O voidaan ratkaista lausumalla sisätylo P1 · P3 koordinaaMääritetään reaktion
tistoissa O ja CM. Kohtihiukkasen energia E4 laboratorioa+b→c+d
koordinaatistossa O sironnan jälkeen saadaan sisätulojen
P1 · P4 ja P2 · P4 avulla.
kynnysenergia, kun hiukkasten (erisuuret) lepomassat ovat
ma 6= mb 6= mc 6= md .
7.8 Kynnysenergia
Tarkastellaan tilannetta edelläolevan käsittelyn taKun hiukkasia törmäytetään yhteen, voi syntyä uusia
paan
ennen törmäystä laboratoriokoordinaatistossa O ja
hiukkasia, mikäli systeemin energia on tarpeeksi korkea.
törmäyksen
jälkeen massakeskuskoordinaatistossa CM.
Pienin energia, joka riittää ainoastaan hiukkasprosessisLaboratoriokoordinaatistossa
O ennen törmäystä hiuksa syntyvien ja jo olemassaolevien hiukkasten lepoenergikanen
a
liikkuu
x-akselia
pitkin
kohti paikallaan olevaa
aan, on kynnysenergia.
hiukkasta
b.
Tällöin
neliliikemäärät
ovat
Esimerkiksi protoni-antiprotoni parin syntyprosessi voip
daan esittää reaktioyhtälöllä p + p → p + p + (p + p̄).
Pa → (E, p = E 2 − m2a , 0, 0)
O
Määritetään pienin energia, joka riittää p+ p̄ parin synty,
Pb → (mb , 0, 0, 0)
miseen. Tarkastellaan tilannetta laboratoriokoordinaatisO
tossa O ja massakeskuskoordinaatistossa CM.
Laboratoriokoordinaatistossa O ensimmäinen protoni koska
O
Pa · Pa = −m2a = −E 2 + p2
(1) liikkuu x-akselia pitkin ja törmää paikallaan olevaan
p
protoniin (2). Tällöin neliliikemäärät ovat
⇔ p = E 2 − m2a .
→ (E, p, 0, 0)
P1
O
→ (m0 , 0, 0, 0)
P2
Massakeskuskoordinaatistossa CM törmäyksen jälkeen
hiukkaset c ja d ovat levossa, jolloin neliliikemäärät ovat
.
O
Pc → (mc , 0, 0, 0)
Massakeskuskoordinaatistossa CM molemmilla protoCM
.
Pd → (md , 0, 0, 0)
neilla on ennen törmäystä sama energia, ja ne liikkuvat
CM
kohti toisiaan x-akselia pitkin.
Näin ollen laboratoriokoordinaatistossa O on systeemin
Reaktion jälkeen kaikki hiukkaset ovat levossa CMkokonaisliikemäärä ennen törmäystä
koordinaatistossa (kynnysenergiaehto), eli
p
P = Pa + Pb →(E + mb , E 2 − m2a , 0, 0)
P′1 = P′2 = P′3 = P′4 → (m0 , 0, 0, 0).
O
CM
Tarkastellaan seuraavaksi systeemin kokonaisnelilii- ja törmäyksen jälkeen massakeskuskoordinaatistossa CM
kemäärää P. Ennen törmäystä
P′ = Pc + Pd → (mc + md , 0, 0, 0).
q
CM
P = P1 + P2 →(E + m0 , p = E 2 − m20 , 0, 0),
O
Nelivektoreiden sisätulon invarianssin ja neliliikemäärän
säilymisen
nojalla on
koska
O
P1 · P1 = −E 2 + p2 = −m20
q
⇔ p = E 2 − m20 .
P · P = P′ · P′
Vastaavasti törmäyksen jälkeen systeemillä on kynnysenergiaehdon nojalla neliliikemäärä
X
P′i → (4m0 , 0, 0, 0).
P′ =
i
CM
Nelivektoreiden sisätulon koordinaatistoinvarianssin ja
neliliikemäärän säilymisen nojalla
⇔ −(E + mb )2 + E 2 − m2a = −(mc + md )2
⇔E=
(mc + md )2 − (m2a + m2b )
.
2mb
Koska E on kiihdytetyn hiukkasen kokonaisenergia, ja
E = T + ma , saadaan laboratoriokoordinaatistossa O liikkuvan hiukkasen kineettiseksi energiaksi
T =
P · P = P′ · P′
(mc + md )2 − (m2a + m2b )
− ma
2mb
(mc + md )2 − (ma + mb )2
.
2mb
⇔ −(E + m0 )2 + E 2 − m20 = −16m20
⇔ E = 7m0 .
40
(69)
Huomaa, että yhtälössä (69) osoittajassa termi (mc +
md )2 vastaa tytärhiukkasia ja termi (ma + mb )2 alkuperäisten hiukkasten osuutta.
Jos alkuperäisten hiukkasten lepomassojen summa on
suurempi kuin tytärhiukkasten lepomassojen summa (ma +
mb > mc + md ), reaktio voi tapahtua millä tahansa kiihdytysenergialla.
Toisaalta, jos alkuperäisten hiukkasten lepomassojen
summa on pienempi kuin tytärhiukkasten lepomassojen
summa (ma + mb < mc + md ), tarvitaan vähintään lauseketta (69) vastaava määrä kineettistä energiaa reaktion toteutumiseksi.
41