JOHDATUS SUHTEELLISUUSTEORIAAN 763102P
Transcription
JOHDATUS SUHTEELLISUUSTEORIAAN 763102P
JOHDATUS SUHTEELLISUUSTEORIAAN 763102P Petri Mutka Fysikaalisten tieteiden laitos Oulun yliopisto 2005 1. Johdanto Tiede on itse itseään korjaavaa, ja tieteellinen tieto on jatkuvan tarkastelun ja kritiikin kohteena. Tämän takia avoimuus ja riippumattomuus ovat hyvin tärkeitä. Tieteen ja sen tekijöiden tuottamien tulosten luonne täytyy olla riippumattomia ulkoisista auktoriteeteistä. Viimekädessä tieteen tuottama tieto saa riippua ainoastaan tehdyistä havainnoista, joihin havaitsijan omat näkemykset tai ulkoiset auktoriteetit eivät saa vaikuttaa. Tiede on edistyvää, eli vanhojen näkemysten ja tulkintojen osoittautuessa jollain tavoin vääriksi tai vajavaisiksi, ne pyritään korvaamaan uusilla. Entä käytännössä? Mieti esimerkkejä tilanteista joissa neljä edellä lueteltua tieteen ominaisuutta voisivat tulla esille? Kuinka niistä poikkeaminen ilmenee ja mitä siitä seuraa? Suhteellisuusteoria, joka koostuu kahdesta erillisestä teoriasta, on toinen modernin fysiikan perusteorioista. Erikoinen tai suppea suhteellisuusteoria käsittelee aikaa ja paikkaa tasaisen liikkeen tapauksessa. Teorian laajennettu versio – yleinen suhteellisuusteoria on gravitaataatioteoria, joka käsittelee kiihtyvää liikettä. Suhteellisuusteoria laajentaa klassisen Galilein ja Newtonin mekaniikan suurille energioille ja nopeuksille. Erikoisen suhteellisuusteorian tapauksessa tämä tarkoittaa nopeuksia, jotka ovat merkittävän lähellä valonnopeuden asettamaa ylärajaa. Tällöin ajan ja paikan käsitteet eivät ole enää klassisessa mielessä yksiselitteisiä. Tällä kurssilla käsitellään erikoista suhteellisuusteoriaa. Kurssilla opitaan, kuinka suhteellisuusteoria rakentuu kahden peruspostulaatin pohjalta ja johtaa Lorentzin koordinaatistomuunnokseen, kun koordinaatistojen välinen nopeus on vakio. Suhteellisuusteoriaa pyritään ymmärtämään neliulotteisen aika-avaruusjatkumon ominaisuuksien pohjalta. Samanaikaisuuden suhteellisuus, pituuden kontraktio ja ajan dilataatio saadaan teorian välittöminä seurauksina. Fysiikan lakien liiketilariippumattomuus on yksinkertaisinta esittää nelivektorein, joihin kurssilla tutustutaan. Kurssi johdattelee myös suhteellisuusteorian tärkeään sovellutusalueeseen, hiukkasten kinematiikkaan sironta- ja tuottoprosesseissa. Kurssin tavoitteena on, että sen jälkeen opiskelija: Mikä on tieteellinen teoria? Käytännössä tieteen kehitys on jatkuvaa havaintojen ja teorian vuoropuhelua. Uudet havainnot ja mittaukset luovat uutta teoriaa ja päinvastoin. Tieteellinen teoria on malli, joka pyrkii selittämään havainnot. Teoria kertoo ainoastaan siitä ilmiömaailmasta, jonka kuvaamiseksi se on laadittu. Tieteellistä teoriaa ei voida koskaan todistaa oikeaksi ainoastaan vääräksi todistaminen on mahdollista. Karkeasti tieteen kehitystä voidaan kuvata seuraavanlaisella jatkuvasti toistuvalla syklillä. Tiede uusiutuu tieteellisten kriisien kautta, jotka syntyvät uusista havainnoista, joita vallitseva teoria ei pysty 1. Tunnistaa fysikaaliset tilanteet, jotka johtavat suhteel- selittämään oikein. Tämä ilmenee eri teorioiden tai niiden lisuusteoreettisiin efekteihin. osa-alueiden välisinä ristiriitaisuuksina tai väärinä ennusteina käsiteltävistä ilmiöistä. 2. Ymmärtää mitä nämä efektit ovat. Uusien havaintojen selittämiseksi pyritään luomaan hy3. Pystyy käytännössä käsittelemään osaa niistä. poteesejä, jotka selittävät sekä vanhat että uudet, ristiriitaiset havainnot. Hypoteesien tasolla eri selitysmallit sekä teoriat kilpailevat keskenään. Kirjoja Parhaalla hypoteesilla, joka korvaa vallitsevan teorian tai Suhteellisuusteoriasta on kirjoitettu lukuisia oppikirjoja, laajentaa sitä, on seuraavat ominaisuudet: tässä muutama lähdeteos joihin kurssi osittain perustuu • Se selittää teorian kattaman ilmiömaailman sekä kaik• Suhonen, E. Johdatus Suhteellisuusteoriaan luentomoki havainnot mahdollisimman laajasti. niste, 1991 • Occamin partaveitsi: se on yksinkertaisin. • French, A. P. Special Relativity, 1968 Tämän jälkeen vallitsevaksi teoriaksi päässyt paras hy• Taylor, E. F. and Wheeler, J. A. Spacetime Physics poteesi on jatkuvan kritiikin ja testaamisen kohteena, kun(5th ed.), 1998 nes tehdään havaintoja, jotka ovat sen kanssa ristiriidassa ja sykli alkaa uudelleen. Kuinka edellä luetellut tieteen neljä tunnusmerkkiä liit1.1 Kuinka tiede toimii? tyvät edellä kuvattuun tieteen kehityksen kiertokulkuun? Tieteen yleisiä tunnusmerkkejä ovat Keksitkö käytännön esimerkkejä? Tämä sykli on toistunut • Objektiivisuus. monissa mittakaavoissa useita kertoja tieteen historiassa, muistatko yhtään esimerkkiä? Millä muilla tavoilla tiede • Kriittisyys. voi kehittyä ja miksi tämä on karkea yksinkertaistus? • Autonomisuus. 1.2 Käytännön esimerkki • Edistyvyys. Klassinen fysiikka vuonna 1880... Tieteellinen tieto perustuu tosiasioihin, joiden täytyy olla 1800-luvun loppupuolella ajateltiin, että klassisen fysiiaina tarkistettavissa ja testattavissa. Tämän takia tieteen kan avulla voidaan selittää kaikki luonnonilmiöt. Tämän tuottaman tiedon täytyy olla avointa ja julkista. 1 käsityksen mukaan ainostaan muutama yksityiskohta oli enää selvittämättä. Myöhemmin nämä valon liikkeeseen ja materian perusolemukseen liittyvät kysymykset kuitenkin muuttivat kaiken. Klassinen Galilein-Newtonin mekaniikka käsittelee kappaleiden liikkeisiin ja dynamiikkaan liittyviä ongelmia, kuten esimerkiksi planeettojen liikettä. Maxwellin sähkömagnetismi selittää sähköön ja magnetismiin liittyvät ilmiöt, mistä esimerkkinä valo ja sähkömagneettisen säteilyn luonne. Termodynamiikka käsittelee kaasujen ja nesteiden olemusta makroskooppisessa mittakaavassa. Boltzmannin statistinen mekaniikka käsittelee ainetta ja sen eri olomuotoja mikroskooppisista lähtökohdista lähtien. Klassisen fysiikan luomassa maailmankuvassa oli kaksi keskeistä selvittämätöntä ongelmaa. Maxwellin teorian mukaisen sähkömagneettisen säteilyn (aaltoliikkeen) hypoteettisen väliaineen, eli eetterin, olemusta ei ymmärretty. Toinen ongelmakohta oli aineen säteilemän spektrin selittäminen. Suhteellisuusteoria on teoria ajasta ja paikasta. Teorian pohjalta on myöhemmin kehitelty gravitaatioteorioita eteenpäin, mutta perusmuodossaan se on Albert Einsteinin luoma (1905,1915). 1.3 Suhteellisuusteoria Suppea tai erikoinen suhteellisuusteoria, jonka Albert Einstein julkaisi vuonna 1905, käsittelee vapaasti liikkuvia havaitsijoita. Teoria on erikoistapaus myöhemmin julkaistusta yleisestä suhteellisuusteoriasta (1915). Suhteellisuusteoria romuttaa klassisen ajan ja paikan käsitteen, ja sitoo ne havaisijan liiketilaan. Teoria perustuu oletuksille, joiden mukaan valon tyhjiönopeus (suurin mahdollinen nopeus) on vakio ja fysiikan lait ovat samat kaikille havaitsijoille. Teorian taustalla on neliulotteinen kuva aikaavaruusjatkumosta, jossa aika rinnastetaan paikkakoordinaatteihin. Käytännössä erikoinen suhteellisuusteoria on varsin yksinkertainen, vaikkakin se johtaa arkiajattelulle vieraisiin tilanteisiin. Yleinen suhteellisuusteoria laajentaa erikoisen suhteellisuusteorian käsitteet myös kiihtyvässä liikkeessä oleviin havaitsijoihin. Käytännössä tämä johtaa teoriaan gravitaatiosta. Teorian perusajatuksen mukaisesti painovoima syntyy neliulotteisen aika-avaruusjatkumon kaareutumisesta. Tätä kaareutumista kuvaa Einsteinin kenttäyhtälö, joka määrää kuinka aine (=massa, energia) vaikuttaa kaarevuuteen. Vastaavasti avaruuden kaarevuus määrää sen, kuinka aine siellä liikkuu. Kaarevien avaruuksien käsittely johtaa matemaattisesti melko vaativaan yleiseen vektorilaskentaan, ja aihe onkin huomattavasti erikoista suhteellisuusteoriaa vaativampi ja raskaampi. ... ja sen jälkeen. Vuosisadan vaihtuessa tehtiin nopeaan tahtiin lukuisia havaintoja, jotka olivat ristiriidassa klassisen fysiikan tuottamien ennusteiden kanssa: • Röntgensäteet (Röntgen, 1895), joiden tuottaminen on kvantti-ilmiö. Vasta vuonna 1912 osoitettiin, että röntgensäteet ovat lyhytaaltoista sähkömagneettista säteilyä. • Elektroni (Thomson, 1895), jonka sähkövaraus muodostaa alkeisvarauksen. Alkeisvarauksen olemassaoloa oli epäilty aiemminkin. 1.4 Suhteellisuusteoria ja klassinen fysiikka • Radioaktiivisuus (Becquerel, 1896), jossa atomiytimet säteilevät hiukkas- tai sähkömagneettista säteilyä hajotessaan. Edellä kuvailtu modernin fysiikan perusteorioiden synty ei tarkoita sitä, että klassinen fysiikka olisi hylättävä. • Valosähköinen ilmiö (Hertz, Hallwachs, Lenard, 1887- Klassisen fysiikan teoriat toimivat hyvin tarkasti omilla 1899), jossa sähkömagneettinen säteily irrottaa elekt- pätevyysalueillaan. roneja metallista oikeissa olosuhteissa. Klassinen fyIlmiöiden energiatiheys määrää sen, ovatko relativistiset siikka antaa tässä täysin vääriä ennusteita. Einstein efektit merkittäviä. Tämä ei ole aina itsestäänselvä tilanne, sai valosähköisen ilmiön selittämisestä Nobelin palkin- sillä energiaa voi olla monessa muodossa, kuten esimerkiknon vuonna 1921. si: • Michelsonin ja Morleyn koe (Michelson, Morley 1887), jolla pyrittiin selvittämään maapallon liiketilaa sähkömagneettisen säteilyn hypoteettisen väliaineen, eetterin, suhteen. • Liike-energia: jos kappaleelle annetaan tarpeeksi liikeenergiaa, sen nopeus nousee tarpeeksi lähelle valonnopeutta (relativistiseksi) ja klassisen mekaniikan mukainen kuvaus tilanteelle pettää. Näiden havaintojen lisäksi selvät ristiriidat klassisen fysiikan teorian sisällä johtivat myöhemmin modernin fysiikan kahteen perusteoriaan: Kvanttimekaniikka käsittelee mikroskooppisen mittakaavan ilmiöitä. Kaikki modernit aineen rakenteen teoriat perustuvat kvanttimekaniikkaan. Kvanttimekaniikan syntyyn vaikutti useita henkilöitä, joista mainittakoon deBroglie, Bohr, Heisenberg, Born, Planck, Jordan, Schrödinger, Dirac, Pauli jne. (likimain 1924-1930). • Massa: Massa on energiaa ja päinvastoin. Jos kappaleen tiheys on tarpeeksi suuri, se alkaa kaareuttamaan avaruutta hyvin voimakkaasti. Tämä voi johtaa voimakkaisiin kiihtyvyyksiin ja relativistiin nopeuksiin. • Lämpötila: lämpötila on liikettä, johon on sitoutuneena energiaa. Tarpeeksi korkeat lämpötilat vaativat relativististen efektien huomioonottamista. 2 • Paine: paine ja lämpötila liittyvät läheisesti toisiinsa. Energiaa voi olla varastoituneena myös staattisiin jännityksiin, mika voi periaatteessa johtaa myös relativistisiin ilmiöihin. • Yleisen suhteellisuusteorian mukainen valon kaareutuminen painovoimakentässä on havaittiin ensimmäisen kerran Auringon lähettyvillä. Nykyään tämä ilmiö nähdään monien astrofysikaalisten kohteiden yhteydessä. Matalaenergisellä rajalla relativististen efektien tulee hävitä ja suhteellisuusteorian täytyy tällöin tuottaa klassisen fysiikan mukaisia tuloksia. Keksitkö todellisia fysikaalisia tilanteita, jotka voivat johtaa relativistisiin efekteihin? Entäpä esimerkkejä edellä luetelluista energian olomuodoista? • Merkuriuksen radan (perihelin) kiertyminen on mitattu ilmiö, joka vastaa hyvin tarkasti yleisen suhteellisuusteorian ennustetta. Suurin osa radan kiertymisestä selittyy klassisen mekaniikan avulla, mutta sen ylitse jäävä osa on tarkasti suhteellisuusteorian mukainen. 1.5 Suhteellisuusteorian testit • Yleinen suhteellisuusteoria ennustaa, että neliulotteisessa aika-avaruusjatkumossa voi liikkua aaltoja, jotka syntyvät nopeasti muuttuvan gravitaatiokentän yhteydessä. Näistä aalloista on toistaiseksi vain epäsuoria havaintoja, mutta meneillään on useita havaintoprojekteja, jotka pyrkivät gravitaatioaaltojen suoraan havaitsemiseen. Kun kahta modernin fysiikan perusteoriaa yritetään soveltaa yhtäaikaa, päädytään ongelmiin. Suhteellisuusteoria ja kvanttimekaniikka eivät sovi yhteen. Pitkään on jo epäilty, että taustalla olisi yksi teoria joka kattaa sekä kvanttimekaniikan että suhteellisuusteorian. Tämän vuoksi teorioiden testaaminen on hyvin tärkeää, sillä niiden ennusteista poikkeavat havainnot antavat vihjeitä uudesta fysiikasta! • Gravitaation aiheuttama punasiirtymä on mitattu maapallon pinnalla ja se havaitaan myös monien astrofysikaalisten kohteiden yhteydessä. Erikoinen suhteellisuusteoria Erikoista suhteellisuusteoriaa on testattu paljon, ja tähän mennessä kaikki sen antamat ennusteet ovat olleet hyvin tarkkoja: • Eetterikokeet, joissa yritetään löytää absoluuttista lepokoordinaatistoa mittaamalla valon tyhjiönopeutta eri suunnissa interferometrillä. • Modernit eetteritestit, jotka perustuvat laserin tai maserin käyttöön. • Mitataan valonnopeutta hyvin tarkasti, esimerkiksi tasaisesti liikkuvassa, kiihtyvässä, pyörivässä tms. koordinaatistossa, ja yritetään löytää poikkeamia valon tyhjiönopeudessa. • Punasiirtymämittaukset, joissa etsitään poikkeamia suhteellisuusteorian ennustamasta relativistisesta doppler-siirtymästä (liikkuvan valonlähteen säteilemän sähkömagneettisen säteilyn aallonpituuden muutos). • Ajanmittaustestit. Suhteellisuusteoria ennakoi liikkuvien kellojen käyvän eri tahtiin kuin levossa olevien. Tästä on etsitty poikkeamia lennättämällä hyvin tarkkoja kelloja esimerkiksi satelliiteissa. Yleinen suhteellisuusteoria Yleisen suhteellisuusteorian testaaminen on huomattavan paljon vaikeampaa kuin erikoisen suhteellisuusteorian. Tämä johtuu siitä, että yleistä suhteellisuusteoriaa vaativat relativistiset ilmiöt syntyvät yleensä suurien massojen lähettyvillä. Niinpä useimmat yleisen suhteellisuusteorian testit ovat käytännössä havaintoja astrofysikaalisista kohteista joissa relativistiset efektit ovat voimakkaina näkyvissä. Tälläisiä testejä ovat esimerkiksi: 3 2. Koordinaatistojärjestelmät Sama pallo! Sama paikka! Sama aika! Klassisesti kappaleen liikkeen kuvaamiseksi tarvitaan koordinaatistojärjestelmä (frame tai frame of reference), joka koostuu seuraavista käsitteistä: • Piste, jonka suhteen paikkaa mitataan, eli origo. • Sopimus tavasta, jolla paikkaa origon suhteen mitataan. • Kello, joka kertoo millä ajanhetkellä kappale on kussakin paikassa. Koska suhteellisuusteorian kannalta aika ja paikka eivät ole yksikäsitteisiä klassisessa mielessä, muutamia koordinaatistojärjestelmiin liittyviä käsitteitä joudutaan tarkentamaan. Kuva 1: Heitetyn pallon lentoradan muoto on havaitsijan liiketilasta riippuva. Molemmissa taloissa pallon paikka ja nopeus, sekä itse talon paikka, on heittohetkellä sama. Vasemmassa talossa, joka pysyy maan suhteen paikallaan, lentorata on paraabeli. Pallon lähtöhetkellä vapaasti tippuvan talon suhteen rata on suoraviivainen. Kello liittyy jokaiseen koordinaatiston pisteeseen, ja samassa koordinaatistossa olevat kellot ovat synkronoitu keskenään. Käytännössä tämä synkronointi tehdään seuraavasti: valitaan referenssipiste, jossa oleva kello nollataan. Lähetetään tästä pisteestä radiaalisesti laajeneva valorintama. Jokaisessa valorintaman saavuttamassa pisteessä oleva kello asetetaan aikaan, joka on valorintaman mukana kulkevan referenssikellon sen hetkisestä ajasta vähennettynä valorintaman laajenemiseen kulunut aika. Keksitkö todellisia tilanteita, joissa pyörivän tai liikkuvan koordinaatiston käytöstä voisi olla hyötyä? 2.1 Vapaa koordinaatisto Tapahtuma on tietty aika ja paikka avaruudessa, joka Miksi maan pinnalta heitetty pallo lentää paraabeliramääritellään esimerkiksi yhden aika- ja kolmen paik- dalla? Tarkastellaan seuraavanlaista tilannetta uhkarohkakoordinaatin avulla (t, x, y, z). keasti kallion kielekkeelle rakennetussa talossa (kuva 1). Havaitsija on olio, joka pystyy mystisesti lukemaan kaikMaanpinnan suhteen levossa olevassa talossa pallo lentää kia koordinaatiston kelloja välittömästi ilman valonparaabeliradalla, ja vapaasti tippuvassa talossa lentorata nopeuteen liittyvää signaaliviivettä. on suoraviivainen. Jokapäiväisen kokemuksen mukaisesti Koordinaatistojärjestelmä on yksinkertaisesti sopimus pallon paraabelirata on seurausta painovoimasta. siitä kuinka aikaa ja paikkaa ilmaistaan. SuhteellisuusTilannetta voidaan tarkastella myös toisin. Pallon hateorian vahvuus on koordinaattivapaa ilmaisu, jossa luon- vaittu paraabelirata on seurausta havaitsijan “epäluonnolnonlait määritellään valitusta koordinaatistojärjestelmästä lisesta” koordinaatistosta, jossa esiintyy huonosta koordiriippumattomalla – invariantilla – tavalla. naatiston valinnasta johtuvia ylimääräisiä kiihtyvyyksiä. Itseasiassa valitulla koordinaatistojärjestelmällä mitaVapaassa pudotuksessa oleva havaitsija näkee pallon liiktaan abstraktimpaa matemaattista käsitettä, eli monistoa, kuvan “luonnollisen” suoraviivaisesti. Gravitaatio on hajoka voidaan tässä yhteydessä mieltää “jatkuvaksi avaruu- vaitsijan liiketilasta johtuvaa “harhaa” – aina voidaan deksi”. Monisto itsessään voi olla kaareva, kuten koordi- määritellä hetkeksi paikallinen koordinaatisto, jossa sitä ei naatistokin. Tästä esimerkkinä maapallon kartta, jota ei ole. voi esittää tasossa ilman mittakaavavirheitä, koska maan 2.2 Vapaan koordinaatiston paikallinen pinta on kaareva pallon pinta. Erilaisia koordinaatistoja, joilla voidaan kuvata samaa luonne tilannetta on ääretön määrä. Pelkästään tutusta karteesiPainovoimaa ei voida hävittää mielivaltaisen pitkäksi aisesta koordinaatistosta on monia muunnelmia (oikea- tai kaa mielivaltaiselta alueelta. Ammutaan esimerkinomaisesvasenkätinen, vino- eli skewed -koordinaatisto, ortogonaali- ti avaruusalus ja kaksi VR:n junavaunua Maata kiertävälle nen jne.). Muista koordinaatistoista mainittakoon esimer- radalle. kiksi napa-, sylinteri- tai vaikkapa elliptinen koordinaatisKuvan 2 avaruusaluksessa olevat testikappaleet liikkuvat to. kuten vapaassa koordinaatistossa. Käytännössä niihin ei Myös itse koordinaatisto voi olla liikkeessä tai vaikkapa vaikuta koordinaatiston valinnasta johtuvia voimia, mikäli pyöriä, jolloin itse koordinaatisto on ajasta riippuvainen. tarkastelu rajoitetaan tarpeeksi pienelle alueelle (aluksen Sopivan koordinaatiston valinta on hyvin tärkeää on- sisäosaan). gelman ratkaisussa, sillä joissain koordinaatistoissa sen Jos koordinaatistoa levennetään tarpeeksi sivusuunnaskäsittely voi muuttua hyvin yksinkertaiseksi ja joissain taas sa, kuten vaakalennossa radallaan etenevässä junavaunusäärimmäisen hankalaksi! sa (kuva 3), vaunun eri päissä oleviin testikappaleisiin vai4 Kuva 2: Avaruusaluksen sisällä tarpeeksi pienellä, vapaasti liikkuvalla alueella Maan kiertoradalla gravitaatiota ei voida havaita. Kuva 4: Vaapaasti liikkuvan alueen ollessa laaja radiaalisessa suunnassa, voimien suuruudet muuttuvat, koska gravitaatiovoima on kääntäen verrannollinen etäisyyden neliöön. Inertiaalilain voimassaolo riippuu valitusta koordinaatistosta. Koordinaatistoa, jossa Newtonin inertiaalilaki on voimassa, kutsutaan inertiaalikoordinaatistoksi. Inertiaalikoordinaatisto on idealisaatio, jota ei todellisuudessa ole olemassa. Käytännössä koordinaatistoa voidaan aina laajentaa siten, että siihen sisältyy (epätasaisia) gravitaatiokenttiä, jotka tuottavat sisäisiä koordinaatiston valinnasta johtuvia kiihtyvyyksiä. Käytännössä kuitenkin lähes aina voidaan määritellä sopivan kokoinen vapaa koordinaatisto, jota voidaan käsitellä halutulla tarkkuudella, kuten inertiaalikoordinaatistoa. Koordinaatistoja, jotka eivät ole inertiaalikoordinaatistoja, ja joissa on sisäisiä kiihtyvyyksiä, kutsutaan epäinertiaalikoordinaatistoiksi. Jos voitaisiin tehdä mielivaltaisen pitkiä ja tarkkoja mittauksia, kaikki reaalimaailman koordinaatistot olisivat todellisuudessa epäinertiaalikoordinaatistoja. Kuva 3: Jos vapaasti liikkuva alue on tarpeeksi suuri sivusuunnassa, kuten tässä VR:n junavaunussa, gravitaatiovoimien suunta vaunun eri osissa muuttuu. kuttavat hieman erisuuntaiset voimat ja koordinaatistossa esiintyy sen valinnasta johtuvia sisäisiä voimia. Vastaavasti radiaalisessa suunnassa (kuva 4), pystyssä olevassa vaunussa testikappaleisiin vaikuttavat voimat ovat erisuuria vaunun eri päissä. Näin ollen tässäkin koordinaatistossa esiintyy sen valinnasta johtuvia sisäisiä voimia. Jos vapaassa koordinaatistossa tarkasteltava alue on tarpeeksi pieni ja aikaväli on tarpeeksi lyhyt, painovoimaa ei ole. Koska gravitaatiokenttä ei ole tasainen, tarpeeksi suurella alueella (tai pitkänä aikana) sen vaikutukset tulevat esille myös vapaassa koordinaatistossa. Se, mitä tarpeeksi pieni alue ja lyhyt aikaväli tarkoittaa, riippuu täysin tarkasteltavasta ongelmasta. Joka tapauksessa koordinaatisto täytyy erikoisen suhteellisuusteorian ongelmissa rajata sopivalle alueelle aikaavaruusjatkumossa. Jos tämä ehto rikkoutuu, tarvitaan yleistä suhteellisuusteoriaa, jossa ongelmaa käsitellään (periaatteessa) määrittelemällä sarja paikallisia koordinaatistoja sekä sääntö siitä, kuinka niiden välillä liikutaan. 2.4 Fysiikan lait inertiaalikoordinaatistossa Kahdesta toistensa suhteen liikkuvasta inertiaalikoordinaatistosta on mahdotonta sanoa, kumpi on levossa ja kumpi liikkeessä. Kaikki inertiaalikoordinaatistot ovat samanarvoisia. Periaatteessa tämä on Galilein esittämä suhteellisuusperiaate hieman laajennetussa muodossa: Fysiikan lait ovat samat kaikissa inertiaalikoordinaatistoissa! Einstein laajensi suhteellisuusperiaatteen Galileon esittämästä suoraviivaisesta liikkeestä koskemaan myös vapaata liikettä (ks. edellä käsitelty vapaa koordinaatisto). 2.3 Inertiaalikoordinaatisto Olkoot kaksi inertiaalikoordinaatistoa A ja A’, joista A’ Newtonin ensimmäinen laki, eli inertiaalilaki, kuuluu liikkuu A:n suhteen vakionopeudella v suuntaan x. Hetkellä seuraavasti: t = t′ = 0 koordinaatistojen origot ovat samassa pisteessä. Koordinaatistosta A siirrytään koordinaatistoon A’ a) Levossa oleva kappale pysyy levossa, jos siihen ei vaimuunnoksella ′ kuta ulkoisia voimia ja x = x − vt (1) t′ = t b) liikkuva kappale jatkaa liikettään vakionopeudella, jos siihen ei vaikuta ulkoisia voimia. Muunnosta (1) kutsutaan Galilein koordinaatistomuun5 nokseksi. Esimerkki: Newtonin toinen laki Newtonin toinen laki F = ma ⇔ a = F m (2) kertoo, että kappaleen kiihtyvyys a on suoraan verrannollinen siihen vaikuttavaan voimaan F ja kääntäen verrannollinen sen massaan m. Tämä on voimassa kaikissa inertiaalikoordinaatistoissa, koska derivoitaessa muunnosyhtälöitä (1) ajan suhteen, nopeudet edellämainituissa inertiaalikoordinaatistoissa A ja A’ muuntuvat kuten u′ = u − v. (3) Koska kiihtyvyys on nopeuden muutos ajan funktiona, ja koordinaatistojen A ja A’ välinen nopeus v on vakio, saadaan uudelleen ajan suhteen derivoimalla kiihtyvyyksille a′ = a. (4) Eli Newtonin toinen laki (2) on voimassa kaikissa inertiaalikoordinaatistoissa. 2.5 Fysiikan lait epäinertiaalikoordinaatistoissa Newtonin toinen laki ei ole voimassa sellaisenaan epäinertiaalikoordinaatistossa. Esimerkiksi maata kiertävään avaruusalukseen sidottu tarpeeksi laaja koordinaatisto on tälläinen epäinertiaalikoordinaatisto. Vaikka aluksen sisällä olevaan testikappaleeseen vaikuttaa Maan vetovoima, se pysyy avaruusaluksen suhteen paikallaan. Tämä voidaan ymmärtää määrittelemällä kiihtyvässä liikkeessä olevasta koordinaatistosta johtuva keinotekoinen voima - keskipakoisvoima - joka kumoaa Maan vetovoiman. Epäinertiaalikoordinaatistoja voidaankin käsitellä määrittelemällä keinotekoisia koordinaatistoon liittyviä voimia. Tälläisiä inertiaalivoimia ovat esimerkiksi keskipakois- ja Coriolisvoima. On tärkeää ymmärtää, missä ja millaisessa koordinaatistossa ongelmaa käsitellään, sillä epäinertiaalikoordinaatistoja täytyy käsitellä eri tavalla kuin inertiaalikoordinaatistoja! 6 3. Suhteellisuusteorian perusperiaatteet Erikoinen suhteellisuusteoria (ja tämä kurssi) käsittelee ajan ja paikan käsitettä kappaleilla, joiden suhteelliset nopeudet ovat merkittävä osa valon tyhjiönopeudesta c ≈ 3.0 × 108 m/s. Teoria käsittelee tasaista liikettä eli erilaisia inertiaalikoordinaatistoja. Epäinertiaalikoordinaatiston tapauksessa voidaan joutua turvautumaan yleiseen suhteellisuusteoriaan, joka menee käsittelemämme ongelmakentän sekä tämän kurssin ulkopuolelle. nopeus v v≪c v< ∼c Inertiaalikoordinaatisto Newtonin lait Suppea suhteellisuusteoria Epäinertiaalikoordinaatisto Newtonin lait + inertiaalivoimat Yleinen suhteellisuusteoria Kuva 5: Michelson ja Morley mittasivat valonnopeutta interferometrillä maapallon ratanopeuden suuntaan sekä Modernia fysiikkaa edeltävä klassinen fysiikka perustuu sitä vastaan kohtisuorassa suunnassa. Nopeuksien oletettiin muuttuvan (vasen puoli), mutta mittaustuloksen (oipitkälti kahdelle perusteorialle: kea puoli) mukaan valonnopeus oli suunnasta riippumaton. • Klassinen mekaniikka, joka sai alkunsa 1500 - 1600 luvun aikana (Newton ja Galilei). ja heijastuu peilistä P1 ilmaisimelle T. Vastaavasti toinen • Maxwellin sähkömagnetismin teoria 1800-luvulta. valonsäde kulkee ensin matkan l2 ja heijastuu peilistä P2 Klassinen mekaniikka lepää vahvasti Galileo Galilein puoliläpäisevän peilin P kautta samalle ilmaisimelle T, jolaikoinaan muotoileman suhteellisuusperiaatteen varassa, la molemmat valonsäteet interferoivat. Syntynyt interferenssikuvio riippuu molempien vajonka mukaan fysiikan lait ovat liiketilasta riippumattolonsäteiden matkaan käyttämästä ajasta. Laitetta mat. pyöritettäessä, eetterin suhteen vakionopeudella liikkuvan Maxwellin sähkömagnetismiä kuvaavat yhtälöt kuitenvalon nopeuden tulisi muuttua maan rataliikkeen sekä 8 kin ennustavat valolle nopeuden c ≈ 3.0 × 10 m/s. Klasmittaussuunnan mukaisesti ja interferenssikuvion tulisi sisen fysiikan kriittiseksi kysymykseksi 1800-luvun lopulla muuttua vastaavasti. tuli, minkä suhteen Maxwellin teorian tuottama valonnoOletetaan, että maapallon nopeus on hypoteettisen eetpeus on määritelty? terin suhteen v, ja valonnopeus vastaavasti c. Tarkastellaan On helppo osoittaa, että Maxwellin yhtälöt eivät ole ensin tapausta, jossa haara S-P-P2 on maan rataliikkeen invariantteja Galilein koordinaatistomuunnoksen suhteen. suunnassa. Maxwellin sähkömagnetismi ja klassinen Galilein ja NewPeilin P2 kautta kukevan valonsäteen nopeus on Galilein tonin mekaniikka ovat ristiriidassa. muunnosten mukaisesti 1800-luvun lopulla valon tiedettiin olevan aaltoliikettä. 3.1 Historiaa Koska aaltoliike tapahtuu (yleensä) väliaineessa, pääteltiin suunnassa P-P2 ⇒ c + v , että Maxwellin yhtälöt antavat valonnopeuden tuntematsuunnassa P2 -P ⇒ c − v toman hypoteettisen väliaineen, eetterin suhteen. Tästä voitiin edelleen päätellä, että valonnopeuden ol- jolloin matkaan P-P2-P kuluu valolta aika lessa vakio eetterin suhteen määritellyssä inertiaalikoordil2 l2 2cl2 naatistossa, täytyy valonnopeuden muuttua Galilein koort2 = + = 2 c − v c + v c − v2 dinaatistomuunnosten mukaiseksi muissa inertiaalikoordinaatistoissa. 2l2 γ 2 1 Michelsonin ja Morleyn kokessa (1881,1887) yritettiin ⇔ t2 = , γ= p . (5) mitata valonnopeuden muutoksia eri suuntiin eetterin suhc 1 − (v/c)2 teen liikkuvien havaitsijoiden koordinaatistoissa (kuva 5). Vastaavasti peilin P1 kautta kulkevalle valonsäteelle √ 3.2 Michelsonin ja Morleyn koe suunnassa P-P1 ⇒ √c2 − v 2 , Koejärjestelyssä mitataan kahden toisiaan vastaan kohc2 − v 2 suunnassa P1 -P ⇒ tisuoraan liikkuvan valonsäteen nopeutta interferometrin avulla (kuva 6). jolloin matkaan P-P1-P kuluu valolta aika Interferometrissä monokromaattisesta valonlähteestä l1 2l1 lähtevä valonsäde jakautuu puoliläpäisevässä peilissä P t1 = 2 √ γ. (6) = 2 2 c kahteen osaan. Ensimmäinen valonsäde kulkee matkan l1 c −v 7 P1 Kuitenkaan minkäänlaista muutosta ei havaittu. Tämän jälkeen Michelsonin ja Morleyn jälkeen koe on uusittu huomattavasti suuremmilla mittaustarkkuuksilla, eikä muutoksia valonnopeudessa ole havaittu. Valon tyhjiönopeus on sama kaikissa koordinaatistoissa! Useiden epäonnistuneiden selitysyritysten jälkeen tämän ristiriidan Maxwellin sähkömagnetismin ja klassisen Galilein ja Newtonin mekaniikan välillä ratkaisi Einstein vuonna 1905 erikoisella suhteellisuusteoriallaan. Einsteinin elegantti ratkaisu perustuu yksinkertaiselle oivallukselle. Jos valonnopeus on vakio kaikissa koordinaatistoissa, täytyy ajan olla koordinaatistosta riippuva! Peili l1 P Peili P2 Puoliläpäisevä peili Valonlähde l2 T Ilmaisin v< ~c Absoluuttinen aika Galilein koordinaatistomuunnos Kuva 6: Michelson ja Morley kokeessa valonlähteestä lähtevä, eetterin suhteen vakionopeudella liikkuva, kahteen osaan jaettu valonsäde kulkee kahta toisiaan vastaan kohtisuoraan olevaa haaraa pitkin ja interferoi sen jälkeen ilmaisimella. Laitetta pyöritettäessä tulisi mittaussuunnan muuttua maapallon rataliikkeen suhteen ja interferenssikuvion muuttua vastaavasti. Nyt eri reittejä kulkeville valonsäteille (5) ja (6) aika-ero on 2γ (γl2 − l1 ). (7) ∆t = t2 − t1 = c Kun laitetta käännetään siten että P1 -P-T on rataliikkeen suunnassa, kuluu matkoihin aikaa t̄1 = t2 ja t̄2 = t1 3.3 Suhteellisuusteorian peruspostulaatit ja Erikoinen suhteellisuusteoria rakentuu kahden peruspos2γ tulaatin varaan: (l2 − γl1 ). (8) ∆t̄ = t̄2 − t̄1 = c 1. Kaikki inertiaalikoordinaatistot ovat samanarvoisia Näin ollen ilmaisimella T havaittu interferenssikuvion fysiikan lakien suhteen. Absoluuttista lepokoordinaasiirtymä on verrannollinen aikojen (7) ja (8) erotukseen tistoa ei ole olemassa. 2γ (γl2 − l1 − l2 + γl1 ) ∆ = ∆t − ∆t̄ = 2. Valon tyhjiönopeus on sama (vakio) kaikissa koordic naatistoissa. 2γ = (γ − 1)(l1 + l2 ). (9) Ensimmäistä postulaattia kutsutaan suhteellisuusperic aatteeksi. Sen mukaan jotkut mitattavat suureet voivat olla Jos T = λ/c on säteilyjakson kesto, jossa λ on säteilyn koordinaatistoriippuvaisia, sen sijaan fysiikka sellaisenaan aallonpituus, on siirtymä on aina sama kaikille havaitsijoille. Suhteellisia, tai havaitsijan koordinaatiston liiketilasta ∆ 2γ S= = (γ − 1)(l1 + l2 ). (10) riippuvaisia, suureita voivat olla mm. T λ Koska maan ratanopeus on merkittävästi alle valonnopeuden (v/c ≪ 1), voidaan γ kehittää sarjaksi 1 v2 γ= p + ... , =1+ 2 c2 1 − (v/c)2 1 • Spatiaaliset etäisyydet. • Aikavälit. (11) • Kiihtyvyydet, koska ne ovat aikariippuvaisia. • Voimat, koska nekin ovat riippuvaisia ajasta. joka katkaistaan toisen asteen termin jälkeen (v 4 /c4 ≈ 0). • Kentät, jotka aiheuttavat voimia. Tällöin l1 + l2 v 2 S≈ . (12) Suhteellisuusperiaatteen mukaisesti muuttumattomia tai λ c2 invariantteja ovat mm. Michelson ja Morleyllä oli l1 +l2 ≈ 22m, λ = 5.5×10−7m ja maan ratanopeus on v ≈ 30km/s. Näillä arvoilla tulee • Fysiikan lainalaisuudet. siirtymäksi yhtälön (12) mukaisesti S = 0.4. Näin suuri siir• Luonnonvakiot. tymä olisi varmasti havaittu jo 1800-luvun mittalaitteilla. 8 Vastaavasti ehdosta 2. tulee u′ = −v ⇒ u = 0, ja • Tapahtumien väliset syy- ja seuraussuhteet. β Näistä kahdesta postulaatista on suorana seurauksena −v = ⇔ β = −δv. (17) δ Lorentz-muunnos, joka korvaa relativistisessa tapauksessa klassisen Galilein koordinaatistomuunnoksen. Nyt yhtälöistä (16) ja (17) saadaan Olkoot kaksi koordinaatistoa A ja A’, joiden akselit ja δ = α. (18) origo ovat päällekkäin hetkellä t = t′ = 0. Koordinaatisto A’ liikkuu nopeudella v koordinaatiston A suhteen xEhdosta 3. saadaan u′ = c ⇔ u = c, jolloin akselin suuntaan. αc − αv α(c − v) αc + β Tällöin koordinaatistosta voidaan siirtyä toiseen = = c= γc + δ γc + α γc + α edellämainitun Lorentz muunnoksen avulla ′ ⇔ c(γc + α) = α(c − v) x = √ x−vt 1−v 2 /c2 y′ = y α(c − v) αv (13) ′ ⇔ γc = (19) −α⇔γ =− 2 z = z c c t−vx/c2 ′ √ t = Huomaa, että δ 6= −γv ⇔ v 2 6= c2 , eli koordinaatistojen 1−v 2 /c2 välinen nopeus ei voi olla valonnopeus! Tässä c on koordinaatistosta riippumaton valon tyhNyt yhtälöiden (17), (18) ja (19) avulla muunnoksiksi jiönopeus c ≈ 3.0 × 108 m/s. (14) saadaan ′ x = αx − αvt = α(x − vt) 3.4 Lorentz-muunnos . (20) ′ 2 t = −αvx/c + αt = α(t − vx/c2 ) Johdetaan Lorentz -muunnos lähtien peruspostulaateista. Olkoot kaksi koordinaatistoa O ja O’. O’ liikkuu O:n Määritellään kerroin α lähettämällä hetkellä t = t′ = 0 suhteen vakionopeudella v x-akselin suuntaan. Hetkellä valorintama, joka etenee joka suuntaan nopeudella c. Valo t = t′ = 0 koordinaatistojen origot ja akselit yhtyvät. kulkee ajassa t matkan r = ct, näinollen Jos joku piste liikkuu O:ssa tasaisella nopeudella, täytyy x2 + y 2 + z 2 = c2 t2 ⇔ x2 + y 2 + z 2 − c2 t2 = 0. sen liikkua tasaisesti myös koordinaatistossa O’. Näinollen muunnoksen koordinaatistojen välillä täytyy olla lineaariKoska valo liikkuu samalla tavalla kaikissa koordinaatisnen: ′ toissa, täytyy olla myös ′ x = x (x, t) = αx + βt , (14) ′ ′ t = t (x, t) = γx + δt (x′ )2 + (y ′ )2 + (z ′ )2 − c2 (t′ )2 = 0. jossa α, β, γ ja δ ovat vakioita. Muunnoksessa (14) Näinollen tätyy olla voimassa on jätetty kirjoittamatta muunnoksessa säilyvät y- ja zx2 + y 2 + z 2 − c2 t2 = A2 {(x′ )2 + (y ′ )2 + (z ′ )2 − c2 (t′ )2 } komponenttien muunnokset (y ′ = y sekä z ′ = z). Muunnoksessa täytyy päteä = A2 {(x′ )2 + y 2 + z 2 − c2 (t′ )2 }, 1. Piste levossa O’:ssa liikkuu nopeudella v O:ssa. missä A on jokin vakio. Tästä seuraa, että 2. Piste levossa O:ssa liikkuu nopeudella −v O’:ssa. ⇔ (1 − A2 )(y 2 + z 2 ) + x2 − c2 t2 = A2 (x′ )2 − c2 (t′ )2 . 3. Valonnopeus c on sama molemmissa koordinaatistois- Tämän perusteella täytyy olla A2 = 1 ja sa. x2 − c2 t2 = (x′ )2 − c2 (t′ )2 . (21) O:ssa nopeudella u = dx/dt liikkuva piste liikkuu O’:ssa Kun sijoitetaan yhtälöön (21) muunnos (20),saadaan nopeudella u′ = dx′ /dt′ . Differentioimalla muunnosyhtälöt 2 (14) saadaan x2 − c2 t2 = α2 (x − vt)2 − c2 α2 t − vx/c2 v v dx′ = αdx + βdt 2 1 + =1 1 − ⇔ α c c dt′ = γdx + δdt ⇔ u′ = αdx + βdt αdx/dt + β dx′ = = ′ dt γdx + δdt γdx/dt + δ αu + β = . γu + δ Ehdosta 1. saadaan u′ = 0 ⇒ u = v, jolloin αv + β = 0 ⇔ β = −αv, δ 6= −γv. γv + δ 1 . α= p 1 − v 2 /c2 (22) Tässä täytyy valita positiivinen juuri neliöidystä lausek(15) keesta, jotta ajan suunta säilyy. Lopulliseksi muunnokseksi tulee siis yhtälön (22) avulla muunnoksesta (20) ′ x = √ x−vt 1−v 2 /c2 y′ = y (16) (23) ′ z = z 2 t′ = √t−vx/c 2 2 1−v /c 9 ja vastaava käänteismuunnos saadaan vaihtamalla muuttujien paikkaa ja korvaamalla v → −v: ′ ′ x = √x +vt 2 /c2 1−v y = y′ . (24) z = z′ ′ ′ 2 t +vx /c t = √ 2 2 y − akselina on ct ajan t sijaan, jolloin valo kulkee 45 asteen kulmassa. ct Valon kulkee 45 asteen kulmassa. ct’ Aika t’ on vakio x’−akselin suuntaisilla suorilla. Aika t on vakio x−akselin suuntaisilla suorilla. cT’ on valon kulkema matka ajassa T’ (x’,t’)−koordinaatistossa. 1−v /c cT’ Usein Lorentz-muunnoksessa käytetään lyhennysmerp kintöjä β = v/c tai γ = 1/ 1 − v 2 /c2 . Edellisessä kappaleessa johdetut muunnosyhtälöt eri inertiaalikoordinaatistojen välillä voidaan kuvata graafisesti käyttäen Minkowskin diagrammaa. Tämä on erittäin hyödyllinen työkalu analysoitaessa relativistisiä efektejä erilaisissa tilanteissa. Minkowskin diagramma on kuvaaja neliulotteisestä aikaavaruusjatkumosta, jossa y-koordinaatti vastaa aika- ja xkoordinaatti kaikkia avaruuskoordinaatteja. Kuvassa 7. on esitetty Minkowskin diagramma. Kuvaajassa on y-akselilla aika normitettuna valonnopeudella ja x-akselilla paikka. Tällä tavalla valo kulkee diagrammassa aina 45◦ kulmassa. Lorentz-muunnetut koordinaattiakselit (’) ovat kiertyneet saman kulman verran kohti 45◦ valon maailmanviivaa. Kun koordinaatistojen välinen nopeus lähestyy valonnopeutta, lähestyvät muunnetut koordinaattiakselit em. valon maailmanviivaa. Kukin Minkowskin diagramman piste vastaa tapahtumaa, eli paikkaa ajassa sekä avaruudessa. Koordinaattistomuunnokset eivät vaikuta itse tapahtumiin, ainoastaan koordinaattiakseleihin, joilta aika ja paikka luetaan. Kuvaajassa tärkeitä ovat samanaikaisuuden viivat, jotka ovat aina (paikka) x-akselin suuntaisia viivoja koordinaatistoissa. Huomaa, että muunnetun koordinaatiston (’) samanaikaisuuden viivat ovat kiertyneet koordinaattiakseleiden tavoin kohti valon maailmanviivaa. Siirryttäessä koordinaatistosta toiseen, sekä aika että paikka muuttuvat Lorentz-muunnoksen mukaisesti! Tutustu kuvaan 7 huolellisesti ja varmista, että ymmärrät, mistä on kysymys. 3.6 Samanaikaisuuden suhteellisuus Aika muuttuu siirryttäessä inertiaalikoordinaatistosta toiseen Lorentz muunnoksella, t′ 6= t. Keskeinen seuraus tästä on se, että toisistaan riippumattomien tapahtumien havaittu järjestys riippuu havaitsijan liiketilasta! Havainnollistetaan tätä kuvan 8. mukaisella ajatuskokeella. Liikkukoon junavaunu relativistisella nopeudella rataa eteenpäin kuvan mukaisesti. Täsmälleen keskellä junavaunua on valonlähde, josta lähtee samanaikaisesti valonsäteet kohti vaunun päätyjä. Junavaunussa olevan havaitsijan mielestä valonsäteet osuvat vaunun päätyihin yhtäaikaa (ylin kuva). Radan varrella olevan havaisijan näkökulmasta (keskimmäinen kuva) valo liikkuu Einsteinin 2. postulaatin mu- cT’ cT 3.5 Lorentz-muunnos ja Minkowskin diagramma Paikka x on vakio ct−akselin suuntaisilla suorilla. Paikka x’ on vakio ct’−akselin suuntaisilla suorilla. x’ x cT on valon kulkema matka ajassa T (x,t)−koordinaatistossa. cT * Galilein transformaatio kiertää ainoastaan aika−akselia t. * Lorentz transformaatio kiertää akseleita ct ja x. Kuva 7: Minkowskin diagrammalla voidaan esittää Lorentz-muunnos graafisesti. Tämänkaltaisten diagrammojen avulla paradoksaalisilta vaikuttavien relativististen tilanteiden selvittely onnistuu helpommin. kaisesti täsmälleen samalla nopeudella kuin junavaunussa olevan havaisijan mittaamana. Radan varrelta katsoen myös junavaunu liikkuu lyhyen matkan sinä aikana, kun valonsäde etenee kohti vaunun päätyjä. Tämän vuoksi valonsäteiltä menee vaunun päätyjen saavuttamiseen hieman eri aika, ja valonsäde osuu ensin vaunun takaosaan ja sitten vasta keulaan (radan varrelta katsottuna). Liikuttaessa junavaunua nopeammin (alin kuva), valo liikkuu edelleen kaikille havaitsijoille samalla vakionopeudella ja vaunu ehtii loitontua havaitsijasta hieman sinä aikana, kun valo matkaa kohti vaunun päitä. Siksi autosta katsottuna etuosaan osuva valonsäde on perillä hieman ennen vaunun takaosaan osuvaa valonsädettä. Eli kaikki kolme havaitsijaa (vaunussa, radan varrella ja nopeammassa autossa) ovat eri mieltä tapahtumien järjestyksestä. Tämä on täysin mahdollista, sillä valonsäteiden osumisella vaunun päätyihin ei ole kausaalista (syy ja seuraus) yhteyttä. Samanaikaisuus on suhteellista! Tarkastellaan tilannetta vielä Minkowski-diagrammojen ja puhtaasti matemaattisten Lorentz-muunnosten avulla. Junavaunut Minkowski diagrammoina Oheisissa kuvissa 9. ja 10. on kuvattuna sama tilanne Minkowski diagrammoina kuin kuvassa 8. Molemmissa diagrammoissa valo kulkee 45◦ asteen kulmassa. Kuvan 9. Minkowski diagramma vastaa kuvan 8. keskimmäistä osaa, jossa (x, ct)-koordinaatisto on sidottu junarataan ja (x′ , ct′ )-koordinaatisto junavaunuun. Junavaunussa samanaikaisesti vaunun päihin osuvien valonsäteiden (tapahtumat A ja B) samanaikaisuuden viiva on kiertynyt kohti valon maailmanviivaa samalla tavalla kuin Lorentz-muunnettu x′ -akseli. Näin ollen (x, ct) koordinaatistossa tapahtumat A (t1 ) ja B (t2 ) eivät ole enää samanaikaiset. Valonsäde osuu ensin vaunun perään (t1 ) 10 Junan koordinaatistossa valon− säteet osuvat vaunun päätyihin yhtäaikaa. ct akse li V al on sä de un a ika− vaun Maahan kiinnitetyssä koordinaa− tistossa valonsäde osuu ensin junan takaosaan ja sen jälkeen etuosaan. c ct’ c radan aika−akseli c c t2 t1 Junaa nopeammin liikkuvassa koordinaatistossa valonsäde osuu ensin junan etuosaan ja sitten takaosaan. c B A t’1 = t’2 x’ c x Kuva 8: Valonlähde relativistisella nopeudella liikkuvassa junavaunussa. Vaunun perä ja sen jälkeen vaunun keulaan (t2 ). Samalla tavalla kuvan 10. Minkowski diagramma vastaa kuvan 8. alimmaista osaa, jossa (x, ct)-koordinaatisto on sidottu radan suhteen liikkuvaan junavaunuun ja (x′ , ct′ )koordinaatisto sitä nopeammin liikkuvaan autoon. Junavaunussa samanaikaisesti vaunun päihin osuvien valonsäteiden (tapahtumat A ja B) samanaikaisuuden viiva on kiertynyt auton koordinaatistossa (x′ , ct′ ) kohti valon maailmanviivaa samalla tavalla kuin Lorentz-muunnettu x′ -akseli. Siksi myös tässä tapauksessa (x′ , ct′ ) koordinaatistossa tapahtumat A (t′1 ) ja B (t′2 ) eivät ole enää samanaikaiset. Valonsäde osuu ensin vaunun perään (t′2 ) ja sen jälkeen vaunun keulaan (t′1 ). Junavaunut Lorentz-muunnoksina Olkoon tapahtuma A valonsäteen osuminen l-pituisen junavaunun takapäähän, vaunun koordinaatistossa (ct1 , x1) = (ct1 , 0). Merkitään tapahtumalla B valonsäteen osumista junavaunun keulaan (ct2 , x2 ) = (ct2 , l). Junan koordinaatistossa siis t1 = t2 . Kuvan 8. keskimmäisessä osassa rata liikkuu x-akselin suunnassa vaunun suhteen nopeudella −v. Tällöin tilannetta voidaan käsitellä Lorentz-muunnosten (23) avulla Lamppu Vaunun keula Kuva 9: Minkowski diagramma valonlähteestä relativistisella nopeudella liikkuvassa junavaunussa (keskimmäinen osio kuvasta 8). (x, ct)-koordinaatisto on kiinnitetty radan varteen, ja (x′ , ct′ ) on tasaisella nopeudella liikkuvan junavaunun koordinaatisto. muunnosten (23) avulla auton koordinaatistossa tapahtumilla on aikaväli ∆t′ = t′1 − t′2 = = c2 t1 − t2 − (x1 − x2 )v/c2 p 1 − v 2 /c2 vl p > 0. 1 − v 2 /c2 Nyt siis t′1 > t′2 ja valonsäde osuu ensin vaunun etuosaan auton koordinaatistosta katsoen. 3.7 Tapahtumien synkronointi Samanaikaisuuden suhteellisuuden suora seuraus on se, että yhdessä inertiaalikoordinaatistossa synkronoidut kellot eivät ole välttämättä synkronoituja toisessa inertiaalikoorinaatistossa. Tämä voidaan ymmärtää kuvien 11. ja 12. avulla. Siir2 2 ryttäessä inertiaalikoordinaatistosta toiseen, aika ja paikt2 + vx2 /c t1 + vx1 /c ja t′2 = p , t′1 = p ka menevät relativistisilla nopeuksilla tavallaan “sekaisin”. 1 − v 2 /c2 1 − v 2 /c2 Kukin eri nopeudella liikkuva inertiaalihavaitsija “siivuttaa” neliulotteista aika-avaruusjatkumoa hieman eri tavaleli radan koordinaatistossa tapahtumilla on aikaväli la. t1 − t2 + (x1 − x2 )v/c2 Minkowski diagrammassa tämä nähdään liikkuvan koor′ ′ ′ p ∆t = t1 − t2 = 2 2 dinaatiston (kuvissa (x′ , ct′ )-koordinaatistot) samanaikai1 − v /c suuden viivojen kiertymisenä paikallaan olevan koordinaavl tiston suhteen. < 0. =− p Sama nähdään myös tarkasteltaessa Lorentzc2 1 − v 2 /c2 muunnoksia (23). Siirryttäessä koordinaatistosta O Nyt siis t′1 < t′2 ja valonsäde osuu ensin vaunun takaosaan. nopeudella v liikkuvaan koordinaatistoon O’ ja piVastaavasti kuvan 8. alimmassa osassa auto liikkuu vau- dettäessä aika t vakiona, on muunnettu aikakoordinaatti nun suhteen nopeudella v x-akselin suuntaan. Lorentz t′ riippuvainen myös paikasta. 11 ct ct akse li vaunun aika−akseli ct’ ct’ V al on auto n sä de aika − Höpö höpö! t’1 x’ x’ t1 = t2 Kaikki kelloni ovat synkronoitu! t’2 x Vaunun perä Lamppu x Vaunun keula Kuva 10: Minkowski diagramma valonlähteestä relativistisella nopeudella liikkuvassa junavaunussa (alimmainen osio kuvasta 8). (x, ct)-koordinaatisto on kiinnitetty junavaunuun, ja (x′ , ct′ ) on tasaisella nopeudella liikkuvan auton koordinaatisto. Kuva 11: Tien varrella, (x, ct)-koordinaatistossa olevan havaitsijan synkronoidut kellot eivät ole synkronoituja relativistisesti liikkuvan autoilijan ((x′ , ct′ )koordinaatisto) näkökulmasta. Tämä johtuu siitä, että (x′ , ct′ )-koordinaatiston samanaikaisuuden viivat ovat kiertyneet (x, ct)-koordinaatiston suhteen. dinaatistoon O’ Lorentz muunnoksen (23) avulla kuten 3.8 Ajan dilataatio t2 − vx/c2 t1 − vx/c2 t2 − t1 Toinen seuraus samanaikaisuuden suhteellisuudesta on ∆t′ = p −p =p 2 2 2 2 1 − v /c 1 − v /c 1 − v 2 /c2 se, että kellot käyvät eri tahtiin eri nopeudella liikkuvissa koordinaatistoissa. ∆t Olkoot kaksi koordinaatistoa O sekä O’, joka liikkuu . (26) = p 1 − v 2 /c2 koordinaatiston O suhteen nopeudella v positiivisen xakselin suuntaan. Hetkellä t = t′ = 0 koordinaatistojen Kun tästä ratkaistaan ∆t ∆t′ :n avulla, saadaan origot yhtyvät. p Tarkastellaan hetkellä t = t′ = 0 synkronoituja kello(27) ∆t = ∆t′ 1 − v 2 /c2 . ja eri koordinaatistoissa samaan aikaan myöhemmin, kuva 13. Koska käsitteet samaan aikaan ja myöhemmin riip- Toisaalta taas käänteismuunnoksesta ∆t′ = t′2 −t′1 saadaan puvat havaisijan liiketilasta, eri inertiaalikoordinaatistoist′ + vx/c2 t′ + vx/c2 t′ − t′1 sa olevien havaitsijoiden mielestä toisessa koordinaatistos∆t = p2 − p1 = p 2 sa oleva havaitsija lukee omassa koordinaatistossa olevaa 1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2 kelloa menneisyydessä. Lorentz-muunnoksesta nähdään, että aikavälit ∆t ja ∆t′ ∆t′ = p . (28) eri koordinaatistojen välillä muuntuvat kuten 1 − v 2 /c2 ∆t . ∆t′ = p 1 − v 2 /c2 Nyt selkeästi (27) on erisuuri kuin (28). Mitä tapahtui?? Eroavuutena näiden kahden tuloksen välillä on se, että aikaa ei ole mitattu samoissa paikoissa, koska x′ riippuu Tätä ilmiötä kutsutaan ajan dilataatioksi. myös ajasta! Jotta tilanne olisi symmetrinen täytyy enTässä yhteydessä kannattaa olla hieman varuillaan ja simmäisessä muunnoksessa myös paikat muuntaa, eli kun tarkkana, että aika muunnetaan samoissa paikoissa. Ajan x′1 = √ −vt21 2 dilataatiolausekkeen soveltaminen sellaisenaan voi joskus 1−v /c , johtaa vääriin lopputuloksiin. x′2 = √ −vt22 2 1−v /c Tarkastellaan edellä mainituissa koordinaatistoissa O ja O’ muuntuvaa aikaväliä lähtien Lorentz-muunnoksesta saadaan aikavälille muunnoksesta (23): (23) ja sen käänteismuunnoksesta (24). Aikaväli ∆t = t2 −t1 muuntuu koordinaatistosta O koort′1 + vx′1 /c2 t′2 + vx′2 /c2 −p ∆t = p 1 − v 2 /c2 1 − v 2 /c2 (25) 12 ct ct’ ct’ ct Sinä vertaat omaa kelloasi minun kellooni menneisyydessä! Eipäs, kun sinä vertaat kelloasi nyt minun kellooni menneisyydessä! Nyt ne kellot ovat kunnolla synkronoitu! Sinun kellosi kulkee hitaammin kuin minun! x’ x’ Meidän kellome ovat nyt synkronoitu! Puhu pukille! x x Kuva 13: Liikkuva kello käy hitaammin. Tämä johtuu siitä, että paikallaan oleva havaisija vertaa kelloaan liikKuva 12: Vastaavasti, jos kellot synkronoidaan autoilijan kuvasta koordinaatistosta katsoen liikkuvaan kelloon menkoordinaatistossa (x′ , ct′ ), ne eivät enää ole synkronoituja neisyydessä! tienvarren (x, ct) koordinaatistossa. t′2 1 − v 2 /c2 − t′1 1 − v 2 /c2 p = 1 − v 2 /c2 p = ∆t′ 1 − v 2 /c2 . Nyt tulokset ovat yhtäpitäviä, kun aikavälit mitataan samoissa paikoissa. Koska aika ja paikka muodostavat kokonaisuuden relativistisissa ongelmissa, kannattaa muuttuvia aikavälejä käsitellä tarkastelemalla tapahtumia joko Lorentz-muunnosten tai Minkowskin diagrammojen kautta, eikä lauseketta (25) mekaanisesti soveltamalla. 3.9 Pituuden kontraktio Myös tässä tapauksessa käänteismuunnosta soveltaen havaitaan samankaltainen symmetria kuin ajan dilataatiota käsiteltäessä edellisessä kappaleessa. Eli yhtälön (29) mekaanisen soveltamisen sijaan on tärkeää, että huomioidaan milloin kappaleiden päiden paikkaa mitataan missäkin koordinaatistossa! Edelleen kannattaa muistaa, että kontraktion havaitsemiseen tarvitaan aikaisemmin määritelty suhteellisuusteoreettinen havaitsija, joka pystyy tekemään mittauksia koordinaatistossa ilman signaaliviivettä. Jos kuvassa 14. sijoitettaisiin kamera ct-akselille, junavaunua ei nähtäisi lyhentyneenä, koska kameraan muodostuu kuva kohteesta siitä heijastuvien valonsäteiden avulla. Kameraan muodostuvan kuvan matemaattinen käsittely ei ole aivan yksioikoista, mutta se on mahdollista. Todellisuudessa relativistinen objekti nähtäisiin kameran avulla kiertyneenä (vääristyneenä), siten että sen takaosaa voitaisiin nähdä enemmän kuin normaalin geometrian mukaan on mahdollista. Kolmas seuraus samanaikaisuuden suhteellisuudesta on fyysisten pituuksien muuttuminen. Kappaleen pituus on sen päiden välinen etäisyys samalla hetkellä. Edelleen, koska samalla hetkellä on riippuvainen havaitsijan liiketilasta, myös pituudet muuntuvat. Olkoot kaksi koordinaatistoa O ja O’, joista O’ liikkuu O:n suhteen nopeudella v positiivisen x-akselin suhteen. 3.10 Inertiaalikoordinaatistojen samanarHetkellä t = t′ = 0 koordinaatistojen origot yhtyvät. voisuus Olkoon kappaleella pituus L′ = x′2 −x′1 lepokoordinaatisErikoisen suhteellisuusteorian ensimmäinen postulaattossaan O’ hetkellä t′ . Tällöin koordinaatistossa O Lorentz- ti asettaa kaikki inertiaalikoordinaatistot samanarvoisiksi. muunnoksia (23) soveltaen sen pituudeksi L havaitaan Siksi aikavälien ja pituuksien muuttuessa erilaisten inertiaalikoordinaatistojen välillä, täytyy muutosten tapahtua x′ − vt′ x′1 − vt′ x′2 − x′1 myös toisinpäin. L = x2 − x1 = p −p = p 1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2 Kuvan 15. relativistisella nopeudella liikkuvassa junavaunussa aikavälit ja pituudet muuntuvat radanvarrelta p L′ ′ havaittuna. Koska vaunuun sidotusta inertiaalikoordinaa2 2 ⇔ L = L 1 − v /c . =p (29) 1 − v 2 /c2 tistosta katsoen muu maailma liikkuu, täytyy vastaavat muutokset tapahtua myös vaunun ulkopuolella vaunusta Huomaa että nyt t1 6= t2 . Relaatiota (29) kutsutaan pikatsoen. tuuden kontraktioiksi tai Lorentz-Fitzgerald-kontraktioksi. Puhtaasti erikoisen suhteellisuusteorian tapauksessa reTilannetta kuvaava Minkowski diagramma on esitetty kulativistiset efektit ovat aina symmetrisiä! vassa 14. 3.11 Nopeuksien muunnos 13 T’ T v L’ L L’ T’ T L’ −v L ct ct’ tit. Esimerkiksi nopeuden x-komponentti muuntuu kuten vau nun et vau nun ta uos a kao s a Kuva 15: Inertiaalikoordinaatistot ovat samanarvoisia, eli relativistiset muutokset ovat symmetrisiä. Radan varrelta havaittavat relativistiset muutokset liikkuvassa vaunussa ovat samat kuin vaunusta havaitut ulkomaailman muutokset. dx′ dx/dt − v γdx − vγdt = = 2) dx dt′ γdt − vγ 1 − (dx/dt)(v/c c2 x’ ⇔ u′x = x v v L ux − v . 1 − vux /c2 Käsittelemällä nopeuden y- ja z-komponentit vastaavasti, saadaan nopeuden muunnokseksi inertiaalikoordinaatistojen O ja O’ välillä ′ ux −v ux = 1−vu √ x /c2 uy 1−v 2 /c2 ′ uy = . (31) 2 1−vu √ x /c 2 /c2 u 1−v ′ z uz = 1−vux /c2 Huomaa, että koordinaatistojen välisen nopeuden ollessa tarpeeksi pieni (v ≪ c), muunnos (31) lähestyy klassista Kuva 14: Liikkuvat kappaleet lyhenevät liikesuunnassa. nopeuksien muunnosta. Tämäkin on seurausta samanaikaisuuden suhteellisuudesta, eli mitattaessa kappaleen päiden paikat samaan aikaan 3.12 Nopeuden suuntakulman muunnos koordinaatistoita (x, ct) ja (x′ , ct′ ) katsoen mittaukset taTarkastellaan sellaista liikettä, jolla on nollasta poikkeapahtuvat eri pisteissä aika-avaruusjatkumossa. va nopeuskomponentti myös koordinaatistojen välistä nopeutta vastaan kohtisuorassa suunnassa (uy 6= 0), edellä esitellyissä koordinaatistoissa O ja O’. Nopeus on paikan derivaatta ajan suhteen: kun derivoiKun kirjoitetaan xy- ja x′ y ′ -tasossa nopeuskomponendaan Lorentz-muunnokset (23) ajan suhteen, saadaan vastit (31) napakoordinaatistossa, voidaan ratkaista nopeuden taava nopeuksien muunnos. Olkoot O ja O’ kaksi koordinaatistoa, joista O’ liik- suuntakulman muunnos. Huomaa, että nopeus on kääntäen verrannollinen aikaan, kuu koordinaatiston O suhteen nopeudella v positiivisen x-akselin suuntaan. Hetkellä t = t′ = 0 koordinaatistojen jolloin pelkkä suuntakulman muuntaminen antaa väärän tuloksen. Aikadilataatio täytyy ottaa huomioon nopeuden origot ja akselit yhtyvät. Olkoot nopeus u = (ux , uy , uz ) koordinaatistossa O ja Lorentz-muunnosten (31) kautta. Kirjoitetaan nopeuden muunnosyhtälöiden (31) x- ja yvastaava nopeus u′ = (u′x , u′y , u′z ) koordinaatistossa O’. komponentit napakoordinaatiston Differentioimalla Lorentz-muunnokset (23) saadaan ′ x = r cos θ dx = γdx − vγdt ′ y = r sin θ dy = dy . (30) ′ dz = dz avulla: ′ dt = γdt − vγ c2 dx ( ′ u cos θ−v ux = u′ cos θ′ = 1−(vu cos θ)/c2 √ Differentiaaleista (30) voidaan laskea nopeuskomponen(32) 1−v 2 /c2 . u sin θ u′y = u′ sin θ′ = 1−(vu cos θ)/c2 14 Jaettaessa nämä nopeuskomponentit toisillaan saadaan p u′y sin θ 1 − v 2 /c2 tan θ′ = ′ = . (33) uz cos θ − v/u Esimerkki: liikkuvan hiukkasen valoemissio Laboratoriokoordinaatiston O suhteen nopeudella v liikkuva hiukkanen emittoi omassa lepokoordinaatistossaan O’ valoa kulmassa θ′ nopeuttaan vastaan. Valonnopeus on molemmissa koordinaatistoissa u = u′ = c. Muunnoksen (31) y-komponentin lausekkeesta napakoordinaatistossa saadaan kulmaksi laboratoriokoordinaatistossa p sin θ′ 1 − v 2 /c2 . sin θ = 1 + v cos θ′ /c Laboratoriossa mitattu suuntakulma on esitetty kuvassa 16. muutamilla nopeuksilla v. Kuvasta nähdään, että hiukkasen nopeuden lähestyessä valonnopeutta, valo pyrkii ohjautumaan etenemissuunnassa olevaan kartioon. Kuva 16: Laboratoriokoordinaatistossa O mitattu emission suuntakulma θ, hiukkasen lepokoordinaatistossa O’ tapahtuvan emission suuntakulman θ′ funktiona. 15 4. Lorentz-Minkowski avaruuden kausaali rakenne Kausaliteetti: tapahtumien välinen syy-seuraus suhde. Kuten jo edellä on useamman kerran todettu, valonnopeus tyhjiössä on suurin mahdollinen nopeus, jolla informaatiota voidaan välittää. Minkowski-diagrammassa (ct, x)-koordinaatisto on normitettu siten, että valonsäteet kulkevat aina 45◦ kulmassa. Lähettämällä valonsäteet Minkowski-diagramman origosta, Lorentz-Minkowski avaruus voidaan jakaa origossa olevan tapahtuman suhteen kolmeen eri kausaaliseen alueeseen kuvan 17 mukaisesti. va ct tapahtumien väliset kausaaliset suhteet ovat kaikille havaitsijoille samat! Toisin sanoen, jos tapahtuma B on seurausta tapahtumasta A, tapahtuu se kaikissa koordinaatistoissa A:n jälkeen! Tarkastellaan tilannetta, jossa hetkellä t = t′ = 0 A:sta lähtee valorintama. Samalla hetkellä nopeudella v liikkuvan koordinaatiston A’ origo on koordinaatiston A origon kanssa päällekkäin. Miten koordinaatistossa A’ oleva havaitsija näkee valorintaman, kuva 18? valorintama n lo Q d sä e va lo ns äd e Absoluuttinen tulevaisuus A S P v Epämääräisyysalue Epämääräisyysalue A’ ns lo va e äd ns R lo va äd e x Absoluuttinen menneisyys Kuva 18: Valorintama havaitsijan A koordinaatistossa. Kuva 17: Laakean Lorentz-Minkowski avaruuden kausaaKoska valonnopeus on kaikille havaitsijoille sama, tulisi liset alueet. koordinaatistossa A’ origossa olevan havaitsijan nähdä itsensä myöskin valorintaman keskellä! Tämä näennäisesti Kuvan origossa oleva tapahtuma P voi olla seurausta ai- paradoksaalinen tilanne voidaan helposti havainnollistaa noastaan tapahtumille, jotka ovat sen absoluuttisessa men- kuvan 19. Minkowski-diagramman avulla. neisyydessä (esim. R). Koordinaatistojen välisestä nopeuserosta johtuen, A’:n Vastaavasti tapahtuma P voi olla syynä ainoastaan sen samanaikaisuuden viivat ovat kiertyneet Minkowskiabsoluuttisessa tulevaisuudessa oleville tapahtumille (esim diagrammassa siten, että myös A’ mittaa olevansa valoQ). Tapahtumalla P ei voi olla minkäänlaista kausaalista kartion keskellä. yhteyttä epämääräisyysalueella oleviin tapahtumiin (esim. Eli A:lla ja A’:lla on samat kausaaliset alueet koordinaaS). tistojen välisistä nopeuksista riippumatta. Kausaalinen raKun sarja kausaalisesti toisiinsa yhteydessä olevia tapah- kenne on Lorentz-invariantti! tumia yhdistetään viivaksi, saadaan maailmanviiva. Tämä voi olla vaikkapa hiukkasen rata ajan funktiona. Huomaa Valoa nopeampi matkustaminen kuitenkin että maailmanviivan täytyy pysyä kaikissa pisValoa nopeampi matkustaminen tai edes informaation teissään poissa epämääräisyysalueelta. välitys ei ole suhteellisuusteorian näkökulmasta mahdollisAbsoluuttinen tulevaisuus muodostaa tapahtuman P ta. Oletetaan kuitenkin hetkeksi, että suhteellisuusteoria suhteen kartion. Aluetta kutsutaankin joskus tulevaisuu- sallisi valoa suuremmat nopeudet ja tarkastellaan mihin se den valokartioksi. Vastaavasti absoluuttisen menneisyyden johtaisi. aluetta kutsutaan menneisyyden valokartioksi. Kuvan 20. Minkowski diagrammassa jousimies pisteessä Koska kausaalisten alueiden rajat määrittää valonsäde, A ampuu valoa nopeamman nuolen pisteeseen B. Tällöin ja koska valonnopeus on kaikille havaitsijoille sama, voi- nuolen maailmanviiva on valonnopeutta loivemmassa kuldaan todeta: massa. Tapahtumia A ja B havainnoivat ampuja (ct, x)Valonnopeuden invariantista luonteesta johtuen, koordinaatistosta, autoilija (ct′ , x′ )-koordinaatistossa ja 16 ct ct ct’ ct’’ ct’ Valoa nopeampi nuoli! va n lo A’ e d sä A lo n e sä d B va ct B x’ ct A ct’’ A B tapahtui ennen A:ta!!? A ct’A = ct’B ct’’ B x’’ A=A’ x A ja B tapahtuivat yhtäaikaa! x’ x Kuva 19: Valorintama Minkowski-diagrammana. Molemmat havaitsijat näkevät itsensä valorintaman keskellä, eri havaitsijat ainoastaan “siivuttavat” aika-avaruutta eri tavalla. Valokartioiden sisällä olevien kausaalisesti toisistaan A B riippuvien tapahtumien järjestys on kaikille havaitsijoille sama. Kuva 20: Valoa nopeampi nuoli ammutaan (A) jousella omenaan (B). Eri nopeuksilla liikkuvat havaitsijat näkevät ′′ ′′ tapahtumat eri järjestyksessä. Sallimalla valoa suuremmat toinen autoilija (ct , x )-koordinaatistossa. Jousimiehen samanaikaisuuden viivat ovat diagrammas- nopeudet voi joissain koordinaatistoissa seuraus edeltää sa vaakatasossa, joten hän havaitsee nuolen lähtevän het- syytä ja kausaliteetti rikkoutua! kellä tA ja osuvan omenaan hetkellä tB . Nuoli osuu omenaan hetkellä tB sen jälkeen kun se on ammuttu hetkellä tistossa junavaunun samanaikaisuuden viivat, jotka ovat tA . kiertyneet kohti valonnopeuden maailmanviivaa, vievät Jousimiehen suhteen liikkuvalla autoilijalla koordinaatissignaalia ajassa taaksepäin radanvarrelta katsottuna! tossa (ct′ , x′ ) on sellainen nopeus, että koordinaatiston saEli ilman signaaliviivettä, lippumies A voi saada manaikaisuuden viivat ovat samassa kulmassa kuin nuolen lähettämänsä viestin ennen sen lähettämistä. Jos lippumaailmanviiva. Näin ollen koordinaatistossa (ct′ , x′ ) nuoli mies A päättää signaalin saatuaan olla lähettämättä sitä, ′ ′ ammutaan ja se osuu maaliinsa samalla hetkellä tA = tB . tai vaikkapa rikkoa laitteen, päädytään mahdottomaan tiKoordinaatistossa (ct′′ , x′′ ) olevan autoilijan samanaikailanteeseen. suuden viivat ovat jyrkemmässä kulmassa, kuin valoa noJoissain tapauksissa on spekuloitu valoa nopeamman peamman nuolen maailmanviiva. Tällöin nuolen maaliin matkustamisen tai kommunikoinnin mahdollisuudesta. ′′ osuminen (tapahtuma B hetkellä tB ) tapahtuu ennen nuoTässä yhteydessä on kehitelty yleiseen suhteellisuusteolen ampumista (tapahtuma A hetkellä t′′A )! Tämä johtaa riaan perustuvia teorioita madonrei’istä, erilaisista aikakausaliteetin rikkoutumiseen, eli tilanteisiin, joissa syy voi avaruuden poimutuksista ja niin edelleen. edeltää seurausta, mikä on mahdotonta. Nämä teoriat eivät poista edellä kuvattua ongelmaa. Kausaliteettirikkomusten salliminen johtaa mahdottoVaikka ylivalonnopeudet tehtäisiin mahdolliseksi kaarevan miin tilanteisiin. Tähän riittää jo valoa nopeampi kommuavaruuden avulla, tarkastelemalla pelkkiä alku- ja lopputinikointi. Havainnollistetaan tätä kuvan 21. ajatuskokeella. loja, edelläolevia vastaavat ajatuskokeet ovat mahdollisia Oletetaan, että hullu tiedemies on keksinyt tavan viestiä ja päädytään samankaltaisiin ongelmiin. ilman signaaliviivettä. Yksi tälläinen viestilaite on sijoitetNäinollen suhteellisuusteorian kannalta ylivalonnopeutuna junaan, joka liikkuu relativistisella nopeudella pitkin det eivät ole missään tilanteessa eivätkä millään keinoilla rataa. Radan varrella on toinen vastaava viestilaite kuvan fysikaalisesti sallittuja, koska ne johtavat aina kausaliteet21. mukaisesti. tirikkomusten mahdollisuuteen. Kun junassa ja radan varrella olevat havaitsijat ovat Näitä ongelmia ei synny, jos valoa suurempia nopeuksia samalla kohdalla, A lähettää lipulla signaalin B:lle. Juei sallita. nan keulassa B lähettää signaalin (välittömästi) junan loppupäähän C:lle. Saatuaan signaalin, C viestittää li4.1 Tapahtumien väliset etäisyydet pulla siitä radan varteen D:lle, joka lähettää signaalin Olkoon meillä kaksi samassa koordinaatistossa olevaa ta(välittömästi) takaisin A:lle. pahtumaa. Tapahtumalla A on koordinaatit (ct1 , x1 ) ja taTarkasteltaessa kuvan 21. tilannetta Minkowskipahtumalla B koordinaatit (ct2 , x2 ) em. koordinaatistossa. diagramman avulla, nähdään että radanvarren koordinaaTapahtumien A ja B välimatka ∆s aika- 17 ct • (∆s)2 = 0 : Aikakoordinaattien erotus on yhtäsuuri kuin spatiaalisten komponenttien. Tällöin tapahtumat ovat valokartion reunalla, ja ne voidaan yhdistää ainoastaan valosignaalilla. Etäisyys on valonkaltainen. ct’ an jun k si i i ke rata C:n l itön Väl ali gna sa stos aati din oor • (∆s)2 < 0 : Aikakoordinaattien erotus on pienempi kuin spatiaalisten komponenttien, ja tapahtumilla ei voi olla kausaalista yhteyttä. Tapahtumat eivät ole samassa valokartiossa, ja etäisyys on avaruudenkaltainen. B:n l i i ke rata A lähettää signaalin B:lle joka lähettää sen välittömästi C:lle. x’ Välitön signaali maan koordinaatistossa C saa signaalin B:ltä ja välittää sen D:lle joka lähettää sen välittömästi takaisin A:lle. 4.2 Invariantti hyperbeli A saa signaalin ennen kuin lähettää sen!!! Tapahtuman P→ etäisyys origosta on (ct, x, y, z) (Lorentz-invariantti) (∆s)2 = c2 t2 − x2 − y 2 − z 2 , ja se määrittelee laakean Lorentz-Minkowski avaruuden ominaisuudet sekä sen “rakenteen”. Laakea tarkoittaa tässä yhteydessä tasaista, eli avaruus ei ole kaareva ja erikoinen suhteellisuusteoria toimii globaalisti. x C Välitön signaali B Välitön signaali D (35) Merkinnöistä Etäisyyden määritelmässä (35) on käytössä kaksi toisistaan poikkeavaa merkkisopimusta: A Kuva 21: Relativistisesti liikkuvassa junassa ja radan varrella on kaksi valoa nopeampaa viestilaitetta. Lippumies A voi saada lähettämänsä signaalin ennen sen lähettämistä, jos valoa nopeampi (tässä tapauksessa välitön) signaalinopeus sallitaan. Tämä johtaa umpikujaan, jota ei voida sallia, joten suhteellisuusteorian mukaan valoa nopeampi kommunikointi (tai matkustaminen) täytyy olla mahdotonta! (∆s)2 = c2 t2 − x2 − y 2 − z 2 (+ − −−) tai (∆s)2 = −c2 t2 + x2 + y 2 + z 2 (− + ++). Kirjallisuudessa käytetään vaihtelevasti molempia merkkisopimuksia. Oleellista tässä on se, että viivaelementissä aika- ja spatiaalikomponenteilla on vastakkaiset merkit, jotta negatiiviset etäisyydet tulevat mahdollisiksi. Edellisessä kappaleessa esitetty etäisyyksien luokittelu avaruuskoordinaatistossa on muuttuu merkkisopimusta vastaavasti, joten on tärkeää ol(∆s)2 = c2 (t1 − t2 )2 − (x1 − x2 )2 = c2 (∆t)2 − (∆x)2 . (34) la selvillä oletetusta järjestelmästä käytettäessä useita eri lähteitä aiheesta! Välimatka (34) on Lorentz invariantti, eli sen suuruus ei Oletetaan että spatiaalikoordinaatit y = z = 0, ja tarriipu käytetystä koordinaatistosta. Toisin sanoen, A:n ja kastellaan etäisyyttä B:n koordinaateille voidaan tehdä mielivaltainen Lorentzmuunnos ja silti etäisyys ∆s säilyy samana. (∆s)2 = c2 t2 − x2 (36) Vastaavaa differentiaalia origosta. Olkoot ds2 = c2 dt2 − dx2 kutsutaan viivaelementin neliöksi. Huomaa, että välimatka ∆s voi olla nolla vaikka A:n ja B:n koordinaatit ovat erisuuret. Myös negatiiviset etäisyydet ovat mahdollisia. Tämä on tärkeä LorentzMinkowski avaruuden perustavaa laatua oleva ominaisuus, joka erottaa sen normaalista Euklidisesta avaruudesta jossa etäisyydet ovat aina positiivisia! Tapahtumien väliset etäisyydet voidaankin luokitella ∆s:n, yhtälö (34), etumerkin avulla: c2 t2 − x2 = a2 (vakio). (37) Tämä on itseasiassa hyperbelin yhtälö; eli niiden pisteiden muodostaman käyrän yhtälö, joiden ajankaltainen (a2 > 0) etäisyys origosta on a2 . Vastaavasti c2 t2 − x2 = −b2 (vakio). (38) muodostaa hyperbelin, joka muodostuu niistä pisteistä joi2 • (∆s) > 0 : Aikakoordinaattien erotus on suurempi den etäisyys origosta on avaruudenkaltainen −b < 0. Nämä käyrät (37) ja (38) ovat asymptoottisia käyrille kuin spatiaalisten komponenttien, jolloin tapahtumat joiden kulmakerroin on yksi (origon kautta kulkevien vavoidaan yhdistää signaalilla ja molemmat pisteet ovat lonsäteiden maailmanviivoille), kuva 22. saman valokartion sisällä. Tällöin etäisyys on ajankaltainen. 2 18 ct ct ct’ a 2 x’ a 2 b 2 x a x 2 b 2 b 2 Kuva 23: Lorentz-muunnetut koordinaattiakselit (ct′ , x′ ) skaalautuvat invarianttien hyperbelien mukaisesti. Kuva 22: Invariantit hyperbelit. Koska hyperbelien yhtälöt tulevat Lorentz-invariantin etäisyyden neliöstä, ovat ne samoja kaikissa koordinaatistoissa. Koordinaatistomuunnoksissa akselit skaalautuvat invariantin hyperbelin mukaisesti, kuva 23. Huomautus: ict Joissain kirjoissa on käytössä merkintätapa, jossa aikakoordinaatti on imaginäärinen. Tämä siksi, että • Imaginaarinen aikakoordinaatti ei toimi kaarevassa avaruudessa, mikä tekee erikoisesta suhteellisuusteoriasta yhteensopimattoman yleisen suhteellisuusteorian kanssa. Eli: ict ⇒ EI! 4.3 Suhteellisuusteorian paradoksit • Aika-avaruusgeometrian käsittely näytää formaalisti Suhteellisuusteorian sovellusalue on jossain määrin arEuklidiselta. kiajattelun ulkopuolella, sillä jokapäiväisessä elämässä ei tarvitse käsitellä valonnopeutta lähellä olevia nopeuksia. • Lorentz-muunnos voidaan esittää (hyperbolisena) Tämä johtaa moniin paradoksaalisen tuntuisiin tilanteisiin. koordinaatiston kiertona. Todellisuudessa suhteellisuusteorian näkökulmasta • Vektorien rinnalla ei tarvita yksimuotoja (yksimuo- mitään ristiriitaa ei ole, vaan kyse on virheellisestä tilanteen tulkinnasta. Yleensä paradoksaaliset tilanteet doista puhutaan myöhemmin). suhteellisuusteoriassa johtuvat: Tämä vanhahtava esitysmuoto on pahasta siksi, että • Samanaikaisuus riippuu havaitsijasta, jolloin tapahtu• Kaikki edellisen listan kohdat; aika-avaruuden geometmat eivät ole(kaan) samanaikaisia kaikkien havaitsiria ei ole Euklidinen, Lorentz-transformaatio ei ole joiden mielestä. koordinaatiston kierto ja yksimuodot ovat hyvin kes• Tilanne on määritelty siten, että esimerkiksi inertiaalikeisessä osassa määriteltäessä vektorilaskennan peruskoordinaatistoehto, tai joku muu perusoletus, rikkouteita Lorentz-Minkowski avaruudessa! tuu. • Periodinen kiertokulma hyperbolisessa koordinaatis• Kausaliteetti on ymmärretty väärin tai se on rikkoonton kierrossa on täysin eri asia kuin asymptoottisesti tunut. käyttäytyvä nopeusparametri. Useimmiten tilanteen pystyy selvittämään piirtämällä • Imaginäärinen aika tekee keskeisen eron Euklidisen Minkowskin aika-avaruus diagramman aiheesta! (+++) Lorentz-Minkowski (-+++) geometrian välillä Käydään vielä esimerkinomaisesti läpi yksi kuuluisimhankalaksi havaita: Euklidisessa geometriassa kahden mista suhteellisuusteorian paradokseista. pisteen välinen etäisyys on nolla vain, jos pisteet ovat samat, kun taas Lorentz-Minkowski avaruudesKaksosparadoksi sa etäisyys on nolla jos, pisteiden välimatka on valonkaltainen! 19 Tervetuloa kotiin! Einstein oli oikeassa, sinä olet minua nuorempi! Kiitoksia, se johtuu siitä että jotain kummallista tapahtui pisteessä C joutuessani kiihdyttämään siirtyäkseni koordinaatistosta toiseen! ct t ka ma Me nom atk an aik a−a k uu Pal sel i ct’ Hmm... aika raketissa kulkee hitaammin kuin Maapallolla, sisareni on minua nuorempi kun hän tulee takaisin! Oho! Mitä tapahtui, aika Maapallolla hyppäsi A:sta B:hen!!?? Minä olen sittenkin nuorempi!? B ct’’ Pal x’ a atk nom va na seli sak ruu Me nom atk a i sel Aika Maapallolla kulkee hitaammin kuin raketissa, sisareni on minua nuorempi kun pääsen takaisin! A Maapallon aika−akseli k a−a aik an atk uum C Me Maapallon avaruusakseli Pal uum Hyvää matkaa! x atk an ava ruu sak seli x’’ Kuva 24: Kaksosparadoksi. Samanikäisistä kaksosista toinen jää maahan ja toinen lähtee relativistisella nopeudella liikkuvalla raketilla avaruusmatkalle. Takaisin tullessaan matkustanut sisar on maahan jäänyttä sisarta nuorempi. Miksi? Koska inertiaalikoordinaatistot ovat samanarvoisia, sisarusten ikäero näyttäisi aiheuttavan ristiriidan. Matkan Minkowski-diagramma on esitetty kuvassa 24. Paradoksin selitys on inertiaalikoordinaatistoehdon rikkoutuminen. Kuvan raketin kääntyessä takaisin pisteessä C, sen täytyy ensin pysähtyä ja kiihdyttää paluumatkalle, jonka ajan se on epäintertiaalikoordinaatistossa. Tätä ei voida tarkalleenottaen käsitellä erikoisen suhteellisuusteorian avulla. Kuitenkin, jos oletetaan että takaisin kääntyminen tapahtuu nopeasti, eli pisteessä C hypätään välittömästi inertiaalikoordinaatistosta (ct′ , x′ ) inertiaalikoordinaatistoon (ct′′ , x′′ ), tilannetta voidaan käsitellä ilman yleistä suhteellisuusteoriaa. Itse meno- ja paluumatkoilla tilanne on, kuten inertiaalikoordinaatistoehdon mukaan täytyy ollakin, symmetrinen. Pisteessä C, hypättäessä inertiaalikoordinaatistosta (ct′ , x′ ) inertiaalikoordinaatistoon (ct′′ , x′′ ), raketin samanaikaisuuden viiva kiertyy välittömästi pisteestä A pisteeseen B. Tällöin raketin matkustaja näkee Maapallolle jääneen sisaren vanhenevan nopeasti! Sisarusten ikäero voidaan laskea yksinkertaisesti aikadilataatiota soveltamalla. 20 5. Vektorilaskenta missä α = 0, 1, 2, 3, eli vektorin komponentit ovat ∆x0 , ∆x1 , ∆x2 , ∆x3 . Vastaavasti samalla vektorilla on kompo5.1 Uudet yksiköt nentit jossain toisessa koordinaatistossa Ō Luodaan uusi yksikköjärjestelmä siten, että valon x → ∆xᾱ . nopeudesta tulee dimensioton, eli c = 1. Tälläistä Ō yksikköjärjestelmää kutsutaan geometrisoiduksi yksikköjärjestelmäksi. Tällöin kaikista yhtälöistä voidaan Tässä vektori ∆x on sama, mutta käytetty koordinaatisjättää valonnopeuden potenssit pois, ja ajan yksiköksi to on O:n sijaan Ō, jolloin vektorin komponentit muuttuvat. Uudet komponentit saadaan vaikkapa Lorentztulee metri. Tällöin valonnopeus on muunnoksen avulla. matka jonka valo kulkee aikayksikössä Esimerkiksi aikakomponentille c= aikayksikkö 3 X v∆x1 ∆x0 −√ = Λ0̄β ∆xβ , ∆x0̄ = √ 1m 1m 1 − v2 1 − v2 = = 1. = β=0 aika jossa valo kulkee metrin 1m Tästä seuraa mm. seuraavat konversioyhtälöt 3 × 108 m/s = 1 1 s = 3 × 108 m , 1 1 m = 3×10 8 s missä {Λ0̄β } ovat neljä numeroa: Λ0̄0 Λ0̄1 Λ0̄2 Λ0̄3 ja esimerkiksi seuraavat johdannaisyksiköt [energia] [liikemäärä] [kiihtyvyys] [voima] = = = = kg kg . m−1 kg/m 1 = √1−v 2 v = − √1−v 2 . = 0 = 0 Yleisesti vektorin komponenttien Lorentz-muunnos voidaan siis kirjoittaa ∆xᾱ = 3 X Λᾱβ ∆xβ , β=0 Näin relativistiset yhtälöt voidaan kirjoittaa yksinkertaisemmin, kun valonnopeutta c ei tarvitse kuljettaa koko missä {Λαβ } on 16 numeroa, jotka muodostavat Lorentzajan mukana. On kuitenkin tärkeää osata siirtyä geometri- muunnosmatriisin. soiduista yksiköistä normaaleihin yksiköihin ja päinvastoin Lorentz-muunnosmatriisit ovat x-akselin suuntaan tarvittaessa. Jatkossa käytetään geometrisoituja yksiköitä γ −vγ 0 0 mikäli toisin ei mainita. −vγ γ 0 0 , (39) Λαβ = 0 0 1 0 5.2 Nelivektorit 0 0 0 1 Nelivektori on esimerkiksi ∆x →(∆t, ∆x, ∆y, ∆z), y-akselin suuntaan O γ 0 α Λβ = −vγ 0 0 1 0 0 −vγ 0 γ 0 0 0 0 1 joka osoittaa yhdestä tapahtumasta toiseen, jolloin sen (40) komponentit ovat näiden tapahtumien koordinaattien erotukset. Huomaa, että ∆t:n kertoimena on tässä valonnopeus (c = 1), koska kaikilla komponenteilla täytyy olla saja z-akselin suuntaan ma yksikkö! Vektorin komponentit transformoituvat, kuten koordiγ 0 0 −vγ naatit koordinaatistomuunnoksessa. Tässä käytetty mer 0 1 0 0 . (41) Λαβ = kintä ’→’ viittaa vektorin komponentteihin O koordinaa 0 0 1 0 O tistossa. −vγ 0 0 γ Merkinnällä ’→’ pyritään korostamaan sitä, että vektori √ O 2 on itsenäinen ja riippumaton geometrinen olio. Sen sijaan Tässä γ = 1/ 1 − v . Otetaan vielä käyttöön Einsteinin summaussääntö, jonvektorin komponentit riippuvat valitusta koordinaatistosta. Eli vektori ∆x voidaan tulkita nuolena tapahtumasta A ka mukaan summataan aina automaattisesti samojen ylätapahtumaan B ja ∆x →(∆t, ∆x, ∆y, ∆z) ovat neljä koor- ja alaindeksinä olevien symbolien yli. Esimerkiksi O dinaatiston valinnasta riippuvaa lukuarvoa! Toinen tapa merkitä sama asia on x → {∆xα } , O ∆xᾱ = 3 X Λᾱβ ∆xβ = Λᾱβ ∆xβ = Λᾱγ ∆xγ , β=0 eli summausindeksin β voi vaihtaa toiseksi (γ) muuttamatta lopputulosta. 21 Huomaa: Kreikkalaiset aakkoset α, β, δ, γ, ... viittaa- Tässä siis Aᾱ 6= Aα ja eᾱ 6= eα , mutta vat aina nelikomponentteihin 0, 1, 2, 3. Latinalaiset aakkoA = Aᾱ eᾱ = Aα eα set i, j, k, ... viittaavat vektorin spatiaalikomponentteihin 1, 2, 3. Toisinsanoen koska vektori geometrisena oliona ei muutu koordinaatistomuunnoksessa. Λᾱβ ∆xβ 6= Λᾱi ∆xi . Tästä voidaan johtaa kantavektoreiden koordinaatistoHuomaa: Yhtälöissä vapaiden indeksien, eli siis nii- muunnokselle den indeksien joiden yli ei summata, täytyy olla samat Λᾱβ Aβ eᾱ = Aα eα ⇔ Aβ Λᾱβ eᾱ = Aα eα yhtäsuuruusmerkin molemmin puolin. Summausindeksit häviävät summatessa. ⇔ Aα Λᾱα eᾱ = Aα eα Yleisesti siis nelivektori on A → {Aα } = A0 , A1 , A2 , A3 , ⇔ eα = Λβ̄α eβ̄ . (43) O Toisin sanoen muunnos (43) antaa koordinaatiston Ō kantavektorit koordinaatiston O kantavektoreiden avulla. Huomaa: Koordinaatiston Ō kantavektorit eβ̄ transforAᾱ = Λᾱβ Aβ . moituvat koordinaatistoon O päinvastaisella tavalla (43) Nelivektorit summautuvat ja ne voidaan kertoa skalaa- kuin vektorin komponentit, joille siis rilla normaalien vektoreiden tapaan: Aβ̄ = Λβ̄α Aα . α α A + B → {A + B } ja sen komponentit koordinaatistossa Ō ovat O Esimerkki Koordinaatisto Ō liikkuu nopeudella v positiivisen xja akselin suuntaan koordinaatiston O suhteen. Yhtälön (39) µA → {µAα } = µA0 , µA1 , µA2 , µA3 . mukaisesti Lorentz-muunnosmatriisi on silloin O γ −vγ 0 0 −vγ γ 0 0 5.3 Kantavektorit , Λαβ = 0 0 1 0 Koordinaatiston määrittelee geometrisesti sen akseleiden 0 0 0 1 suuntaiset yksikkövektorit, eli kantavektorit. Ortonormaalissa koordinaatistossa O kantavektorit ovat √ missä γ = 1/ 1 − v 2 . Nyt nelivektori A →(5, 0, 0, 2), jol O e → (1, 0, 0, 0) 0 O loin sen komponentit koordinaatistossa Ō ovat e1 → (0, 1, 0, 0) O A0̄ = Λ0̄0 A0 + Λ0̄1 A1 + Λ0̄2 A2 + Λ0̄3 A3 e2 → (0, 0, 1, 0) O e3 → (0, 0, 0, 1) = γ5 + (−vγ) · 0 + 0 · 0 + 0 · 0 = 5γ. O = A0 + B 0 , A1 + B 1 , A2 + B 2 , A3 + B 3 Vastaasti koordinaatistossa Ō esimerkiksi ajan kantavektorille e0̄ →(1, 0, 0, 0) ja niin edelleen. Yleisesti e0 6= e0̄ , Vastaavasti muille komponenteille A1̄ = −5vγ O koska kantavektorit määrittelevät eri koordinaatiston. A2̄ = 0 Kantavektoreille (α:nnen kantavektorin β:nnelle kompoA3̄ = 2 nentille) (eα )β = δαβ eli nelivektorilla A on koordinaatistossa Ō komponentit missä δαβ = 1, 0, A →(5γ, −5vγ, 0, 2). α=β . α 6= β Ō Muunnetaan vielä kantavektorit muunnoksen (43) mukaiKantavektoreiden avulla nelivektori A on koordinaatti- sesti: vapaana geometrisena oliona e0 = Λ0̄0 e0̄ + Λ1̄0 e1̄ + Λ2̄0 e2̄ + Λ3̄0 e3̄ A = Aα eα = A0 e0 + A1 e1 + A2 e2 + A3 e3 . (42) = γe0̄ − vγe1̄ , ja vastaavasti muille kantavektoreille 5.4 Kantavektoreiden transformointi Vastaavasti edellämainitulle vektorille (42) koordinaatistossa Ō A = Aᾱ eᾱ . 22 e1 e2 e3 = −vγe0̄ + γe1̄ = e2̄ . = e3̄ Eli kyseessä on kantavektori e0 kappaleen omassa koordinaatistossa. Toisinsanoen, kappaleen lepokoordinaatistossa Ō nelinopeus voidaan kirjoittaa U = e0 → U ᾱ = (1, 0, 0, 0). t e0 e0 Ō e1 Vastaavasti nopeudella v liikkuvan kappaleen nelinopeus saadaan Lorentz transformoimalla nelinopeus U lepokoordinaatistosta Ō liikkuvaan koordinaatistoon O: U β = Λβᾱ U ᾱ → U 0 , U 1 , U 2 , U 3 . x e1 O t e 0 =U Kuva 25: Muunnetut kantavektorit. e1 5.5 Käänteismuunnokset A Lorentz-muunnos on ainoastaan nopeuden funktio Λβ̄α = β̄ Λ α (v), joka muuntaa kantavektorit kuten eα = x Λβ̄α (v)eβ̄ . Koska kanta O saadaan Ō:sta nopeuden v funktiona tapahtuvalla transformaatiolla, täytyy käänteismuunnoksessa nopeuden olla −v, eli eµ̄ = Λνµ̄ (−v)eν , jossa voidaan vapaa indeksi vaihtaa β̄:ksi: eβ̄ = Λνβ̄ (−v)eν , Kuva 26: Kappaleen nelinopeus on sen maailmanviivan tangentti, jonka pituus on yksi aikayksikkö kyseisen kappaleen lepokoordinaatistossa. Nelinopeuden spatiaalikomponentit (α = 1, 2, 3) ovat hyvin läheisesti sidoksissa kappaleen normaaliin (kolmi-) noEli peuteen. Λβ̄α (v)Λνβ̄ (−v) = δ να , Luonnollisestikaan kiihtyvässä liikkeessä olevalla kappaleella ei ole koordinaatistoa, jossa se olisi aina levossa. Voitoisin sanoen käänteismuunnosmatriisi on alkuperäisen daan kuitenkin määritellä kullakin hetkellä koordinaatisto, muunnoksen käänteismatriisi! Eli, vektorille Aβ̄ = joka liikkuu kuten kiihtyvässä liikkeessä oleva kappale kulΛβ̄α (v)Aα on käänteismuunnos lakin hetkellä. Tälläistä koordinaatistoa kutsutaan MCRFΛνβ̄ (−v)Aβ̄ = Λνβ̄ (−v)Λβ̄α (v)Aα = δ να Aα = Aν , koordinaatistoksi (Momentarily Comoving Reference joka muuntaa jo muunnetut komponentit takaisin alku- Frame). Tällöin nelinopeus kiihtyvässä liikkeessä olevalla kappaleella on sen MCRF-koordinaatiston kantavektori peräisiksi. Käänteismuunnosmatriisi on siis alkuperäisen muun- e0 . nosmatriisin käänteismatriisi. Käytännössä Lorentzmuunnosmatriisin käänteismatriisi saadaan vaihtamalla 5.7 Neliliikemäärä (-impulssi) Kappaleen neliliikemäärä määritellään P = m0 U, missä nopeuden v etumerkkiä, jolloin muunnetut koordinaam 0 on kappaleen massa sen omassa koordinaatistossa (letit palaavat takaisin alkuperäisiksi käänteismuunnoksen pomassa). Eli kappaleeseen sidotussa lepokoordinaatistosjälkeen. sa O neliliikemäärä on ⇒ eα = Λβ̄α (v)eβ̄ = Λβ̄α (v)Λνβ̄ (−v)eν = δ να eν . 5.6 Nelinopeus P = m0 U = m0 e0 →(m0 , 0, 0, 0). Nelinopeus U on kappaleen maailmanviivan tangentti, O O jonka pituus on yksi aikayksikkö kyseisen kappaleen lepoVastaavasti kappaleen suhteen liikkuvassa koordinaatistoskoordinaatistossa. Tasaisesti liikkuvan kappaleen koordinaatistossa nelino- sa Ō on neliliikemäärä peus on aika-akselin suuntainen ja aikayksikön pituinen. P = m0 U →(P 0 = E, P 1 , P 2 , P 3 ), Ō 23 Epärelativistisella rajalla säilymislaki (44) pelkistyy missä aikakomponentti P 0 vastaa kappaleen kokonaisenergiaa E ja spatiaalikomponentit P i lineaarista liikemäärää. klassisiksi energian ja liikemäärän säilymislaeiksi. Energian säilymisessä täytyy kuitenkin ottaa mukaan kappaleiden leEsimerkki pomassat. Kappale, jonka lepomassa on m0 liikkuu nopeudella v Kuitenkin, kuten kurssin alkupuolella on opittu, x-akselin suuntaisesti O-koordinaatistossa. Lasketaan sen käsitteet “ennen” ja “jälkeen” riippuvat havaitsijan liiketinelinopeuden ja neliliikemäärän komponentit. lasta. Yksittäiset nelinopeudet voivat siten riippua havaitLepokoordinaatistossaan Ō ajan kantavektori on e0̄ , jol- sijasta, mutta niiden summa on vakio kaikissa koordinaaloin nelinopeus U = e0̄ ja neliliikemäärä P = mU. Nelino- tistoissa. peuden komponenteille Määritellään hyvin käyttökelpoinen koordinaatisto. CMkoordinaatisto (Center of Momentum), joka on inertiaaliU α = Λαβ̄ (e0̄ )β̄ = Λα0̄ , koordinaatisto, jossa X jolloin vastaavasti neliliikemäärälle P α = m0 Λα0̄ . Eli neliP(i) → (Etotal , 0, 0, 0). CM nopeudella on komponentit i U0 U1 U2 U3 = = = = (1 − v 2 )−1/2 v(1 − v 2 )−1/2 0 0 5.9 Nelivektoreiden sisätulo Tästä eteenpäin viivalementin neliössä ja sisätulossa käytetään merkkisopimusta (-+++), jolloin vektorin suuruus on ja vastaavasti neliliikemäärällä P0 P1 P2 P3 = = = = A2 = −(A0 )2 + (A1 )2 + (A2 )2 + (A3 )2 . m0 (1 − v 2 )−1/2 m0 v(1 − v 2 )−1/2 . 0 0 Nyt on voimassa kaikissa koordinaatistoissa O ja Ō −(A0 )2 + (A1 )2 + (A2 )2 + (A3 )2 = −(A0̄ )2 + (A1̄ )2 + (A2̄ )2 + (A3̄ )2 , Pienillä nopeuksilla v ≪ c, saadaan {U i } = (v, 0, 0), mistä tulee nimitys nelinopeus. Vastaavasti pienillä nopeuksilla sillä vektorin suuruus ei riipu käytetystä koordinaatistosneliliikemäärälle {P i } = (m0 v, 0, 0) ja kappaleen energialle ta. Vektorit voidaan luokitella suuruutensa A2 mukaisesti kuten tapahtumien välimatkat ∆s2 : 1 0 2 −1/2 2 E ≡ P = m0 (1 − v ) ≈ m0 + m0 v . 2 • A2 > 0, A on avaruudenkaltainen vektori. Toisin sanoen kappaleen energia on pienillä nopeuksilla (v ≪ c) sen massaa vastaavan energian ja liike-energian summa. 5.8 Neliliikemäärän säilymislaki Galilein ja Newtonin klassisessa mekaniikassa • Energia säilyy. • Liikemäärä säilyy. • A2 < 0, A on ajankaltainen vektori. • A2 = 0, A on valonkaltainen vektori (null vector ). Tässä on tärkeää huomata, että valonkaltainen vektori (null vector ) EI ole nollavektori, toisinsanoen Aα 6= 0, ainoastaan A2 = 0. Koordinaatistossa O kahden nelivektorin A ja B sisätulo on A · B = −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 . Vastaavasti erikoisessa suhteellisuusteoriassa neli-impulssi Myös sisätulo A · B on vektorin suuruuden tavoin koordisäilyy kokonaisuutena, jossa siis aikakomponentit vastaa- naatistosta riippumaton, eli invariantti. vat energiaa ja spatiaalikomponentit klassista liikemäärää. Kantavektoreille eα Määritellään relativistinen neliliikemäärän säilymislaki: e0 · e0 = −1 Neliliikemäärä P säilyy, eli useampien kappaleiden vuoe1 · e1 = e2 · e2 = e3 · e3 = 1 rovaikuttaessa kokonaisneliliikemäärä eα · eβ = 0 jos α 6= β X P≡ Pi (44) Nämä kantavektorit muodostava siis ortonormaalin kankaikki nan, jossa kantavektorit ovat kohtisuorassa toisiaan vaskappaleet taan ja normalisoitu yksikkövektoreiksi. (i) Yksikkövektoreiden sisätulot voidaan kirjoittaa lyhyesti eα · eβ = ηαβ , missä on sama ennen ja jälkeen vuorovaikutuksen. Tämä on tärkeä säilymislaki etenkin hiukkasten kinemaα 6= β 0, tiikkaa tutkittaessa, ja sen paikkaansapitävyyttä on testat−1, α = β = 0 , ηαβ = tu paljon. 1, α=β 24 tai toisin ilmaistuna Tarkastellaan aikaa t laboratoriokoordinaatistossa sekä sen suhteen liikkuvan kappaleen lepokoordinaatistossa. η00 = −1, η11 = η22 = η33 = 1 . Olkoon kappale laboratoriokoordinaatiston pisteessä ηαβ = 0, josα 6= β x, josta se siirtyy infinitesimaalisesti siirroksen dx = Edellä esitelty viivaelementin merkkikonventio on siis itsea- (dt, dx, dy, dz) verran. Siirroksen suuruus on siten siassa lähtöisin ηαβ :n diagonaalikomponenttien merkeistä. ds2 ≡ dx · dx = −dt2 + dx2 + dy 2 + dz 2 . Itseasiassa ηαβ on vektorilaskennassa hyvin keskeisellä sijalla oleva metrinen tensori, joka määrittelee sisätulon Ajankaltaiselle siirrokselle tämä on negatiivinen. Kappaja sen kuinka kahden pisteen välinen etäisyys lasketaan. leen lepokoordinaatistossa paikka ei muutu, joten dx = Tämä taas määrittelee avaruuden “rakenteen”. dy = dz = 0. Siksi Metrisen tensorin avulla edellä ollut sisätulo voidaan kirjoittaa ds2 = −dt2 = −dτ 2 , (45) A · B = −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 missä τ on kappaleen ominaisaika, ts. aika lepokoordinaatistossa. Kappaleen liikkuessa nopeudella v laboratorio= A B ηαβ . koordinaatistossa, voidaan ominaisajalle kirjoittaa p Esimerkki dτ 2 = −ds2 ⇔ dτ = dt2 − dx2 − dy 2 − dz 2 Myös koordinaatistossa Ō sisätulo eᾱ · eβ̄ = ηᾱβ̄ , ja e0̄ · r e1̄ = 0, kuva 27. p dx2 + dy 2 + dz 2 ⇔ dτ = dt 1 − = dt 1 − v 2 . 2 dt t Eli ominaisajan ja laboratoriokoordinaatiston ajan välinen relaatio on p dt dτ = dt 1 − v 2 = . (46) γ α β e0 Jos tämä integroidaan puolittain, saadaan aikaväleille φ φ τ2 − τ1 = e1 x Zt2 t1 dt p 1 − v2 . Vielä, jos oletetaan koordinaatistojen välinen nopeus vakioksi, on p τ2 − τ1 = (t2 − t1 ) 1 − v 2 , mikä on käytännössä ajan dilataation lauseke. Tästä nähdään myös, että tapahtumien välinen ominaisaika on Kuva 27: Kantavektorit e0̄ ja e1̄ koordinaatistossa O. verrannollinen niiden välisen maailmanviivan pituuteen. Edelleen, koska ds2 on invariantti, voidaan ominaisajalle Koordinaatistoon piirretyt kantavektorit eivät näytä ole- kirjoittaa van kohtisuorassa, kuitenkin niiden sisätulo on nolla! Tässä dτ 2 = −dx · dx, taas nähdään, että jokapäiväisen Euklidiseen avaruuteen nähdään, että vektori dx/dτ , missä siis dτ = harjaantuneen intuition käyttäminen Lorentz-Minkowski josta √ −dx · dx, on tangentti maailmanviivalle. Vektorin suuavaruudessa voi johtaa harhaan. ruus on Vektorit ovat Lorentz-Minkowski avaruudessa ortogodx · dx dx dx = −1, · = naalisia, jos niiden kulmat 45◦ kulmaan nähden ovat sadτ dτ (dτ )2 mat. Tästä nähdään myös, että valon maailmanviivan tanjoka on normaaleissa yksiköissä valonnopeuden neliö. Toigentti on kohtisuorassa itse itseään vastaan! sinsanoen dx/dτ on ajankaltainen vektori, jonka suuruus on −1 ja joka on tangentti maailmanviivalle. Esimerkki Kappaleen MCRF koordinaatistossa siirrosvektorilla dx Kappaleen nelinopeus U on ajan kantavektori sen omassa lepokoordinaatistossa (MCRF), joten U·U = −1. Tämä on komponentit pitää paikkansa sisätulon invarianssin nojalla kaikissa koor(dt, 0, 0, 0), dx → dinaatistoissa! Toisin sanoen aina on MCRF dτ = dt U2 = U · U = U α U β ηαβ = −U 0 U 0 + U 1 U 1 + U 2 U 2 + U 3 U 3 = −1. joten 5.10 Ominaisaika 25 dx → (1, 0, 0, 0) dτ MCRF Klassisessa dynamiikassa voima f määritellään liikeyhtälön dx = (e0 )MCRF . dp dτ f= dt Nämä ovat edellä jo esitellyn nelinopeuden ominaisuuksia, eli nelinopeus on paikan ominaisaikaderivaatta avulla. Vastaava neliyhtälö on tai U= dx . dτ F= (47) dP dt dP dP = =γ . dτ dτ dt dt (49) Liikkuvassa koordinaatistossa O neliliikemäärällä on komponentit Esimerkki: Lepomassa ja liikemassa P →(E, p1 , p2 , p3 ), Tarkastellaan nopeudella v liikkuvan kappaleen massaa O laboratoriokoordinaatistossa O sekä kappaleeseen sidotusjoten nelivoiman spatiaalikomponenteille sa lepokoordinaatistossa Ō. Lepokoordinaatistossa Ō kappaleen massa on tietenkin dpi i = γf i F = γ m0 (lepomassa). Vastaavasti neliliikemäärän komponentit dt ovat ja aikakomponentille P → {U α } = (m0 , 0, 0, 0). Ō dt d dm F0 = (m0 γ) = γ . Kun tämä neliliikemäärä Lorentz-muunnetaan laboratoriodτ dt dt koordinaatistoon O saadaan komponenteille Toisinsanoen, nelivoiman aikakomponentti on sidoksissa α α β massan muutokseen ajan funktiona. Yleensä massa oleteP → U = Λ βU = m0 γ(1, vx , vy , vz ) O taan aina vakioksi, jolloin aikakomponentti on nolla. Eli nelivoiman komponentit ovat koordinaatistossa O = (E ≡ m, γpx , γpy , γpz ). (48) dm i (50) ,f . F→γ Nyt voidaan assosioida laboratoriokoordinaatistossa liikO dt kuvan kappaleen kokonaisenergia E vastaavaan (liike)massaan m. Neliliikemäärän aikakomponenteista (48) Esimerkki: Lepomassan vakioisuus lähtien voidaan kirjoittaa liikemassan ja lepomassan Kun lähdetään liikkeelle neliliikeyhtälöstä (49), on väliseksi relaatioksi dP dU d dm0 m0 F= = (m0 U) = U + m0 . m = m0 γ = √ . 2 dτ dτ dτ dτ 1−v 5.11 Nelikiihtyvyys ja liikeyhtälö Tarkastellaan nelinopeuden U ominaisaikaderivaattaa d2 x dU = dτ dτ 2 differentioimalla nelinopeuden neliö U·U⇒ dU d (U · U) = 2U · . dτ dτ Kun tästä otetaan puolittain sisätulo nelinopeuden U kanssa, saadaan dU dm0 ·U U + m0 F·U= dτ dτ dm0 dU U · U + m0 U · . dτ dτ Koska U · U = −1 ja U · (dU/dτ ) = 0, saadaan = F·U =− dm0 . dτ Koska nelinopeuden sisätulo U · U = −1 on aina vakio, Kappaleen lepomassa on siten vakio, mikäli nelivoima on täytyy olla kohtisuorassa hiukkasen maailmanviivaa vastaan. dU d (U · U) = 2U · = 0. dτ dτ Esimerkki: Massan ja energian vastaavuus Tarkastellaan tapausta, jossa lepomassa m0 on vakio, eli Toisin sanoen nelinopeus on aina nelikiihtyvyyttä vastaan kohtisuorassa. Koska MCRF:ssä nelinopeudella U on ai- F · U = 0. Nyt F i = γf i ja F 0 = γ(dm/dt). Näinollen noastaan aikakomponentti, nelinopeuden ja nelikiihtyvyydm den kohtisuoruus tarkoittaa, että = γf j U i ηij . F · U = 0 ⇔ U 0γ dt dU Koska nelinopeuden komponentit ovat lepokoordinaatis→ (0, A1 , A2 , A3 ). dτ MCRF tossa U → (1, 0, 0, 0) ja liikkuvassa koordinaatistossa MCRF Kutsutaan tätä nelivektoria nelikiihtyyvydeksi, jolle A= U → γ(1, vx , vy , vz ), on O dU ⇔ U · A = 0. dτ γ2 26 dm dm = γ 2 f j v j ηij = γ 2 f · v ⇔ = f · v. dt dt (51) Tästä seuraa myös se, että ei ole olemassa sellaista ykKun hiukkanen liikkuu voiman f vaikutuksesta matkan dr, tehty työ on f · dr, joka on toisaalta hiukkasen saama ener- sikkövektoria e0 , joka olisi tangentti valon maailmanviivalgialisä dE. Näinollen le. Tangenttivektori voidaan kyllä määrittää, mutta se ei voi olla yksikkövektori. dE dr dm Neliliikemäärä ei ole yksikkövektori, vaan se antaa enerdE = f · dr ⇔ =f· =f ·v = dt dt dt gian ja liikemäärän valitussa koordinaatistossa. Jos xyhtälön (51) nojalla. Kun tämä integroidaan saadaan m = akselia pitkin liikkuvalla fotonilla on jossain koordinaatis√ E + vakio. Eli energia E = m = γm0 = m0 / 1 − v 2 ja tossa energia E, niin kyseisessä koordinaatistossa sen neli0 kappaleen energia on sen liikemassa. Olkoon kappaleen le- nopeuden aikakomponentti on P = E. Koska liike tapah2 3 pokoordinaatistossa E0 = m0 , eli kappaleen lepomassaan tuu x-akselilla, täytyy olla P = P = 0. Jotta vektori olisi 1 liittyy energia. Toisaalta myös käänteisesti: energiaan liit- valonkaltainen, täytyy olla P = E, eli tyy massa, johon myös gravitaatio vaikuttaa! P · P = −E 2 + E 2 = 0. Kokonaisenergian E ja lepoenergian E0 erotus on kappaleen kineettinen energia Eli fotonien liikemäärä vastaa aina sen energiaa! Kvanttimekaniikasta tiedetään, että fotonin energia on T = E − E0 = m − m0 = (γ − 1)m0 . E = hν, missä h = 6.6256 × 10−34 Js on Planckin vakio, ja ν on fotonin taajuus. Tarkastelemalla fotonin energian Lorentz-muunnosta voidaan johtaa relativistinen DopplerEsimerkki: Energia ja liikemäärä Tarkastellaan kappaletta, jonka neliliikemäärä on P. siirtymä fotoneille. Tarkastellaan laboratoriokoordinaatistossa O positiiviTällöin neliliikemäärän neliölle P · P = m20 U · U = −m20 . sen x-akselin suuntaan liikkuvaa fotonia, jonka taajuus on Toisaalta ν. Tällöin laboratoriokoordinaatiston x-akselia pitkin postitiiviseen suuntaan nopeudella v liikkuvassa koordinaatisP · P = −E 2 + (P 1 )2 + (P 2 )2 + (P 3 )2 , tossa Ō sillä on energia Ē = P 0̄ sekä taajuus ν̄. Tällöin jolloin kappaleen kokonaisenergian täytyy olla neliliikemäärille koordinaatistoissa O ja Ō voidaan lausua E 2 = m20 + 3 X P 0̄ = Λ0̄α P α , (P i )2 . jolloin i=1 P 1v hν hνv E −√ = √ −√ = hν̄. Ē = √ Esimerkki: Liikkuva havaitsija 2 2 2 1−v 1−v 1−v 1 − v2 Olkoot kappaleella neliliikemäärä P ja liikkukoon havaitsija nelinopeudella UO . Tällöin Tästä saadaan fotonin taajuuksien suhteeksi koordinaatistoissa O ja Ō P · UO = P · e0 , r 1−v 1−v ν̄ = , ⇒ = √ missä e0 on havaitsijan koordinaatiston O ajan kantavekν 1+v 1 − v2 tori. Samassa koordinaatistossa kappaleen neliliikemäärällä mikä on siis relativistisen Doppler siirtymän lauseke. Huoon komponentit maa, että tässä yhteydessä oletettiin että fotoni ja laboP →(E, P 1 , P 2 , P 3 ), ratorikoordinaatiston O suhteen liikkuva koordinaatisto Ō O liikkuvat samaan suuntaan. Jos koordinaatistolla Ō on nojoten peuskomponentteja fotonin liikesuuntaa vastaan, Doppler−P · UO = E. siirtymän lauseke muuttuu hieman. Kuten aiemmin on opittu, hiukkasen neliliikemäärän Kappaleen energia E havaitsijan O suhteen voidaan laskea missä tahansa koordinaatistossa skalaaritulon P · UO neliöstä saadaan sen lepomassa. Koska fotonin neliliikemäärän neliön täytyy olla nolla, jotta se liikkuisi vaavulla. lon kaltaisia geodeesejä pitkin, on fotonin lepomassa välttämättä nolla. Eli fotonille 5.12 Fotonit ja massattomat kappaleet Fotoneille ei ole määritelty nelinopeutta! Fotonit liikkum20 = −P · P = 0. vat valonkaltaisilla suorilla, joten valolle Tämä pätee fotonien lisäksi myös kaikille muille massattodx · dx = 0. mille hiukkasille. Vain lepomassattomat kappaleet voivat kulkea valonTästä ja ominaisajan lausekkeesta (45) nähdään, että dτ = nopeudella, koska massalliselta kappaleelta valonnopeuden 0, ja nelinopeutta ei voida määritellä. Käytännössä tämä saavuttamiseen vaaditaan ääretön energia. tarkoittaa sitä, että ei ole mahdollista valita sellaista koorEli valonnopeudella liikkuvalle kappaleelle dinaatistoa, jonka suhteen valo olisi levossa. Näin ollen myöskään MCRF-koordinaatistoa ei valon tapauksessa ole olemassa. 27 P1 = 1, P0 6. Tensorit kun taas m0 lepomassaiselle kappaleelle s m2 P1 2 P · P = −m0 , ja 0 = 1 − < 1. P (P 0 )2 6.1 Metrinen tensori Olemme jo tavanneet yhden tensorin, eli metrisen tensorin, joka määrittelee kahden nelivektorin välisen sisätulon. Olkoot nelivektorit A ja B kannassa {eα } koordinaatisHuomaa! Kappaleelle, jolle m 6= 0 voidaan aina tossa O: määrittää MCRF-koordinaatisto (inertiaalikoordinaatisto, A = Aα eα , B = B β eβ . jossa se on levossa), mutta fotonilla ja muilla massattomilla kappaleilla ei ole olemassa lepokoordinaatistoa! Näiden vektoreiden välinen skalaaritulo on A · B = (Aα eα ) · (B β eβ ) = Aα B β (eα · eβ ) = Aα B β ηαβ . Tämä on sama asia kirjoitettuna koordinaatistosta riippumattomalla tavalla kuin −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 . Tässä luvut ηαβ ovat metrisen tensorin komponentit ! Metriikka antaa “säännön” siitä, kuinka kahdesta vektorista saadaan luku. 0 Tensori tyyppiä (N ) on lineaarinen N :n vektorin funktio, joka palauttaa reaaliluvun. Esimerkiksi alussa esitelty metrinen tensori ηαβ on (02 ) tensori, joka ottaa kaksi vektoria argumenteikseen ja palauttaa reaaliluvun. Merkinnät Aα B β ηαβ = Aα Bβ = A · B = η(A, B) ovat ekvivalentteja. Tensorien lineaarisuus tarkoittaa sitä, että (α, β ∈ ℜ) (αA) · B = α(A · B) (A + B) · C = A · C + B · C tai A · (βB) = A · (B + C) = β(A · B) A·B+A·C Symbolilla ηαβ merkitään laakean Lorentz-Minkowski avaruuden metristä tensoria. Laakea avaruus tarkoittaa sitä, että inertiaalikoordinaatistoehto on voimassa. Yleisesti metristä tensoria merkitään gαβ = g( , ), eli sisätulo A · B = g(A, B) = Aα B β gαβ ∈ ℜ. Lineaarisuus vastaavasti tarkoittaa sitä, että g(αA + βB, C) = αg(A, C) + βg(B, C). Huomautus! Tensorit ovat invariantteja koordinaatistomuunnosten suhteen! Eli tensori on itse vektoreiden, koordinaatistosta ja yksittäisistä komponenteista riippumattomien olentojen funktio. Huomautus! Paikan funktio f (t, x, y, z) on reaaliluvun palauttava funktio, jonka argumentteina ei ole vektoreita. Funktio on siten (00 )-tensori. Huomatus: Funktion käsite Merkinnässä y = f (x) 28 = A0 p0 + A1 p1 + A2 p2 + A3 p3 • y on reaaliluku. ovat ekvivalentteja. Huomaa, että viimeisessä muodossa kaikkien komponenttien edessä on ’+’-merkit, toisin kuin • f ( ) on “sääntö“ (mapping) reaaliluvusta toiseen reaa- kahden vektorin välisessä sisätulossa! lilukuun. Operaatio Aα pα on vektorin A ja yksimuodon p̃ kontNämä ovat kolme eri asiaa. Vastaavasti tensoreiden tapauk- raktio (contraction), joka voidaan suorittaa minkä tahansa vektorin ja yksimuodon kanssa ilman muita tensoreita. sessa Yksimuodon p̃ komponentit Lorentz-muunnetussa kan• A ja B ovat nelivektoreita. nassa {eβ̄ } ovat • A · B on reaaliluku. pβ̄ ≡ p̃(eβ̄ ) = p̃(Λαβ̄ eα ) = Λαβ̄ p̃(eα ) = Λαβ̄ pα . • g( , ) on “sääntö“, joka liittää vektorit A, B sekä reKun verrataan tätä kantavektoreiden transformointiin aaliluvun A · B toisiinsa! • x on reaaliluku. Tensorin komponentit Samoin kuin nelivektoreilla, myös tensoreilla on komponentit: 0 (N ) tensorin komponentit koordinaatistossa O ovat sen arvot, kun tensorin argumentteina ovat koordinaatiston O kantavektorit {eα }. Esimerkki Metrisen tensorin komponentit koordinaatistossa O ovat g(eα , eβ ) = eα · eβ = ηαβ . 6.2 (01)-tensorit: yksimuodot (one-form) Tyypin (01 )-tensorit ovat erikoisasemassa, sillä ne muodostavat normaalien nelivektoreiden rinnalle duaalisen kannan. Duaalisella kannalla tarkoitetaan rinnakkaista vektoriavaruutta, jossa jokaista vektoria vastaa yksikäsitteisesti (01 )-tensori ja päinvastoin. Siksi niillä on oma nimensä, eli yksimuoto. Joissain vanhemmissa lähteissä yksimuotoja kutsutaan kovarianteiksi vektoreiksi. Englannin kielellä yksimuotoja kutsutaan: covector, covariant vector tai one-form. Merkitään yksimuotoa aaltoviivalla p̃, ja koska kyseessä on (01 ) tensori, ottaa yksimuoto argumentikseen yhden vektorin ja palauttaa reaaliluvun. Eli p̃(A) ∈ ℜ. Olkoot q̃ toinen yksimuoto, tällöin tensorien laskusäännöt pätevät ja kun s̃ = p̃ + q̃ , r̃ = αp̃ on s̃(A) = r̃(A) = p̃(A) + q̃(A) . αp̃(A) Yksimuodot täyttävät vektoriavaruuden määritelmän, niinpä ne muodostavat normaalien nelivektoreiden rinnalle edellä mainitun duaalisen vektoriavaruuden. Yksimuotojen komponentit muodostetaan samalla tavalla kuin tensoreidenkin komponentit, eli eβ̄ = Λαβ̄ eα , nähdään, että yksimuotojen komponentit transformoituvat kuten kantavektorit, ja vastakkaisella tavalla kuin vektorien komponentit. On helppo osoittaa, että kontraktio Aα pα on koordinaatistosta riippumaton: Aᾱ pᾱ = Λᾱβ Aβ (Λµᾱ pµ ) = Λᾱβ Λµᾱ Aβ pµ = δ µβ Aβ pµ = Aβ pβ . Tämä on suoraaan rinnastettavissa siihen, että vektori A = Aα eα on koordinaatistosta riippumaton geometrinen olio. 6.3 Kantayksimuodot Nelivektoreiden tapaan neljä lineaarisesti riippumatonta yksimuotoa virittävät kannan. Mistä tahansa vektorikannasta voidaan määritellä vastaava yksimuotokanta {ω̃α , α = 0, ...3}, joka on duaali vektorikannalle {eα }. Eli yksimuoto voidaan kirjoittaa kantayksimuotojen avulla kuten p̃ = pα ω̃ α , missä ω̃ α ovat neljä eri kantayksimuotoa. Kun tarkastellaan vektorin A ja yksimuodon p̃ kontraktiota p̃(A) = pα ω̃α (A) = pα ω̃ α (Aβ eβ ) = pα Aβ ω̃ α (eβ ) nähdään, että ⇒ ω̃ α (eβ ) = δ αβ . (52) Kantayksimuodoilla on koordinaatistossa O komponentit ω̃ 0 → (1, 0, 0, 0) pα ≡ p̃(eα ). ω̃ 1 ω̃ 2 ω̃ 3 O → (0, 1, 0, 0) O → (0, 0, 1, 0) O → (0, 0, 0, 1) O Huomautus! Relaatio (52) määrittää kantavektoreiden {eα } avulla Komponenttimuodossa yksimuodon indeksi on alhaalla, yksikäsitteisen yksimuotokannan {ω̃α }. kun taas vektoreilla indeksi on ylhäällä. Eli seuraavat merkinnät Huomautus! p̃(A) = p̃(Aα eα ) = Aα p̃(eα ) = Aα pα 29 Vaikka sekä vektori että yksimuoto voidaan kuvata neljällä eri komponentilla, on niillä täysin erilainen geometrinen merkitys! Kantayksimuodot transformoituvat kuten vektoreiden komponentit: ω̃ᾱ = Λᾱβ ω̃ β . τ=2 t U τ=1 Yksimuodon geometrinen merkitys Kun vektori mielletään yleensä nuoleksi, yksimuodolla on vastaava toisenlainen geometrinen merkitys. Yksimuoto ei ole nuoli. Matemaattisesti yksimuoto kuvaa vektorit luvuiksi. Yksimuoto on sarja pintoja, ja sen suuruus riippuu pintojen välimatkoista, kuva 28. φ(τ)=φ[ t (τ), x (τ), y (τ), z (τ)] τ=0 x Kuva 29: Ominaisajalla τ parametrisoitu maailmanviiva. (a) (b) (c) Toisinsanoen dφ/dτ on U:n lineaarinen funktio ja kyseessä on yksimuoto, jonka komponentit ovat ∂φ ∂φ ∂φ ∂φ . d̃φ → , , , O ∂t ∂x ∂y ∂z Kuva 28: Yksimuodon geometrinen merkitys. (a) Yksimuoto on “sarja” pintoja. (b) Yksimuodon antama luku Eli d̃φ on funktion φ gradientti, ja sen geometrinen merkivektorista vastaa niiden pintojen määrää, jotka “nuoli” tys on sama kuin yksimuodolla. lävistää. (c) Pienempi yksimuoto samasta vektorista vastaa vähempää määrää pintoja! Huomautus! Vektori on suora, ja myös yksimuodon pinnat ovat suoHuomaa, että 4-ulotteisessa aika-avaruusjatkumossa yk- ria ja yhdensuuntaisia, koska yksimuoto on paikallisesti simuotojen määrittämät pinnat ovat kolmiulotteisia. Yk- määritelty kussakin koordinaatiston pisteessä! simuoto ei siis määritä suuntaa, vaan tavan “viipaloida” avaruutta. Pintojen välimatka on kääntäen verrannollinen Huomautus! yksimuodon suuruuteen. Gradientti sellaisenaan ei ole vektori, vaan tarvitaan Esimerkiksi gradientti on yksimuoto. metriikka, jotta gradienttiin voitaisiin liittää vektori. Geometrisesti gradientti (yksinään) on yksimuoto! Funktion derivaatta = yksimuoto! Tarkastellaan vielä, kuinka gradientti transformoituu. Olkoon jokaisessa aika-avaruuden pisteessä määritelty Yksimuodolle skalaarikenttä φ(x). Kappaleen maailmanviivalla on kus(d̃φ)ᾱ = Λβᾱ (d̃φ)β , sakin pisteessä jokin arvo φ(x), joka muuttuu liikuttaessa ja toisaalta derivoinnin ketjusäännön perusteella maailmanviivaa pitkin. Parametrisoidaan tämän kappaleen maailmanviiva omi∂φ ∂xβ ∂xβ ∂φ naisajalla τ (kuva 29). = ⇒ ( d̃φ) = (d̃φ)β . ᾱ ∂xᾱ ∂xβ ∂xᾱ ∂xᾱ Nyt kappaleen nelinopeus on sen maailmanviivan tangentti, eli Koska dt dx dy dz ∂xβ , , , , U→ xβ = Λβᾱ xᾱ ⇒ = Λβᾱ , O dτ dτ dτ dτ ∂xᾱ ja edellämääritelty skalaarikenttä φ muuttuu maailmanvii- ja transformaatio on sama kuin yksimuodoilla muutenkin! vaa pitkin liikkuttaessa kuten Huomautus: derivaatta dφ ∂φ dt ∂φ dx ∂φ dy ∂φ dz Derivaattaa merkitään usein = + + + dτ ∂t dτ ∂x dτ ∂y dτ ∂z dτ ∂φ ∂φ ≡ φ ,α . ≡ φ ,x tai ∂φ 0 ∂φ 1 ∂φ 2 ∂φ 3 ∂x ∂xα U U + U + U . = ∂t ∂x ∂y ∂z Yleisesti on voimassa Tässä siis tuotetaan luku dφ/dτ vektorista U, joka vasxα,β ≡ δ αβ ⇔ d̃xα ≡ ω̃ α , taa φ:n muutosta maailmanviivalla, jonka tangentti on U. 30 (02 ) tensori ottaa siis kaksi nelivektoria argumentteina, joiden järjestys on tärkeä. Näinollen voidaan tarkastella (02 ) tensoreiden symmetriaominaisuuksia. Symmetrinen tensori: ja näin ollen mille tahansa funktiolle d̃f = ∂f d̃xα . ∂xα Huomaa, että tämä on tensori, eikä infitesimaalinen muuf (A, B) = f (B, A) ∀ A, B. tos f :ssä. Tämä täytyisi kontraktoida infinitesimaalisen vektorin kanssa, jotta saataisiin f :n muutos johonkin suun- Kun asetetaan A = eα ja B = eβ saadaan komponenteille taan! fαβ = fβα . Mielivaltaisesta (02 ) tensorista h saadaan symmetrinen 6.4 (02) tensorit ja ulkotulo tensori asettamalla Otsikon mukainen tensori on sellainen, joka ottaa kaksi 1 1 nelivektoria argumenteikseen. Yksinkertaisin mahdollinen h(s) (A, B) = h(A, B) + h(B, A) 2 2 tensori on kahden yksimuodon (ulko)tulo. 0 Olkoot p̃ ja q̃ yksimuotoja, tällöin ulkotulo p̃ ⊗ q̃ on (2 ) 1 ⇔ h(s)αβ = h(αβ) = (hαβ + hβα ). tensori, joka tuottaa kahdella vektorilla luvun p̃(A)q̃(B). 2 Eli kyseessä on (01 ) tensoreiden (yksimuotojen) tuottamien Antisymmetrinen tensori: lukujen tulo. Tätä operaatiota merkitään siis symbolilla ’⊗’. f (A, B) = −f (B, A) ∀ A, B. Huomaa! Kun asetetaan A = eα ja B = eβ saadaan komponenteille Ulkotulo ’⊗’ EI kommutoi, eli tensorit p̃ ⊗ q̃ 6= q̃ ⊗ p̃, fαβ = −fβα . toisinsanoen Vastaavasti mielivaltaisesta (02 ) tensorista h saadaan anp̃(A)q̃(B) 6= p̃(B)q̃(A). tisymmetrinen tensori asettamalla h(a) (A, B) = Komponentit Yleisesti (02 ) tensori ei ole ulkotulo, mutta se voidaan aina ilmaista ulkotuloista muodostettujen tensoreiden summana. Tensorin f komponentit ovat siis 1 1 h(A, B) − h(B, A) 2 2 ⇔ h(a)αβ = h[αβ] = fαβ ≡ f (eα , eβ ). 1 (hαβ − hβα ). 2 Huomaa! Mille tahansa tensorille Tässä molemmat indeksit α ja β voivat saada neljä eri arvoa, joten (02 ) tensorilla on 16 komponenttia, jotka voidaan ajatella 4x4 matriisina. Mielivaltaisille vektoreille hαβ = 1 1 (hαβ + hβα ) + (hαβ − hβα ) 2 2 = h(αβ) + h[αβ] . (02 ) f (A, B) = f (Aα eα , B β eβ ) = Aα B β f (eα , eβ ) = Aα B β fαβ . Tutkitaan seuraavaksi, voidaanko tälle tensorille muodostaa kanta kuten nelivektoreille tai yksimuodoille siten että f = fαβ ω̃ αβ . Tällöin täytyisi olla Eli kaikki tensorit voidaan jakaa symmetriseen ja antisymmetriseen osaan! Esimerkiksi metrinen tensori g on symmetrinen, eli g(A, B) = g(B, A). 6.5 Metriikka ja tensorit Olkoot metriikka g ja nelivektori V. Koska metrinen tensori g vaatii kaksi vektoria argumenteiksi, puuttuu lausekkeesta g(V, ) yksi vektori! Eli fµν = f (eµ , eν ) = fαβ ω̃ αβ (eµ , eν ) g( , V) = g(V, ) ≡ Ṽ( ) ⇒ ω̃ αβ (eµ , eν ) = δ αµ δ βν . on yksimuoto (metriikka g on symmetrinen) ja kun tällä operoidaan vektoriin A on Mutta kuten aiemmin on jo nähty, on δ αµ = ω̃(eµ ), joten Ṽ(A) ≡ g(V, A) = g(A, V) = A · V. ω̃ αβ = ω̃α ⊗ ω̃ β . Toisinsanoen tensorit ω̃α ⊗ ω̃ β muodostavat kannan (02 ) tensorille ja f = fαβ ω̃ α ⊗ ω̃ β . Tensoreiden symmetriat Komponenttimuodossa tämä on Vα ≡ Ṽ(eα ) = V · eα = eα · V = eα · (V β eβ ) = (eα · eβ )V β ⇒ Vα = ηαβ V β . Toisinsanoen, metrinen tensori kuvaa vektorit yksimuodoiksi. Huomaa, että vektorin komponentin indeksi on 31 Kuten yksimuoto on kuvaus, joka antaa vektorista reylhäällä (V α ) ja yksimuodon alhaalla (Vα )! Erikoistapauksena laakeassa Lorentz-Minkowski avaruudessa gαβ = ηαβ aaliluvun, voidaan myös vektori käsittää kuvauksena joka ja antaa yksimuodosta reaaliluvun, eli V → (a, b, c, d) ⇔ Ṽ → (−a, b, c, d), V(p̃) ≡ p̃(V) ≡ pα V α ≡< p̃, V > . eli siirryttäessä vektoreista yksimuotoihin ainoastaan aikakomponentin etumerkki muuttuu. Tämä voidaan lyhyellä harppauksella yleistää (M 0 ) tensoreille, joka on siis M :n yksimuodon lineaarinen funktio, Yksimuodot vektoreiksi joka palauttaa reaaliluvun. Kun metrisen tensorin käänteismuoto on η αβ , saadaan käänteisesti Esimerkki Aα ≡ η αβ Aβ . (2 ) tensori V ⊗ W palauttaa luvun 0 On helppo osoitta, että {η αβ } = {ηαβ }, jolloin yksimuodosta päästään vektoriin vaihtamalla aikakomponentin etumerkkiä. V(p̃)W(q̃) ≡ p̃(V)q̃(W) = V α pα W β qβ . sekä tähän liittyvälle vektorille, joka on normaali φ:n tasaarvopintoihin nähden on Rᾱβ̄ = R(ω̃ ᾱ ; eβ̄ ) = R(Λᾱµ ω̃ µ ; Λνβ̄ eν ) = Λᾱµ Λνβ̄ Rµν . Tensorilla V ⊗ W on komponentit V α W β ja kantavektorit eα ⊗ eβ . Miksi yksimuotoja ja vektoreita?? Yleistetään tätä vielä edelleen siten, että otetaan muTutussa euklidisessa avaruudessa metriikan karteesiset kaan argumentteihin myös yksimuodot. Eli (M N ) tensori on komponentit ovat {δij }. Tällöin yksimuodoilla ja vektoreilM :n yksimuodon ja N :n vektorin lineaarinen funktio, joka la on samat komponentit. palauttaa reaaliluvun. Erikoisessa suhteellisuusteoriassa näin ei ole, vaan esimerkiksi kentän φ gradientille Esimerkki ∂φ ∂φ ∂φ ∂φ Olkoot R (11 ) tensori, ja tarkastellaan sen komponenttien d̃φ → ( , , , ) transformaatiota: ∂t ∂x ∂y ∂z dφ → (− ∂φ ∂φ ∂φ ∂φ , , , ). ∂t ∂x ∂y ∂z Eli tensorin jokainen indeksi transformoidaan erikseen! Indeksien nostaminen ja laskeminen Kuten jo aiemmin nähtiin, metriikka kuvaa vektorin V Erikoisen suhteellisuusteorian epäeuklidisen metriikan takia yksimuotojen ja vektoreiden välistä eroa ei voida unoh- yksimuodoksi Ṽ, eli taa! Vastaavanlaisia vektoreiden dualismeja on muuallakin g(V, ) = Ṽ( ). fysiikassa, kuten esimerkiksi kvanttimekaniikassa. Yksimuotojen suuruus ja skalaaritulo Yleisesti yksimuodoille ja vektoreille on voimassa p̃2 = p2 = ηαβ pα pβ . Tämä voidaan yleistää myös tensoreille. Eli, metriikka kuN −1 vaa (N M ) tensorin (M+1 ) tensoriksi. Vastaavasti käänteinen +1 N metriikka kuvaa (M ) tensorin (N M−1 ) tensoriksi. Esimerkki Olkoot (21 ) tensori T αβγ , tällöin Koska p̃2 = ηαβ (η αµ pµ )(η βν pν ) α = ηβµ T αµγ , T βγ ja ηαβ η βν = δ να , on p̃2 = η αµ pµ pα . joka on (12 ) tensori. Tässä siis keskimmäinen indeksi laskettiin ylhäältä alas. Eli yksimuotojen suuruus saadaan käänteisen metrisen tensorin avulla. Toisinsanoen Esimerkki Metrikalle p̃2 = −(p0 )2 + (p1 )2 + (p2 )2 + (p3 )2 , η αβ ≡ η αµ ηµβ ≡ δ αβ . mikä on sama kuin vektoreille, joten yksimuodot voivat olla kuten vektoritkin ajankaltaisia, avaruudenkaltaisia tai Tensoreiden differentiointi valonkaltaisia. Funktio f on (00 ) tensori, ja sen gradientti d̃f on (01 ) Vastaavasti, kuten vektoreille myös kahden yksimuodon tensori. Toisin sanoen tensorin differentiointi nostaa sen sisätulolle tulee kovarianttia luokkaa. Olkoot (11 ) tensori T, jolla on komponentit {T βα }, jotka p̃ · q̃ = −p0 q0 + p1 q1 + p2 q2 + p3 q3 . ovat paikan funktioita. Tensori T voidaan kirjoittaa T = T βα ω̃ β ⊗ eα . 6.6 (M N ) tensorit 32 Nyt liikutaan maailmanviivaa pitkin, jolloin Metriikka määrittää siis sisätulon ja sitä kautta vektorien pituudet. Se kuvaa avaruuden rakenteen, minkä takia erikoisen suhteellisuusteorian Lorentz-Minkowski avaruudesta puhutaan laakeana avaruutena tai laakeana metriikkana. T(τ + ∆τ ) − T(τ ) dT = lim ∆τ →0 dτ ∆τ ja koska kantayksimuodot ja -vektorit ovat vakioita on α dT β dT α ω̃ β ⊗ eα = T β,γ U γ ω̃β ⊗ eα . = dτ dτ Eli tensoria differentioitaessa maailmanviivaa pitkin, täytyy sen derivoidut komponentit kontraktoida maailmanviivan tangentin (nelinopeuden) kanssa. Tämä vastaa vektorilaskennasta tuttua suunnattua derivaattaa. Huomaa! dT/dτ on myös (11 ) tensori, koska dT α β = T β,γ ω̃ ⊗ eα U γ . dτ Tästä nähdään, että T:n gradientti α ∇T ≡ T β,γ ω̃ β ⊗ ω̃ γ ⊗ eα on (12 ) tensori! Toisinsanoen α dT ≡ ∇U T, ∇U T → T β,γ Uγ . dτ Tässä yhteydessä on oletettu, että kantayksimuodot ja kantavektorit ovat vakoioita. Tämä oletus pitää paikkaansa erikoisen suhteellisuusteorian tapauksessa. Jos avaruus on kaareva, näin ei enää ole ja kantavektoreiden sekä yksimuotojen muutokset täytyy ottaa huomioon tensoreita differentioitaessa. Tämä johtaa yleiseen suhteellisuusteoriaan ja siinä käytettyyn yleiseen vektorilaskentaan. 6.7 Metriset ja epämetriset vektorialgebrat Miksi juuri metrinen tensori kuvaa vektorit yksimuodoiksi ja päinvastoin? Miksi ei joku muu (02 ) tensori? Tarkastellaan näitä kysymyksiä kahdessa eri osassa: 1. Miksi yleensä vektoreiden ja yksimuotojen välillä on yhteys? Ilman tätä yhteyttä, jossa siis vektori operoi yksimuotoa tai päinvastoin, sisätuloa ei olisi määritelty. Fysiikassa sisätulo ja sen kautta avaruudet, joissa voidaan määritellä etäisyys tavalla tai toisella, ovat erittäin käyttökelpoisia. Näin ollen metriikkaa tarvitaan. 2. Miksi metriikka, eikä joku muu tensori? Jos metriikkaa ei olisi, joku muu symmetrinen tensori tekisi vastaavan kuvauksen yksimuotojen ja vektoreiden välillä. Tätä tensoria voitaisiin yhtä hyvin kutsua metriikaksi... Metriikka on vektorialgebraan kiinteästi kuuluva osa, joka määrittää avaruuden rakenteen. Eri avaruuksilla on erilaiset rakenteet. Esimerkiksi Riemannin avaruudessa vektoreilla on aina positiivinen pituus. Toisaalta taas pseudo-Riemannin avaruudessa vektorin pituus voi olla myös negatiivinen (esim. erikoisen suhteellisuusteorian Lorentz-Minkowski avaruus). Voidaan myös määritellä vaikkapa antisymmetrinen metriikka, joka johtaisi spinori-avaruuteen. 33 7. Relativistinen dynamiikka 2. Liikemäärä säilyy, toisinsanoen spatiaalikomponenNormaaleissa epärelativistisissa tapauksissa klassinen teista Galilein ja Newtonin mekaniikka toimii hyvin. Nyt meillä pν = p′ ⇔ Eν = m′ v on matemaattiset työkalut rakentaa vastaava formalismi, Näistä voidaan ratkaista hiukkasen nopeudeksi absorption jolla käsitellä myös relativistisia ongelmia. Tässä tapauksessa sovellusalueena ovat lähinnä relativis- jälkeen Eν Eν tiset atomaariset ja alkeishiukkasilmiöt. v= ′ = m m 0 + Eν Hiukkasprosesseja käsitellään soveltaen kahta jo perusmekaniikasta tuttua periaatetta: Huomaa! 1. Liikemäärän säilyminen. Jos Eν ≪ m0 , on v ≈ Eν /m0 , joka vastaa klassista tapausta, jossa m0 vakiomassainen kappale saa fotonilta im2. Energian säilyminen. pulssin Eν . Kohdan (1) käsittely muistuttaa hyvin paljon vastaavaa Emissio klassisen mekaniikan formalismia. Säilyvänä suurena on reTarkastellaan laboratoriokoordinaatistossa O paikallaan lativistisessa tapauksessa neliliikemäärä vektorisuureena. olevaa m0 massaista atomia, joka emittoi fotonin energialla Seuraavan kohdan (2) mukaisesti energia säilyy myös E positiivisen x-akselin suuntaan. ν relativistisissa hiukkasprosesseissa, mutta se voi ottaa eri Vuorovaikutuksen jälkeen fotonilla (f) ja atomilla (h) on muotoja (esim. massa). liikemäärää ja energiaa. Tällöin atomin liikemassa on m′ Näitä perusperiaatteita sovelletaan siten, että tarkastel′ sekä (uusi) lepomassa m laan tilannetta ennen ja jälkeen vuorovaikutuksen. Tämä 0 ja se liikkuu nopeudella v fotonin liikesuuntaa vastaan. mahdollistaa hiukkasprosessien luonnehdinnan, vaikka itse Atomilla on siis ennen emissiota neliliikemäärä vuorovaikutuksen yksityiskohtia ei tiedetä. Relativistisessa formalismissa ei juurikaan tarvita Ph →(E0 = m0 , 0, 0, 0). itse Lorentz-muunnosta, vaan se perustuu LorentzO invarienttien suureiden käsittelyyn. Vuorovaikutuksen jälkeen syntyneellä fotonilla sekä atomilla on neliliikemäärät 7.1 Massattomat hiukkaset Tälläisiä hiukkasia ovat esimerkiksi fotonit. Massattomat hiukkaset ovat jossain määrin erikoisasemassa relativistisia hiukkasilmiöitä tarkasteltaessa. P′h →(E ′ = m′ , p′ , 0, 0) O P′f →(Eν′ , p′ν = Eν′ , 0, 0) . O Koska neliliikemäärä säilyy, on Ph = P′h + P′f ja Absorptio Tarkastellaan paikallaan olevaa hiukkasta (lepomassa m0 ), johon osuu laboratoriokoordinaatiston O x-akselia pitkin liikkuva fotoni (energia Eν ), jonka hiukkanen absorboi. Vuorovaikutuksen jälkeen hiukkasella (h) on massa m′ ja se liikkuu nopeudella v fotonin (f) liikesuuntaan. Ennen vuorovaikutusta hiukkasen neliliikemäärä on 1. Energia säilyy, eli aikakomponenteista E0 = Eν + E ′ ⇔ m0 = Eν + m′ . (53) 2. Liikemäärän säilyminen saadaan spatiaalikomponenteista 0 = p′ν + p′ ⇔ p′ − Eν = 0. Ph →(E0 = m0 , 0, 0, 0) Kohdasta (1) ja (2) saadaan siten yhtälöpari ′ m = m0 − Eν . p′ = Eν O ja fotonin liikemäärä Pf →(Eν , pν = Eν , 0, 0). O Vuorovaikutuksen jälkeen fotoni häviää, ja hiukkasella on neliliikemäärä Kun otetaan atomin neliliikemäärän vektorista sisätulo itsensä kanssa, saadaan P′h · P′h = −(m′ )2 + (p′ )2 = −(m′0 )2 . (54) P′h →(E ′ = m′ , p′ , 0, 0) Tässä ensimmäinen muoto sisätulolle on laskettu laboratoriokoordinaatistossa ja toinen atomin lepokoordinaatistosNyt neliliikemäärä säilyy hiukkasprosesseissa, eli Ph + sa. Lausekkeet ovat yhtäsuuria, koska sisätulo on LorentzPf = P′h . Kun tarkastellaan eri komponentteja, nähdään invariantti. että Sisätulosta (54) ja energian säilymisestä (53) saadaan O 1. Energia säilyy, eli aikakomponenteista ′ (m′0 )2 = m20 − 2m0 Eν . ′ E0 + Eν = E ⇔ m0 + Eν = m . (55) Tässä massat m0 ja m′0 ovat siis hiukkasen lepomassat ennen ja jälkeen emission. Niiden erotus vastaa energiaa 34 Q = m0 − m′0 . Tästä erotuksesta saadaan m′0 = m0 − Q, kun v/c ≪ 1. Joten E ≈ E ′ (1 + v). jolloin lausekkeesta (55) tulee Mössbauer efekti m20 − 2m0 Q + Q2 = m20 − 2m0 Eν Joissain olosuhteissa emission tai absorption rekyyli jakautuu kaikkien kiteen hilassa olevien atomien kesken. Q Kiteen hilassa voi olla esim. 1010 atomia, jolloin termi ⇔ Eν = hν = Q 1 − (56) Q/(2m0 ) yhtälössä (56) käytännössä häviää ja lähes kaikki 2m0 energia menee fotonille. Esimerkiksi 1010 atomin iridium Koska fotonin energia Eν on suoraan verrannollinen taa−17 kiteelle Q/(2m . 0 ) ≈ 3 × 10 juuteen ν, lauseketta (56) vastaava taajuus laskee ja aallonJos atomin emissiotaajuus on hyvin terävä, niin sama pituus kasvaa erotuksen Q kasvaessa. Tämä kuvaa atomin pätee myös absorptiotaajuudelle, ja pienetkin muutokset kokemaa rekyyliä fotonin emittoituessa. energiassa tekevät absorption mahdottomaksi. Tätä kutHuomaa, että jos emittoiva atomi ei kokisi rekyyliä, kaiksutaan Mössbauer ilmiöksi, jonka löytämisestä Rudolf L. ki energia Q menisi fotonille. Mössbauer sai Nobelin palkinnon vuonna 1957. Lausekkeella (56) on suoria fysikaalisia seurauksia. KosKiteiden tapauksessa ilmiö tulee voimakkaana esille, ka atomit tai niiden ytimet virittyvät ainoastaan tietyn ja absorption voimakkuus riippuu vahvasti emittoivan ja kokoisilla energiapaketeilla (energiatasot ovat kvantittuabsorpoivan atomin suhteellisesta nopeudesta. Emissioneet), ne eivät pysty absorboimaan niille ominaista emisabsorptio resonanssi on hyvin herkkä gammasäteillä, jopa siosäteilyä! 0.1 cm/s nopeusero voi tuhota resonanssin. Toisin sanoen atomin viritystilan laskiessa, sen energia Jos joku efekti tuhoaa resonanssin, gammasäteiden taamuuttuu ja se emittoi fotonin. Osa fotonin energiasta mejuutta muuttamalla se voidaan palauttaa. Muutoksen avulnee kuitenkin atomin kokemaan rekyyliin. la efekti voidaan mitata erittäin tarkasti. Jos edellä emittoitu fotoni tapaa samanlaisen atomin, Mössbauer efekti on havaittu 35 eri isotoopilla, joilla joka on vastaavassa alemmassa energiatilassa, sillä ei ole on stabiili perustila ja virittynyt tila joka purkautuu gamenää tarpeeksi energiaa, jotta se pystyisi virittämään atomasäteilynä. min uudelleen. Käänteisesti, Mössbauer ilmiön avulla voidaan tuottaa Jos atomien emissioviivat olisivat teräviä (emissio aina gammasäteitä, joiden taajuus tiedetään hyvin tarkasti. täsmälleen samalla energialla) ja emittoivat sekä absorboiKaikenkaikkiaan Mössbauer ilmiöllä on lukuisia erilaivat atomit olisivat paikallaan, kaasu olisi läpinäkyvää omisia sovelletuksia. Ilmiötä on käytetty esim. gravitaatiopunaissäteilylleen! nasiirtymän mittauksissa, ytimen ja elektronin vuorovaiKäytännössä kuitenkin kutusten tutkimiseen sekä hilassa olevien ytimien ja hilan • Energiatasot eivät ole tarkastiottaen teräviä. vuorovaikutusten tutkimiseen. Mössbauer ilmiötä voidaan käyttää myös spektroskopiassa. Ilmiö on hyvin tärkeä eten• Jos absorboivalla atomilla on oikea nopeus, se voi komkin ydinfysiikassa. pensoida taajuusmuutoksen Doppler siirtymällä. • Näkyvälle valolle terminen liike hävittää tämän efektin. Fotoniraketti Sähkömagneettinen säteily työntää rakettia eteenpäin. Koska fotonit liikkuvat valonnopeudella ja työntövoima on • Korkeampitaajuuksisilla γ-säteillä rekyyli on paljon suoraan verrannollinen pakokaasujen lähtönopeuteen, olisi vahvempi ja efekti on siten havaittavissa. tälläinen raketti hyvin tehokas. Olkoon m0 raketin lepomassa, ja merkitään f :llä Esimerkki hyötykuorman (= f m0 ) osuutta lepomassasta. Elohopean (Hg) kokema rekyyli on yhtälön (56) muJos raketti (r) lähtee levosta ja antaa hyötykuormalle nokaisesti verrannollinen Q/(2m0 ) = Q/(2m0 c2 ):een. Gam- peuden v, tietty määrä säteilyenergiaa E (f) liikkuu vasr masäteille, joita viritetty elohopea emittoi, Q = 412keV ja takkaiseen suuntaan. −25 elohopealle m0 = 198amu = 3.28 × 10 kg. Raketin neliliikemäärä alussa on Gammasäteiden tapauksessa Q/(2m0 c2 ) ≈ 10−6 osa Pr →(m0 , 0, 0, 0) energiasta menee rekyyliin. Valolle (Q ≈ 2eV) efekti on O viisi kertaluokkaa pienempi. Kun tarkastellaan emissiota ja absorptiota, tulee rekyyli ja lopussa P′r →(m′ , p′ , 0, 0) ottaa huomioon kaksi kertaa. Ehto sille, että sekä absorpO . tio että emissio ovat mahdollisia on se, että emissiolähde P′f →(Er , −Er , 0, 0) O liikkuu absorptiokohteen suhtee nopeudella P Tässä siis neliliikemäärävektori P′f = Pν edustaa kaikQ v ′ −6 kien fotoneiden liikemäärää. Kun muistetaan, = 2.24 × 10 ≈ 670m/s. ≈ √että m = c m 0 c2 ′ ′ 2 f m γ ja p = m v = f m γv (missä γ = 1/ 1 − v on 0 Koska Doppler-siirtymä nostaa energiaa osalla v/c, nopeuden v ollessa pieni: r ν 1+v 1+v E = ′ = = √ ≈ 1 + v, E′ ν 1−v 1 − v2 0 Lorentz-tekijä) saadaan aika- ja spatiaalikomponenteista säilymisyhtälöt m0 = m′ + Er = f m0 γ + Er 0 = p′ − Er = f m0 γv − Er 35 elektroni ⇔ m0 = f m0 γ + f m0 γv ⇔ f γ + f vγ = 1. (57) Kun positroni γ = (1 − v 2 )−1/2 ⇔ γ 2 v 2 = γ 2 − 1, saadaan yhtälöstä (57) p f γ 2 − 1 = 1 − f γ ⇔ f 2 − 2f γ + 1 = 0. Asetetaan Lorentz-tekijän arvoksi γ = 10, jolloin matkantekoaika raketin koordinaatistossa lyhenee huomattavasti. Tällöin hyötykuorman osuudeksi tulee p √ f = γ − γ 2 − 1 = 10 − 99 ≈ 0.05, mikä on noin 5%. Jos halutaan pysähtyä kohteessa ja kääntyä takaisin, palaavan massan osuus on f −4 , eli tässä tapauksessa 10−5 m0 . Tästä nähdään, että relativistisia nopeuksia on hyvin hankala saavuttaa makroskooppisilla kappaleilla. fotoni Kuva 30: Kaavakuva elektroni-positroniparin muodostumisen jättämästä jäljestä hiukkasilmaisimessa. 7.2 Parisynty ja annihilaatio Massa-energia ekvivalenssi Tietyissä olosuhteissa on mahdollista luoda uusia hiukkasia, jos energiaa on riittävästi tarjolla. Jos halutaan luoda hiukkanen, jonka lepomassa on m0 , vaaditaan siihen energiaa vähintään E = m0 c2 verran. Käytännössä kuitenkin energiaa vaaditaan paljon enemmän. Tämä johtuu seuraavista seikoista. Energian ja liikemäärän säilymislakien lisäksi on muita säilymislakeja, joiden täytyy olla voimassa (esim. varauksen säilyminen). Tämän takia on mahdotonta luoda vain yksi hiukkanen törmäysprosessissa. Esimerkiksi elektroni-positronipari voi syntyä γfotonista (energia 1.02Mev) reaktion γ → e− + e+ kautta. Hiukkasia syntyy tavallisesti törmäytettäessä olemassaolevia hiukkasia. Esimerkiksi π-mesoneja (pioneja) saadaan aikaan pommittamalla vetyatomien ytimiä energeettisillä protoneilla reaktioyhtälön P1 + P2 → P + N + π + mukaisesti. Tässä törmäävistä protoneista syntyy protoni, neutroni ja pioni. Koska liikemäärän täytyy säilyä, on suuri osa energiasta sidottuna systeemin liiketilaan. Tarkastellaan fotonien parisyntyä. Kuvassa 30. on kaavakuva hiukkasilmaisimessa havaitusta elektronin ja positronin radasta. Selvästi fotoni, joka on neutraali, eikä jätä jälkeä ilmaisimeen, on tullut alhaalta. Radat ovat lähes symmetriset, joten elektronilla ja positronilla on lähes sama energia. Prosessiin tarvitaan vielä yksi osapuoli lisää, sillä liikemäärän täytyy säilyä. Tämä johtuu siitä, että kahdelle massalliselle hiukkaselle voidaan aina määritellä koordinaatisto, jossa niiden kokonaisliikemäärä on nolla. Fotonilla on aina liikemäärä kaikissa koordinaatistoissa, eikä sitä voida hävittää koordinaatistoa vaihtamalla! Tässä tapauksessa neljäs kappale on atomiydin, joka pystyy ottamaan paljon liikemäärää vastaan viemättä paljoa energiaa koska ydin on massiivinen. Myös käänteinen prosessi e− + e+ → γ + γ on mahdollinen. Tätä kutsutaan annihilaatioksi, jossa hiukkanen ja antihiukkanen muuttuvat säteilyksi. Myös tähän tarvitaan vähintään kaksi fotonia, sillä liikemäärän täytyy säilyä! Hiukkasilmaisimet Hiukkasilmaisimilla havaitaan hiukkaskiihdyttimissä tapahtuvien törmäysprosessien tuottamia hiukkasia. Ilmaisimessa hiukkassuihku törmäytetään joko paikallaan olevaan kohtioon tai vastakkaiseen suuntaan liikkuvaan hiukkassuihkuun. Vastaavanlaisia ilmaisimia käytetään myös maapallon ulkopuolelta tulevan kosmisen säteilyn ilmaisimissa. Törmäyttämällä hiukkassuihkuja keskenään laboratoriokoordinaatistossa paikallaan olevan kohtion sijaan, voidaan törmäysenergioita nostaa huomattavasti. Ilmaisimissa tapahtuvat törmäykset tuottavat suuren määrän erilaisia hiukkasia, joiden kaikkien havaitseminen on hyvin hankalaa. Käytännössä nämä yhä hyvin energeettiset törmäystuotteet sinkoutuvat useassa kerroksessa oleviin ilmaisimiin, joissa mitataan hiukkasten varausta, massaa, energiaa ja liikerataa. Varautuneet hiukkaset erotetaan sähköisesti neutraaleista hiukkasista magneettikentällä, ja hiukkasten radat mitataan ratailmaisimilla. Kaikki ratailmaisimet perustuvat siihen, että energeettiset varatut hiukkaset voivat ionisoida liikeradallaan väliainetta. Erilaisia ratailmaisintyyppejä ovat mm. kaasu- tai nestetäytteiset ilmaisimet (sumukammiot, kuplakammiot), kipinäkammiot ja lankakammio sekä puolijohdeilmaisimet. Varsinaisten ilmaisimien lisäksi tarvitaan niiden tuottaman tiedon analysointiin ja tallentamiseen erilaisia apulaitteita. Ilmaisimesta jännitepulsseina saatu tieto käsitellään elektronisesti. Jos taas reaktiotuotteet synnyttävän näkyvän jäljen, tutkiminen tapahtuu optisesti. 36 • Sumukammiossa ionisoivat hiukkaset aiheuttavat lii- menttien sisällä olevaa kaasua aiheuttaen sarjan kipinäpurkauksia anodilangoissa. Nämä radat voidaan mitata, tallentaa ja analysoida suoraan tietokoneen avulla. Kamera Neste Käämit Käämit 7.3 Dopplerin ilmiö Tarkastellaan fotonin liikettä emissiolähteen suhteen liikkuvan havaitsijan näkökulmasta. Liikkukoon valonlähde (lepokoordinaatisto Ō) laboratoriokoordinaatiston O x-akselin suuntaisesti nopeudella v. Laboratoriokoordinaatistossa O valonlähteestä emittoitu fotoni liikkuu kulmassa θ liikesuuntaa (x-akseli) vastaan. Tällöin sillä on neliliikemäärä P → {P α } = (E, px = E cos θ, py = E sin θ, 0), Hiukkasuihku O missä E on fotonin energia laboratoriokoordinaatistossa. Muunnetaan neliliikemäärä hiukkasen lepokoordinaatistoon Ō, jolloin P → P ᾱ = Λᾱα P α Ō Mäntä = (Ē = γ(E − vpx ), p̄x = γ(−vE + px ), p̄y = γpy , 0). Muunnetun neliliikemäärän aikakomponentista saadaan fotonin energialle Ē lepokoordinaatistossa Ē = γ(E − vpx ) = γE(1 − v cos θ). Magneettikenttä Koska fotonin energian riippuvuus taajuudesta on Ē = hν̄ ja vastavasti E = hν, saadaan tästä Doppler siirtymäksi Kuva 31: Donald A. Glaserin vuonna 1952 kehittämä √ ν̄ 1 − v 2 kuplakammio. Hiukkassuihku ohjataan ylikuumentuneeν= . (58) seen nesteeseen (neste saadaan ylikuumentuneeseen tilaan 1 − v cos θ pienentämällä painetta nopeasti männän avulla). Nesteen kiehuminen varattujen hiukkasten kulkuradalla valokuva- Huomaa, että vastaava klassinen Doppler-siirtymän muoto on ν = ν̄/(1 − v cos θ). Jos valonlähde liikkuu kohti havaittaan. sijaa, kulma θ = 0 ja √ ν̄ 1 − v 2 keradallaan ylikylläisessä vesihöyryssä sumujäljen. , ν= Nämä jäljet voidaan havaita optisesti, esimerkiksi va1−v lokuvaamalla. eli ν > ν̄ (sinisiirtymä). Vastakkaiseen suuntaan lähtevälle • Sumukammion syrjäytti helppokäyttöisempi kupla- valonsäteelle θ = π ja kammio, jossa kriittisessä tilassa oleva ylikuumentu√ ν̄ 1 − v 2 nut neste (vety) kiehuu ionisoivan hiukkasen liikeraν= , 1+v dalla. Liikeradat havaitaan kolmiulotteisesti kuvaamalla ne kameralla useasta eri kulmasta. eli tässä tapauksessa ν < ν̄ ja kyseessä on punasiir• Kipinäkammiossa on sarja jännitee-erossa pidettyjä tymä. Suorassa kulmassa havaitsijaan nähden lähtevälle metallilevyjä. Kammion läpi kulkeva varattu hiukka- valonsäteelle θ = π/2 ja nen ionisoi radallaan levyjen välissä olevaa kaasua aip ν = ν̄ 1 − v 2 heuttaen sarjan kipinäpurkauksia, jotka voidaan havaita. Tälläinen ilmaisin on jatkuvakäyttöinen, eikä sitä tarvitse virittää uudelleen kupla- ja sumukam- (vrt. tätä ajan dilataation lausekkeeseen!). mion tavoin. 7.4 Comptonin sironta • Lankakammiossa on kaasuun upotettuna kahden kaFotoni ja (vapaa) elektroni törmäävät elastisesti. Valitoditason välissä olevia anodilankoja. Peräkkäisien taan koordinaatisto O, jossa fotoni lähestyy levossa olevaa elementtien langat ovat kohtisuorassa toisiaan vas- elektronia x-akselia pitkin. Fotoni siroaa elektronista xytaan. Kammion läpi kulkeva hiukkanen ionisoi ele- tasossa. 37 Ennen törmäystä elektronilla ja fotonilla on nelilii- ja vastaavasti ilman sirontaa (jos θ = 0) fotonin aallonpituus ei muutu. kemäärät K ja P: K P → (m0 , 0, 0, 0) O → (Eν , Eν , 0, 0) 7.5 Atomiytimen sidosenergia ja massakato . O Törmäyksen jälkeen elektroni liikkuu nopeudella u ja fotoni, joka siroaa kulmaan θ nopeudella v i = (sin θ, cos θ, 0). Tällöin törmäyksen jälkeen neliliikemäärät ovat K′ → (E, px , py , 0) O . P′ → (Eν′ , Eν′ cos θ, Eν′ sin θ, 0) O Stabiilia atomiydintä pitää koossa ytimessä olevien alkeishiukkasten välillä vaikuttavat voimat. Jos ytimestä poistetaan protoni tai neutroni, täytyy tehdä työtä sidosenergiaa vastaan. Tähän työhön sekä siihen liittyvään energiaan liittyy vastaava massa. Ytimen massa on siis pienempi kuin sen rakenneosien massojen summa. Massakato on siten Fotoni liikkuu laboratoriokoordinaatistossa O kulmaan θ ∆m = Zmp + (A − Z)mn + Zme − MZ,A , (62) törmäyksen jälkeen. Kokonaisneliliikemäärä säilyy prosessisa, eli missä mp on protonin lepomassa, mn neutronin lepomassa, K + P = K′ + P′ . MZ,A Z-protonia ja A − Z neutronia sisältämän ytimen Koska haluamme päästä eroon Lorentz-tekijästä γ, massa ja me on elektronin massa. jätetään tässä yhtäsuuruusmerkin toiselle puolelle vain K′ , Vastaavat sidosenergiat saadaan kertomalla yhtälö (62) jolloin valonnopeuden neliöllä. K′ = K + P − P′ . Energian yksikkönä on usein elektronivoltti eV, joka vastaa elektronin saamaa liikenergiaa, kun se kiihdytetään 1 Kun tästä otetaan sisätulo itsensä kanssa, saadaan V potentiaalieron läpi. Tyypillinen sidosenergia on noin 8 MeV nukleonia kohti, ⇔ K′ · K′ = K · K + P · P + P′ · P′ vastaavasti elektronien sidosenergiat ovat noin 10 - 100 eV luokkaa. Näin ollen elektronien sidosenergian vaikutus on +2(K · P − K · P′ − P · P′ ). (59) häviävän pieni. Tässä P · P = P′ · P′ = 0, koska fotonin neliliikemäärän neliö on kaikissa koordinaatistoissa nolla. Vastaavasti K·K = K′ · K′ = −m20 , koska hiukkasen neliliikemäärän neliö on sama kaikissa koordinaatistoissa (myös lepokoordinaatistossa). Näin ollen yhtälöstä (59) jää jäljelle ainoastaan ristitermit, eli ⇒ K · P − K · P′ − P · P′ = 0. (60) 7.6 Hiukkasen hajoaminen Epästabiili hiukkanen, jonka lepomassa on M , hajoaa kahdeksi tytärhiukkaseksi (lepomassat m1 ja m2 ). Valitaan koordinaatisto O siten, että hajoava hiukkanan on levossa (energia E = M ), ja tytärhiukkaset saavat energiat E1 ja E2 sekä vastaavat liikemäärät p1 ja p2 . Hiukkasen neliliikemäärä on ennen hajoamista P →(E, 0, 0, 0), Jäljelle jäävät sisätulot voidaan laskea: K·P K · P′ P · P′ O ja hajoamisen jälkeen tytärhiukkaset liikkuvat pitkin x-akselia vastakkaisiin suuntiin. Tytärhiukkasten neliliikemäärät ovat siten = −m0 Eν = −m0 Eν′ , = −Eν Eν′ + Eν Eν′ cos θ = Eν Eν′ (cos θ − 1) P1 →(E1 , p1 , 0, 0) jolloin yhtälöstä (60) saadaan m0 Eν′ m0 Eν − ⇔ + Eν Eν′ (1 O − cos θ) = 0 1 h 1 − = (1 − cos θ), ν′ ν m0 Eν′ P2 →(E2 , p2 , 0, 0). O (61) ′ Neliliikemäärä säilyy, joten E = P = P1 + P2 ⇔ p1 = M = E1 + E2 −p2 kun Eν = hν ja = hν . Yhtälö (61) sitoo siroavan fotonin taajuuden muutok- Toisaalta neliliikemäärävektoreiden neliöt antavat sen sirontakulmaan. Vastaavsti aallonpituuden avulla (λ = P1 · P1 = −E12 + p21 = −m21 c/ν = 1/ν) P2 · P2 = −E22 + p22 = −m22 h (1 − cos θ). ∆λ = 2 m0 E1 = p21 + m21 ⇔ . Aallonpituuden muutos on suurin kun θ = π, ja fotoni E22 = p22 + m22 siroaa liikesuuntaansa vastakkaiseen suuntaan. Tällöin Kun yhtälöt (64) vähennetään toisistaan, saadaan 2h , λmax = E12 − E22 = p21 + m21 − p22 − m22 = m21 − m22 m0 38 (63) (64) ja sironnan jälkeen m21 − m22 m21 + m22 E1 − E2 = = . (65) P3 → (E ′ , p′ cos θ′ , p′ sin θ′ , 0) E1 + E2 M CM . P4 → (E ′ , −p′ cos θ′ , −p′ sin θ′ , 0) Nyt tytärhiukkasten energiat voidaan ratkaista yhtälöistä CM (63) ja (65) muodostetun yhtälöparin avulla: ( Tässä siis sirontakulma on θ′ . Neliliikemäärän säilymisestä E1 + E2 = E = M lähtien (P1 +P2 = P3 +P4 ) on helppo osoitaa, että E = E ′ . m21 −m22 E1 − E2 = ja p = p′ . Joten sironnan jälkeisiksi nelivektoreiksi tulee M Laskemalla nämä yhteen ja vähentämällä toisistaan saadaan ( M 2 +m21 −m22 E1 = 2M . M 2 −m21 +m22 E2 = 2M Tytärhiukkasten liikemäärät saadaan edellisestä yhtälöstä ja yhtälöstä (64): p (M 2 − m21 − m22 )2 − 4m21 m22 . p1 = −p2 = 2M 7.7 Elastinen sironta Tarkastellaan identtisten, m0 lepomassaisten hiukkasten sirontaa laboratoriokoordinaatistossa O sekä massakeskuskoordinaatistossa CM. Laboratoriokoordinaatisto θ m0 φ (E, −p cos θ′ , −p sin θ′ , 0) → P4 CM . Lasketaan systeemin massakeskusenergia E laboratoriossa (koordinaatisto O) kiihdytetyn hiukkasen energian avulla. Ennen sirontaa hiukkasten neliliikemäärän sisätulo on laboratoriokoordinaatistossa O ja CMkoordinaatistossa CM O P1 · P2 = −E 2 − p2 = −E1 m0 . (66) Lisäksi massakeskuskoordinaatistossa CM P1 · P1 = −E 2 + p2 = −m20 ⇔ p2 = E 2 − m20 . y m0 CM Massakeskuskoordinaatisto (CM) y (E, p cos θ′ , p sin θ′ , 0) → P3 (67) Kun yhtälö (67) sijoitetaan sistätulon P1 ·P2 lausekkeeseen (66), saadaan massakeskuenergiaksi E kiihdytysenergian E1 avulla θ’ m0 x −E1 m0 = −E 2 − E 2 + m20 = −2E 2 + m20 m0 x θ’ E1 m0 + m20 . (68) 2 Lausutaan sironneen hiukkasen energia (alaindeksi kolme) sirontakulman θ′ ja kiihdytysenergian E1 avulla. Neliliikemäärien P2 ja P3 sisätulon avulla on ⇔E= Kuva 32: Elastista sirontaa käsitellään tarkastelemalla tilannetta yhtäaikaa laboratoriokoordinaatistossa ja massakeskuskoordinaatistossa. r CM P2 · P3 = −E 2 − p2 cos θ′ = −m0 E3 . Laboratoriokoordinaatistossa O liikkuva hiukkanen siro- Sijoittamalla tähän yhtälö (67) saadaan aa paikallaan olevasta identtisestä kohtiohiukkasesta. ⇔ −E 2 − (E 2 − m20 ) cos θ′ = m0 E3 , Kuvan 32 mukaisesti neliliikemääriksi tulee ennen sirontaa josta yhtälön (68) avulla tulee P1 → (E1 , p1 , 0, 0) O P2 → (E2 = m0 , 0, 0, 0) E1 m0 + m20 E1 m0 + m20 O 2 ⇔ m0 E3 = + − m0 cos θ′ . 2 2 ja sironnan jälkeen P3 P4 → (E3 , p3 cos θ, p3 sin θ, 0) O → (E4 , p4 cos φ, p4 sin φ, 0) Tästä vähennettäessä puolittain m20 , saadaan . O Vastaavasti massakeskuskoordinaatistossa CM hiukkaset lähestyvät toisiaan samalla nopeudella (energialla), ja siroavat symmetrisesti kulmaan θ′ . Kuvan mukaisesti neliliikemääriksi tulee ennen sirontaa P1 P2 → CM → CM m0 E3 − m20 = = E1 m0 − m20 E1 m0 − m20 + cos θ′ 2 2 θ′ E1 m0 − m20 (1 + cos θ′ ) = (E1 m0 − m20 ) cos2 , 2 2 koska (E, p, 0, 0) θ′ cos = 2 (E, −p, 0, 0) 39 r θ′ 1 + cos θ′ 1 + cos θ′ ⇔ cos2 = . 2 2 2 Näin ollen tästä jää jäljelle sironneen hiukkasen energiaksi Koska protonin leponenergia on E0 = m0 , täytyy kiihE3 sirontakulman θ′ ja kiihdytysenergian E1 avulla lausut- dytetylle protonille antaa kineettistä energiaa määrä T = tuna 6m0 , jotta protoni-antiprotoni parin synty olisi mahdolli′ 2 θ nen. ⇔ E3 = (E1 − m0 ) cos + m0 . 2 Vastaavasti sirontakulma θ laboratoriokoordinaatistossa Kynnysenergia yleisessä tapauksessa O voidaan ratkaista lausumalla sisätylo P1 · P3 koordinaaMääritetään reaktion tistoissa O ja CM. Kohtihiukkasen energia E4 laboratorioa+b→c+d koordinaatistossa O sironnan jälkeen saadaan sisätulojen P1 · P4 ja P2 · P4 avulla. kynnysenergia, kun hiukkasten (erisuuret) lepomassat ovat ma 6= mb 6= mc 6= md . 7.8 Kynnysenergia Tarkastellaan tilannetta edelläolevan käsittelyn taKun hiukkasia törmäytetään yhteen, voi syntyä uusia paan ennen törmäystä laboratoriokoordinaatistossa O ja hiukkasia, mikäli systeemin energia on tarpeeksi korkea. törmäyksen jälkeen massakeskuskoordinaatistossa CM. Pienin energia, joka riittää ainoastaan hiukkasprosessisLaboratoriokoordinaatistossa O ennen törmäystä hiuksa syntyvien ja jo olemassaolevien hiukkasten lepoenergikanen a liikkuu x-akselia pitkin kohti paikallaan olevaa aan, on kynnysenergia. hiukkasta b. Tällöin neliliikemäärät ovat Esimerkiksi protoni-antiprotoni parin syntyprosessi voip daan esittää reaktioyhtälöllä p + p → p + p + (p + p̄). Pa → (E, p = E 2 − m2a , 0, 0) O Määritetään pienin energia, joka riittää p+ p̄ parin synty, Pb → (mb , 0, 0, 0) miseen. Tarkastellaan tilannetta laboratoriokoordinaatisO tossa O ja massakeskuskoordinaatistossa CM. Laboratoriokoordinaatistossa O ensimmäinen protoni koska O Pa · Pa = −m2a = −E 2 + p2 (1) liikkuu x-akselia pitkin ja törmää paikallaan olevaan p protoniin (2). Tällöin neliliikemäärät ovat ⇔ p = E 2 − m2a . → (E, p, 0, 0) P1 O → (m0 , 0, 0, 0) P2 Massakeskuskoordinaatistossa CM törmäyksen jälkeen hiukkaset c ja d ovat levossa, jolloin neliliikemäärät ovat . O Pc → (mc , 0, 0, 0) Massakeskuskoordinaatistossa CM molemmilla protoCM . Pd → (md , 0, 0, 0) neilla on ennen törmäystä sama energia, ja ne liikkuvat CM kohti toisiaan x-akselia pitkin. Näin ollen laboratoriokoordinaatistossa O on systeemin Reaktion jälkeen kaikki hiukkaset ovat levossa CMkokonaisliikemäärä ennen törmäystä koordinaatistossa (kynnysenergiaehto), eli p P = Pa + Pb →(E + mb , E 2 − m2a , 0, 0) P′1 = P′2 = P′3 = P′4 → (m0 , 0, 0, 0). O CM Tarkastellaan seuraavaksi systeemin kokonaisnelilii- ja törmäyksen jälkeen massakeskuskoordinaatistossa CM kemäärää P. Ennen törmäystä P′ = Pc + Pd → (mc + md , 0, 0, 0). q CM P = P1 + P2 →(E + m0 , p = E 2 − m20 , 0, 0), O Nelivektoreiden sisätulon invarianssin ja neliliikemäärän säilymisen nojalla on koska O P1 · P1 = −E 2 + p2 = −m20 q ⇔ p = E 2 − m20 . P · P = P′ · P′ Vastaavasti törmäyksen jälkeen systeemillä on kynnysenergiaehdon nojalla neliliikemäärä X P′i → (4m0 , 0, 0, 0). P′ = i CM Nelivektoreiden sisätulon koordinaatistoinvarianssin ja neliliikemäärän säilymisen nojalla ⇔ −(E + mb )2 + E 2 − m2a = −(mc + md )2 ⇔E= (mc + md )2 − (m2a + m2b ) . 2mb Koska E on kiihdytetyn hiukkasen kokonaisenergia, ja E = T + ma , saadaan laboratoriokoordinaatistossa O liikkuvan hiukkasen kineettiseksi energiaksi T = P · P = P′ · P′ (mc + md )2 − (m2a + m2b ) − ma 2mb (mc + md )2 − (ma + mb )2 . 2mb ⇔ −(E + m0 )2 + E 2 − m20 = −16m20 ⇔ E = 7m0 . 40 (69) Huomaa, että yhtälössä (69) osoittajassa termi (mc + md )2 vastaa tytärhiukkasia ja termi (ma + mb )2 alkuperäisten hiukkasten osuutta. Jos alkuperäisten hiukkasten lepomassojen summa on suurempi kuin tytärhiukkasten lepomassojen summa (ma + mb > mc + md ), reaktio voi tapahtua millä tahansa kiihdytysenergialla. Toisaalta, jos alkuperäisten hiukkasten lepomassojen summa on pienempi kuin tytärhiukkasten lepomassojen summa (ma + mb < mc + md ), tarvitaan vähintään lauseketta (69) vastaava määrä kineettistä energiaa reaktion toteutumiseksi. 41