BM20A5800 Funktiot, vektorit ja lineaarialgebra
Transcription
BM20A5800 Funktiot, vektorit ja lineaarialgebra
BM20A5800 Funktiot, vektorit ja lineaarialgebra Jouni Sampo 29. syyskuuta 2015 Sisältö 1 Yhden muuttujan funktiot 1.1 Lukujoukot ja lukuvälit . . . . . . . . 1.2 Funktioista yleisesti . . . . . . . . . . 1.3 Perusfunktiot . . . . . . . . . . . . . 1.3.1 Polynomit . . . . . . . . . . . 1.3.2 Rationaalilausekkeet . . . . . 1.3.3 Trigonometriset funktiot . . . 1.3.4 Logaritmifunktiot . . . . . . . 1.3.5 Potenssifunktiot . . . . . . . . 1.3.6 Hyperboliset funktiot . . . . . 1.3.7 Itseisarvo . . . . . . . . . . . 1.4 Yhdistetyt funktiot . . . . . . . . . . 1.5 Injektio, surjektio ja bijektio . . . . . 1.6 Käänteisfunktiot . . . . . . . . . . . 1.7 Yhtälöt, epäyhtälöt ja yhtälöryhmät . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Vektorit ja usean muuttujan funktiot 2.1 Vektoreiden peruskäsitteet . . . . . . . . . . . 2.1.1 Standardikantavektorit . . . . . . . . . 2.1.2 Vektoreiden välinen kulma ja pistetulo 2.2 Suorat ja tasot vektorien avulla esitettynä . . 2.2.1 Tasot . . . . . . . . . . . . . . . . . . . 2.3 Vaihtoehtoisia ilmaisutapoja vektoreille . . . . 2.4 Usean muuttujan reaaliarvoiset funktiot . . . 2.5 Vektoriarvoiset funktiot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 5 5 6 7 10 11 12 13 13 14 16 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 20 21 22 23 26 28 28 29 3 Matriisit 3.1 Matriiseihin liittyvät peruskäsitteet . . . . . . . . . . . 3.2 Matriisien laskutoimitukset . . . . . . . . . . . . . . . 3.2.1 Matriisien yhteenlasku ja kertominen skalaarilla 3.2.2 Matriisien kertolasku . . . . . . . . . . . . . . . 3.3 Lineaariset yhtälöryhmät . . . . . . . . . . . . . . . . . 3.3.1 Gaussin eliminointi . . . . . . . . . . . . . . . . 3.3.2 Lineaarinen riippumattomuus . . . . . . . . . . 3.3.3 Ratkaisujen yleisiä ominaisuuksia . . . . . . . . 3.4 Käänteismatriisi . . . . . . . . . . . . . . . . . . . . . . 3.5 Determinantit . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Determinantin määritelmä . . . . . . . . . . . . 3.5.2 Determinanttien perusominaisuuksia . . . . . . 3.5.3 Cramerin sääntö . . . . . . . . . . . . . . . . . 3.6 Ominaisarvot ja ominaisvektorit . . . . . . . . . . . . . 3.6.1 Määritelmä ja laskenta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 30 32 32 33 34 35 38 39 40 42 42 43 44 45 45 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Yhden muuttujan funktiot 1.1 Lukujoukot ja lukuvälit Erilaisia lukujoukkoja: • Luonnolliset luvut: N = {0, 1, 2, 3, . . . } • Kokonaisluvut: Z = {. . . , −2, −1, 0, 1, 2, . . . } • Rationaaliluvut (jaksolliset desimaaliluvut): Q = {m/n | m, n ∈ Z, n 6= 0} • Irrationaaliluvut eli jaksottomat desimaaliluvut • Reaaliluvut eli kaikki rationaaliluvut ja irrationaaliluvut yhdessä. Merk. R Avoimet ja puoliavoimet välit: • Suljettu väli: [a, b] := {x ∈ R | a ≤ x ≤ b} • Vasemmalta puoliavoin väli: • Oikealta puoliavoin väli: ]a, b] := {x ∈ R | a < x ≤ b} [a, b[:= {x ∈ R | a ≤ x < b} • Avoin väli: ]a, b[:= {x ∈ R | a < x < b} Lukujoukkojen A ja B välisiä operaatioita: • Yhdiste: A ∪ B = {x | x ∈ A tai x ∈ B} • Leikkaus: A ∩ B = {x | x ∈ A ja x ∈ B} • Erotus: A \ B = {x | x ∈ A ja x ∈ / B} Esimerkki 1.1. • Avoimia ja puoliavoimia välejä: [2, 4[, ] − 1, 2[, ] − ∞, 4] • Suljettuja välejä: [4, 7], [−10, 8] • Yhdisteitä: [4, 6] ∪ [5, 7[= [4, 7[, {7} ∪ [5, 7[= [5, 7] • Leikkauksia: [4, 6] ∩ [5, 7[= [5, 6], [4, 6[∩[5, 7[= [5, 6[, N ∩ [3.4, 6[= {4, 5} • Erotuksia: [4, 6] \ {6} = [4, 6[, [4, 6]\]5, 8] = [4, 5] Hakasulkujen sijaan voidaan käyttää merkintänä myös normaaleja aaltosulkuja kun tarkoitetaan avointa tai puoliavointa väliä, eli esimerkiksi ]3, 6] voitaisiin merkitä (3, 6]. 2 1.2 Funktioista yleisesti Sääntöä f : D(f ) → B, joka liittää jokaiseen pisteeseen x ∈ D(f ) täsmälleen yhden pisteen f (x) ∈ B, sanotaan funktioksi f . B D(f ) R(f ) x f (x) Kuva 1: Määrittely-, maali- ja arvojoukko. Edellisessä joukkoa D(f ) kutsutaan määrittelyjoukoksi, joukkoa B maalijoukoksi ja joukkoa R(f ) := {f (x) | x ∈ D(f )} arvojoukoksi. Yllä esitetyt käsitteet ovat yleisiä, tässä kappaleessa keskitytään kuitenkin vain yhden reaalimuuttujan reaaliarvoisiin funktioihin, eli oletetaan että D(f ) ⊂ R ja R(f ) ⊂ R. Pisteiden (x, f (x)) muodostamaa käyrää kutsutaan funktion kuvaajaksi eli graafiksi. Määrittelyjoukon etsintä: • a∈ / D(f ) jos jotain lausekkeessa f (x) esiintyvää välitulosta ei voida laskea kun x = a, esim. tapahtuu nollalla jakaminen. • Edellinen pätee vaikka raja-arvo limx→a f (x) voitaisiin laskea, tai esim. sopivasti supistamalla vältyttäisiin nollalla jakamiselta. • Käytännössä voidaan siis aina kysyä "Osaako yksinkertainen taskulaskin laskea tämän vai antaako virheen". Esimerkki 1.2. Etsi funktioiden a) f (x) = joukot. q 1− 1 x b) g(x) = x x−1 Ratkaisu: a) r f (x) = 1− 1 x f : D(f ) → R 1 ≥ 0} x R(f ) = [0, 1[∪]1, ∞[= [0, ∞[\{1} D(f ) = {x ∈ R | x 6= 0, 1 − 3 − 2x−1 x−1 arvo- ja määrittely b) x 2x − 1 − x−1 x−1 g : D(g) → R D(g) = {x ∈ R|x 6= 1, x 6= 1} = \{1} g(x) = Mitäs jos oltaisiin sievennelty? g(x) = 2x − 1 x − (2x − 1) −x + 1 −1(x − 1) x − = = = = −1 x−1 x−1 x−1 x−1 x−1 y x 0 1 −1 g:n kuvaaja R(g) = {−1} Kuva 2 Esimerkki 1.3. xy-tason käyrä y = x2 on funktion f (x) = x2 kuvaaja eli graafi (katso kuva 3). Määrittelyjoukko D(f ) = R ja arvojoukko R(f ) = [0, ∞[= R+ ∪ {0}. y y = x2 x Kuva 3: Graafi. 4 1.3 1.3.1 Perusfunktiot Polynomit Polynomit ovat funktioita jotka voidaan kirjoittaa muodossa f (x) = a0 + a1 x + a2 x2 + · · · + an xn = n X ai x i , (1) i=0 missä kertoimet ai ∈ R ja n ∈ N. Luku n on polynomin asteluku (olettaen että an 6= 0) Esimerkki 1.4. Olkoon f (x) = 4x3 +6 ja g(x) = 6x4 −x3 +x2 Määritä polynomien f (x)+g(x) ja f (x)g(x) kertoimet ja asteluvut. Edellä esitetty muoto (1) polynomille ei ole aina käytännöllisin: usein polynomit ilmaistaan nollakohtiensa avulla seuraavan lauseen mukaisesti. Lause 1.1. Polynomilla on enintään astelukunsa verran reaalisianollakohtia (poikkeuksena triviaalitapaus f (x) = 0). Jos polynomilla f (x), jonka asteluku on n, on reaaliset nollakohdat xi , i = 1, ..., m niin se voidaan kirjoittaa muodossa m Y f (x) = g(x)(x − x1 )(x − x2 ) · · · (x − xm ) = g(x) (x − xi ) , i=1 missä g(x) on polynomi jonka asteluku on n − m. 5 (2) y y y = −2x3 + x y= x3 x x (a) (b) y y y = x4 x x y = 4x4 − 3x2 + 1 4 (c) (d) Kuva 4: Polynomifunktioiden nollakohtia. Yleisesti korkean asteen polynomin nollakohtien analyyttinen etsintä on hankalaa, jopa mahdotonta. Kuitenkin jos tunnetaan valmiiksi muutama nollakohta niin voidaan esim. jakokulmassa laskemalla etsiä e.m. polynomi g(x), jonka nollakohdat löydetään helposti jos n − m ≤ 2. Esimerkki 1.5. Laske polynomin f (x) = x4 − 4x3 + 2x2 + 4x − 3 nollakohdat kun tiedetään että f (1) = f (−1) = 0. Esimerkki 1.6. Ratkaise epäyhtälö x4 − 4x3 > −2x2 − 4x + 3. 1.3.2 Rationaalilausekkeet • Rationaalilausekkeet ovat muotoa P (x) Q(x) jossa P (x) ja Q(x) ovat polynomeja. • Rationaalilausekkeet eivät ole määriteltyjä pisteissä joissa Q(x) = 0. 6 • Näidenkin lausekkeiden sieventämisessä pätevät normaalit laskusäännöt, eli voidaan supistaa ja laventaa kuten reaaliluvuilla laskettaessa yleensäkin. Esimerkki 1.7. Missä pisteissä lauseke on määritelty? Sievennä lauseke a) 2 x+1 ab−b2 2a2 +ab c) xx+3 e) xyy2−x : xy+x 2 −1 − x2 −x d) 4a2 −b2 · b−a y x2 −1 x+1 b) x3 −6x2 +9x 5x2 −15x Rationaalilausekkeita sisältävät epäyhtälöt on helppoa ratkaista mikäli esiintyvien polynomien nollakohdat saadaan ratkaistua. Mikäli lauseke ei ole valmiiksi sopivassa muodossa tai usempia termejä (oikea puoli 0), niin turvallinen tapa on siirtää kaikki termit vasemmalle puolelle ja laventaa sopivasti. Tämä tosin voi johtaa korkeamman asteen polynomien nollakohtien etsimiseen. Esimerkki 1.8. Ratkaise epäyhtälöt 1.3.3 (x−1)2 (x+1) x−3 ≥ 0 ja 1 x−2 > x x+1 Trigonometriset funktiot Funktiot sin ja cos määritellään yksikköympyrän avulla (katso kuva 5). y Pπ/2 Pt = (cos t, sin t) kaaren pituus t t (radiaaneja) A = (1, 0) Pπ O x2 + y 2 = 1 C P−π/2 Kuva 5: Ympyrä. Muutamia muita määritelmästä suoraan seuraavia hyädyllisiä ominaisuuksia: 7 x • cos2 t + sin2 t = 1 • 2π-jaksollisuus eli cos(t + 2π) = cos(t), sin(t + 2π) = sin(t) • cos on parillinen ja sin pariton funktio eli cos(−t) = cos(t), sin(−t) = − sin(t) • Arvojen vaihteluväli [−1, 1] eli cos(t) ∈ [−1, 1] ja sin(t) ∈ [−1, 1]. Funktioiden cos(t) ja sin(t) avulla voidaan määritellä muita trigonometrisia funktioita joista tärkein on tangentti (3) tan(t) := sin(t)/ cos(t) 8 y − π2 1 π 2 −π π π/4 x y = tan x (a) y y = sin x π 3π/2 1 −π −π/2 −3π/2 x π/2 −1 (b) y 1 y = cos x π/2 π −π −2π 2π −π/2 x −1 (c) Kuva 6: Käyrät y = tan t (a), y = sin t (b) ja y = cos t (c) Määritelmistä suoraan seuraavat suorakulmaisen kolmion (katso kuva 7) ominaisuudet on myös hyvä muistaa a a b sin t = , tan t = , cos t = (4) c b c c a t b Kuva 7: Kolmio. 9 0 < t < 90◦ 1.3.4 Logaritmifunktiot Kuten trigonometriset funktiot, luonnollinen logaritmi ln(t) voidaan myös määritellä graafisesti. Olkoon t piste positiivisella x-akselilla xy-koordinaatistossa ja At on se pinta-ala joka jää suorien x = t ja x = 1, x-akselin ja käyrän y = 1/x väliin. y y = 1/x At t 1 x Kuva 8: Luonnollinen logaritmi graafisesti määriteltynä. ln(t) = At , t≥1 −At , 0 < t < 1 Luonnollisen logaritmifunktion f (t) = ln(t) ominaisuuksia: • Määrittelyjoukko D(f ) =]0, ∞[. • Arvojoukko R(f ) =] − ∞, ∞[ (Tämän osoittamiseksi tarvitsisimme määrätyn integraalin käsitettä.) • Aidosti kasvava koko määrittelyjoukossaan (⇒ f 0 (t) > 0 kaikilla t ∈ D(f )) • ln(1) = 0 Yleinen (a-kantainen) logaritmi voidaan määritellä luonnollisen logaritmin avulla loga (t) := ln(t) . ln(a) (5) Logaritmien laskusääntöjä. Olkoon a > 0, b > 0, x > 0, y > 0, a 6= 1 ja b 6= 1. Tällöin i) loga 1 = 0 ii) loga (xy) = loga (x) + loga (y) 1 iii) loga x = − loga (x) iv) loga (x/y) = loga (x) − loga (y) b (x) v) loga (xy ) = y loga (x) vi) loga (x) = log log (a) b 10 (6) y log2 (x) ln(x) log10 (x) x log0,1 (x) 1 log0,5 (x) Kuva 9: Erikantaisia logaritmifunktioita. 1.3.5 Potenssifunktiot Määrittelemme ensin funktion f (x) = exp(x) tai f (x) = ex . Tämä voidaan tehdä yksinkertaisesti vaihtamalla luonnollisen logaritmifunktion muuttujan ja funktion arvon roolit päinvastaisiksi: (7) y = ex ⇔ ln(y) = x Funktiot exp ja ln ovat itseasiassa toistensa käänteisfunktoita (joita käsittelemme yleisemmin myöhemmin). Funktion f (x) = ex ominaisuuksia: • Määrittelyjoukko D(f ) =] − ∞, ∞[. • Arvojoukko R(f ) =]0, ∞[ • Aidosti kasvava koko määrittelyjoukossaan (⇒ f 0 (x) > 0 kaikilla x ∈ D(f )) • e1 = e = limn→∞ (1 + 1/n)n = 2.721828 . . . • eln(x) = x kaikille x ≥ 0 ja ln(ex ) = x kaikille x ∈ R. Yleinen potenssifunktio voidaan määritellä vastaavasti yleisen logaritmin avulla: y = ax ⇔ loga (y) = x , eli loga (x) = ln(x) . ln(a) Potenssifunktion ominaisuuksia. Jos a > 0 ja b > 0 niin i) a0 = 1 ii) ax+y = ax ay x iii) a−x = 1/ax iv) ax−y = aay v) (ax )y = axy vi) (ab)x = ax bx 11 (8) y y = ln(x) y = ex 1 x 1 Kuva 10: Eksponentti- ja logaritmifunktio. Esimerkki 1.9. a) Laske limx→∞ log1/2 (x). b) Mitä on x jos log2 (x0.7 ) = 10? Esimerkki 1.10. Sievennä lausekkeet: √ a) loga (x4 + 3x2 + 2) + loga (x4 + 5x2 + 6) − 4 loga x2 + 2 b) log √ π (1 − cos√x) + logπ√(1 + cos x) − 2 logπ (sin x) c) ( 32 )4 , d) ( x)2 , e) x2 1.3.6 Hyperboliset funktiot Hyperboliset funktiot cosh(x) ja sinh(x) voidaan määritellään kaavoilla ex + e−x , 2 • Laskukaavoja on esim. Beta pullollaan. cosh(x) = sinh(x) = ex − e−x 2 y y = cosh(x) x y = sinh(x) Kuva 11: Hyperboliset funktiot. 12 Esimerkki 1.11. Osoita että cosh2 (x) − sinh2 (x) = 1 1.3.7 Itseisarvo |x| = x, x ≥ 0 −x, x < 0 (9) Katso kuva 12. |x| −x |x| x 0 |y − x| = |x − y| x y Kuva 12: Itseisarvo. Huomaa että määritelmän kaavassa (9) voidaan x:n tilalle myös sijoittaa suurempi lauseke. Esimerkki 1.12. |(x + 3)(x − 4)| = (x + 3)(x − 4) , (x + 3)(x − 4) ≥ 0 −(x + 3)(x − 4) , (x + 3)(x − 4) < 0 Esimerkki 1.13. Ratkaise | 2x + 5 |= 3. • Jos itseisarvoja on useampia, pahimmassa tapauksessa jokainen täytyy käsitellä erikseen ja tarkasteltavien vaihtoehtojen määrä lisääntyy Esimerkki 1.14. f (x) + g(x) −f (x) + g(x) |f (x)| + |g(x)| = f (x) − g(x) −f (x) − g(x) 1.4 , , , , f (x) ≥ 0 ja g(x) ≥ 0 f (x) < 0 ja g(x) ≥ 0 f (x) ≥ 0 ja g(x) < 0 f (x) < 0 ja g(x) < 0 Yhdistetyt funktiot Käytännön toteutuksen ja suunnittelun monimutkaisuuden välttämiseksi jaetaan prosessit usein pienempiin, toisiaan seuraaviin, vaiheisiin. Siis ensin x:lle tehdään operaatio f ja sitten lopputulokselle operaatio g. Matemaattisesti tämä tarkoittaa arvon g(f (x)) laskentaa. Luonnollisesti kaikkien välivaiheiden laskennan täytyisi onnistua, eli myös funktion g(f (x)) määrittelyjoukko 13 kiinnostaa. Olkoon f ja g funktioita. Yhdistetyn funktion (g ◦ f )(x) = g ◦ f (x) = g(f (x)) määrittelyjoukko on D(g ◦ f ) = {x | x ∈ D(f ) ja f (x) ∈ D(g)} (10) Esimerkki 1.15. Olkoon f (x) = x + 5 ja g(x) = x2 − 3. Laske f ◦ g(0) ja g ◦ f (−5). Esimerkki 1.16. Määritä f ◦ g, g ◦ f sekä näiden määrittely- ja arvojoukot kun f (x) = g(x) = x + 1. Esimerkki 1.17. Määritä f ◦ f , D(f ◦ f ) ja R(f ◦ f ) kun f (x) = 1−x . 1+x Esimerkki 1.18. Määritä D(h ◦ (g ◦ f )) ja D((h ◦ g) ◦ f ) kun f (x) = ja h(x) = 1/x. 1.5 √ x ja √ x + 2, g(x) = √ x−1 Injektio, surjektio ja bijektio Matemaattinen määritelmä: Funktio f on injektio jos ja vain jos f (x1 ) = f (x2 ) ⇒ x1 = x2 ∀x1 , x2 ∈ D(f ). Määritelmästä seuraa että jatkuva funktio on injektio jos ja vain jos se on joko aidosti kasvava tai aidosti vähenevä. Yhtälöitä käsitellessä on suhteellisen turvallista ottaa puolittain funktio joka on injektiivinen: huolta täytyy kantaa lähinnä määrittelyjoukosta. Epäyhtälöiden yhteydessä puolittain funktioita otettaessa vain aidosti kasvavat tai aidosti vähenevät funktiot ovat helppoja soveltaa, muiden kanssa täytyy olla todella tarkkana. 14 A B A (a) Surjektio. B A (b) Injektio. y (c) Bijektio. y y y∈B y∈B y∈B x x∈A f :A→B (d) Surjektiivinen funktio. B x x x∈A f :A→B x∈A f :A→B (e) Injektiivinen funktio. (f) Bijektiivinen funktio. Kuva 13: Surjektio, injektio ja bijektio. Esimerkki 1.19. Piirrä esimerkkejä funktion kuvaajista sellaisille funktioille jotka a) ovat injektioita, b) eivät ole injektioita. Esimerkki 1.20. Tutki onko f injektio koko määrittelyjoukossaan. Jollei ole, kuinka määrittelyjoukkoa pitäisi rajoittaa jotta f olisi injektio? p a) f (x) = (x − 1)3 b) f (x) = x2 − 2 |x| Esimerkki 1.21. Olkoon f ja g injektioita. Osoita että f ◦ g on injektio. Injektio, surjektio ja bijektio voidaan voidaan ajatella myös yhtälöiden ratkaisujen kautta: • Jos f : D(f ) → B on injektio ja a ∈ B niin yhtälöllä f (x) = a on korkeintaan yksi ratkaisu. • Jos f : D(f ) → B on surjektio ja a ∈ B niin yhtälöllä f (x) = a on aina vähintään yksi ratkaisu. • Jos f : D(f ) → B on bijektio ja a ∈ B niin yhtälöllä f (x) = a on täsmälleen yksi ratkaisu. Esimerkki 1.22. Ovatko funktiot cos(x), sin(x) ,logb (x), xn ja ex injektioita, surjektioita tai bijektioita kun maalijoukko B on a) B = R, b) B = R(f )? 15 1.6 Käänteisfunktiot Käänteisfunktio f −1 voidaan määritellä kaikille funktioille f jotka ovat injektioita seuraavasti: f (x) = y ⇔ x = f −1 (y) (11) Käänteisfunktiolla pätee siis seuraavat ominaisuudet: • D(f −1 ) = R(f ) • R(f −1 ) = D(f ) • f (f −1 (x)) = x • f −1 (f (x)) = x • (f −1 ) −1 (x) = f (x) f f (x) x f −1 Kuva 14: Käänteisfunktio. Mikäli käänteisfunktio on annettu, voidaan ratkaista mitä on x: arvo jos tunnetaan yhteys y = f (x) (eli tunnetaan f ) ja arvo y:lle. Tämä tapahtuu yksinkertaisesti ottamalla funktio f −1 puolittain yhtälöstä y = f (x). Vaikka käänteisfunktiota ei tunnettaisikaan, on usein tärkeä tietää onko sellainen edes olemassa, jotta ongelman ratkaisemiseksi osataan valita oikea algoritmi (tämä korostuu kun funktion lähtö- ja maalijoukot ovat monimutkaisempia kuin R. Graafisesti f (x) ja f −1 voidaan piirtää samaan koordinaatistoon peilaamalla f (x) suoran y = x suhteen. 16 y y y=x x = cos y y = x2 y = cos x x x x = y2 y=x (a) Kosinifunktiolla ei ole käänteisfunktiota, kun D(f ) = R. (b) Parillisella polynomifunktiolla ei ole käänteisfunktiota, kun D(f ) = R. y y x= √ y y= x = ln y x √ x x y = ln x y=x y=x (c) Eksponenttifunktio on logaritmifunktion käänteisfunktio. (d) Neliöjuurifunktiolla on käänteisfunktio. Kuva 15: Funktioita ja käänteisfunktioita. Käänteisfunktion lausekkeen määrittäminen voi olla hyvin haastavaa, joskus jopa mahdotonta: Täytyisi ratkaista y lausekkesta x = f (y). Esimerkki 1.23. Ratkaise käänteisfunktio f −1 (x) kun f (x) on a) 4x + 1 b) (x − 1)3 c) ex + e−x Jos funktio ei ole injektio, täytyy määrittelyjoukkkoa (eli käänteisfunktion arvojoukkoa) rajoittaa mikäli käänteisfunktio tahdotaan määrittää. Näin menetellään esimerkiksi trigonometristen funktioiden kohdalla: R(cos−1 ) = [0, π], R(sin−1 ) = [−π/2, π/2], R(tan−1 ) =] − π/2, π/2[. Esimerkki 1.24. Sievennä a) sin (cos−1 (−1/3)) b) sin sin−1 (0.6) c) tan−1 (−1) Ratkaisu: a) 17 { 1 Trigonometristen funktioiden käänteisfunktioiden määritelmän perusteella sin(cos (− ) ∈ [0, π]). | {z3 } z }| −1 ≥0 Toisaalta trigonometristen funktioiden määritelmästä (yksikköympyrä) (sin α)2 + (cos α)2 = 1 ⇒ (sin α)2 =p1 − (cos α)2 ⇒ sin α = ± 1 − (cos α)2 Voimme siis päätellä että muutettaessa sin neliöjuurilausekkeeksi täytyy meidän valita nimeomaan negatiivinen neliöjuuri. s 2 1 1 −1 = 1 − cos cos−1 − ⇒ sin cos − 3 3 s 2 1 = 1− − 3 r r 1 8 = 1− = 9 9 √ 2 2 = . 3 1.7 Yhtälöt, epäyhtälöt ja yhtälöryhmät Yhden muuttujan yhtälöt voidaan kirjoittaa muotoon g(x) = f (x), missa f ja g ovat siis x:n funktioita. Epäyhtälöt voidaan kirjoittaa samoin muotoon g(x) < f (x), g(x) > f (x), g(x) ≤ (x) tai g(x) ≥ f (x). Luonteeltaan erilaisia ratkaisutyyppejä: • Tarkka (analyyttinen) ratkaisu. – Usein paras jos tarvitaan täsmällinen ratkaisu tai lausekkeet sisältävät vapaita parametreja – Ei aina mahdollinen eikä käyttökelpoisin – 1. vuoden kursseissa yleensä käytetty • Numeerinen ratkaisu – Tiettyjen reunaehtojen vallitessa helpohko – Tuloksien luotettavuus kyseenalainen jollei tiedetä täsmälleen mitä ja miten ollaan tekemässä – Jos yhtälöllä useampia ratkaisuja niin usein hankalaa löytää kaikki ratkaisut – Ratkaisut ovat likimääräisiä (mutta laskenta-aikaa lisäämällä oikeita desimaaleja yleensä voidaan saada kuinka paljon vain tarvitaan) – Ei juuri käsitellä 1. vuoden kursseissa 18 • Graafinen ratkaisu – Suoraviivainen ratkaisutapa – Ratkaisut ovat likimääräisiä, mutta voidaan tarkentaa ("zoomaamalla"ratkaisun ympäristöön). – Hankalille lausekkeille käyrien piirtäminen ei triviaalia. Laskutarkkuudesta virheitä. – Salliin jossain määrin vapaita parametreja – Ei yleisty hyvin useamman muuttujan funktioille (joita käsitellään 1. vuoden kevään kursseissa) Esimerkki 1.25. Hae seuraaville yhtälöille graafinen ratkaisu. Jos mahdollista, etsi myös tarkka ratkaisu. a) x2 − 2x = a √ b) cos(x) = 1/ 2 c) sin(x) = 2x 5π Esimerkki 1.26. Hae seuraaville ratkaisu ja/tai tarkka ratkaisu. √ epäyhtälöille graafinen x+1 1 2x 2 > x−1 a) x − 2x < a b) cos(x) ≥ 1/ 2 c) sin(x) > 5π d) 6x−10 Yhtälöryhmien erittäin lyhyt oppimäärä: • Yhtälöryhmät muodostavat useammista yhtälöstä joilla on useampia muuttujia. • Yhtälörymien ratkaisemisesta (tarkka-, graafinen- ja numeerineratkaisu) voidaan todeta samat asiat mitä todettiin edellä yhtälöiden ratkaisuista. • Yksittäinen kahdenmuuttujan yhtälö esittää tasokäyrää. • Kahden muuttujan ja kahden yhtälön yhtälöryhmän ratkaisuja ovat tasokäyrien leikkauspisteet. • Kolmen muuttujan yhtälöryhmän ratkaisut ovat tasopintojen leikkauspisteitä (joita voi olla myäs ääretän määrä). Esimerkki 1.27. Etsi ratkaisu ja/tai tarkka ratkaisu. seuraaville yhtälöryhmille graafinen 2 2 2 y=x cos(y) = (cos(x)) (x − 1) + y 2 + z 2 = 2 a) b) c) x = y2 (sin(y))2 = 1 − x (x + 1)2 + y 2 + z 2 = 2 Yhtälöryhmiä muodostuu oleellisesti kun sanallinen informaatio puetaan matemaattiseen muotoon: Esimerkki 1.28. Määritä sen toisen asteen polynomin kertoimet joka kulkee (x, y) pisteiden (1, 0), (2, 4) ja (3, 16) kautta. Esimerkki 1.29. Kännykän etäisyys pisteessä (0, 10) sijaitsevasta tukiasemasta on 4km ja pisteessä (5,0) sijaitsevasta tukiasemasta etäisyys on 8 km. Millainen yhtälöryhmä on ratkaistava jos tahdotaan tietää missä pisteessä kännykkä on? Saadaanko kännykän koordinaatti selville yksikäsitteisesti? 19 2 Vektorit ja usean muuttujan funktiot Alkuun muutama sana avaruuksista R2 ja R3 joissa pääasiassa pyörimme tässä kappaleessa. Kolmiulotteisessa avaruudessa pisteen paikan määrää kolme lukua. Nämä luvut ilmoitetaan yleensä etäisyyksinä origosta, mitattuna kolmen toisiaan vastaan kohtisuoran akselin suunnassa. Näitä akseleita kutsutaan x–, y– ja z–akseleiksi, ja ne muodostavat karteesisen koordinaatiston. Pisteen P koordinaatit 3–ulotteisessa avaruudessa muodostavat järjestetyn kolmikon (x, y, z), missä reaaliluvut x, y ja z ovat pisteen etäisyydet origosta x–, y– ja z–akselin suunnassa. Kolmiulotteista avaruutta merkitään symbolilla R3 . Vastaavasti 2–ulotteista tasoa merkitään symbolilla R2 . On syytä huomata että kolmiulotteiseen avaruuteen voidaan taso asettaa monessa eri asennossa, eli pelkkä merkintä R2 ei kerro kaikkea mahdollista informaatiota vaan on oleellista mitä avaruuden koordinaatiston akselit edustavat. 2.1 Vektoreiden peruskäsitteet Vektori on otus jolla on suunta ja suuruus (koko, pituus). Geometrinen esitys: nuoli alkupisteestä loppupisteeseen. Vektoria pisteestä A pisteeseen B merkitään −→ v = AB (12) − v ja → v ovat käteviä. Varsin Erityisesti käsin kirjoitettaessa myös vaihtoehtoiset merkinnät v, → − tavallista on myös käyttää vain merkintää v, ja jättää lukijan vastuulle arvata asiayhteydestä onko kyseessä vektori vai ei. −→ Vektorin v suuruus = "nuolen"pituus, merkitään |v| tai |AB|. Vektorit u ja v ovat yhtäsuuria, jos niillä on sama pituus ja suunta. Esimerkki 2.1. Piirrä vektorit u ja v siten että niiden suunta on sama ja u on tuplasi pidempi kuin v. Voidaanko vektorit piirtää useammalla eri tavalla? Edellä käytetyt geometriset esitykset toimivat hyvin havainnollistavasti kun käsittelemme vektoreita avaruudessa R2 tai R3 . Keskitymmekin aluksi näihin avaruuksiin, vaikka lähes kaikki ominaisuudet ja kaavat joita esitämme toimisivat myös Rn :ssä. Vektorien u ja v summa saadaan asettamalla vektorin v häntä vektorin u kärkeen. Summavektori u + v on vektori u:n alkupäästä v:n kärkeen. Skalaarilla kertominen: Jos v on vektori ja t on skalaari, skalaarimonikerta tv on vektori, jonka pituus on |t| kertaa v:n pituus ja suunta sama kuin v:llä, jos t > 0 ja vastakkainen suunta, jos t < 0. Jos t = 0, pituus on nolla, kyseessä on nollavektori, merkitään 0. 20 u u+v v 2v − 12 v Kuva 16: Vektorien summa ja skalaarilla kertominen. 2.1.1 Standardikantavektorit Määritellään R2 :ssa vektorit i ja j seuraavasti: i on vektori origosta pisteeseen (1, 0) ja j origosta pisteeseen (0, 1). Nämä vektorit ovat standardikantavektorit tasossa. Jokainen vektori r origosta pisteeseen (x, y) voidaan ilmaista vektorien i ja j avulla: r = xi + yj. (13) Vaikka vektorin merkintä itsessään ei sisälläkkään yleisesti tietoa vektorin alkupisteestä, usein oletamme että se alkaa origosta. Jos p tätä tahdotaan korostaa, voidaan puhua paikkavektorista. Paikkavektorin r pituus on |r| = x2 + y 2 y (x, y) y 1 r j i 1 x x Kuva 17: Standardikantavektorit ja paikkavektori. Vektorien u = u1 i + u2 j ja v = v1 i + v2 j summa ja skalaarilla kertominen komponenttien avulla: u + v = (u1 + v1 )i + (u2 + v2 )j (14) tu = (tu1 )i + (tu2 )j (15) Nollavektori: 0 = 0i + 0j Vektoria jonka pituus on 1 kutsutaan yksikkövektoriksi. Mistä tahansa vektorista v voidaan muodostaa yksikkövektori v̂ jakamalla se pituudellaan: 1 v̂ = v (16) |v| 21 Kaikki edelliset määritelmät yleistyvät suoraan R3 :n vektoreille suoraviivaisesti. Kolmiulotteisessa avaruudessa standardikannan muodostavat vektorit i, j ja k, ts. vektorit origosta pisteisiin (1, 0, 0), (0, 1, 0) ja (0, 0, 1). Kaikki R3 :n vektorit voidaan esittää kantavektorien lineaarikombinaatioina, esim. paikkavektori pisteeseen (x, y, z) r = xi + yj + zk (17) x, y ja z ovat r:n komponentit. r:n pituus |r| = p x2 + y 2 + z 2 (18) −−→ Vektori v = P1 P2 pisteestä P1 = (x1 , y1 , z1 ) pisteeseen P2 = (x2 , y2 , z2 ) voidaan esittää kantavektorien avulla: −−→ v = P1 P2 = (x2 − x1 )i + (y2 − y1 )j + (z2 − z1 )k (19) Vektorit n–ulotteisessa avaruudessa Rn voidaan ilmaista yksikkövektorien e1 , e2 , · · · , en avulla muodossa x = x1 e1 + x2 e2 + · · · xn en (20) 2.1.2 Vektoreiden välinen kulma ja pistetulo R2 :n vektorien u = u1 i + u2 j ja v = v1 i + v2 j pistetulo u · v määritellään u · v = u1 v1 + u2 v2 (21) Vastaavasti R3 :ssa vektorien u = u1 i + u2 j + u3 k ja v = v1 i + v2 j + v3 k pistetulo u · v = u1 v1 + u2 v2 + u3 v3 (22) Samoin määriteltäisiin pistetulo myös avaruuden Rn vektoreille. Pistetulon ominaisuuksia: u·v =v·u u · (v + w) = u · v + u · w (tu) · v = u · (tv) = t(u · v) u · u = |u|2 (23) Jos θ on vektorien u ja v välinen kulma (0 ≤ θ ≤ π), niin u · v = |u||v| cos θ (24) Esimerkki 2.2. Laske vektorien u = 2i + 3j ja v = −1i + 2j välinen kulma. Esimerkki 2.3. Määritä kaikki vektorit jotka ovat kohtisuorassa vektoria u = 2i + 3j − k vastaan. 22 2.2 Suorat ja tasot vektorien avulla esitettynä Perinteinen tapa esittää suora R2 :ssa (xy-koordinaatistossa) on yhtälö y = kx + c. Vektoreiden avulla esitettynä kaikkien suoran pisteiden paikkavektorit saadaan kun parametrin t ∈ R arvoa vaihdetaan yhtälössä r = (r0 + tv), (25) missä r0 on suoran minkä tahansa pisteen paikkavektori ja v on suoran suuntainen vektori. Tämä esitystapa kelpaa suoralle sekä R2 :ssa että R3 :ssa ja yleisemminkin. y L tv Lkv r r0 x Kuva 18: Suora vektorien avulla esitettynä. Esimerkki 2.4. Esitä suora y = 2x + 3 vektoreiden avulla. Esimerkki 2.5. Suora kulkee pisteiden (4, 5, 1) ja (2, 0, 7) kautta. Mikä on tämän suoran yhtälö? Jos parametrin t arvot rajoitetaan välille [a, b] niin muodostuu jana. Mikäli suuntavektorin v pituus on 1, tällöin janan pituus on |b − a|. Esimerkki 2.6. Määrittele suora joka kulkee x−akselin suuntaisesti ja kulkee pisteen (3, 1, 2) kautta. Määrittele myös edellä mainitulta suoralta jana jonka pituus on 5 ja keskipiste (3, 1, 2). Jos merkitään r = xi + yj + zk, r0 = x0 i + y0 j + z0 k ja v = ai + bj + ck tarkastellaan yhtälössä (25) jokaista kolmea komponettia erikseen, saadaan suoran (skalaari) esitysmuoto x = x0 + at (26) y = y0 + bt (−∞ < t < ∞) z = z0 + ct 23 Esimerkki 2.7. Muodosta suoran normaali esitysmuoto eliminoimalla esitysmuodosta (26) parametri t. Ratkaisu: Jos a 6= 0, b 6= 0 ja c 6= 0, voidaan t ratkaista kaikista yhtälöistä, jolloin saadaan standardimuoto: y − y0 z − z0 x − x0 = = (27) a b c Jos jokin v:n komponenteista häviää niin voidaan t toki yhä eliminoida, Esim jos c = 0 niin x − x0 y − y0 = , z = z0 . a b (28) Esimerkki 2.8. Määritä suora joka kulkee pisteen P = (3, 3, 2) kautta ja leikkaa x-akselin pisteessä x = (0, 2, 0), i) vektorimuodossa, ii) skalaarimuodossa, iii) normaalimuodossa. Kahden geometrisen objektin välinen etäisyydellä tarkoitetaan niillä olevien kahden pisteen välistä lyhintä etäisyyttä. Pisteen etäisyys suorasta voidaan laskea hyvin monella eri tavalla. Eräs tapa on käyttää n.k. ristitulon sisältävää kaavaa: Pisteen P0 etäisyys pisteen P1 kautta kulkevasta suorasta, joka on vektorin v suuntainen on s= |(r0 − r1 ) × v| |v| (29) Kaavan tarvitsema ristitulo × esitellään hieman myöhemmin mutta käymme seuraavan tehtävän sisällä läpi periaatteen jolla saadaaan myös lähin piste, ei pelkästään etäisyyttä. Esimerkki 2.9. Etsi pistettä (4, −2) lähin piste suoralta y = 2x + 1. Olkoon piste r1 suoralla L1 jonka suuntavektori on v1 . Vastaavasti olkoon r2 suoralla L2 jonka suuntavektori on v2 . Suorien L1 ja L2 välinen (lyhin) etäisyys on s= |(r2 − r1 ) · (v1 × v2 )| . |v1 × v2 | (30) Tämä kaava löytyy useimmista kaavakirjoista. Jälleen kaavan käyttö vaatisi mystisen ristitulon hallintaa. Eikä kaava anna edes tietoa siitä mitkä nuo lähimmät pisteet ovat. Kokeillaanpa seuraavan esimerkin ratkaisussa käyttää taas helppoa geometrista lähestymistapaa tähän. 24 z v1 × v2 L2 v2 v 1 s y L1 x Kuva 19: Suorien etäisyys z y v1 × v2 v2 v1 v1 v2 x Kuva 20: Ristitulo. Esimerkki 2.10. Oletetaan että kaksi maanalaista tunnelia kulkevat suorien L1 ja L2 suuntaisesti. Olkoon nämä suorat määrittelevät paikka- ja suuntavektorit r1 = 1i + 0j + 1k, v1 = 1i + 1j + 1k, r2 = 0i + 0j + 2k, r1 = 2i + 0j + 0k. Mitkä ovat ne tunnelien pisteet jotka ovat toisiaan lähimpänä. 25 2.2.1 Tasot Olkoon jälleen P0 = (x0 , y0 , z0 ) R3 :n piste, jonka paikkavektori on r0 = x0 i + y0 j + z0 k. Jos n = Ai + Bj + Ck on nollasta poikkeava vektori, on olemassa täsmälleen yksi taso, joka kulkee pisteen P0 kautta ja on n:ää vastaan kohtisuora. Tällöin n on tason normaalivektori. Jos P = (x, y, z) on mielivaltainen piste tasossa, jonka paikkavektori on r, tason yhtälö vektorimuodossa on n · (r − r0 ) = 0. (31) Taso siis muodostuu kaikista niistä pisteistä joiden paikkavektori r toteuttaa edellisen yhtälön. Mitähän e.m. yhtälö muuten mahtaa geometrisesti merkitä? z n P0 r − r0 y P r0 r O x Kuva 21: Taso ja sen normaalivektori Jos edellisessä yhtälössä pistetulo lasketaan auki niin saadaan tason yhtälö normaalimuodossa: A(x − x0 ) + B(y − y0 ) + C(z − z0 ) = 0 (32) Esimerkki 2.11. Kävellään pitkin pisteen (1, 2, 1) kautta kulkevaa tasoa jonka normaalivektori on (2, 1, 2). Ajatellaan z-koordinaattia korkeutena. lKuinka paljon liikutaan ylöspäin (tai alaspäin) aina kun a) x-suunnassa liikutaan yksi yksikkö ja y suunnassa nolla yksikköä. b) y-suunnassa liikutaan yksi yksikkö ja x suunnassa nolla yksikköä c) sekä x että y suunnassa liikutaan yksi askel Taso voidaan myös esittää parametrisessa muodossa (kahden parametrin avulla) kun annetaan tason suunnan määrittävät suuntavektorit v1 ja v2 sekä yksi piste r0 tasolta: r = r0 + t1 v1 + t2 v2 , missä t1 , t2 ∈ R 26 (33) Esimerkki 2.12. Oletetaan että kolmiulotteisessa avaruudessa pystytään liikkumaan aina vain vektoreiden v1 = i + 2j + 3k ja v2 = 4i + 5j + 6k suuntiin. Oletetaan lähdetään liikkumaan pisteestä (−1, 0, 1). Esitä parametrisessa muodossa kaikki mahdolliset pisteet joihin päästään liikkumaan. Pisteen etäisyydelle tasosta on suoria kaavoja: Olkoon P0 mikä tahansa tason piste. Pisteen P = (x1 , y1 , z1 ) etäisyys tasosta Ax + By + Cz + D = 0: −−→ P P · n |(r − r) · n| |r0 · n − r · n| 0 0 s= = (34) = |n| |n| |n| Koordinaattien (x1 , y1 , z1 ) avulla lausuttuna s= |Ax1 + By1 + Cz1 + D| √ . A2 + B 2 + C 2 (35) z n P0 r − r0 P s y r0 r O x Kuva 22: Pisteen etäisyys tasosta Jälleen kerran nämä kaavat epäonnistuvat vastaamaan yksinkertaiseen kysymykseen: mikä on pistettä P lähin piste? Mietitään tähän ratkaisumallia seuraavan tehtävän yhteydessä. Esimerkki 2.13. Mikä on pisteen (2, −1, 3) etäisyys tasosta, jonka yhtälö on 2x − 2y − z = 9? Mikä on tämä kyseinen piste johon matka on lyhin? 27 2.3 Vaihtoehtoisia ilmaisutapoja vektoreille Rakkaalla lapsella on monta nimeä ja vektoreitakin voidaan merkitä monella eri tavalla. Esimerkiksi R3 :ssa olemme käyttäneet yksikkövektoreita i, j ja k vektoreita käsiteltäessä. Näiden lisäksi yleisesti käytetään ainakin kaarisulkuja ja hakasulkuja joiden väliin vain ladotaan edellämainittujen yksikkövektoreiden kertoimet. Nämä kertoimetkin voidaan latoa joko peräkkäin tai päälleekkäin, pilkuilla erotettuna tai ilman pilkkuja, tilanteesta riippuen. Siis alla olevat merkinnät voitaisiin tulkita samaksi vektoriksi R3 :ssa 2i + 3j − k, 2 3 −1 , 2, 3, −1 , 2 3 , −1 2 3 −1 , 2, 3, −1 , 2 3 −1 Samanlaisia merkintöjä voidaan käyttää myös Rn :ssä. Jollei asiayhteydestä homma selviä niin joillaikin merkinnöillä tietysti R2 :ssa on mahdollisuus sekoittaa lukujoukko ja vektori keskenään. Ja toiseksi viimeisintä merkintätapaahan käytetään myös avaruuden pisteiden merkitsemiseen, mutta tässä ei suurta vaaraa ole koska pistettä voidaan oleellisesti ajatella (paikka)vektorina. 2.4 Usean muuttujan reaaliarvoiset funktiot Kappaleessa 1.2. esitettiin yleinen funktion määritelmä ja sitä sovellettiin yhden reaalimuuttujan reaaliarvoisten funktioden kanssa. Tässä kappaleessa käsitellään usean reaalimuuttujan reaaliarvoisia funktioita. Esimerkiksi f (x, y, z) = x2 y + cos(zx) on kolmen muuttujan funktio reaaliarvoinen funktio. Usean muuttujan funktion argumenttia voidaan ajatella myös avaruuden Rn pisteenä tai vektorina (ja puhua vektorimuuttujan funktiosta). Esimerkiksi jos x = (x1 , x2 ) niin g(x) = f (x1 , x2 ) = x21 ex2 on kahden muuttujan reaaliarvoinen funktio. Edelliset funktiot olivat sillä tavalla yksinkertaisia että ne olivat kaikkialla määriteltyjä ja arvojoukotkin on helppo nähdä: f : R3 → R, R(f ) =] − ∞, ∞[, g : R2 → R ja R(g) = [0, ∞[. Suurimman mahdollisen määrittelyjoukon etsiminen usean muuttujan funktioille ei periaatteessa ole sen vaikeampaa kuin yhden muuttujan funktoillekkaan: mietitään vain milloin laskutoimitukset ovat sallittuja. Sensijaan määrittelyjoukon hahmottelu voi olla haastavaa. Esimerkki mahdollinen määrittelyjoukkko funktioille f (x, y) = p 2.14. Etsi ja hahmottele suurin p 1 2 2 + −x − y + 5 ja f (x, y, z) = x + y 2 + z 2 − 1 + ln(x + y). x−2y Arvojoukon määrittäminen usean muuttujan funktioilla on yleisesti hyvinkin vaikea ongelma, laskettiin sitten käsin tai tietokoneella. Edellisen esimerkin funktioiden arvojoukot lienevät vielä pääteltävissä, mutta entäpä esim. funktion f (x, y) = cos(xy) + x3 − y 2 kun D(f ) = {(x, y) ∈ R2 | x2 + y 2 < 1)}? Arvojoukko jää ehkä päättelemättä/käsin laskematta. Kuten yhdenkin muuttujan funktioiden tapauksessa niin myös usean muuttujan funktioiden käyttäytymistä voidaan arvioida funktion kuvaajaa tarkastelemalla. Ainakin jos muuttujia ei ole kauhean paljoa. • Kahden muuttujan funktion f (x, y) kuvaajaa voidaan ajatella pintana kolmiulotteisessa avaruudessa: Jos koordinaattiakselit ovat x, y ja z niin merkitään z = f (x, y). Esimerkiksi p 2 2 funktion f (x, y) = 1 − x − y kuvaaja on yksikköpallon xy-tason yläpuoleinen osa. 28 • Kolmen muuttujan funktion kuvaajaa voi ajatella vaikka "animaationa"jossa yhtä muuttujaa ajatellaan p vaikkapa aikana. Tällöin pinta muuttuisi ajansuhteen. Esim. funktion f (x, y, t) = (1 + cos(t)) − x2 − y 2 kuvaajaa voisi demonstroida xy-tason yläpuoleisena osana pallosta jonka säde ensin pienenee, sitten suurenee, sitten pienenee jne. Myös tasa-arvo käyriä voidaan käyttää kuvaajien hahmottelussa. Kahden muuttujan funktiolle f (x, y) tasa-arvo käyrät ovat sellaisia xy-tason käyriä joissa funktio saa aina saman arvon. Jos funktion arvoa ajattelee korkeuskoordinaattina ja kuvaajaa pintana niin tasa-arvokäyrät ovat samassa roolissa kuin suunnistuskartassa näkyvät käyrät ovat maaston korkeudelle. Eli jos muuttujien arvoja vaihdellaan vain niin että pysytään tasa-arvokäyrällä niin kuvaajalla ei liikuta ylös- eikä alaspäin. Esimerkki 2.15. Funktion f (x, y) = 2y + x2 tasa-arvokäyrät ovat muotoa 2y + x2 = C eli alaspäin aukeavia paraabeleja. Kun tässä lukua C kasvatetaan niin funktion arvo kasvaa ja samalla nämä paraabelit siirtyvät ylospäin. Tästä voimmekin nähdä että kun otetaan yksi askel y-suunnassa niin kuvaaja nousee kaksi askelta korkeammalle. Toisiin suuntiin kuvaajan muutosten tarkka hahmottaminen ei olekkaan niin helppoa. Injektiivisyys, surjektiivisuus ja bijektiivisyys määritellään usean muuttujan funktioille aivan samoin kuin yhden muuttujan funktioille. Nämä eivät kuitenkaan ole kovin mielenkiintoisia käsitteitä jos funktion maalijoukko on R sillä tällöin injektiiviset funktiot ovat aika harvassa jolleivat määrittelyjoukot ole hyvin rajoittuneita (oleellisesti yksiulotteisina ajateltavia). 2.5 Vektoriarvoiset funktiot Aikaisemmin funktioidemme maalijoukko on ollut aina R tai sen osajoukko. Vektoriarvoisista funktioista puhuttaessa avaruus. ajattelemme että maalijoukko voi olla myös √ √ useampiulotteinen Esim. f (x) = x2 , x3 on funktio f : R → R2 ja f (x) = x2 , x, 1 − x on funktio f : [0, 1] → R3 . Edellisten esimerkkien kaltaisten yhden muuttujan vektoriarvoisten funktioiden kuvaajat voidaan ajatella käyrinä maaliavaruudessa: kyseinen käyrä muodostuu niistä kaikista pisteistä joita funktio arvokseen saa kun sen (ainut) muuttuja saa kaikki arvonsa. Esimerkki 2.16. Hahmottele funktioiden f (x) = x2 , 2x ja g(t) = 2t, t + 1, 2 kuvaajia. Usein tälläisen funktion muuttujaa t voidaan ajatella aikana ja funktion arvo f (t) kertoo missä pisteessä ollaan tänä ajanhetkenä. Yleisimmillään tällä kurssilla funktion määrittelyjoukko on Rn (tai sen osajoukko) ja maalijoukko on Rm . Tälläisiä funktioita syntyy esimerkiksi kun sähköisten piirien toimintaa mallintaessa: - Funktion f muuttujina olisi esimerkiksi jännitelähteiden (n kappaletta) jännitteet vektorissa U ja funktion arvona vektori I joka sisältää piirissä kulkevien meitä kiinnostavien virtojen arvoja (m kappaletta). Eli f (U) = I. -Jos funktio olisi surjektio (maalijoukkona Rm ) niin jännitteet sopivasti valitsemalla saataisiin varmasti aikaiseksi mitkä tahansa virrat. - Pystyttäisiinkö jännitteet selvittämään mitatuista virroista yksikäsitteisesti riippuisi varmaan siitä mitä virtoja on mitattu. Jos tälläinen funktio olisi injektio niin mitatuista virroista voisi päätellä kaikki jännitteet käyttämällä käänteisfunktiota f −1 (I) = U. 29 Surjektiivisuus ja injektiivisyyskäsitteet ovat siin tietysti aivan samat kuin aikaisemmin yhden muuttujan reaaliarvoisia funktioita käsitellessä. Käytännössä tällä kurssilla käsittelemme vektorimuuttujan vektoriarvoisista funktioista puhuttaessa vain n.k. lineaarisia funktioita, jotka esitellään myöhemmissä kappaleissa. 3 Matriisit Matriisilla tarkoitetaan luku– tai funktiojoukkoa, joka on järjestetty hakasulkujen (tai kaarisulkujen) ympäröimäksi suorakulmaiseksi taulukoksi. Näitä lukuja tai funktioita kutsutaan matriisin alkioiksi tai elementeiksi. Esimerkkejä matriiseista: x e sin x 4 28 −1 4 a1 a2 a3 , (36) , , e2x x2 11 0.27 0 7 Ja sitten tuhannen taalan kysymys: Mihin matriiseja tarvitaan? Vastaus tähän on: Matriisit ovat monesti kätevä apuväline tiedon kompaktiin ja tehokkaaseen esittämiseen, analysointiin ja muokkaukseen. Erityisesti lineaariset yhtälöryhmät, esim. ( 5x − 2y + z = 0 (37) 3x + 4z = 0 on kätevää esittää kerroinmatriisin 5 −2 1 A= 3 0 4 (38) avulla. Esimerkkejä matriisien sovellusalueilta ovat mm.: • sähkö–, tie– ym. verkostojen mallintaminen • säätötekniikka • kemialliset reaktiot • tilastollisen tiedon analysointi • mekaniikka • tietokonegrafiikka 3.1 Matriiseihin liittyvät peruskäsitteet Termillä rivi viitataan lyhyesti matriisin vaakariviin ja termillä sarake matriisin pystyriviin. Yleensä matriisia merkitään isolla kirjaimella (A, B, C jne.) tai kirjoittamalla yleinen matriisielementti haka- tai kaarisulkuihin: A = [ajk ]. Ensimmäinen indeksi ilmoittaa rivin ja toinen sarakkeen, josta kyseinen elementti löytyy. a11 a12 · · · a1n a21 a22 · · · a2n (39) A = [ajk ] = .. .. .. . . ··· . am1 am2 · · · amn Matriisi, jossa on m riviä ja n saraketta on m × n–matriisi. Mikäli matriiisin A elementit ovat reaalilukuja niin voidaan merkitä A ∈ Rm×n . Tärkeitä erikoistapauksia: 30 • Jos m = n, on kyseessä n × n– neliömatriisi. Neliömatriisin diagonaali, jolla ovat alkiot a11 , a22 , . . . , ann on matriisin päälävistäjä. • Jos m = 1 ja n > 1 kutsutaan matriisia yleensä rivivektoriksi tai vaakavektoriksi ja merkintänä käytetään yleensä ison kirjaimen sijasta pientä kirjainta, esim. v = [2 4 1]. • Jos n = 1 ja m > 1 kutsutaan matriisia yleensä sarakevektoriksi tai pystyvektoriksi ja b merkintänä käytetään yleensä ison kirjaimen sijasta pientä kirjainta, esim b = 1 b2 Matriisien yhtäsuuruus: Matriisit A ja B ovat yhtäsuuria, ts. A = B, jos niiden kaikki alkiot ovat yhtäsuuria, eli ajk = bjk kaikilla j:n ja k:n arvoilla. Vektorin a transpoosi aT saadaan vaihtamalla pystyvektori vaakavektoriksi tai päinvastoin. Vastaavasti matriisin A transpoosi AT saadaan vaihtamalla matriisin rivit ja sarakkeet keskenään: a11 a21 · · · am1 a12 a22 · · · am2 (40) AT = [akj ] = .. .. .. . . ··· . a1n a2n · · · amn Jos AT = A, matriisi A on symmetrinen. Symmetriset matriisit ovat varsin yleisiä sovelluksissa. Jos AT = −A, matriisi A on vinosymmetrinen (skew–symmetric). Matriisin A ∈ Rm×n alimatriisi (tai osamatriisi, engl. submatrix) saadaan jättämällä A:sta rivejä ja/tai sarakkeita pois. Esim. 2 × 3–matriisin a11 a12 a13 (41) A= a21 a22 a23 2 × 2–alimatriisit ovat a12 a13 a11 a13 a11 a12 ja , a22 a23 a21 a23 a21 a22 (42) Yo. matriisilla A on myös kaksi 1 × 3–, kolme 2 × 1–, kuusi 1 × 2 ja kuusi 1 × 1–alimatriisia. Pienemmistä matriiseja (erityisesti vektoreita) yhdistetään usein myös suuremmiksi matriiseiksi esim. vaakavektoreista ai = ai1 ai2 · · · ain , i = 1, . . . , m (43) voidaan koota m × n matriisi a1 a2 A = .. . (44) am Samoin esim. pystyvektoreista bi = b1i b2i · · · bni T , i = 1, . . . , m (45) voidaan koota n × x matriisi B = b1 , b2 , . . . , bm (46) Esitysmuodossa (46) jätetään pilkut usein myös merkitsemättä tai sitten vektorit bi erotellaan väli- tai katkoviivalla. 31 Neliömatriisi, jonka päälävistäjän yläpuolella Esim. 1 −2 5 olevat alkiot ovat nollia, on alakolmiomatriisi. 0 0 3 0 (47) 0 2 Neliömatriisi, jonka päälävistäjän alapuolella olevat alkiot ovat nollia, on yläkolmiomatriisi. 1 6 −1 0 3 2 (48) 0 0 2 Molemmissa tapauksessa päälävistäjän alkiot voivat olla tai olla olematta nollia. Neliömatriisi A = [ajk ], jonka päälävistäjän ylä– ja alapuoliset alkiot ovat nollia, ts. ajk = 0, kun j 6= k, on diagonaalimatriisi. Diagonaalimatriisi, jonka päälävistäjän alkiot ovat kaikki ykkösiä, on identtinen matriisi eli yksikkömatriisi, merkitään In tai I. Esim. 3 × 3–yksikkömatriisi: 1 0 0 I = 0 1 0 (49) 0 0 1 3.2 3.2.1 Matriisien laskutoimitukset Matriisien yhteenlasku ja kertominen skalaarilla • Yhteenlasku: Jos A = [ajk ] ja B = [bjk ], niin A + B = [ajk + bjk ] (50) • Skalaarilla kertominen: Olkoon A = [ajk ] m × n–matriisi ja c skalaari (yleensä reaali- tai kompleksiluku). Tällöin cA = [cajk ] (51) Kuten yleensäkin, luvulla −1 kertominen voidaan esittää lyhyesti: (−1)A = −A ja yleisemmin (−k)A = −kA. Negatiivisten skalaarien avulla matriisien vähennyslasku tulee määriteltyä myös luonnollisella tavalla: A + (−B) = A − B. erotus). Nollamatriisi: m × n–matriisi on m × n–nollamatriisi, jos kaikki sen elementit ovat nollia, merkitään 0 (tai 0, jos ei ole vaaraa sekoittaa nollamatriisia reaalilukuun). Toisinsanoen A = B jos ja vain jos A − B on nollamatriisi. Edellisistä määritelmistä seuraa selvästi mm. seuraavat reaaliluvuille ja vektoreillekin pätevät tutut ominaisuudet: A+B=B+A (52) (U + V) + W = U + (V + W) (53) A+0=A (54) A + (−A) = 0 (55) c(A + B) = cA + cB (56) 32 (c + k)A = cA + kA (57) c(kA) = (ck)A (58) 1A = A (59) Huom. Matriisien on oltava samankokoisia, jotta yhteenlasku olisi määritelty. Selvästi pätee myös että (A + B)T = AT + BT (60) (cA)T = cAT (61) Esimerkki 3.1. Olkoon 1 3 2 A= , −1 2 −3 0 4 0 B= . −1 2 1 (62) Laske 4A, A + B, 2B − 2A, AT +BT, A−BT , tai perustele miksi lasku ei ole määritelty. Määritä a siten että a2 A + 2aA + A = 0 3.2.2 Matriisien kertolasku Tähän loppuikin sitten samankaltaisuus matriisien ja reaalinumeroiden välisten operaatioiden välillä, matriisin kertolasku määritellään seuraavasti: m × n–matriisin A = [ajk ] ja r × p–matriisin B = [bjk ] tulo C = AB on määritelty jos ja vain jos r = n (B:n rivien määrä = A:n sarakkeiden määrä) ja määritellään m × p–matriisina C = [cjk ], jonka elementit ovat cjk = n X ajl blk = aj1 b1k + aj2 b2k + · · · + ajn bnk (63) l=1 Huom. Vaikka olisi AB = 0, niin välttämättä ei ole A = 0, B = 0 tai BA = 0. Esim. 1 1 −1 1 −1 1 1 1 vs. 2 2 1 −1 1 −1 2 2 Yleisessä tapauksessa siis AB 6= BA, esim. 9 3 1 −4 vs. −2 0 2 5 1 −4 9 3 2 5 −2 0 (64) (65) Intuitiivisesti selvempiä matriisitulon ominaisuuksia ovat: (kA)B = (kAB) = A(kB) (66) A(BC) = (AB)C (67) (A + B)C = AC + BC (68) C(A + B) = CA + CB (69) Vähemmän intuitiivinen taasen on ominaisuus (AB)T = BT AT 33 (70) Esimerkki 3.2. 1 3 2 A= , −1 2 −3 0 4 0 B= . −1 2 1 (71) Laske AB, BA, AT B, ABT , AT BT ja BT AT tai perustele miksi kertolasku ei ole määritelty. Esimerkki 3.3. Jos A on 4 × 5 matriisi ja B on 3 × 4 matriisi niin minkä kokoisia täytyy matriisien C ja D olla jotta lauseke AC + DB olisi määritelty? Matriisien tulon määritelmästä seuraa: Jos a ja b ovat n:n alkion pystyvektoreita, aT on vaakavektori ja vektorien kertolaskun tulos on 1 × 1–matriisi, ts. reaaliluku. Tätä lukua kutsutaan vektorien a ja b sisätuloksi tai pistetuloksi, merkitään a · b: b1 n .. X T a · b = a b = [a1 · · · an ] . = al bl = a1 b1 + · · · + an bn . (72) l=1 bn 3.3 Lineaariset yhtälöryhmät Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x1 , · · · , xn on joukko yhtälöitä, jotka ovat muotoa a11 x1 + · · · + a1n xn = b1 a x + · · · + a x = b 21 1 2n n 2 (73) · · · am1 x1 + · · · + amn xn = bm Esim. kahden yhtälön ja kolmen tuntemattoman yhtälöryhmä: ( 5x1 + 2x2 − x3 = 4 x1 − 4x2 + 3x3 = 6 (74) Lukuja ajk kutsutaan ryhmän kertoimiksi. • Jos kaikki luvut bi ovat nollia, kyseessä on homogeeninen yhtälöryhmä. • Jos ainakin yksi bi on nollasta poikkeava, on kyseessä epähomogeeninen ryhmä. Yhtälöryhmän ratkaisu on lukujoukko x1 , · · · , xn , joka toteuttaa kaikki m yhtälöä. Yhtälöryhmän ratkaisuvektori on vektori x, jonka komponentit muodostavat ryhmän ratkaisun. Jos yhtälöryhmä on homogeeninen, on olemassa ainakin triviaaliratkaisu x1 = 0, · · · , xn = 0. Erityisen kiinnostavia kysymyksiä • Kuinka yhtälöryhmä ratkaistaan algoritmillisesti? (Muutama tapa esitetään tällä kurssilla) • Ratkaisujen määrä: Onko ratkaisua? Jos on, niin millaisia erilaista ratkaisua löytyy? (tämän kurssin ydinainesta) • Kuinka herkkä ratkaisu on matriisin lukujen aij tai bi muutoksille, eli tilanteelle jossa joko systeemi muuttuu tai häiriöitä esiintyy? (käsitellään hieman myös tällä kurssilla) 34 Yhtälöryhmä (73) voidaan kirjoittaa matriisien avulla: Ax = b , missä kerroinmatriisi A = [ajk ] on m × n–matriisi a11 a12 a21 a22 A = .. .. . . am1 am2 (75) a1n a2n .. . ··· ··· ··· ··· (76) amn ja pystyvektorit x1 x = ... b1 b = ... xn Matriisi a11 a21 à = .. . (77) bm a12 a22 .. . am1 am2 ··· ··· ··· ··· a1n a2n .. . b1 b2 .. . (78) amn bm on yhtälöryhmän lisätty matriisi (augmented matrix). Matriisi à sisältää yhtälöryhmän kaikki annetut luvut ja määrittää siten yhtälöryhmän täydellisesti. Yhtälöryhmän ratkaisemiseksi tarvitsee näin ollen tarkastella ainoastaan lisättyä matriisia. Käytännön resepti: Gaussin eliminointi. Esimerkki 3.4. Kirjoita yhtälöryhmä ( 5x1 + 2x2 − x3 = 4 x1 − 4x2 + 3x3 = 6 (79) matriisimuodossa ja esitä myös yhtälöryhmää kuvaava lisätty matriisi. 3.3.1 Gaussin eliminointi Tässä kappaleessa esitetään eräs yksinkertainen algoritmi, Gaussin eliminaatio, lineaarisin yhtälöryhmän ratkaisemiseksi. Tämä algoritmi ei ole erityisen tehokas (vaatii paljon laskutoimituksia) mutta antaa tarkan ratkaisun ja on käyttökelpoinen pieniä yhtälöryhmiä käsin ratkaistaessa. Yleisesti: yhtälöryhmän ratkaisut pysyvät samoina, jos tehdään perusoperaatiot yhtälöille: • Yhtälöiden järjestys vaihdetaan (ei vaikuta ratkaisuihin) • Yksi tai useampi yhtälö kerrotaan nollasta poikkeavalla vakiolla • Yhtälö lisätään (puolittin) toiseen yhtälöön. Gaussin eliminointi käyttää näitä operaatioita lineaariseen yhtälöryhmään. Jos yhtälöryhmä kuvataan lisätyn matriisin avulla niin operaatiot on nopeampi suorittaa koska xi symboleja ja ylimääräisiä "+"symboleja ei tarvitse kirjoittaa näkyviin. Vastaavat lineaarisenvyhtälöryhmän käsittelyn perusoperaatiot lisätylle matriisille: • Vaihdetaan kaksi riviä keskenään 35 • Yksi tai useampi rivi kerrotaan nollasta poikkeavalla vakiolla • Lisätään vakiolla kerrottu rivi toiseen riviin Gaussin eliminaation tarkoituksena on muokata yhtälöryhmän lisättymatriisi niinkutsuttuun porrasmuotoon. 1. Vähennetään ylin rivi sopivalla kertoimella kerrottuna kaikista muista riveistä. Kerroin valitaan aina siten että ensimmäisen sarakkeeseen tulee nolla. Tämän toimenpiteen jälkeen ensimmäisessä sarakkeessa on ainoastaan ylimmällä rivillä nollasta poikkeava alkio. 2. Vähennetään toinen rivii sopivalla kertoimella kerrottuna kaikista alapuoleisista riveistä. Kerroin valitaan aina siten että kullakin rivillä toiseen sarakkeeseen (lävistäjän alapuolella) tulee nollia. 3. Jatketaan vastaavasti kunnes lävistäjän alapuolella on pelkkiä nollia. 4. Ratkaistaan alimmalta riviltä viimeisen muuttujan arvo ja sijoitetaan se toiseksi alimpaan yhtälöön (riviin). 5. Ratkaistaan toiseksi alimmalta riviltä (yhtälöstä) toiseksi viimeisen muuttujan arvo ja sijoitetaan se kolmanneksi alimpaan yhtälöön (riviin). Jatketaan muuttujen ratkaisua tällä tavalla kunnes kaikki muuttujat on ratkaistu. HUOM! Edellisessä algoritmissa voi tulla välillä vastaan tilanne jossa ei voida edetä koska lävistäjällä on jossain vaiheessa lukuarvo 0. Tällöin voidaan toimia seuraavasti: a) Jos kyseisessä sarakkeessa on lävistäjän alapuolella vielä nollasta poikkeavia arvoja, vaihdetaan rivejä keskenään. b) Jos lävistäjäalkio ja kaikki sen alapuolella ovat nollia niin siirrytään seuraavaan sarakkeeseen. Jotta tällöin algoritmissa voitaisiin puhua vielä lävistäjäalkioista, pitää "unohtaa"matriisin ensimmäinen saraka (jota ei muutenkaan enää tarvita mihinkään) ennen vaiheita 4 ja 5. Tätä "lävistäjäalkiota"kutsutaankin yleensä tukialkioksi". Huomionarvoista on myös että mikä tahansa rivi voidaan missä tahansa vaiheessa kertoa millä tahasa nollasta poikkeavalla luvulla: näin kannattaa tehdä joskus esim. murtolukujen välttämiseksi tai algoritmin numeerisen stabiilisuuden parantamiseksi (ei käsitellä tällä kurssilla). Esimerkki 3.5. Olkoon x ∈ R3 ja 1 0 −4 A = −2 0 3 −1 2 1 (80) a) Ratkaise Gaussin eliminoinnilla yhtälöryhmä Ax = 0. b) Etsi ne vektorit x ∈ R3 joille Ax = x. Edellistä algoritmia voidaan käyttää myös tapauksissa joissa muuttujia on enemmän kuin yhtälöitä. Tässä tapauksessa (mikäli ratkaisua on ylipäätään olemassa) jotkut luvuista xj jäävät varmasti vapaasti valittaviksi. Ratkaisuja voi siis olla äärettömän monta. Esimerkiksi kolmen muuttujan (x1 , x2 ja x3 ) tapauksessa voidaan sanoa että yhtälörymän ratkaisuiksi kelpaavat (x1 , x2 , x3 ) pisteet muodostavat jonkin seuraavista 36 a) tyhjän joukon (eli ei ole olemassa ratkaisua) b) yksittäisen pisteen avaruudessa R3 c) suoran avaruudessa R3 d) tason avaruudessa R3 (melko harvinainen tapaus) Esimerkki 3.6. Yhtälö 1 0 −4 1 −2 0 3 x = 1 −1 2 1 a (81) kuvaa erästä prosessia jossa x on alkutuotteiden määrä ja oikean puolen vektori ilmaiseen haluttujen lopputuotteiden määrään. Millä parametrin a arvoilla yhtälöllä a) on yksi ratkaisu? a) ei ole yhtään ratkaisua? c) on ääretön määrä ratkaisuja? Esimerkki 3.7. Tutkitaan yhtälöryhmää Ax = b. Yhtälöryhmää kuvaava lisätty matriisi à = [A b] voidaan Gaussin reduktiolla muokata porrasmatriisimuotoon. Merkitään näin saatua porrasmatriisia symbolilla B. Tutkitaan viittä erilaista yhtälöryhmää : 2 4 0 2 2 4 0 1 0 2 4 0 2 4 0 (i) B = , (ii) B = (iii) B = 0 0 0 0 , (iv) B = 0 0 1 1 1 , (v) 0 2 1 0 0 1 0 0 0 0 0 0 0 0 0 2 4 0 1 1 0 0 1 1 0 B= 0 0 0 2 4 0 0 0 0 0 Kussakin tapauksessa vastaa seuraaviin kysymyksiin: a) Onko yksikään edellisessä kohdassa tutkituista yhtälörymistä homogeeninen? Jollei, niin kuinka matriisi B muuttuisi jos alkup yhtälöryhmä olisi homogeeninen (mutta A ei muuttuisi)? b) Ratkaise matriisin B kuvaama htälöryhmä. Mikäli mahdollista, anna ratkaisu muodossa x = b̃ + c1 v1 + . . . ck vk , missä ci ∈ R (eli etsi vektorit b̃ ja vi ). c) Tulkitse geometrisesti edelliset ratkaisut kohtien (i)-(iii) matriiseille. d) Ratkaise vastaavat homogeeniset yhtälöryhmät. Tulkitse ratkaisut geometrisesti kohdissa (i)-(iii). Kappaleen lopuksi esittelemme vielä hieman kehittyneen version edellä esitetystä algoritmista: Gaussin-Jordan eliminaation. Tässä algoritmissa suoritetaan edellisen algoritmin vaiheen 3 jälkeen seuraavat askeleet 1. "nollataan"viimeisen "ei nolla"rivin ensimmäisen nollasta poikkeavan alkion (n.k. tukialkion) yläpuolelta kaikki luvut lisäämällä kyseistä riviä yläpuoleisiin riveihin sopivilla kertoimilla kerrottuna. 2. Siirrytään seuraavaksi ylimpään "ei nolla"riviin ja toistetaan edellinen. Jatketaan niin kauan että kaikki rivit on käyty läpi. 37 Tällöion saatavassa porrasmatriisissa on yleensä huomattavasti enemmän nollia ja alkuperäisen algoritmin vaiheet 4 ja 5 on nopeampi suorittaa. Lisäksi usein Gaussin tai Gauss-Jordanin eliminaatiossa muutetaan ensin arvoon 1 tukialkio, eli se lisättävän rivin alkio jonka alapuoleisia alkioita viedään nollaksi. Tämä tapahtuu yksinkertaisesti kertomalla koko kyseinen rivi sopivalla luvulla. Esimerkki 3.8. Ratkaise Gauss-Jordan eliminaatiolla seuraavat yhtälöryhmät −3x + 2y − 6z = 6 2x1 − x2 + 1x3 = 1 (a) (b) 5x + 7y − 5z = 6 3x1 + 2x2 − 4x3 = 4 x + 4y − 2z = 8 −6x1 + 3x2 − 3x3 = 2 3.3.2 Lineaarinen riippumattomuus Vektorien a1 , · · · , am lineaarikombinaatio on muotoa c1 a1 + · · · + cm am , (82) missä c1 , · · · , cm ovat skalaareja (tässä tapauksessa reaalilukuja). Vektorit a1 , · · · , am ovat lineaarisesti riippumattomia, jos ja vain jos c1 a1 + c2 a2 + · · · + cm am = 0 ⇔ c1 = c2 = · · · = cm = 0 (83) Jos lineaarikombinaatio on nolla siten, että jokin kertoimista on nollasta poikkeava, vektorit ovat lineaarisesti riippuvia. Tällöin ainakin jokin niistä voidaan ilmaista toisten lineaarikombinaationa. z v2 v1 y v3 0, 5v1 −1, 5v2 x Kuva 23: Lineaarisesti riippuvat vektorit. 38 z v2 y v1 v3 0, 5v1 1, 5v2 x Kuva 24: Lineaarisesti riippumattomat vektorit. Matriisin A = [ajk ] lineaarisesti riippumattomien rivien tai sarakkeiden maksimimäärä on matriisin A aste (rank), merkitään rankA. Edellä esitetyssä matriisin asteen määritelmä pitää sisällään seuraavan tuloksen: matriisin A ja sen transpoosin AT aste on sama. Tämä tulos ei ole millään muotoa triviaali ja useissa lähteissä matriisin asteen määritelmä pitääkin sisällään vain maininnan joko sarakkeesta tai rivistä, ei molemmista. On täysin sovelluskohtaista kiinnostaako matriisin lineaarisesti riippumattomien rivi- vai sarakevektorien määrä. Gaussin eliminaation yhteydessä esitetyt perusoperaatiot (rivien vaihto etc) eivät muuta matriisin astetta. Matriisin aste saadaankin siis eliminaation lopputuloksena saatavan porrasmatriisin ei–nollarivien lukumääränä (osaatko perustella miksi?). Suora seuraus lineaarisen riippumattomuuden käsitteestä on että kaikki vektorit v ∈ Rn voidaan esittää vektoreiden v1 , . . . , vm lineaarikombinaatioina jos ja vain jos vektoreiden v1 , . . . , vm joukosta n kappaletta on lineaarisesti riippumattomia. Jos näin on, niin sanomme että vektorit v1 , . . . , vm virittävät avaruuden Rn . Esimerkki 3.9. Tutki ovatko vektorit 1 0 −3 , 3 1 −4 ja −2 −1 1 lineaarisesti riiippumattomia. 3.3.3 Ratkaisujen yleisiä ominaisuuksia Lineaarisella yhtälöryhmällä a11 x1 + a12 x2 + · · · + a1n xn = b1 a x + a x + · · · + a x = b 21 1 22 2 2n n 2 ··· am1 x1 + am2 x2 + · · · + amn xn = bm eli yhtälöryhmällä Ax = b • on ratkaisuja jos ja vain jos r = rank(A) = rank(Ã) 39 (84) • on täsmälleen yksi ratkaisu, jos r = n • on ääretön määrä ratkaisuja, jos r < n Homogeeniselle lineaariselle yhtälöryhmälle a11 x1 + a12 x2 + · · · + a1n xn = 0 a x + a x + · · · + a x = 0 21 1 22 2 2n n ··· am1 x1 + am2 x2 + · · · + amn xn = 0 (85) pätee: • Triviaaliratkaisu x = 0 aina olemassa • Ei–triviaaliratkaisuja olemassa jos ja vain jos r = rank(A) < n • Jos r < n, triviaali– ja ei–triviaaliratkaisut yhdessä muodostavat ratkaisuavaruuden, jonka dimensio on n − r (ei päde epähomogeenisille yhtälöryhmille, osaatko sanoa miksi?) • Ratkaisuavaruuden dimensio = A:n nulliteetti, merk. null(A). Pätee siis rank(A) + null(A) = n (86) Käytännössä null(A) on yhtälöryhmän ratkaisussa vapaiksi jäävien muuttujien lukumäärä (epähomogeenisen yhtälöryhmän tapauksessa sillä oletuksella että ratkaisua on ylipäätään olemassa). Esimerkki 3.10. Olkoon B matriisi joka saadaan kun matriisi A muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(A) , null(A) sekä yhtälöryhmän Ax = 0 ratkaisuavaruuden dimensio (eli ratkaisussa vapaaksi kun jäävien muuttujien lukumäärä) 2 4 0 1 1 2 4 0 2 4 0 1 2 4 0 0 1 1 0 , d) B = 0 0 1. 0 0 a) B = 0 0 1 1 , b) B = , c) B = 0 0 0 0 0 0 2 4 0 0 0 2 0 0 0 0 0 0 0 0 0 0 Esimerkki 3.11. Olkoon B matriisi joka saadaan kun yhtälöryhmään Ax = b liittyvä lisätty matriisi à = [A b] muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(A) , null(A) sekä yhtälöryhmän Ax =b ratkaisussa vapaaksi kun jäävien muuttujien lukumäärä 2 4 0 1 1 0 2 4 0 −1 2 4 0 1 −1 2 4 1 0 0 1 1 0 −3 , c) B = 0 0 1, d) B = 0 0 1 −2. a) B = 0 0 1 1 1 , b) B = 0 0 0 2 4 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3.4 Käänteismatriisi Tarkastellaan neliömatriiseja n × n–matriisin A = [ajk ] käänteismatriisi A−1 on matriisi, jolle pätee AA−1 = A−1 A = I (87) 3 1 Esimerkki 3.12. Olkoon A = . Muotoile lineaarinen yhtälöryhmä joka ratkaisemalla −2 4 saataisiin käänteismatriisi A−1 . 40 Käänteismatriisi voidaan määrittää esim. Gauss–Jordan –eliminoinnilla. • Idea: muodostetaan lisätty matriisi à = [A I] ja saatetaan se Gauss-Jordan eliminoinnilla muotoon [I K], jossa tällöin K = A−1 . • Myöhemmin esitetään menetelmä, jolla käänteismatriisin voi määrittää determinanttien avulla 1 −1 1 Esimerkki 3.13. Määritä matriisille A = 0 0 1 käänteismatriisi. 5 5 0 Epähomogeenisella yhtälöryhmällä ei välttämättä ole ratkaisua. Niinpä käänteismatriisiakaan ei kaikille matriiseille voida määrittää. Jos A:lla on käänteismatriisi, kutsutaan matriisia ei– singulaariseksi, muussa tapauksessa se on singulaarinen. A x Ax A−1 Kuva 25: Käänteismatriisi Mihinkä käänteismatriisia sitten käytetään? Käänteismatriisin määritelmästä seuraa että jos käänteismatriisi A−1 on olemassa niin yhtälöryhmä Ax = b voidaan ratkaista kun yhtälö kerrotaa puolittain käänteismatriisilla: A−1 Ax = Ix = x, eli x = A−1 b. Siis jos kerroinmatriisin käänteismatriisi on valmiina, voidaan yhtälöryhmä ratkaista suoraan matriisin ja vektorin kertolaskuna. Jokainen vektorin x arvo voidaan lisäksi laskea toisistaan riippumatta, jolloin laskenta on mahdollista toteuttaa tehokkaasti esim. rinnakkaislaskentaa hyväksi käyttäen. Esimerkki 3.14. 1 −1 1 2 0 0 1 Ratkaise yhtälöryhmä Ax = b käänteismatriisin avulla kun A = ja b = 0 5 5 0 −1 Muutamia käänteismatriisiin liittyviä ominaisuuksia: • Käänteismatriisi on yksikäsitteinen. • n × n–matriisilla A on käänteismatriisi jos ja vain jos rank A = n • Käänteismatriisin käänteismatriisi: (A−1 )−1 = A • Tulon käänteismatriisi: (AC)−1 = C−1 A−1 Edellisistä ominaisuuksista seuraa että A,B ja C ovat n × n–matriiseja, niin 41 • Jos rank A = n ja AB = AC, niin B = C • Jos rank A = n, niin AB = 0 ⇒ B = 0 • Jos A on singulaarinen, niin ovat myös AB ja BA Esimerkki 3.15. Oletetaan että A ja B ovat ei-singulaarisia 3 × 3 matriiseja ja x, y ja b ovat 3 × 1 matriiseja (sarakevektoreita). a) Ratkaise x kun tiedetään että Ab + B(x − y) = b. b) Millä ehdolla yhtälöllä Ab + B(x − y) = x on i) yksikäsitteinen ratkaisu ii) ääretön määrä ratkaisuja? Esimerkki 3.16. Eräs tyypillinen sovellus käänteismatriisille on pienimmän neliösumman menetelmä jossa data-pisteisiin (xi , yi ), i = 1, . . . , n yritetään sovittaa mallia y = a1 f1 (x) + a2 f2 (x) + · · · + am fm (x) missä m ≤ n. Mikäli tällä ongelmalla on yksikäsitteinen ratkaisu niin se voidaan muotoilla yhtälöryhmän AT Aa = AT b ratkaisuna, missä matriisi A riippuu pisteistä xi ja funktioista fj ja vektori b riippuu yi pisteistä. Mitä tässä tapauksessa voidaan sanoa matriisin AT A asteesta? Muodosta matriisi A ja vektori b kun sovitettavana on lineaarinen malli y = a1 x + a2 . 3.5 Determinantit Determinantti on neliömatriiseihin liittyvä käsite. Determinanttia voidaan käyttää mm. kun ratkaistaan yhtälöryhmiä, luokitella kriittisiä pisteitä, tutkitaan lineaarista riippuvuutta, määritetään käänteismatriisia, tehdään muuttujanvaihtoja, määritetään ristituloa jne. Determinantin sovelluskohteet ovat siis moninaiset, joskin ilman determinanttejakin voitaisiin pärjätä: determinantti on pohjimmiltaan laskusääntö jolla suhteellisen monimutkainen asia voidaan joskus esittää melko helposti muistettavasa ja toteutettavassa muodossa. 3.5.1 Determinantin määritelmä Käsitellään siis n × n–matriiseja, merkitään a11 a21 A = .. . an1 a12 · · · a22 · · · .. . ··· an2 · · · a1n a2n .. . . (88) ann Tapauksessa n = 2 determinantti määritellään kaavalla a11 a12 = a11 a22 − a12 a21 detA = a21 a22 (89) Tämä 2 × 2 matriisin determinantin laskukaava on peruskaava joka löytyy useimmista kaavastoista. Myös 3 × 3 matriisin determinantin laskukaava löytyy usein jossain muodossa kaavastoista, esim. seuraava muoto on hyvin yleisesti käytetty: a11 a12 a13 a21 a22 a23 = a11 a22 a23 − a21 a12 a13 + a31 a12 a13 (90) a32 a33 a32 a33 a22 a23 a31 a32 a33 Huom. merkit: + - + Yhtälön oikealla puolella olevat alideterminantit saadaan poistamalla D:stä ko. determinantin kerrointa vastaava rivi ja sarake, esim. a11 :n tapauksessa ensimmäinen 42 rivi ja sarake jne. Tämä on itseasiassa erikoistapaus rekursiokaavasta jolla suurempien matriisien determinantti on kätevää määritellä: a11 a12 a13 · · · a1n n a21 a22 a23 · · · a2n X (−1)j+k ajk Mjk .. = . k=1 a31 a32 a33 · · · ann missä alideterminantti Mjk on n − 1:en kertaluvun determinantti, joka saadaan poistamalla matriisista j:s rivi ja k:s sarake. Indeksi j voi siis viitata mihin tahansa riviin. Tällä tavalla laskettua determinanttia kutsutaan rivin suhteen auki kehitetyksi. Determinantti voidaan myös kehittää auki sarakkeen suhteen: a11 a12 a13 · · · a1n n a21 a22 a23 · · · a2n X (−1)j+k ajk Mjk , .. = . k=1 a31 a32 a33 · · · ann lopputulos on sama. 0 −1 Esimerkki 3.17. Määritä det(A) käyttämällä rekursiokaavaa kun A = 2 0 1 0 1 4 0 −1 0 2 . 3 0 0 2 Usein käytetään käsitettä liittotekijä (cofactor): ajk :n liittotekijä on Cjk = (−1)j+k Mjk ja determinantti liittotekijöiden avulla: det(A) = aj1 Cj1 + aj2 Cj2 + · · · + ajn Cjn = a1k C1k + a2k C2k + · · · + ank Cnk 3.5.2 (91) Determinanttien perusominaisuuksia Determinantilla on useita ominaisuuksia joista kaikki eivät ensisilmäyksellä ole välttämättä aivan itsestäänselviä listaamme näistä joitakin: • Jos determinantin rivit ja sarakkeet vaihdetaan keskenään, determinantin arvo ei muutu. • Jos determinantin jokin rivi tai sarake kerrotaan vakiolla k, determinantin arvo muuttuu k–kertaiseksi. • Jos jonkin rivin tai sarakkeen kaikki alkiot ovat nollia, on determinantin arvo = 0. • Jos determinantin kaksi riviä tai saraketta vaihdetaan keskenään, vaihtuu determinantin merkki. • Jos jokin rivi tai sarake saadaan toisesta vakiolla kertomalla, on determinantin arvo = 0. • Jos jokin rivi tai sarake lisätään toiseen vakiolla kerrottuna, determinantin arvo ei muutu. • n × n–matriiseille A ja B, det(AB) = det(BA) = det(A)det(B) 43 (92) • Jos determinantin alkiot ovat funktioita, determinantin D derivaatta D0 on D0 = D(1) + D(2) + · · · D(n) , (93) missä D(j) saadaan derivoimalla j:nnen rivin alkiot. • Transpoosin determinantti: detAT = detA (94) 1 detA (95) • Käänteismatriisin determinantti: detA−1 = • Neliömatriisin rivit (tai sarakkeet) ovat lineaarisesti riippumattomia jos ja vain jos matriisin determinantti ei ole nolla. • Homogeenisen yhtälöryhmälle (jonka kerroinmatriisi on neliömatriisi) triviaaliratkaisu on ainut ratkaisu jos ja vain jos kerroinmatriisin determinantti ei ole nolla. Edellisiä ominaisuuksia käyttäen voidaan osoittaa että determinantin arvo voidaan laskea viemällä matriisi porrasmuotoon Gaussin eliminaatiota käyttämällä ja sen jälkeen kertomalla diagonaalialkiot keskenään. 1 0 −1 Esimerkki 3.18. Määritä det(A) käyttämällä Gaussin eliminaatiota kun −1 1 0 . 2 1 3 3.5.3 Cramerin sääntö Cramerin säääntöä voidaan käyttää tietyissä tilanteissa raktaisemaan lineaarinen yhtälöryhmä determinantteja hyväksi käyttäen: Jos n:n yhtälön ja n:n muuttujan yhtälöryhmällä a11 x1 + · · · + a1n xn = b1 a x + · · · + a x = b 21 1 2n n 2 (96) · · · an1 x1 + · · · + ann xn = bn on nollasta poikkeava kerroin matriisin determinantti, eli D = det(A) 6= 0, ryhmällä on täsmälleen yksi ratkaisu, joka saadaan kaavasta D2 Dn D1 , x2 = , · · · , xn = , (97) x1 = D D D missä Dk on determinantti, joka saadaan D:stä korvaamalla k:s sarake alkioilla b1 , · · · , bn . Cramerin säännön seurauksena saadaan kääteismatriisin laskemiselle determinanttien avulla sääntö A11 A21 · · · An1 1 1 A12 A22 · · · An2 A−1 = [Ajk ]T = (98) . ··· . detA detA . A1n A2n · · · Ann , missä Ajk on ajk :ta vastaava liittotekijä. Huom. Cramerin sääntö on joskus kätevä käsin laskettaessa ja sitä on helppo soveltaa vaikka matriisi A sisältäisi parametreja (eli jotkut tai jopa kaikki alkiot olisivat tuntemattomia). Se ei myöskään sisällä jakolaskuja, mikä usein saattaa auttaa numeriikan kanssa. Myös teoreettisia tuloksia johdettaessa, Cramerin sääntö voi yksinkertaistaa välivaiheita huomattavasti. Kuitenkin kun lasketaan kuinka monta laskutoimenpidettä joudutaan tekemään determinanttien aukikehityksessä, huomataan tämän olevan niin suuri ettei tätä menetelmää kovin usein sovelleta käytännön sovelluksissa. 44 3.6 Ominaisarvot ja ominaisvektorit Ominaisvektorit ja ominaisarvot ovat suuressa roolissa lineaaristen systeemien käyttäytymistä tutkittaessa. Monet tärkeät matemaattiset apuneuvot (mm. diagonalisointi ja singulaariarvohajotelma) myös käyttävät ominaisarvoja ja vektoreita hyödykseen. 3.6.1 Määritelmä ja laskenta Olkoon A = [ajk ] n × n–matriisi. Tarkastellaan vektoriyhtälöä Ax = λx, (99) missä λ on luku. Sellaista λ:n arvoa, jolla yhtälöllä on ratkaisu x 6= 0, kutsutaan matriisin A ominaisarvoksi (eigenvalue). Vastaavasti ratkaisut x 6= 0 ovat A:n ominaisarvoa λ vastaavia ominaisvektoreita. Suoraan määritelmästä seuraa että jos x on matriisin A ominaisarvoa λ vastaava ominaisvektori, niin on myös kx ∀ k 6= 0. Ominaisarvojen joukko = A:n spektri (kirjallisuudessa usein puhutaan kuvauksen tai operaattorin A spektristä). Ominaisarvoon λ liittyvät ominaisvektorit yhdessä vektorin 0 kanssa muodostavat tähän ominaisarvoon liittyvän A:n ominaisavaruuden. Matriisin ominaisarvojen ja –vektorien määräämistä kutsutaan ominaisarvo–ongelmaksi (eigenvalue problem). Ominaisarvoyhtälö voidaan kirjoittaa muotoon (A − λI)x = 0 (100) Tällä yhtälöllä on nollasta poikkeavia ratkaisuja jos ja vain jos rank(A − λI) < n. Tämä taas sattuu olemaan yhtäpitävä sen kanssa että a11 − λ a · · · a 12 1n a21 a22 − λ · · · a2n D(λ) = det(A − λI) = .. (101) .. .. = 0 ... . . . an1 an2 · · · ann − λ Yo. yhtälö on matriisin A karakteristinen yhtälö, ja D(λ) karakteristinen determinantti. Kun D(λ) kehitetään, saadaan λ:n shut-in n:nnen asteen polynomi, joka on matriisin A karakteristinen polynomi. Etsimällä tämän polynomin nollakohdat siis löydetään ominaisarvot. Ominaisarvoja tosin etsitään tällä tavoin vain pienille matriiseille ja lähinnä käsin laskettaessa. Edellisestä nähdään suoraan että n × n–matriisilla on siis vähintään yksi ominaisarvo ja enintään n erilaista ominaisarvoa (siis jos myös polynomien kompleksijuuret sallittaisiin). Kuinka monta erilaista (lineaarisesti riippumatonta) ominaisvektoria sitten kuhunkin ominaisarvoon liittyy? Tätä ei voi suoraan ominaisarvon perusteella täsmällisesti ennustaa sen paremmin kuin että yksi niitä vähintään on. Etsimällä annetulle ominaisarvolle yhtälöryhmän Ax = λx yleinen ratkaisu, saamme sitten kaikki ominaisarvot ja tässä ratkaisussa vapaaksi jäävien muuttujien lkm. lineaarisesti riippumattomien ominaisvektorien määrä. 45 Jos ajatellaan matriisia A lineaarimuunnoksena, ominaisvektorit ovat niitä vektoreita jotka säilyttävät suuntansa tässä kuvauksessa. Näissä tapauksissa kuvaus on siis vain tietyn skalaarin sanelema pituuden skaalaus, ja tämä skalaari on kyseistä ominaisvektoria vastaava ominaisarvo. Käsin laskien ominaisarvot laskettava ensin, sen jälkeen voidaan laskea ominaisvektorit esim. Gaussin eliminoinnilla. Suurille matriiseille ominaisarvot (ja ominaisvektorit) lasketaan yleensä tietokoneella. Jos matriisin A ominaisarvo λ on karakteristisen yhtälön Mλ :nnen kertaluvun juuri, Mλ on λ:n algebrallinen kertaluku (algebraic multiplicity). Ominaisarvoon λ liittyvien lineaarisesti riippumattomien ominaisvektorien lukumäärä mλ on λ:n geometrinen kertaluku (geometric multiplicity). 1 0 0 Esimerkki 3.19. Määritä matriisin C = 3 0 1 ominaisarvot sekä niiden algebraalinen 1 1 0 että geometrinen monikerta. Määritä myös näihin ominaisarvoihin liittyvät ominaisvektorit. Huom. matriisilla ei välttämättä ole reaalisia ominaisarvoja. Kompleksilukuja käyttäen löytäisimme kuitenkin ominaisarvoja ja ominaisvektoreita mutta näitä tarvitsemme vasta kurssilla "BM20A5830 Differentiaaliyhtälöiden peruskurssi", joten emme käsittele niitä tällä kurssilla. 0 1 Esimerkki 3.20. Onko matriisilla reaalisia ominaisarvoja?. −1 0 46