Luentomoniste
Transcription
Luentomoniste
Matriisit ja optimointi kauppatieteilijöille 802160P Luentomoniste Kari Myllylä Niina Korteslahti Topi Törmä Oulun yliopisto Matemaattisten tieteiden laitos Kevät 2015 Sisältö 1 Matriisialgebra 1.1 Määritelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Matriisien laskutoimituksia . . . . . . . . . . . . . . . . . . . . 1.2.1 Matriisien yhteen- ja vähennyslasku . . . . . . . . . . . 1.2.2 Skalaarilla kertominen . . . . . . . . . . . . . . . . . . 1.2.3 Matriisien kertolasku: . . . . . . . . . . . . . . . . . . . 1.3 Erikoistyyppisiä matriiseja . . . . . . . . . . . . . . . . . . . . 1.3.1 Diagonaalimatriisi . . . . . . . . . . . . . . . . . . . . 1.3.2 Identtinen matriisi (Yksikkömatriisi) . . . . . . . . . . 1.3.3 Nollamatriisi . . . . . . . . . . . . . . . . . . . . . . . 1.4 Transponoitu matriisi . . . . . . . . . . . . . . . . . . . . . . . 1.5 Matriisin determinantti . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Determinantin määrääminen: . . . . . . . . . . . . . . 1.5.2 Determinantin ominaisuuksia: . . . . . . . . . . . . . . 1.6 Käänteismatriisi . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Menetelmiä käänteismatriisin ratkaisemiseksi: . . . . . 1.6.2 Käänteismatriisin ominaisuuksia: . . . . . . . . . . . . 1.7 Lineaarisen yhtälöryhmän matriisimuoto ja sen ratkaiseminen 1.8 Lineaarinen riippuvuus ja matriisin aste . . . . . . . . . . . . 1.8.1 Lineaarinen riippuvuus . . . . . . . . . . . . . . . . . . 1.8.2 Matriisin aste . . . . . . . . . . . . . . . . . . . . . . . 1.8.3 Matriisin asteen ominaisuuksia . . . . . . . . . . . . . 1.9 Matriisin ominaisarvot ja ominaisvektorit . . . . . . . . . . . . 1.9.1 Ominaisarvojen määrääminen . . . . . . . . . . . . . . 1.9.2 Ominaisvektoreiden määrittäminen . . . . . . . . . . . 1.10 Panos-tuotos–malli . . . . . . . . . . . . . . . . . . . . . . . . 1.11 Matriisien sovellutus regressioanalyysissä . . . . . . . . . . . . 2 Yhden muuttujan funktion optimointi 2.1 Funktion f (x) tutkiminen derivaatan avulla . 2.1.1 Funktion monotonisuus ja derivaatta . 2.1.2 Funktion kuperuus ja toinen derivaatta 2.2 Funktion f (x) ääriarvo . . . . . . . . . . . . . 2.2.1 Paikallisten ääriarvokohtien löytäminen 2.2.2 Paikallisten ääriarvokohtien laatu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 4 4 5 6 6 7 7 8 8 9 10 11 12 13 14 17 17 18 19 20 20 21 22 24 . . . . . . 28 28 28 29 30 32 35 1 3 Kahden muuttujan funktion ääriarvoista 3.1 Normaalit ääriarvot (ei sidotut) . . . . . . . . . . . . . . . . . 3.1.1 Kahden muuttujan funktion paikalliset ääriarvokohdat 3.1.2 Kahden muuttujan funktion ääriarvon laatu . . . . . . 3.2 Sidotut ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Sidotut ääriarvot yhtälörajoitteen tapauksessa . . . . . 3.2.2 Sidotut ääriarvot epäyhtälörajoitteen tapauksessa . . . 3.2.3 Absoluuttiset ääriarvot ehtoalueessa . . . . . . . . . . . 3.2.4 Hyötyfunktion maksimi . . . . . . . . . . . . . . . . . . . . . . . . . . 38 38 39 39 40 40 42 43 43 . . . . . . 46 46 46 47 48 48 50 5 Lineaarinen optimointi 5.1 Geometrinen ratkaisu . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Kantaratkaisu–menetelmä . . . . . . . . . . . . . . . . . . . . . . 5.3 SIMPLEX–menetelmä . . . . . . . . . . . . . . . . . . . . . . . . 52 52 54 55 . . . . . . . . 4 Usean muuttujan funktion ääriarvoista 4.1 Normaali ääriarvo (ei sidottu) . . . . . . . . . . . . . . . . . . . 4.1.1 Usean muuttujan funktion ääriarvokohta . . . . . . . . . 4.1.2 Usean muuttujan funktion ääriarvon laatu . . . . . . . . 4.2 Sidotut ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 n muuttujan ja m yhtälörajoitteen tapaus, missä m < n 4.2.2 n muuttujan ja yhden epäyhtälörajoitteen tapaus . . . . 2 1 Matriisialgebra Matriisien avulla voidaan 1.1 käsitellä yhtälöitä tehokkaasti ratkaista yhtälöryhmiä ratkaista optimointitehtäviä regressioanalyysi laatia erilaisia malleja esim. panos-tuotos–malli Määritelmä Matriisi on taulukko a11 a12 · · · a1n a21 a22 · · · a2n = Am×n = (aij ) = (aij )m×n , A= . .. .. . . . . . . . am1 am2 · · · amn m×n missä luvut aij ovat reaalilukuja. Lukuja aij sanotaan matriisin A alkioiksi. Alkio aij on matriisin A i:nnellä vaakarivillä ja j:nnellä pystyrivillä oleva alkio. Matriisi, jossa on m vaakariviä ja n pystyriviä, on m × n–matriisi; merkitään Am×n . Jos m = n, niin A on neliömatriisi. Kaksi matriisia a11 .. A= . am1 · · · a1n b11 · · · b1s .. .. ja B = ... . . . ... . . · · · amn m×n br1 · · · brs r×s ovat samat eli A = B, jos ja vain jos (i) m = r ja n = s (ii) aij = bij ∀ i, j. Jos matriisissa n = 1u1eli se on m × 1-matriisi, niin kysymyksessä on m–ulotteinen .. , missä ui on vektorin ū i. komponentti. pystyvektori ū = . um Vastaavasti v̄ = (v1 , . . . , vn ) on n-ulotteinen vaakavektori eli 1 × n–matriisi ja vi on vektorin v̄ i. komponentti. 3 1.2 Matriisien laskutoimituksia 1.2.1 Matriisien yhteen- ja vähennyslasku Matriisit A ja B voidaan laskea yhteen (vähentää toisistaan) jos ja vain jos ne ovat molemmat m × n–matriiseja. Olkoot A ja B m × n–matriiseja, ts. a11 · · · a1n .. ... A = ... . am1 · · · Tällöin amn b11 .. B= . bm1 · · · m×n a11 + b11 .. A+B = . ··· ... am1 + bm1 · · · Vastaavasti a11 − b11 .. A−B = . ··· ... ··· ... am1 − bm1 · · · b1n .. . bmn . m×n a1n + b1n .. . . amn + bmn m×n a1n − b1n .. . . amn − bmn m×n Matriisien yhteenlasku on 1. vaihdannainen: A + B = B + A 2. liitännäinen: A + (B + C) = (A + B) + C. Esimerkki 1.1. 2 5 10 0 3 4 20 8 7 − + = 9 1 −7 5 12 6 −1 9 −6 1.2.2 Skalaarilla kertominen Matriisilaskennassa reaalilukua kutsutaan skalaariksi. Olkoon nyt A = (aij )m×n ja k ∈ R. Tällöin a11 · · · a1n ka11 · · · .. . . ... .. .. kA = k · . = ... am1 · · · amn m×n kam1 · · · ka1n .. . kamn = (kaij )m×n = Ak. m×n 4 Esimerkki 1.2. 0 2 1 3· = −5 3 8 Huomautus. A − B = A + (−B) = A + (−1) · B 1.2.3 Matriisien kertolasku: Matriisien A = (aij )m×n ja B = (bij )r×s tulo AB on mahdollinen jos ja vain jos n = r. Siis matriisin A pystyrivien lukumäärä = matriisin B vaakarivien lukumäärä. Matriisi A on tulon AB edellinen tekijä ja B jälkimmäinen tekijä. Olkoon A = (aij )m×n ja B = (bij )n×s . Tällöin Am×n · Bn×s = (AB)m×s = (cij )m×s , missä cij = n X aik bkj eli alkio cij k=1 saadaan matriisin A i:nnen vaakarivin ja matriisin B j:nnen pystyrivin pistetulona. Siis b11 · · · b1s · ... . . . ... bn1 · · · bns n×s am1 · · · amn m×n X n n X a1k bk1 · · · a1k bks k=1 k=1 . . . .. .. .. = . X n n X amk bk1 · · · amk bks ··· ... a11 .. AB = . a1n .. . k=1 k=1 m×s Esimerkki 1.3. A= 3 5 8 10 4 1 , 2×3 6 9 B = 1 7 5 11 3×2 4 7 1 ja C = . 9 2 5 2×3 Laske AB, BA ja AC. 5 Matriisien kertolasku on 1. liitännäinen: A(BC) = (AB)C 2. ei vaihdannainen: siis yleensä AB 6= BA. Esimerkki 1.4. 0 (2, 1, 0) · 1 = 0 1 · (2, 1, 0) = 2 2 1 1 0 1 · = 0 1 1 1 0 1 1 1 · = 1 1 0 1 Falk-kaavio: Esimerkki 1.5. A= 1.3 3 5 8 10 4 1 2×3 6 9 B = 1 7 5 11 3×2 AB = Erikoistyyppisiä matriiseja 1.3.1 Diagonaalimatriisi Olkoon A = (aij )n×n neliömatriisi. Matriisin A päälävistäjän muodostavat alkiot a11 , a22 , . . . , ann . Matriisi A on diagonaalimatriisi, jos matriisin A muut alkiot paitsi mahdollisesti päälävistäjän alkiot ovat nollia. 6 Eli a11 · · · .. .. A= . . an1 · · · a1n .. . ann n×n on diagonaalimatriisi, jos aij = 0, kun i 6= j. 1.3.2 Identtinen matriisi (Yksikkömatriisi) Identtinen matriisi on diagonaalimatriisi, jonka kaikki päälävistäjän alkiot ovat ykkösiä. Siis A = (aij )n×n on identtinen matriisi, jos ( aij = 0, i 6= j aii = 1, i = 1, 2, . . . , n. Identtistä matriisia merkitään symbolilla In (= In×n ). Siis esimerkiksi I1 = (1), I2 = 1 0 , 0 1 1 0 0 I3 = 0 1 0 . 0 0 1 Lause 1.1. Olkoon A m × n–matriisi. Tällöin Am×n In = Im Am×n = Am×n . 1.3.3 Nollamatriisi Matriisi A = (aij )m×n on nollamatriisi, jos aij = 0 ∀ i, j. Nollamatriisia merkitään Ōm×n . Siis esimerkiksi 0 0 0 Ō2×3 = . 0 0 0 Lause 1.2. Olkoon A m × n–matriisi. Tällöin Am×n + Ōm×n = Ōm×n + Am×n = Am×n Am×n Ōn×k = Ōm×k ja sekä Ōk×m Am×n = Ōk×n . 7 1.4 Transponoitu matriisi Olkoon A m×n–matriisi. Matriisin A transponoitu matriisi AT on n×m–matriisi, jonka i. vaakarivi on matriisin A i. pystyrivi (ja j. pystyrivi on matriisin A j. vaakarivi). Jos a11 a21 A= . .. a12 a22 .. . ··· ··· .. . am1 am2 · · · a1n a2n .. . amn m×n a11 a21 · · · am1 a12 a22 · · · am2 T , niin A = . . .. .. . . . . . . . a1n a2n · · · amn n×m Huomautus. u1 (u1 , . . . , un )T = ... T v1 .. . = (v1 , . . . , vn ). ja un vn Diagonaalimatriisin D transponoitu matriisi DT on aina alkuperäinen diagonaalimatriisi, eli DT = D. Esimerkki 1.6. 1 −2 6 7 4 11 A= 14 5 9 0 1 2 AT = Neliömatriisi A = (aij )n×n on symmetrinen, jos aij = aji ∀ i, j. Tällöin A = AT . Huomautus. Olkoot A = (aij )m×n , B = (bij )m×n ja C = (cij )n×r . Tällöin (A + B)T = AT + B T 1.5 ja (BC)T = C T B T . Matriisin determinantti Determinantti on yksikäsitteinen reaaliluku ja määritellään vain neliömatriiseille. Matriisin A determinanttia merkitään det A ja |A|. 8 1.5.1 Determinantin määrääminen: 2 × 2–matriisin determinantti a11 a12 Kun A = , niin det A = |A| = a11 a22 − a12 a21 . a21 a22 2×2 1 × 1–matriisin determinantti Kun A = a11 Esimerkki 1.7. 1×1 , niin det A = |A| = a11 . −8 1 3 4 = Determinantin määrittäminen yleisesti: Jos n > 2, niin matriisin An×n determinantti palautuu 2×2–matriisin tapaukseen seuraavasti: Mij on sellainen (n−1)×(n−1)–matriisi, joka saadaan matriisista A poistamalla siitä i. vaakarivi ja j. pystyrivi. Mij on matriisin A (alkioon aij tai paikkaan ij liittyvä) alimatriisi. Determinantti det Mij = |Mij | on matriisin A (alkioon aij tai paikkaan ij liittyvä) alideterminantti. Skalaari Aij = (−1)i+j |Mij | on matriisin A (alkioon aij tai paikkaan ij liittyvä) kofaktori. Tällöin matriisin A determinantti det A = |A| = n X aij (−1)(i+j) |Mij | ∀ i ∈ {1, . . . , n}. j=1 Tällöin det A on kehitetty i. vaakarivin mukaan. Samoin det A = |A| = n X aij (−1)(i+j) |Mij | ∀ j ∈ {1, . . . , n}, i=1 9 jolloin det A on kehitetty j. pystyrivin mukaan. Siis n × n–matriisin determinantti määrätään sen tiettyjen (n − 1) × (n − 1)– alimatriisien determinanttien avulla. Toistamalla yo. menettelyä jokaisen n × n–matriisin A determinantti voidaan palauttaa sen tiettyjen 2 × 2–alimatriisien determinanteiksi. Esimerkki 1.8. Olkoon 3 0 −2 A = 6 −8 1 . 0 3 4 Määrää |A|. Sarruksen menetelmä: Tämä menetelmä toimii vain 3 × 3-matriiseille. Olkoon a11 a12 a13 A = a21 a22 a23 . a31 a32 a33 3×3 Tällöin |A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . Esimerkki 1.9. Olkoon 3 0 −2 A = 6 −8 1 . 0 3 4 Määrää |A| Sarruksen menetelmällä. 1.5.2 Determinantin ominaisuuksia: Olkoon A n × n-matriisi. 1) Jos matriisin A kaksi samansuuntaista riviä vaihdetaan keskenään, determinantin merkki vaihtuu. Esimerkki 1.10. 9 12 15 1 7 1 = 1 1 1 10 2) Jos matriisin A jokin vaakarivi (tai pystyrivi) kerrotaan vakiolla c ∈ R, determinantti muuttuu c–kertaiseksi. Esimerkki 1.11. 9 12 15 1 7 1 = 1 1 1 3) Jos matriisin A johonkin riviin lisätään jokin muu samansuuntainen rivi vakiolla kerrottuna, determinantin arvo ei muutu. Tavoite: Paljon 0:ia riville, jonka suhteen determinantti kehitetään. Esimerkki 1.12. 3 0 −2 6 −8 1 = 0 3 4 4) Jos A = (aij ) on yläkolmiomatriisi (tällöin kaikki alkiot päälävistäjän alapuolella nollia) tai alakolmiomatriisi (kaikki alkiot päälävistäjän yläpuolella nollia), niin det A = |A| = a11 a22 · · · ann . 5) Jos A = (aij ) on diagonaalimatriisi, niin |A| = a11 a22 · · · ann . 6) Jos matriisin A jokin vaakarivi (tai pystyrivi) koostuu pelkästään nollista, niin |A| = 0. (Kehitetään determinantti ko. rivin suhteen.) 7) Jos matriisin A kaksi samansuuntaista riviä ovat samat, niin |A| = 0. 8) |A| = |AT | 9) Olkoot A ja B n × n–matriiseja. Tällöin |AB|=|BA|=|A||B|. Esimerkki 1.13. Olkoon 3 0 −2 A = 6 −8 1 . 0 3 4 Määritetään |A| käyttämällä ominaisuutta 3). 1.6 Käänteismatriisi Olkoon A n × n–neliömatriisi. Sellaista n × n–matriisia B, joka toteuttaa ehdon AB = BA = In sanotaan matriisin A käänteismatriisiksi ja merkitään B = A−1 . 11 Kaikilla neliömatriiseilla ei ole käänteismatriisia. Matriisi, jolla on käänteismatriisi, on säännöllinen. Lause 1.3. Matriisilla A on käänteismatriisi olemassa jos ja vain jos det A 6= 0. Huomautus. Käänteismatriisi on yksikäsitteinen. Todistus. Jos B1 ja B2 ovat sellaisia matriiseja, että AB1 = B1 A = In ja AB2 = B2 A = In , niin B1 = B1 In = B1 (AB2 ) = (B1 A)B2 = In B2 = B2 . Siis B1 = B2 . Huomautus. Jos AB = In , niin myös BA = In . 1.6.1 Menetelmiä käänteismatriisin ratkaisemiseksi: 1) Käänteismatriisi kofaktorien ja determinantin avulla. Olkoon A n × n–matriisi, jolle det A 6= 0. Olkoon K seuraava matriisin A kofaktorien Aij muodostama matriisi: A11 A12 · · · A1n A21 A22 · · · A2n , K= . . . . .. .. .. .. An1 An2 · · · Ann missä Aij = (−1)i+j |Mij | (paikan ij kofaktori). Tällöin 1 A−1 = KT . det A Esimerkki 1.14. Määritä matriisin 0 −2 −3 A= 1 3 3 −1 −2 −2 käänteismatriisi. 12 2) Gaussin eliminoimismenetelmä Olkoon a11 · · · .. ... A= . an1 · · · Muodostetaan matriisi A In = a1n .. . ann a11 a12 · · · a1n a21 a22 · · · a2n .. .. .. .. . . . . an1 an2 · · · ann . n×n 0 ··· 0 1 ··· 0 . .. . . .. . . . 0 0 · · · 1 n×2n 1 0 .. . Tässä matriisissa voidaan i) vaakarivi kertoa millä tahansa vakiolla, ii) jokin vaakarivi lisätä vakiolla kerrottuna toiseen vaakariviin, iii) vaihtaa vaakarivit keskenään. Näillä operaatioilla pyritään muuttamaan matriisi I B , jolloin matriisi B = A−1 . Esimerkki 1.15. Määritä matriisin 0 −2 −3 A= 1 3 3 −1 −2 −2 A I muotoon käänteismatriisi. 1.6.2 Käänteismatriisin ominaisuuksia: Olkoon A n × n–matriisi, jolle det A 6= 0 eli A−1 on olemassa. Tällöin 1) (A−1 )−1 = A 2) (A−1 )T = (AT )−1 3) (AB)−1 = B −1 A−1 , jos B −1 ja AB ovat olemassa 1 . 4) det (A−1 ) = det A 13 1.7 Lineaarisen yhtälöryhmän matriisimuoto ja sen ratkaiseminen 1) Tarkastellaan yhtälöryhmää, jossa muuttujien lukumäärä on sama kuin yhtälöiden lukumäärä a11 x1 + a12 x2 + . . . + a1n xn = c1 a21 x1 + a22 x2 + . . . + a2n xn = c2 (1) .. . a x + a x + . . . + a x = c , n1 1 n2 2 nn n n missä kertoimet aij ja vakiot ci ovat tunnettuja. Tämä on n:n muuttujan x1 , . . . , xn vakiokertoiminen lineaarinen n:n yhtälön ryhmä. (Siis muuttujien lkm = yhtälöiden lkm.) Yhtälöryhmä (1) voidaan esittää matriisimuodossa: c1 x1 a11 a12 · · · a1n c2 x2 a21 a22 · · · a2n (2) =. · . .. .. .. .. . .. . . . . . an1 an2 · · · ann n×n xn n×1 cn n×1 eli muodossa A · X̄ = C̄. (3) Jos kerroinmatriisilla A on käänteismatriisi, kerrotaan yhtälö (3) puolittain vasemmalta käänteismatriisilla A−1 ja saadaan: A−1 (AX̄) = A−1 C̄ ⇔ (A−1 A)X̄ = A−1 C̄ ⇔ I X̄ = A−1 C̄ ⇔ (4) X̄ = A−1 C̄. Lause 1.4. Jos matriisi A on säännöllinen eli A−1 on olemassa (det A 6= 0), niin yhtälöryhmän (1) yksikäsitteinen ratkaisu on X̄ = A−1 C̄. (Yhtälöryhmällä yksikäsitteinen ratkaisu ⇔ A säännöllinen.) Esimerkki 1.16. Ratkaise yhtälöryhmä −2y − 3z = 1 x + 3y + 3z = 2 −x − 2y − 2z = 1 . 14 Lause 1.5. (Cramerin sääntö). Oletetaan, että yhtälöryhmässä (1) on n tuntematonta ja n yhtälöä sekä det A 6= 0 eli yhtälöryhmällä on yksikäsitteinen ratkaisu X̄ = A−1 C̄. Cramerin sääntö yhtälöryhmän ratkaisemiseksi ilman käänteismatriisin A−1 laskemista on seuraava: c1 a12 · · · a1n a11 c1 a13 · · · a1n 1 c2 a22 · · · a2n 1 a21 c2 a23 · · · a2n x1 = x2 = . . .. . . .. .. . . .. , .. , |A| .. |A| .. . . . . . . . cn an2 · · · a2n an1 cn an3 · · · a2n a11 1 a21 · · · , xn = . |A| .. an1 · · · a1(n−1) c1 · · · a2(n−1) c2 .. .. . .. . . . · · · an(n−1) cn Esimerkki 1.17. Ratkaise yhtälöryhmä 3x + y − z = 2 x − 2y + z = −9 4x + 3y + 2z = 1 . 2) Tarkastellaan yhtälöryhmää a11 x1 + a12 x2 + . . . + a1n xn = c1 a21 x1 + a22 x2 + . . . + a2n xn = c2 .. . a x + a x + . . . + a x = c , m1 1 m2 2 mn n m (5) eli n:n muuttujan x1 , . . . , xn ja m:n yhtälön ryhmä, joka voidaan esittää matriisimuodossa a11 a12 · · · a1n x1 c1 a21 a22 · · · a2n x2 c2 · . = . (6) .. .. .. .. . . .. . . . . am1 am2 · · · amn m×n xn n×1 cm m×1 15 Matriisiesitys on tällöin muotoa: A · X̄ = C̄, missä A = (aij )m×n . (7) Tapauksessa m 6= n A−1 ei ole olemassa ja det A ei ole olemassa, joten menetelmät X̄ = A−1 C̄ ja Cramer eivät toimi. Samoin, jos m = n, mutta |A| = 0, niin menetelmät X̄ = A−1 C̄ ja Cramer eivät toimi. Lause 1.6 (Gaussin eliminoimismenetelmä). Gaussin eliminoimismenetelmää voidaan soveltaa myös tapauksissa, joissa kerroinmatriisilla A ei ole käänteismatriisia, det A = 0, ja silloinkin, kun yhtälöryhmän yhtälöiden ja tuntemattomien muuttujien lukumäärä ei ole sama. Menetelmä perustuu siihen, että yhtälöryhmään (5) voidaan soveltaa seuraavia alkeismuunnoksia sen ratkaisun muuttumatta (a) yhtälöiden järjestyksen vaihto (b) yhden tai useamman yhtälön kertominen vakiolla (6= 0) (c) yhden tai useamman yhtälön kerrannaisen lisääminen muihin yhtälöihin. Yhtälöryhmän asemasta tarkastelemme täydennettyä kerroinmatriisia a11 a12 · · · a1n c1 a21 a22 · · · a2n c2 . (A|C̄) = . .. .. .. ... .. . . . am1 am2 · · · amn cm (8) m×(n+1) Nyt yhtälöryhmän (5) alkeismuunnoksia (a), (b) ja (c) vastaa täydennettyyn kerroinmatriisiin (8) kohdistuvat muunnokset: (a) vaakarivien järjestyksen vaihto (b) yhden tai useamman vaakarivin kertominen nollasta eroavalla vakiolla (c) vaakarivin kertominen vakiolla ja sen lisääminen toiseen vaakariviin. Huomautus. Vain vaakarivimuunnoksia. Näillä muunnoksilla matriisi (8) pyritään saamaan muotoon 1 0 ··· 0 0 1 ··· 0 .. .. . . .. X̄ = I A−1 C̄ = I X̄ , . . . . 0 0 ··· (9) 1 16 josta saadaan ratkaisu X̄. (Tapaus m = n ja yksikäsitteinen ratkaisu.) Tai muotoon 1 0 .. . 0 ··· 1 ··· .. . 0 0 .. . 0 .. . 0 ··· .. . 0 .. . 0 0 ··· 0 B , (10) joka avataan takaisin yhtälöryhmäksi. (Tapaukset m 6= n tai ei yksikäsitteistä ratkaisua.) Esimerkki 1.18. x + 3y − z = 1 x − 2y + z = 2 2x − y + z = 3 Esimerkki 1.19. x + 2y − z = 10 2x + 4y − 2z = 20 x + y + z = 6 Esimerkki 1.20. x + 2y − z = 10 2x + 4y − 2z = 5 x + y + z = 6 1.8 Lineaarinen riippuvuus ja matriisin aste 1.8.1 Lineaarinen riippuvuus Olkoot v̄1 , v̄2 , . . . , v̄m n–komponenttisia vektoreita (vaaka- tai pystyvektoreita). Vektorit v̄1 , v̄2 , . . . , v̄m ovat lineaarisesti riippuvia, jos on olemassa sellaiset reaaliluvut r1 , r2 , . . . , rm , jotka eivät kaikki ole nollia, että r1 v̄1 + r2 v̄2 + . . . + rm v̄m = 0̄. 17 Tällöin jotkut vektorit voidaan esittää toisten lineaarisena yhdisteenä. Jos ehdosta r1 v̄1 + r2 v̄2 + . . . + rm v̄m = 0̄. seuraa, että r1 = r2 = . . . = rm = 0, niin vektorit v̄1 , v̄2 , . . . , v̄m ovat lineaarisesti riippumattomia. Tällöin mitään vektoria ei voida esittää toisten lineaarisena yhdisteenä. Esimerkki 1.21. Tutki, ovatko seuraavat vektorit lineaarisesti riippumattomat. a) (1, 2, 1), (0, 1, 2) ja (1, 3, 3) b) (1, 2) ja (2, 0) 1.8.2 Matriisin aste Matriisi A = (aij )m×n on muodostunut m:stä vaakarivistä (-vektorista) ja n:stä pystyrivistä (-vektorista). Jokaisella matriisilla lineaarisesti riippumattomien vaakarivien lukumäärä on sama kuin lineaarisesti riippumattomien pystyrivien lukumäärä. Tätä lukumäärää sanotaan matriisin A asteeksi ja merkitään r(A). Tietysti 1 ≤ r(A) ≤ min(m, n). Esimerkki 1.22. 1 a) A = 5 1 1 b) A = 3 2 Määritä matriisin A aste, kun 4 3 2 3 9 . 6 Matriisin A = (aij )m×n alimatriisi on matriisi, joka saadaan poistamalla matriisista A nolla tai useampia pysty- ja/tai vaakarivejä. Lause 1.7. Olkoon A matriisi ja k suurin sellainen kokonaisluku, että matriisilla A on olemassa k × k–alimatriisi, jonka determinantti 6= 0. Tällöin r(A) = k. Esimerkki 1.23. 1 a) A = 5 1 (Toisella tavalla.) Määritä matriisin A aste, kun 4 3 2 18 1 b) A = 3 2 1 c) A = 0 1 3 9 6 2 1 1 2. 3 3 1.8.3 Matriisin asteen ominaisuuksia Olkoot A ja B n × n–matriiseja. 1) Diagonaalimatriisin aste = matriisin nollasta eriävien alkioiden lukumäärä. Erityisesti r(In ) = n. 2) r(A) = r(AT ). 3) r(AB) ≤ min{r(A), r(B)}. Lause 1.8. r(An×n ) = n jos ja vain jos A on säännöllinen eli det A 6= 0 eli A−1 on olemassa. Siis A on säännöllinen jos ja vain jos sen kaikki pystyrivit (vast. vaakarivit) ovat lineaarisesti riippumattomat. Matriisissa voidaan sen astetta muuttamatta: a) Vaihtaa samansuuntaisten rivien järjestystä. b) Kertoa mikä tahansa vaaka- tai pystyrivi nollasta eroavalla vakiolla. c) Lisätä mihin tahansa riviin jokin toinen samansuuntainen rivi vakiolla kerrottuna. Tavoite: Yläkolmio/alakolmiomatriisin aste on helppo laskea Lauseen 1.7 menettelyllä. Esimerkki 1.24. Määrää matriisin −1 3 2 6 1 5 2 4 A= −3 −8 6 9 −5 −4 1 −3 aste. 19 1.9 Matriisin ominaisarvot ja ominaisvektorit Matriisien sovelluksissa joudutaan joskus tilanteeseen, jossa on ratkaistava n × n– matriisia A koskeva yhtälö An×n X̄n×1 = λX̄n×1 , (11) missä X̄ = (x1 , . . . , xn )T ja λ ∈ R ovat tuntemattomia. 2x + 3y + 5z = λx Esimerkiksi x + 2y + 2z = λy , x, y, z ja λ tuntemattomia. x + 3y + 3z = λz Yhtälö (11) pätee aina, kun X̄n×1 = 0̄n×1 . Jos on olemassa nollavektorista eroava vektori X̄ ∈ Rn ja reaaliluku λ, joille AX̄ = λX̄, niin luku λ on matriisin A ominaisarvo ja X̄ on ominaisarvoa λ vastaava ominaisvektori X̄ 6= 0̄. Huomautus. Olkoon X̄ matriisin A ominaisvektori ja λ vastaava ominaisarvo. Jos a 6= 0, niin myös aX̄ on matriisin A ominaisarvoa λ vastaava ominaisvektori. Todistus. A(aX̄) = (Aa)X̄ = (aA)X̄ = a(AX̄) = aλX̄ = λ(aX̄) 1.9.1 Ominaisarvojen määrääminen Tarkastellaan yhtälöä (11) AX̄ = λX̄ ⇔ AX̄ − λX̄ = 0̄ ⇔ AX̄ − λI X̄ = 0̄ ⇔ (A − λI)X̄ = 0̄. Tällä yhtälöllä on yksikäsitteinen ratkaisu, kun (A − λI) on säännöllinen, eli |A − λI| = 6 0 eli (A − λI)−1 on olemassa. Tämä ratkaisu on X̄ = (A − λI)−1 · 0̄ = 0̄. 20 Siten ratkaisu X̄ = 0̄ on yksikäsitteinen (eli ainoa) ratkaisu, kun (A − λI) on säännöllinen, eli |A − λI| = 6 0. Täten yhtälöllä (A − λI)X̄ = 0̄ on (ei-triviaali) ratkaisu X̄ 6= 0̄ täsmälleen silloin, kun A−λI ei ole säännöllinen eli täsmälleen silloin, kun det (A − λI) = |A−λI| = 0. Siten matriisin A ominaisarvot saadaan yhtälön |A − λIn | = 0 reaalijuurina. Lauseke |A−λI| on λ:n suhteen astetta n oleva polynomi. Sitä sanotaan matriisin A karakteristiseksi polynomiksi ja yhtälöä |A − λI| = 0 matriisin A karakteristiseksi yhtälöksi. Huomautus. Karakteristisen polynomin nollakohdat eivät välttämättä ole reaalisia (siis eivät ominaisarvoja) ja jokin nollakohta voi olla moninkertainen. Esimerkki 1.25. Määritä matriisin 10 3 A= 3 2 ominaisarvot. Huomautus. Ala- ja yläkolmiomatriisin ominaisarvot ovat päälävistäjän alkiot. 1.9.2 Ominaisvektoreiden määrittäminen Olkoon λ matriisin A = (aij )n×n ominaisarvo. Ominaisarvoon λ liittyvät ominaisvektorit saadaan yhtälön (A − λIn )X̄ = 0̄ ratkaisuna X̄, missä X̄ 6= 0̄. Esimerkki 1.26. Määritä matriisin A= 1 −2 −2 1 ominaisarvot ja ominaisvektorit. 21 1.10 Panos-tuotos–malli Tunnetaan eräs panos-tuotos–taulu: xi1 xi2 x1 x2 x3 .. . x11 x21 x31 .. . x12 x22 x32 .. . xi3 ... xin yi x13 x23 x33 .. . ... ... ... ... x1n x2n x3n .. . y1 y2 y3 .. . xn xn1 xn2 xn3 . . . xnn yn Vaakarivillä toimialan i kokonaistuotannon xi käyttö välituotteina xij toimialoilla j ja lopputuotteena yi . Muodostetaan malli, joka kertoo yleisesti lopputuotteiden kysynnän perusteella toimialojen kokonaistuotannon. xi1 xi2 xi3 . . . xin yi x1 x2 x3 .. . x11 x21 x31 .. . x12 x22 x32 .. . x13 x23 x33 .. . ... ... ... .. . x1n x2n x3n .. . y1 y2 y3 .. . xn xn1 xn2 xn3 ... xnn yn Mallin muodostaminen tapahtuu vaakarivien perusteella: xi = n X xij + yi , missä n on toimialojen lukumäärä. (12) j=1 Mallin kiinteät kertoimet lasketaan eräästä tunnetusta panos-tuotos–taulusta seuraavasti: aij = xij ⇔ xij = aij xj , xj missä 0 ≤ aij ≤ 1. (13) Panoskerroin aij ilmaisee kuinka paljon toimialalla j tarvitaan toimialan i tuotantoa yhden tuoteyksikön tuottamiseen. Sijoittamalla yhtälö (13) yhtälöön (12) saadaan: xi = n X aij xj + yi , missä i = 1, . . . , n. j=1 22 Eli x1 = a11 x1 + a12 x2 + . . . + a1n xn + y1 , x2 = a21 x1 + a22 x2 + . . . + a2n xn + y2 , .. . x = a x + a x + . . . + a x + y . n n1 1 n2 2 nn n n Yleinen muoto: X̄ = AX̄ + Ȳ , X̄ = kokonaistuotanto missä Ȳ = loppukysyntä . A = nk. teknillinen matriisi Eli x1 x2 .. . xn n×1 a11 a12 · · · a1n x1 y1 a21 a22 · · · a2n x2 y2 = . + . . .. .. .. .. .. .. . . . . an1 an2 · · · ann n×n xn n×1 yn n×1 Tästä saadaan ratkaistua toimialojen tuotannot xi , kun tunnetaan kertoimet aij ja lopputuotteiden kysynnät yi , eli tiedetään halutut lopputuotemäärät ja suhde kuinka paljon toimiala tarvitsee toisten toimialojen tuotantoa välituotteina. Siis ⇔ ⇔ ⇔ ⇔ X̄ = AX̄ + Ȳ X̄ − AX̄ = Ȳ I X̄ − AX̄ = Ȳ (I − A)X̄ = Ȳ | (I − A)−1 · X̄ = (I − A)−1 Ȳ Näin johdettu yhtälö X̄ = (I − A)−1 Ȳ on panos-tuotos–malli, joka ilmaisee toimialojen kokonaistuotannon riippuvuuden lopputuotteiden kysynnästä. Käänteismatriisi (I − A)−1 on Leontief:n käänteismatriisi. Merkitään sen alkioita bij : x1 b11 b12 · · · b1n y1 x2 b21 b22 · · · b2n y2 = . . .. .. .. . . .. . .. . . . . xn n×1 bn1 bn2 · · · bnn n×n yn n×1 Siis xi = bi1 y1 + bi2 y2 + . . . + bin yn . 23 Leontief:n käänteismatriisi ilmaisee toimialojen kokonaistuotannon ja lopputuotteiden kysynnän välisen riippuvuuden. Eli alkio bij ilmaisee, kuinka paljon tuotantoa tarvitaan toimialalla i, jotta toimialalla j voitaisiin tuottaa yksi lopputuoteyksikkö. Esimerkki 1.27. Kahden teollisuudenalan tuotantoa kuvaa seuraava taulukko. Muodosta sen avulla panos-tuotos–malli. (luvut milj. euroa) tuottaja A B kokonaistuotanto 600 480 välikäyttö A B 150 240 200 120 loppukysyntä 210 160 1.11 Matriisien sovellutus regressioanalyysissä Usean muuttujan Pienimmän neliösumman–regressioanalyysissä ajatellaan, että (selitettävä) muuttuja y riippuu (selittävistä) muuttujista x1 , x2 , . . . , xk ja häiriötekijästä u yhtälön y = β0 + β1 x1 + β2 x2 . . . + βk xk + u mukaisesti. Vakioita β0 , β1 , . . . , βk ei tunneta ja käytettävissä on n:n kappaleen otos muuttujan y ja muuttujien x1 , x2 , . . . , xk arvoja. Siis n kpl y:n arvoja ja niitä vastaavat xi :n arvot ovat tiedossa: yi = β0 + β1 x1i + β2 x2i . . . + βk xki + ui , i = 1, 2, . . . , n. (14) Tehtävänä on löytää estimaatit (arviot) vakioille β0 , β1 , . . . , βk eli löytää (paras) lineaarinen funktio, jonka kautta y riippuu muuttujista xi . Merkitään: y1 1 x11 x21 · · · xk1 β0 u1 y2 1 x12 x22 · · · xk2 β1 u2 , β̄ = . ja ū = . . Ȳ = . , X = . . .. .. .. . .. .. .. .. . . . . yn 1 x1n x2n · · · xkn n×k+1 βk un Yhtälöryhmä (14) saadaan nyt matriisimuotoon Ȳ = X β̄ + ū . (15) 24 Vakioiden β0 , β1 , . . . , βk estimaattien löytämiseksi käytetään ns. pienimmän neliösumman menetelmää. Merkitään vektorin β̄ estimaattia β̂0 β̂1 β̂ = . . .. β̂k Tällöin Ȳ = X β̂ + ē , missä ē = Ȳ − X β̂ = (e1 , e2 , . . . , en )T on n:n ns. jäännöstermin muodostama pystyvektori. Siis ei = yi − (β̂0 + β̂1 x1i + . . . + β̂k xki ) . Pienimmän neliösumman menetelmässä summa n X e2i = ēT ē i=1 minimoidaan. (Virheen minimointi.) Siis etsitään β̂, jolla virhe minimoituu. Nyt n X e2i = ēT ē = (Ȳ − X β̂)T · (Ȳ − X β̂) i=1 = (Ȳ T − (X β̂)T ) · (Ȳ − X β̂) = (Ȳ T − β̂ T X T ) · (Ȳ − X β̂) = Ȳ T Ȳ − Ȳ T X β̂ − β̂ T X T Ȳ + β̂ T X T X β̂ . Vektorin β̂ määrittämiseksi etsitään lausekkeen ēT ē pienin arvo kuten normaalissa ääriarvotehtävässä. 25 Etsitään ensin KRP derivoimalla lauseke tuntemattoman β̂ suhteen ja asettamalla se nollaksi: ∂ ∂ β̂ (ēT ē) = −X T (Ȳ T )T − X T Ȳ + 2X T X β̂ = −2X T Ȳ + 2X T X β̂ = 0̄ ⇔ X T X β̂ = X T Ȳ ⇔ β̂ = (X T X)−1 X T Ȳ , mikäli X T X säännöllinen. Jotta voidaan osoittaa, että β̂ = (X T X)−1 X T Ȳ on minimiratkaisu, on tutkittava toista derivaattaa ∂ 2 ēT ē ∂ β̂ 2 = ∂ ∂ β̂ (−2X T Ȳ + 2X T X β̂) = 2X T X . Jos matriisi X T X on positiividefiniitti, niin kyseessä on minimiratkaisu. Käytännön tilanteissa X T X on aina positiividefiniitti. Paras lineaarinen funktio y = β 0 + β 1 x1 + β 2 x2 . . . + β k xk , joka selittää muuttujan y riippuvuuden muuttujista x1 , x2 , . . . , xk , löytyy siis yhtälöstä β̂0 β̂1 β̂ = . = (X T X)−1 X T Ȳ , .. β̂k missä matriisit X ja Ȳ saadaan 1 x11 x21 1 x12 x22 X = . . .. .. .. . n kappaleen otoksesta seuraavasti: · · · xk1 y1 · · · xk2 y2 ja Ȳ = . , .. .. .. . . 1 x1n x2n · · · xkn n×k+1 yn missä yi on muuttujan y arvo i. otoksessa ja x1i , x2i , . . . , xki ovat sitä vastaavat muuttujien x1 , x2 , . . . , xk arvot i. otoksessa. 26 Esimerkki 1.28. Estimoi yhtälön y = β0 + β1 x1 kertoimia β pienimmän neliösumman menetelmällä, kun havaintoaineisto on seuraava: y1 = 5 x11 = −1 y2 = 3 x12 = 0 y3 = −2 x13 = 1 y4 = 8 x14 = −2 27 2 Yhden muuttujan funktion optimointi 2.1 Funktion f (x) tutkiminen derivaatan avulla 2.1.1 Funktion monotonisuus ja derivaatta Funktio f (x) on monotoninen välillä I, jos se on joko kasvava tai vähenevä välillä I. Funktio f (x) on aidosti monotoninen välillä I, jos se on aidosti kasvava tai aidosti vähenevä välillä I. Monotonisuuden yhteys derivaattaan on seuraava: Lause 2.1. Oletetaan, että funktio f (x) on derivoituva (ja siten myös jatkuva) välillä I. Tällöin funktio f (x) on (i ) kasvava välillä I, jos f 0 (x) ≥ 0 kaikilla x ∈ I (tangentit välillä I nousevia tai x-akselin suuntaisia suoria), (ii ) aidosti kasvava välillä I, jos f 0 (x) > 0 kaikilla x ∈ I (tangentit välillä I nousevia suoria), (iii ) vähenevä välillä I, jos f 0 (x) ≤ 0 kaikilla x ∈ I (tangentit välillä I laskevia tai x-akselin suuntaisia suoria), (iv ) aidosti vähenevä välillä I, jos f 0 (x) < 0 kaikilla x ∈ I (tangentit välillä I laskevia suoria). (i) (ii) (iii) (iv) 28 Esimerkki 2.1. Milloin funktio f (x) = 3x4 − 20x3 + 36x2 on kasvava? 2.1.2 Funktion kuperuus ja toinen derivaatta Lause 2.2. Käyrä y = f (x) on aidosti alaspäin kupera välillä ]a, b[ ⇔ tangenttien kulmakertoimet tulevat aidosti suuremmiksi muuttujan x kasvaessa ⇔ derivaatta f 0 (x) on aidosti kasvava välillä ]a, b[ ⇔ f 00 (x) > 0 välillä ]a, b[ Lause 2.3. Käyrä y = f (x) on aidosti ylöspäin kupera välillä ]a, b[ ⇔ tangenttien kulmakertoimet tulevat aidosti pienemmiksi muuttujan x kasvaessa ⇔ derivaatta f 0 (x) on aidosti vähenevä välillä ]a, b[ ⇔ f 00 (x) < 0 välillä ]a, b[ 29 2.2 Funktion f (x) ääriarvo Funktiolla f (x) on kohdassa x0 ∈ Df suurin arvo, jos f (x) ≤ f (x0 ) kaikilla x ∈ Df . Vastaavasti funktiolla f (x) on kohdassa x0 ∈ Df pienin arvo, jos f (x) ≥ f (x0 ) kaikilla x ∈ Df . Suurinta arvoa sanotaan myös absoluuttiseksi maksimiksi ja pienintä arvoa absoluuttiseksi minimiksi. Esimerkki 2.2. Välillä [−1, 1] funktion f (x) = 2x − 1 pienin arvo on f (−1) = −3 ja suurin arvo on f (1) = 1. Esimerkki 2.3. Funktion f (x) = x2 pienin arvo R:ssä on f (0) = 0. Suurinta arvoa funktiolla ei ole. Esimerkki 2.4. Funktiolla f (x) = x3 ei ole pienintä eikä suurinta arvoa R:ssä. 30 Piste x0 ∈ Df on funktion f paikallinen maksimikohta, jos on olemassa sellainen r > 0, että f (x) ≤ f (x0 ) aina, kun x ∈ Df ja x ∈]x0 − r, x0 + r[. Tällöin f (x0 ) on funktion f paikallinen maksimiarvo. Vastaavasti kohta x0 ∈ Df on funktion f paikallinen minimikohta, jos on olemassa sellainen r > 0, että f (x) ≥ f (x0 ) aina, kun x ∈ Df ja x ∈]x0 − r, x0 + r[. Tällöin f (x0 ) on funktion f paikallinen minimiarvo. 31 Paikallisia ääriarvoja kutsutaan myös lokaaleiksi ääriarvoiksi. 2.2.1 Paikallisten ääriarvokohtien löytäminen Lause 2.4. Olkoon f (x) välillä I ∈ R derivoituva funktio. Jos kohta x0 ∈ I on funktion f (x) paikallinen ääriarvokohta, niin f 0 (x) = 0. (KRP ) Geometrisesti: f 0 (x0 ) = 0 jos ja vain jos käyrän pisteeseen x0 piirretyn tangentin kulmakerroin on nolla eli kyseinen tangentti on x-akselin suuntainen suora. Lauseen 2.4 mukaan siis derivoituvan funktion f (x) mahdolliset paikalliset ääriarvokohdat löytyvät derivaatan f 0 (x) nollakohdista. Derivaatan nollakohtia kutsutaan kriittisiksi pisteiksi. 32 Lause 2.4 ei kuitenkaan päde kääntäen: Jos f 0 (x0 ) = 0, niin kriittinen piste x0 ei ole välttämättä funktion f ääriarvokohta, vaan se voi olla myös ns. satulapiste. Lause 2.5. Jatkuvan funktion f (x) mahdolliset paikalliset ääriarvokohdat löydetään tutkimalla 1) derivaatan f 0 (x) nollakohdat eli milloin f 0 (x) = 0, 2) epäderivoituvuuskohdat eli kohdat, joissa derivaattaa f 0 (x) ei ole olemassa. Esimerkki 2.5. Etsi funktion f (x) = x5 + 5x3 + 8x + 1 mahdolliset paikalliset ääriarvokohdat. Lause 2.6. Jos funktion f (x) määrittelyjoukko on suljettu tai puoliavoin väli, niin paikallinen ääriarvo voi esiintyä myös välin päätepisteissä. 33 Lause 2.7. Edellä olevien tulosten nojalla funktion f (x) paikallisia ääriarvokohtia voivat siis olla 1) 2) 3) 4) funktion f (x) epäjatkuvuuskohdat funktion f (x) epäderivoituvuuskohdat funktion f (x) derivaatan f 0 (x) nollakohdat välin päätepisteet, mikäli funktio f (x) on määritelty suljetulla tai puoliavoimella välillä. Etsittäessä funktion absoluuttisia ääriarvoja on vertailtava paikallisia ääriarvoja ja lisäksi tarvittaessa tutkittava raja-arvot lim f (x) ja lim f (x). x→∞ x→−∞ 34 2.2.2 Paikallisten ääriarvokohtien laatu Lause 2.8 (Ääriarvon olemassaolo ja laatu, derivaatan merkkikaavion käyttö). Olkoon funktio f derivoituva eräässä kohdan x0 ympäristössä. Olkoon lisäksi f 0 (x0 ) = 0 tai x0 epäderivoituvuuskohta eli x0 on mahdollinen paikallinen ääriarvokohta. Jos funktion f derivaatta muuttuu kohdassa x0 (i ) positiivisesta negatiiviseksi, kyseessä on paikallinen maksimikohta. (f muuttuu aidosti kasvavasta aidosti väheneväksi ) (ii ) negatiivisesta positiiviseksi, kyseessä on paikallinen minimikohta. (f muuttuu aidosti vähenevästä aidosti kasvavaksi ) Jos f 0 (x) ei muuta merkkiään kohdassa x0 , niin funktiolla f (x) ei ole ääriarvokohtaa kohdassa x0 , vaikka f 0 (x0 ) = 0 tai x0 on epäderivoituvuuskohta. Huomautus. Lause 2.8 ei päde epäjatkuvuuskohdissa, vaan ne on tutkittava tarkemmin. ( x3 + x, kun − 2 ≤ x < 0 Esimerkki 2.6. Määritä funktion f (x) = ääriarvot. −x, kun 0 ≤ x ≤ 3 Esimerkki 2.7. Määritä funktion f (x) = x4 − 2x2 ääriarvot välillä [0, 3]. Esimerkki 2.8. Etsi funktion f (x) = x3 paikalliset ja absoluuttiset ääriarvot. Esimerkki 2.9. Määritä funktion f (x) = x4 − 8x2 + 24 ääriarvot. Esimerkki 2.10. Määritä seuraavan funktion paikalliset ja absoluuttiset ääriarvot. ( x2 + x, kun x < 0 f (x) = − x2 , kun x ≥ 0 Lause 2.9. Olkoon f derivoituva eräässä kohdan x0 ympäristössä ja oletetaan, että x0 on kriittinen piste eli että f 0 (x0 ) = 0. Tällöin 1) jos f 00 (x0 ) < 0, niin x0 on paikallinen maksimikohta, 2) jos f 00 (x0 ) > 0, niin x0 on paikallinen minimikohta, 3) jos f 00 (x0 ) = 0, niin x0 voi olla maksimikohta, minimikohta tai satulapiste (ks. derivaatan merkkikaavio Lause 2.8 tai Lause 2.10) 35 Esimerkki 2.11. Määrää funktion f (x) = 3x4 − 4x3 − 36x2 + 2 ääriarvokohdat. Lause 2.10. Olkoon f (x) jatkuva funktio, joka on n kertaa derivoituva pisteessä x0 . Tällöin f (x0 ) on paikallinen ääriarvo jos ja vain jos on olemassa sellainen parillinen kokonaisluku n, että f (k) (x0 ) = 0 kaikilla k = 1, 2, . . . , n − 1 ja f (n) (x0 ) 6= 0. Kyseessä on lisäksi paikallinen minimi, jos f (n) (x0 ) > 0 ja paikallinen maksimi, jos f (n) (x0 ) < 0. Esimerkki 2.12. Määrää funktion f (x) = x3 paikalliset ääriarvot. Esimerkki 2.13. Määrää funktion f (x) = x4 paikalliset ääriarvot. Lause 2.11. Suljetulla välillä [a, b] jatkuva funktio f (x) saavuttaa tällä välillä suurimman ja pienimmän arvonsa. 36 37 3 Kahden muuttujan funktion ääriarvoista 3.1 Normaalit ääriarvot (ei sidotut) Funktiolla z = f (x, y) on pisteessä (x0 , y0 ) ∈ Df suurin arvo (absoluuttinen maksimi), jos f (x, y) ≤ f (x0 , y0 ) kaikilla (x, y) ∈ Df . Vastaavasti funktiolla on pisteessä (x0 , y0 ) ∈ Df pienin arvo (absoluuttinen minimi), jos f (x, y) ≥ f (x0 , y0 ) kaikilla (x, y) ∈ Df . Esimerkki 3.1. Olkoon z = f (x, y) = x + y. Funktion kuvaaja on taso eikä sillä siksi ole suurinta eikä pienintä arvoa. Esimerkki 3.2. Olkoon z = f (x, y) = x2 +y 2 −1. Funktion kuvaaja on paraboloidi. Suurinta arvoa ei ole, mutta pienin arvo on f (0, 0) = −1. Piste (x0 , y0 ) ∈ Df on funktion f paikallinen maksimikohta, jos f (x, y) ≤ f (x0 , y0 ) eräässä pisteen (x0 , y0 ) ympäristössä. Tällöin f (x0 , y0 ) on funktion paikallinen maksimiarvo. Vastaavasti (x0 , y0 ) ∈ Df on funktion f paikallinen minimikohta ja f (x0 , y0 ) paikallinen minimiarvo, jos f (x, y) ≥ f (x0 , y0 ) eräässä pisteen (x0 , y0 ) ympäristössä. 38 3.1.1 Kahden muuttujan funktion paikalliset ääriarvokohdat Lause 3.1 (KRP:n etsiminen). Olkoon funktio f (x, y) jatkuva ja derivoituva. Jos funktiolla on paikallinen ääriarvo pisteessä (x0 , y0 ), niin ∂f (x0 , y0 ) = 0, ∂x ∂f (x0 , y0 ) = 0. ∂y Mahdolliset paikalliset ääriarvokohdat saadaan siis ratkaisemalla yhtälöryhmä ( fx = 0 fy = 0. Huomautus. KRP, joka ei ole ääriarvokohta, on satulapiste. Esimerkki 3.3. Määrää kriittiset pisteet funktiolle f (x, y) = x2 − y 2 . 3.1.2 Kahden muuttujan funktion ääriarvon laatu Lause 3.2. Olkoon z = f (x, y) 2. kertaluvun osittaisderivaattoineen jatkuva. Tällöin z = f (x, y) on ylöspäin kupera täsmälleen silloin, kun 2 2 ∂ 2f ∂ f ∂ 2f ∂ 2f ∂ 2f ≤ 0, ≤0 ja · 2 − ≥0 2 2 2 ∂x ∂y ∂x ∂y ∂y∂x kaikilla (x, y) ∈ Df ja alaspäin kupera täsmälleen silloin, kun 2 2 ∂ 2f ∂ 2f ∂ 2f ∂ f ∂ 2f ≥ 0, ≥0 ja · 2 − ≥0 2 2 2 ∂x ∂y ∂x ∂y ∂y∂x kaikilla (x, y) ∈ Df . Esimerkki 3.4. Tutki funktion f (x, y) = x2 + 4y 2 + 3xy kuperuutta. Lause 3.3. Oletetaan, että z = f (x, y) on 2. kertaluvun osittaisderivaattoineen jatkuva. Jos funktio on ylöspäin kupera, sen jokainen kriittinen piste on absoluuttinen maksimikohta. Jos funktio on alaspäin kupera, sen jokainen kriittinen piste on absoluuttinen minimikohta. 39 Lause 3.4. Olkoon funktio z = f (x, y) 2. kertaluvun osittaisderivaattoineen jatkuva ja (a, b) on funktion kriittinen piste. Tällöin kriittinen piste (a, b) on (i ) paikallinen minimikohta, jos 2 2 ∂ 2f ∂ 2f ∂ f ∆= (a, b) > 0 (a, b) · 2 (a, b) − ∂x2 ∂y ∂y∂x ∂ 2f ∂ 2f ja (a, b) > 0, (a, b) > 0 ∂x2 ∂y 2 (ii ) paikallinen maksimikohta, jos 2 2 ∂ 2f ∂ f ∂ 2f (a, b) > 0 (a, b) · 2 (a, b) − ∆= ∂x2 ∂y ∂y∂x ∂ 2f ∂ 2f ja (a, b) < 0, (a, b) < 0 ∂x2 ∂y 2 (iii ) satulapiste, jos 2 2 ∂ 2f ∂ 2f ∂ f ∆= (a, b) · 2 (a, b) − (a, b) < 0 ∂x2 ∂y ∂y∂x (iv ) Testi ei kerro mitään, jos ∆ = 0. Tutki tarkemmin. Esimerkki 3.5. Määrää funktion f (x, y) = x3 − y 3 + 3xy paikalliset ääriarvot. 3.2 Sidotut ääriarvot 3.2.1 Sidotut ääriarvot yhtälörajoitteen tapauksessa Oletetaan, että funktiot f (x, y) ja g(x, y) ovat 2. kertaluvun osittaisderivaattoineen jatkuvia määrittelyjoukossaan. Määrättävä funktion f (x, y) paikalliset ääriarvot ehdolla g(x, y) = 0. Sijoitusmenetelmä Ratkaistaan x tai y ehtoyhtälöstä g(x, y) = 0 (jos mahdollista) ja sijoitetaan funktioon f (x, y), jolloin saadaan yhden muuttujan funktio, jolle lasketaan ääriarvot normaalisti. Esimerkki 3.6. Etsi funktion f (x, y) = 5x2 +6y 2 −xy ääriarvot ehdolla x+2y = 24. 40 Lagrangen menetelmä Muodostetaan kohdefunktio F (x, y, λ) = f (x, y) − λg(x, y). Määritetään kohdefunktion F (x, y, λ) kriittiset pisteet eli mahdolliset ääriarvokohdat ratkaisemalla yhtälöryhmä ∂f ∂g ∂F ∂x = ∂x − λ · ∂x = 0 ∂g ∂F = ∂f − λ · ∂y =0 ∂y ∂y ∂F = −g(x, y) = 0 ⇔ ∂λ g(x, y) = 0 Ääriarvon laadun testaaminen kriittisessä pisteessä: ∂ 2F ∂ 2F ∆= · − ∂x2 ∂y 2 ∂ 2F ∂x∂y 2 > 0, ∂ 2F <0 ∂x2 ja ∂ 2F <0 ∂y 2 ∂ 2F >0 ∂x2 ja ∂ 2F >0 ∂y 2 ⇒ paikallinen maksimikohta 2 2 ∂ F ∂ 2F ∂ 2F ∆= · − > 0, ∂x2 ∂y 2 ∂x∂y ⇒ paikallinen minimikohta 2 2 ∂ F ∂ 2F ∂ 2F · − ≤0 ∆= 2 2 ∂x ∂y ∂x∂y ⇒ testi ei anna tulosta (tutkittava funktioita tarkemmin) Esimerkki 3.7. Etsi funktion f (x, y) = 5x2 +6y 2 −xy ääriarvot ehdolla x+2y = 24. Lagrangen kertoimen tulkinta Tehtävä alunperin muotoa: Maksimoi/minimoi funktio f (x, y) ehdolla g(x, y) = b. Voidaan osoittaa, että optimikohdassa (x0 , y0 ) ∂f (x, y) . λ= ∂b Eli kerroin λ arvioi kuinka paljon optimiarvo muuttuu, jos alkuperäisen tehtävän rajoitetta b muutetaan. Eli jos rajoitteessa oleva vakio b muuttuu yhden yksikön, niin optimiarvo muuttuu λ yksikköä. 41 Usein b kuvaa jonkin resurssin määrää (työ, luonnonvarat), jolloin λ ilmoittaa resurssin varjohinnan. Eli paljonko kannattaa maksaa, jos saa yhden yksikön lisää resurssia. Huomautus. Jotta arviointimenetelmä toimii, ehdossa on oltava muuttujien kertoimien positiivisia. Esimerkki 3.8. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla x + 2y = 25. Esimerkki 3.9. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla x + 2y = 23. 3.2.2 Sidotut ääriarvot epäyhtälörajoitteen tapauksessa Etsittävä ääriarvot funktiolle f (x, y) ehdolla g(x, y) ≤ 0. Menetelmä on seuraava: 1. Ääriarvotetaan funktio f (x, y) ilman ehtoa g(x, y) ≤ 0. Ratkaistaan kuten normaali ääriarvotehtävä. Siten mahdollinen paikallinen ääriarvokohta (x0 , y0 ) löytyy funktion f (x, y) osittaisderivaattojen nollakohtana. Suoritetaan normaali laatutarkastelu kriittiselle pisteelle (x0 , y0 ). Jos kriittinen piste toteuttaa ehdon g(x, y) ≤ 0, niin se on myös tämän ehdon mukainen sidottu paikallinen ääriarvokohta. (Ääriarvokohta löytyy alueen sisältä, g(x, y) ≤ 0.) 2. Tarkastellaan epäyhtälörajoitteen g(x, y) ≤ 0 sijaan yhtälörajoitetta g(x, y) = 0. Ratkaistaan kuten normaali sidottu ääriarvotehtävä Lagrangen menetelmällä, missä kohdefunktio on nyt muotoa F (x, y, λ) = f (x, y) − λg(x, y). Olkoon ratkaisuna saatu kriittinen piste (x0 , y0 ). Suoritetaan Lagrangen menetelmän laatutarkastelu löydetylle kriittiselle pisteelle. (Ääriarvokohta löytyy alueen reunalta, g(x, y) = 0.) 42 3. Lopullinen päättely kohtiin 1. ja 2. perustuen. Esimerkki 3.10. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≤ 24. Esimerkki 3.11. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≥ 24. 3.2.3 Absoluuttiset ääriarvot ehtoalueessa Maksimoi/minimoi funktio f (x, y) usean ehdon määräämässä ehtoalueessa E = {(x, y) | gi (x, y) ≤ 0, i = 1, . . . , m}. Ehdot toteuttavat absoluuttiset ääriarvot löytyvät joko paikallisista ääriarvokohdista ehtoalueen E sisältä, (gi (x, y) < 0), tai sidotuista ääriarvokohdista ehtoalueen E reunalta, (gi (x, y) = 0). Lause 3.5. Derivoituvan funktion f (x, y) mahdolliset ääriarvokohdat löydetään tutkimalla: 1. Osittaisderivaattojen 0–kohdat 2. Määrittely-/tarkastelujoukon E reunat (ja nurkat). Jos funktio on jatkuva ja derivoituva suljetussa joukossa E, niin mahdolliset ääriarvokohdat löytyvät kohtien 1. ja 2. avulla. Näistä valitaan pienin ja suurin. Esimerkki 3.12. Etsi funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvot joukossa E = {(x, y) | x ≥ 0, y ≥ 0, x + 2y ≤ 24}. 3.2.4 Hyötyfunktion maksimi Kuluttajan oletetaan valitsevan hyödykkeitä siten, että niiden käytöstä saatava tyytyväisyys maksimoituu. Oletetaan, että kuluttajan ostot rajoittuvat kahteen hyödykkeeseen Q1 ja Q2 . Hyötyfunktio on U = f (q1 , q2 ), missä q1 ja q2 ovat hyödykkeiden kulutusmäärät. Siis hyötyfunktio U = f (q1 , q2 ) kuvaa hyödykkeiden kulutusmääristä aiheutuvaa tyytyväisyyttä. 43 Oletetaan, että hyötyfunktiolla U = f (q1 , q2 ) on jatkuvat 1. ja 2. kertaluvun osittaisderivaatat olemassa. Nämä osittaisderivaatat ovat hyödykkeiden rajahyötyjä. Tyytyväisyys kasvaa kulutuksen kasvaessa eli ∂U >0 ∂q1 ja ∂U > 0. ∂q2 Kuluttaja haluaa maksimoida hyötynsä, mutta kulutusta rajoittaa budjettirajoite y0 = p1 q1 + p2 q2 , missä y0 on ostamiseen käytettävissä oleva rahamäärä ja p1 ja p2 ovat hyödykkeiden Q1 ja Q2 yksikköhintoja. Maksimoidaan siis hyötyfunktio U = f (q1 , q2 ) budjettirajoitteella y0 = p1 q1 +p2 q2 . Budjettirajoitteesta saadaan q2 = y 0 − p1 q1 . p2 Näin ollen hyötyfunktio y 0 − p1 q1 U = f q1 , p2 on yhden muuttujan q1 funktio. Maksimoidaan hyötyfunktio U muuttujan q1 suhteen. Asetetaan ensin ∂U = 0. (Etsitään siis KRP) ∂q1 Tämä ehto on välttämätön, muttei riittävä. Toisen derivaatan negatiivisuus takaa maksimin olemassaolon. Täytyy siis vielä olla ∂ 2U < 0. ∂q12 Esimerkki 3.13. Maksimoi hyötyfunktio U = q1 q2 , kun p1 = 15, p2 = 5 ja kuluttajan tulot y0 = 150. Ratkaisu: Budjettirajoite on 15q1 + 5q1 = 150 ⇔ 5q2 = 150 − 15q1 ⇔ q2 = 30 − 3q1 44 ja hyötyfunktio U = q1 q2 = q1 (30 − 3q1 ) = 30q1 − 3q12 . Etsitään kriittinen piste: ⇔ Koska ∂U = 30 − 6q1 = 0 ∂q1 6q1 = 30 ⇔ q1 = 5 ⇒ q2 = 30 − 3q1 = 30 − 15 = 15. ∂ 2U (q1 = 5) = −6 < 0, ∂q12 niin q1 = 5 on maksimikohta. Vastaava maksimiarvo on Umax = q1 q2 = 5 · 15 = 75. 45 4 Usean muuttujan funktion ääriarvoista 4.1 Normaali ääriarvo (ei sidottu) Funktiolla y = f (x1 , . . . , xn ) on pisteessä (a1 , . . . , an ) ∈ Df suurin arvo (absoluuttinen maksimi), jos f (x1 , . . . , xn ) ≤ f (a1 , . . . , an ) kaikilla (x1 , . . . , xn ) ∈ Df . Vastaavasti funktiolla on pisteessä (a1 , . . . , an ) ∈ Df pienin arvo (absoluuttinen minimi), jos f (x1 , . . . , xn ) ≥ f (a1 , . . . , an ) kaikilla (x1 , . . . , xn ) ∈ Df . Piste (a1 , . . . , an ) ∈ Df on funktion f paikallinen maksimikohta, jos f (x1 , . . . , xn ) ≤ f (a1 , . . . , an ) eräässä pisteen (a1 , . . . , an ) ympäristössä. Tällöin f (a1 , . . . , an ) on funktion paikallinen maksimiarvo. Vastaavasti (a1 , . . . , an ) ∈ Df on funktion f paikallinen minimikohta ja f (a1 , . . . , an ) paikallinen minimiarvo, jos f (x1 , . . . , xn ) ≥ f (a1 , . . . , an ) eräässä pisteen (a1 , . . . , an ) ympäristössä. 4.1.1 Usean muuttujan funktion ääriarvokohta Lause 4.1 (KRP:n etsiminen). Olkoon funktio f jatkuva ja derivoituva. Jos funktiolla on paikallinen ääriarvo pisteessä (a1 , . . . , an ), niin ∂f (a1 , . . . , an ) = 0, ∂x1 ∂f (a1 , . . . , an ) = 0, ∂x2 ... ∂f (a1 , . . . , an ) = 0. ∂xn Mahdolliset paikalliset ääriarvokohdat saadaan siis ratkaisemalla yhtälöryhmä ∂f =0 ∂x1 ∂f = 0 ∂x2 ... ∂f ∂xn = 0. Huomautus. KRP, joka ei ole ääriarvokohta, on satulapiste. Esimerkki 4.1. Määrää kriittiset pisteet funktiolle f (x1 , . . . , xn ) = x21 + . . . + x2n . 46 4.1.2 Usean muuttujan funktion ääriarvon laatu Olkoon y = f (X̄) = f (x1 , . . . , xn ), eli f on n muuttujan funktio. Funktion f Hessin matriisi muodostetaan seuraavasti: f11 f12 · · · f1n f21 f22 · · · f2n ∂ ∂f H = fxx = . , missä fij = . .. . . .. ∂xj ∂xi .. . . . fn1 fn2 · · · fnn n×n Olkoon a11 · · · a1n .. ... A = ... . . an1 · · · ann n×n Matriisi A on positiividefiniitti, jos sen alideterminantit a11 a12 a13 A1 = a11 , A2 = a11 a12 , A3 = a21 a22 a23 , . . . a21 a22 a 31 a32 a33 An = A ovat kaikki positiivia. Vastaavasti matriisi A on negatiividefiniitti, jos A1 < 0 , A2 > 0 , A3 < 0 , eli ... (−1)i |Ai | > 0 . Lause 4.2. Olkoon löydetty kriittinen piste X̄0 = (a1 , a2 , . . . , an ) ja H = H(X̄0 ) funktion f (X̄) Hessin matriisi kriittisessä pisteessä X̄0 . Tällöin 1) Kriittinen piste X̄0 on funktion f (X̄) paikallinen maksimikohta, jos funktion f (X̄) Hessin matriisin alideterminanteille Hi (X̄0 ) pätee (−1)i |Hi (X̄0 )| > 0 kaikilla i = 1, . . . , n eli Hessin matriisi H on negatiividefiniitti. 47 2) Kriittinen piste X̄0 on funktion f (X̄) paikallinen minimikohta, jos funktion f (X̄) Hessin matriisin alideterminanteille Hi (X̄0 ) pätee |Hi (X̄0 )| > 0 kaikilla i = 1, . . . , n eli Hessin matriisi H on positiividefiniitti. 3) Kriittinen piste X̄0 ei ole paikallinen ääriarvokohta, jos |Hi (X̄0 )| = 6 0 kaikilla i = 1, . . . , n, mutta 1) tai 2) ei toteudu. 4) Jos |Hi (X̄0 )| = 0 jollakin i = 1, . . . , n, niin testi ei kerro mitään, joten tutki tarkemmin. Esimerkki 4.2. Etsi paikalliset ääriarvot funktiolle f (x, y) = x2 y + y 3 − y. 4.2 Sidotut ääriarvot 4.2.1 n muuttujan ja m yhtälörajoitteen tapaus, missä m < n Maksimoi (vast. minimoi) funktio f (x1 , . . . , xn ) ehdoilla gi (x1 , . . . , xn ) = 0, missä i = 1, . . . , m. Lagrange–funktio: L(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) − m X λj gj (x1 , . . . , xn ), j=1 missä λj :t ovat Lagrange-kertoimia. 1o Ääriarvon mahdollinen olemassaolo: (KRP) ( ∂L ∂xi ∂L ∂λj =0 =0 eli ( Lxi = 0 , kaikilla i = 1, . . . , n gj = 0 , kaikilla j = 1, . . . , m. Näin saadaan mahdollinen paikallinen ääriarvokohta X̄0 . 2o Ääriarvon olemassaolo ja laatu: 48 Määritellään laajennettu Hessin matriisi ∂g1 ∂g1 ··· 0 ··· 0 ∂x1 ∂xn . .. .. .. .. .. .. . . . . . ∂gm ∂gm 0 ··· 0 ··· ∂x1 ∂xn H̄ = ∂g1 m ∂x1 · · · ∂g Lx1 x1 · · · Lx1 xn ∂x1 . .. .. .. ... . ... . . . . ∂gm ∂g1 · · · Lxn x1 · · · Lxn xn ∂xn ∂xn 0̄m×m Jm×n = . T Jn×m Hn×n (n+m)×(n+m) (m+n)×(m+n) Laajennetun Hessin matriisin tarvittavat alideterminantit |H̄i | ovat |H̄i (X̄0 )| = 0 .. . 0 ∂g1 ∂x1 .. . ∂g1 ∂xi ··· .. . ··· 0 .. . ∂g1 ∂x1 ··· ... ∂g1 ∂xi 0 ∂gm ∂x1 ··· ∂gm ∂xi ··· .. . ··· ∂gm ∂x1 .. . ∂gm ∂xi .. . .. . L x1 x1 · · · L x1 xi .. .. ... . . Lxi x1 · · · Lxi xi , missä i = m + 1, . . . , n. Eli |H̄i | on ”vasemmasta yläkulmasta” i:nteen muuttujaan asti otettu alideterminantti. Siis nollamatriisin lisäksi otetaan mukaan i kappaletta pysty- ja vaakarivejä. Nyt ääriarvon laatu mahdollisessa paikallisessa ääriarvokohdassa X̄0 määräytyy seuraavasti: 1) Jos (−1)i |H̄i | > 0, kaikilla i = m + 1, . . . , n, niin KRP on paikallinen sidottu maksimikohta. 2) Jos (−1)m |H̄i | > 0, kaikilla i = m + 1, . . . , n, niin KRP on paikallinen sidottu minimikohta. 3) Jos kumpikaan ei toteudu, testi ei kerro mitään, joten tutki tarkemmin. 49 Esimerkki 4.3. Määritä funktion f (x, y, z) = −x2 − 7y − 10z − 3 paikalliset ääriarvot ehdoilla x + y + z = 0 ja x + 2y + 3z = 0. 3o Lagrangen kertoimen tulkinta: Tehtävä alunperin muotoa: Maximoi/minimoi funktio f (X̄) ehdoilla gj (X̄) = bj , missä X̄ = (x1 , . . . , xn ) ja j = 1, . . . , m. Voidaan osoittaa, että optimikohdassa X̄ λj = ∂f (X̄) . ∂bj Eli kerroin λj osoittaa kuinka paljon optimiarvo muuttuu, jos alkuperäisen tehtävän rajoitetta gj muutetaan. Eli jos rajoitteessa oleva vakio bj muuttuu yhden yksikön, niin optimiarvo muuttuu λj yksikköä. Usein bj kuvaa jonkin resurssin määrää (työt, luonnonvarat), jolloin λj ilmoittaa resurssin varjohinnan. Eli paljonko kannattaa maksaa, jos saa yhden yksikön lisää resurssia? Esimerkki 4.4. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla x + 2y = 25. Esimerkki 4.5. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla x + 2y = 23. P Huomautus. Ehtojen kertoimien on oltava positiivisia ja L = f − λj gj . 4.2.2 n muuttujan ja yhden epäyhtälörajoitteen tapaus Ääriarvot funktiolle f (x1 , . . . , xn ) ehdolla g(x1 , . . . , xn ) ≤ 0. Menetelmä on seuraava: 1) Ääriarvotetaan funktio f (x1 , . . . , xn ) ilman epäyhtälöehtoa g(x1 , . . . , xn ) ≤ 0. Mahdollinen paikallinen ääriarvokohta X̄0 löytyy siis funktion f (X̄) osittaisderivaattojen nollakohtana. Suoritetaan normaali laatutarkastelu kriittiselle pisteelle X̄0 Hessin matriisin avulla. 50 Jos kriittinen piste toteuttaa ehdon g(x1 , . . . , xn ) ≤ 0, niin se on myös epäyhtälöehdon mukainen sidottu paikallinen ääriarvokohta. (Ääriarvokohta löytyy siis ehtoalueen sisältä, g(x1 , . . . , xn ) ≤ 0.) 2) Tarkastellaan epäyhtälörajoitteen g(x1 , . . . , xn ) ≤ 0 sijaan yhtälörajoitetta g(x1 , . . . , xn ) = 0. Ratkaistaan kuten normaali sidottu ääriarvotehtävä, missä Lagrange-funktio on nyt muotoa L(x1 , . . . , xn , λ) = f (x1 , . . . , xn ) − λg(x1 , . . . , xn ). Olkoon ratkaisuna saatu kriittinen piste X̄0 . Suoritetaan Lagrangen mukainen laatutarkastelu kriittiselle pisteelle X̄0 laajennetun Hessin matriisin avulla. (Ääriarvokohta löytyy siis ehtoalueen reunalta, g(x1 , . . . , xn ) = 0.) 3) Kohtiin 1) ja 2) perustuva päättely. Esimerkki 4.6. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≤ 24. Esimerkki 4.7. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≥ 24. 51 5 Lineaarinen optimointi Tehtävä: Maksimoi/minimoi kohdefunktio z = f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . + cn xn + c0 (Lineaarinen!!!) rajoitteilla a11 x1 + a12 x2 + . . . + a1n xn ≥ b1 (Lineaariset!!!) a21 x1 + a22 x2 + . . . + a2n xn ≤ b2 .. . am1 x1 + am2 x2 + . . . + amn xn ≤ bm xj ≥ 0 ∀ j = 1, . . . , n . 5.1 Geometrinen ratkaisu Kahden päämuuttujan tapaus: Max/min f (x1 , x2 ) = c1 x1 + c2 x2 + c0 rajoitteilla a11 x1 + a12 x2 ≥ b1 a21 x1 + a22 x2 ≤ b2 .. . am1 x1 + am2 x2 ≤ bm x1 , x2 ≥ 0, ei pakollinen. Muodostetaan ratkaisumonikulmio eli etsitään ehtoalue, jossa rajoitteet toteutuvat. Lause 5.1. Jos ratkaisumonikulmio on suljettu, niin optimointitehtävän yksikäsitteinen ratkaisu löytyy ratkaisumonikulmion kärjistä. Jos ratkaisuja on useita, niin ainakin kaksi niistä löytyy ratkaisumonikulmion kärkipisteistä. Jos ratkaisumonikulmio on avoin alue, tutki tarkemmin. Esimerkki 5.1. Max/min f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla 2x1 + x2 ≤ 6 5x1 + 4x2 ≥ 20 x , x ≥ 0 . 1 2 52 Huomautus. Ratkaisumonikulmio ei välttämättä ole suljettu rajoitteilla. Esimerkiksi: ( ( 2x1 + x2 ≤ 6 2x1 + x2 ≥ 6 5x1 + 4x2 ≥ 40 5x1 + 4x2 ≥ 40 Esimerkki 5.2. Min/max f (x, y) = 2x + 10y rajoitteilla 2x + y ≥ 6 5x + 4y ≥ 20 x, y ≥ 0 . Esimerkki 5.3. Min/max f (x, y) = −2x + 10y rajoitteilla 2x + y ≥ 6 5x + 4y ≥ 20 x, y ≥ 0 . 53 5.2 Kantaratkaisu–menetelmä Tehtävä: Maksimoi/minimoi kohdefunktio z = f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . + cn xn + c0 rajoitteilla a11 x1 + a12 x2 + . . . + a1n xn ≤ b1 a21 x1 + a22 x2 + . . . + a2n xn ≥ b2 .. . am1 x1 + am2 x2 + . . . + amn xn ≤ bm xj ≥ 0 ∀ j = 1, . . . , n. Rajoite-epäyhtälöt muutetaan lisämuuttujien (xn+1 , . . . , xn+m ) avulla yhtälöiksi: a11 x1 + a12 x2 + . . . + a1n xn + xn+1 = b1 a21 x1 + a22 x2 + . . . + a2n xn − xn+2 = b2 .. . am1 x1 + am2 x2 + . . . + amn xn + xn+m = bm xj ≥ 0 ∀ j = 1, . . . , n + m. Kantaratkaisu on eo. yhtälöryhmän sellainen ratkaisu, jossa tuntemattomista x1 , . . . , xn+m on n kappaletta nollia ja lisäksi positiivisuusehtoa ei huomioida. Kantamuuttujat ovat ne m muuttujaa, joita ei aseteta nolliksi. Hyväksyttävä kantaratkaisu on kantaratkaisu, joka toteuttaa myös positiivisuusehdon. Optimaalinen kantaratkaisu on hyväksyttävä kantaratkaisu, joka antaa kohdefunktion optimiarvon. Lause 5.2. Jos kohdefunktiolla on äärellinen optimi, niin ainakin yksi optimaalinen ratkaisu löytyy hyväksyttävänä kantaratkaisuna. Optimointi: 1) haetaan kantaratkaisut 2) valitaan hyväksyttävät kantaratkaisut 3) lasketaan funktion arvot kohdan 2) pisteissä 54 4) valitaan näistä haettu optimiarvo. Esimerkki 5.4. Min/max f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla 2x1 + x2 ≤ 6 5x1 + 4x2 ≥ 20 x , x ≥ 0 . 1 2 . Huomautus. Kantaratkaisu–menetelmä ei toimi avoimessa alueessa. Pienellä varovaisuudella kylläkin. 5.3 SIMPLEX–menetelmä Tehtävä. Maksimoi/minimoi kohdefunktio z = f (X̄) = c1 x1 + c2 x2 + . . . + cn xn rajoitteilla a11 x1 + a12 x2 + . . . + a1n xn ≤ b1 a21 x1 + a22 x2 + . . . + a2n xn ≥ b2 .. . am1 x1 + am2 x2 + . . . + amn xn ≤ bm xj ≥ 0 ∀ j = 1, . . . , n. Rajoite-epäyhtälöt muutetaan lisämuuttujien avulla yhtälöiksi: Esimerkiksi rajat ( a11 x1 + a12 x2 + . . . + a1n xn ≤ b1 ⇒ a21 x1 + a22 x2 + . . . + a2n xn ≥ b2 ( a11 x1 + a12 x2 + . . . + a1n xn + xn+1 = b1 a21 x1 + a22 x2 + . . . + a2n xn − xn+2 + xn+3 = b2 . Lisämuuttujat: xn+1 ei kohdefunktioon, kylläkin arvotaulukkoon. 55 xn+3 kohdefuntioon ja arvotaulukkoon. ( minimointi ⇒ M xn+3 M suuri positiivinen luku. maksimointi ⇒ −M xn+3 , xn+2 ei kohdefunktioon eikä arvotaulukkoon lisämuuttujana. Esimerkki 5.5. Minimoi z = f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla 2x1 + x2 ≤ 6 5x1 + 4x2 ≥ 20 x , x ≥ 0 . 1 2 Rajoite-epäyhtälöt muutetaan lisämuuttujien avulla yhtälöiksi: 2x1 + x2 + x3 = 6 5x1 + 4x2 − x4 + x5 = 20 x , x , x , x ≥ 0 . 1 2 3 4 ⇒ minimoi z = f (x1 , x2 ) = 2x1 + 10x2 + M x5 edellä olleilla rajoitteilla. Muodostetaan arvotaulukko seuraavasti: cj 2 10 0 0 M cj lisämuuttujat arvot x1 x2 x3 x4 x5 0 M x3 x5 zj cj − zj 6 20 20M 2 5 5M 2 − 5M 1 4 4M 10 − 4M 1 0 0 0 0 −1 −M M 0 1 M 0 (Kun x3 = 6 ja x5 = 20, niin x1 = x2 = 0 ⇒ z = 20M ) zj :n arvot saadaan laskemalla lisämuuttujien arvoiksi sarakkeen luvut ja kertoimiksi c3 ja c5 . cj − zj edustaa lisäystä funktion arvoon, joka saavutetaan muuttujan j yhden yksikön lisäyksellä (ko. arvoista). Optimaalisuuden tarkistus: Maksimointitehtävä: 56 Jos rivin cj −zj kaikki arvot ovat negatiivisia (≤ 0), niin tulosta ei voida parantaa ja on löydetty maksimikohta. Minimointitehtävä: Jos rivin cj − zj kaikki arvot ovat positiivisia (≥ 0), niin tulosta ei voida parantaa ja on siten löydetty minimikohta. Nyt 2 − 5M < 0 ja 10 − 4M < 0 ⇒ ei minimikohta. Korvaavan ja väistyvän muuttujan valinta: Suurin parannus eli tässä tapauksessa pienennys funktion arvoon saadaan muuttujan x1 lisäyksestä (2 − 5M < 10 − 4M, M suuri positiivinen luku) ⇒ x1 korvaava muuttuja ja x1 :n sarake optimisarake. Jaetaan lisämuuttujien arvot vastaavilla optimisarakkeen arvoilla: x3 : 6 =3 2 x5 : 20 =4 5 Se, jolla on pienempi positiivinen arvo, valitaan väistyväksi muuttujaksi. ⇒ x3 väistyvä muuttuja Muodostetaan uusi arvotaulu: Korvaavan muuttujan x1 rivi saadaan väistyvän muuttujan x3 rivin alkioista jakamalla ne optimisarakkeen x1 muuttujan x3 arvolla. cj 2 10 0 0 M cj lisämuuttujat arvot x1 x2 x3 x4 x5 2 M x1 x5 3 20 1 5 1 2 1 2 4 0 0 −1 0 1 Muut rivit: uuden vanhan vanhan rivin vastaava rivin = rivin − alkio optimi- · alkio korvaa- alkio alkio sarakkeessa valla rivillä 57 cj 2 10 0 0 M x2 x3 x4 x5 1 2 0 −1 −M M 0 1 M 0 cj lisämuuttujat arvot x1 2 M x1 x5 zj cj − zj 3 5 6 + 5M 1 0 2 0 1 9 1 2 3 2 + 32 M − 32 M − 52 1 − 52 M −1 + 25 M Ei minimiratkaisu, sillä 9 − 32 M < 0. Nyt x2 on korvaava muuttuja ja x2 :n sarake on optimisarake. Lisäksi x1 : 3 1 2 5 = 6 ja x5 : 3 2 = 10 3 ⇒ x5 väistyvä muuttuja Muodostetaan uusi arvotaulu: cj 2 10 0 0 M cj lisämuuttujat arvot x1 x2 x3 x4 x5 2 10 x1 x2 3 1 0 1 2 1 2 0 − 23 0 10 3 cj 2 3 10 0 0 M x3 x4 x5 = 43 − 53 −42 = −14 3 14 1 3 − 13 lisämuuttujat arvot x1 x2 2 10 x1 x2 zj cj − zj 4 3 10 3 1 0 2 0 0 1 10 0 = 36 1 2 cj 108 3 − 35 8 6 − 23 −18 = −6 3 6 18 3 2 3 =6 M −6 Tämä on minimiratkaisu, sillä 14 > 0, 6 > 0 ja M − 6 > 0. Siis minimiratkaisu on x1 = 4 3 ja x1 = 10 , 3 jolloin minimiarvo on 36. 58 Esimerkki 5.6. Maksimoi z = f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla 2x1 + x2 ≤ 6 5x1 + 4x2 ≥ 20 x , x ≥ 0 . 1 2 Muutetaan epäyhtälörajoitteet yhtälöiksi: 2x1 + x2 + x3 = 6 5x1 + 4x2 − x4 + x5 = 20 x , x , x , x ≥ 0 . 1 2 3 4 ⇒ maksimoi z = f (x1 , x2 ) = 2x1 + 10x2 − M x5 edellä olleilla rajoitteilla. Muodostetaan arvotaulukko seuraavasti: cj 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 0 −M x3 x5 zj cj − zj 6 20 −20M 2 5 −5M 2 + 5M 1 4 −4M 10 + 4M 1 0 0 0 0 −1 M −M 0 1 −M 0 (Kun x3 = 6 ja x5 = 20, niin x1 = x2 = 0 ⇒ z = −20M ) Optimaalisuuden tarkistus: Nyt 2 + 5M > 0 ja 10 + 4M > 0 ⇒ ei maksimikohta. Korvaavan ja väistyvän muuttujan valinta: Suurin parannus funktion arvoon saadaan muuttujan x1 lisäyksestä (2 + 5M > 10 + 4M, M suuri positiivinen luku) ⇒ x1 korvaava muuttuja ja x1 :n sarake optimisarake. Jaetaan lisämuuttujien arvot vastaavilla optimisarakkeen arvoilla: x3 : 6 =3 2 x5 : 20 =4 5 59 Se, jolla on pienempi positiivinen arvo, valitaan väistyväksi muuttujaksi. ⇒ x3 väistyvä muuttuja Muodostetaan uusi arvotaulu: Korvaavan muuttujan x1 rivi saadaan väistyvän muuttujan x3 rivin alkioista jakamalla ne optimisarakkeen x1 muuttujan x3 arvolla. cj 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 2 −M x1 x5 3 20 1 5 1 2 1 2 4 0 0 −1 0 1 cj 2 10 0 0 −M x2 x3 x4 x5 1 2 0 −1 M −M 0 1 −M 0 cj lisämuuttujat arvot x1 2 −M x1 x5 zj cj − zj 3 5 6 − 5M 1 0 2 0 1 9 1 2 3 2 − 32 M + 32 M − 52 1 + 25 M −1 − 52 M Ei maksimiratkaisu, sillä 9 + 32 M > 0. Nyt x2 on korvaava muuttuja ja x2 :n sarake optimisarake. Lisäksi x1 : 3 1 2 = 6 ja x5 : 5 3 2 = 10 3 ⇒ x5 väistyvä muuttuja Muodostetaan uusi arvotaulu: cj 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 2 10 x1 x2 3 1 0 1 2 1 2 0 − 32 0 10 3 1 − 53 2 3 60 cj 2 10 0 0 −M x2 x3 x4 x5 4 1 0 3 3 1 − 53 − 32 10 −14 −6 0 14 6 − 13 cj lisämuuttujat arvot x1 2 10 x1 x2 zj cj − zj 4 3 10 3 1 0 2 0 36 2 3 6 −M − 6 Tämä ei ole maksimiratkaisu, sillä 14 > 0 ja 6 > 0. Koska 14 > 6, niin x3 on korvaaja muuttuja ja x3 :n sarake on optimisarake. Lisäksi 4 3 4 3 x1 : 10 3 −5 3 = 1 ja x2 : = −2 ⇒ x1 väistyvä muuttuja Muodostetaan uusi arvotaulu: cj 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 0 10 x3 x2 1 3 4 0 1 1 − 53 1 4 − 14 10 3 0 cj − 32 2 3 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 0 10 x3 x2 zj cj − zj 1 5 50 3 4 5 4 50 4 − 42 4 0 1 10 0 1 0 0 0 1 4 − 41 Ei maksimiratkaisu, sillä optimisarake. Lisäksi 10 4 x3 : − 14 − 10 4 10 4 1 4 10 4 −M − 10 4 > 0. Nyt x4 on korvaava muuttuja ja x4 :n sarake 1 1 4 = 4 ja x2 : 5 = −20 − 41 ⇒ x3 väistyvä muuttuja 61 Muodostetaan uusi arvotaulu: cj 2 10 0 0 −M cj lisämuuttujat arvot x1 x2 x3 x4 x5 0 10 x4 x2 4 5 3 0 1 4 0 1 − 14 −1 5 4 cj 1 4 2 10 0 0 −M x2 x3 x4 x5 1 0 0 0 −1 0 0 −M cj lisämuuttujat arvot x1 0 10 x4 x2 zj cj − zj 4 6 60 3 2 20 −18 0 4 1 1 10 10 0 −10 Selvästi kyseessä on maksimiratkaisu. Nyt ( x2 = 6 x4 = 4 ⇒ 5x1 + 4 · 6 − 4 + x5 = 20 ⇒ x1 = x5 = 0 Optimikohta on siis x1 = 0, x2 = 6. z = 2 · 0 + 10 · 6 − M · 0 = 60. 62