Luento 6
Transcription
Luento 6
Luento 6 June 1, 2015 Luento 6 Ekstensiivisen muodon pelit Normaalimuodon pelissä on luontevaa ajatella, että pelaajat tekevät valintansa samanaikaisesti. Ekstensiivisen muodon peleissä pelin jonottaisella rakenteella on keskeinen merkitys. Aluksi käsittelemme pelejä, joissa pelaajien informaatio on täydellistä eli he tietävät mitä pelissä on tapahtunut siinä vaiheessa kun on heidän vuoronsa tehdä valinta. Pelien kuvaamiseen käytämme yleensä pelipuita. Luento 6 Ekstensiivisen muodon pelit Definition Ekstensiivisen muodon peli hN, H, P, (ui )i koostuu pelaajien joukosta N, historioiden joukosta H, pelaajafunktiosta P ja pelaajien hyötyfunktioista. Historiat ovat jonoja pelaajien valintoja. Pelaajafunktio liittää jokaiseen ei-terminaaliseen historiaan pelaajan, jonka vuoro on tehdä valinta. Terminaaliset historiat ovat sellaisia, että peli päättyy ja niihin liittyy kullekin pelaajalle hyötyluku. Luento 6 Ekstensiivisen muodon pelit Pelin historiat toteuttavat seuraavat ominaisuudet i) Ø ∈ H, ii) jos L K ak k=1 ∈ H niin ak k=1 ∈ H kaikille L < K , iii) jos jonolle ∞ K ∞ ak k=1 pätee ak k=1 ∈ H kaikille K niin ak k=1 ∈ H. Tulkinta on, että jokainen historia koostuu pelaajien teoista. K Terminaalihistoria ak k=1 on sellainen, että ei ole olemassa K +1 aK +1 siten, että ak k=1 ∈ H jollekin luvulle K , tai se on äärettömän pitkä. Pelaajafunktio liittää jokaiseen terminaalihistoriaan tyhjän joukon. Jos pelissä on vain äärellisen pitkiä historioita ja terminaalihistorioiden joukko on äärellinen peliä sanotaan äärelliseksi. Muutoin peli on ääretön. Luento 6 Ekstensiivisen muodon pelit Pelit, joissa ei ole äärettömän pitkiä historioita voidaan ratkaista algoritmisesti. Takaperoinen induktio on menetelmä, jolla voidaan löytää ainakin jotkut Nash-tasapainot ja lisäksi se löytää aina vähintään yhden tasapainon. Menetelmässä aloitetaan pelin lopusta ja määrätään optimaaliset valinnat. Sitten siirrytään askel lähemmäksi alkua ja tehdään sama. Teknisesti sanotaan, että aloitetaan lyhyimmistä osapeleistä ja siirrytään toiseksi lyhyimpiin jne. Tällä tavoin määrätään kullekin pelaajalle jokaisessa hänen päätössolmussaan optimaalinen päätös. Seuraavat esimerkit kuvaavat menetelmää. Luento 6 Ekstensiivisen muodon pelit Peli jossa takaperoinen induktio toimii hyvin. Luento 6 Ekstensiivisen muodon pelit Peli jossa takaperoinen induktio ei toimi niin hyvin kuin edellä. Luento 6 Ekstensiivisen muodon pelit Vielä yksi peli, jossa takaperoinen induktio ei toimi hyvin. Luento 6 Ekstensiivisen muodon pelit Peli, jossa takaperoinen induktio toimii ’liian hyvin’. Luento 6 Ekstensiivisen muodon pelit Toisessa esimerkissä induktio ei tuota yksikäsitteistä vastausta, koska joissa päätössolmuissa pelaajat ovat indifferenttejä tekojen välillä. Kolmannessa esimerkissä ongelma on äärettömät historiat; ei ole lyhintä osapeliä josta induktion voisi aloittaa. Yleisesti ottaen takaperoinen induktio ei ole riittävän vahva menetelmä tasapainon määräämiseksi. Tästä syystä joudumme taas tyytymään Nash-tasapainoon ratkaisukäsitteenä. Joudumme tietysti ensin määrittelemään, mitä tarkoitetaan strategialla. Se ei ole triviaali käsite; sanallisesti strategia on täydellinen suunnitelma, mitä pelaaja tekee kussakin päästössolmussaan. Jopa niissä solmuissa, joita ei voida strategian mukaan saavuttaa. Luento 6 Ekstensiivisen muodon pelit Definition Pelaajan i strategia ekstensiivisen muodon pelissä hN, H, P, (ui )i on funktio si , joka liittää jokaiseen historiaan h, jolle P(h) = i alkion joukosta Ai (h). Tämä määritelmä ei ole vielä täydellisen yksikäsitteinen. Strategian täydellinen määrittely vaatii enemmän koneistoa kuin meillä on käytössä tällä kurssilla. Yksityiskohtainen määrittely löytyy esimerkiksi teoksesta Klaus Ritzberger: Foundations of Non-Cooperative Game Theory. Luento 6 Ekstensiivisen muodon pelit Strategian määräämiseksi pitää olla selvillä, missä järjestyksessä pelaajien päätössolmuja käsitellään. Olkoon ensimmäisessä pelissä järjestys vasemmalta oikealle ja ylhäältä alas. Yksi strategia P1:lle olisi tällöin (d , u, u, m). P1:n puhtaiden strategioiden joukossa on 16 alkiota ja P2:n puhtaiden strategioiden joukossa 6 alkiota. Takaperoisella induktiolla saatu strategiaprofiili on (u, m, u, m; m, d ), missä P1:n strategiat on annettu ensin. Luento 6 Ekstensiivisen muodon pelit Strategiat indusoivat terminaalhistorian, johon liittyyvät hyödyt kullekin pelaajalle. Ekstensiivisen muodon pelin Nash-tasapaino voidaan näin määritellä ihan kuten normaalimuodon peleille. Definition Ekstensiivisen muodon pelissä hN, H, P, (ui )i strategiaprofiili s ∈ ×j∈N sj on Nash-tasapaino, jos jokaiselle pelaajalle i pätee 0 ui (si , s−i ) ≥ ui si , s−i 0 kaikille si ∈ Si . Monesti on hyvä ajatella, että terminaalihistoriat liittyvät reaalisiin tulemiin ja pelaajien hyödyt ovat seurausta näistä tulemista. Luento 6 Ekstensiivisen muodon pelit I Mallitetaan lopuksi historiallinen tapahtuma ekstensiivisen muodon pelinä. Kun Cortez rantautui Meksikoon hänellä oli vastassaan omia sotajoukkoja lukuisammat atsteekit. Varmistaakseen miestensä taistelutahdon ja tehdäkseen tämän selväksi atsteekeille hän poltti laivat, joilla retkikunta oli saapunut. Näin mitään pakotietä ei ollut. Atsteekit vetäytyivät kukkuloille sen sijaan, että olisivat taistelleet. Tässä on ohitettu muutamia historiallisesti tärkeitä seikkoja ja yksinkertaistettu kovasti. Oletetaan, että miehistön päätöksiä ei tarvitse mallittaa, vaan koska laivat on poltettu miehistö taistelee ankarasti. Luento 6 Ekstensiivisen muodon pelit I Kenties tämä peli kuvaa tilannetta. Luento 6