Luento 6

Transcription

Luento 6

Luento 6
June 1, 2015
Luento 6
Ekstensiivisen muodon pelit
Normaalimuodon pelissä on luontevaa ajatella, että pelaajat
tekevät valintansa samanaikaisesti.
Ekstensiivisen muodon peleissä pelin jonottaisella rakenteella
on keskeinen merkitys.
Aluksi käsittelemme pelejä, joissa pelaajien informaatio on
täydellistä eli he tietävät mitä pelissä on tapahtunut siinä
vaiheessa kun on heidän vuoronsa tehdä valinta.
Pelien kuvaamiseen käytämme yleensä pelipuita.
Luento 6
Definition
Ekstensiivisen muodon peli hN, H, P, (ui )i koostuu pelaajien
joukosta N, historioiden joukosta H, pelaajafunktiosta P ja
pelaajien hyötyfunktioista.
Historiat ovat jonoja pelaajien valintoja.
Pelaajafunktio liittää jokaiseen ei-terminaaliseen historiaan
pelaajan, jonka vuoro on tehdä valinta.
Terminaaliset historiat ovat sellaisia, että peli päättyy ja niihin
liittyy kullekin pelaajalle hyötyluku.
Luento 6
Pelin historiat toteuttavat seuraavat ominaisuudet i) Ø ∈ H, ii) jos
L
K
ak k=1 ∈ H niin ak k=1 ∈ H kaikille L < K , iii) jos jonolle
∞
K
∞
ak k=1 pätee ak k=1 ∈ H kaikille K niin ak k=1 ∈ H.
Tulkinta on, että jokainen historia koostuu pelaajien teoista.
K
Terminaalihistoria ak k=1 on sellainen, että ei ole olemassa
K +1
aK +1 siten, että ak k=1 ∈ H jollekin luvulle K , tai se on
äärettömän pitkä.
Pelaajafunktio liittää jokaiseen terminaalihistoriaan tyhjän
joukon.
Jos pelissä on vain äärellisen pitkiä historioita ja
terminaalihistorioiden joukko on äärellinen peliä sanotaan
äärelliseksi.
Muutoin peli on ääretön.
Luento 6
Pelit, joissa ei ole äärettömän pitkiä historioita voidaan
ratkaista algoritmisesti.
Takaperoinen induktio on menetelmä, jolla voidaan löytää
ainakin jotkut Nash-tasapainot ja lisäksi se löytää aina
vähintään yhden tasapainon.
Menetelmässä aloitetaan pelin lopusta ja määrätään
optimaaliset valinnat.
Sitten siirrytään askel lähemmäksi alkua ja tehdään sama.
Teknisesti sanotaan, että aloitetaan lyhyimmistä osapeleistä ja
siirrytään toiseksi lyhyimpiin jne.
Tällä tavoin määrätään kullekin pelaajalle jokaisessa hänen
päätössolmussaan optimaalinen päätös.
Seuraavat esimerkit kuvaavat menetelmää.
Luento 6
Peli jossa takaperoinen induktio toimii hyvin.
Luento 6
Peli jossa takaperoinen induktio ei toimi niin hyvin kuin edellä.
Luento 6
Vielä yksi peli, jossa takaperoinen induktio ei toimi hyvin.
Luento 6
Peli, jossa takaperoinen induktio toimii ’liian hyvin’.
Luento 6
Toisessa esimerkissä induktio ei tuota yksikäsitteistä vastausta,
koska joissa päätössolmuissa pelaajat ovat indifferenttejä
tekojen välillä.
Kolmannessa esimerkissä ongelma on äärettömät historiat; ei
ole lyhintä osapeliä josta induktion voisi aloittaa.
Yleisesti ottaen takaperoinen induktio ei ole riittävän vahva
menetelmä tasapainon määräämiseksi.
Tästä syystä joudumme taas tyytymään Nash-tasapainoon
ratkaisukäsitteenä.
Joudumme tietysti ensin määrittelemään, mitä tarkoitetaan
strategialla.
Se ei ole triviaali käsite; sanallisesti strategia on täydellinen
suunnitelma, mitä pelaaja tekee kussakin päästössolmussaan.
Jopa niissä solmuissa, joita ei voida strategian mukaan
saavuttaa.
Luento 6
Definition
Pelaajan i strategia ekstensiivisen muodon pelissä hN, H, P, (ui )i on
funktio si , joka liittää jokaiseen historiaan h, jolle P(h) = i alkion
joukosta Ai (h).
Tämä määritelmä ei ole vielä täydellisen yksikäsitteinen.
Strategian täydellinen määrittely vaatii enemmän koneistoa
kuin meillä on käytössä tällä kurssilla.
Yksityiskohtainen määrittely löytyy esimerkiksi teoksesta Klaus
Ritzberger: Foundations of Non-Cooperative Game Theory.
Luento 6
Strategian määräämiseksi pitää olla selvillä, missä
järjestyksessä pelaajien päätössolmuja käsitellään.
Olkoon ensimmäisessä pelissä järjestys vasemmalta oikealle ja
ylhäältä alas.
Yksi strategia P1:lle olisi tällöin (d , u, u, m).
P1:n puhtaiden strategioiden joukossa on 16 alkiota ja P2:n
puhtaiden strategioiden joukossa 6 alkiota.
Takaperoisella induktiolla saatu strategiaprofiili on
(u, m, u, m; m, d ), missä P1:n strategiat on annettu ensin.
Luento 6
Strategiat indusoivat terminaalhistorian, johon liittyyvät
hyödyt kullekin pelaajalle.
Ekstensiivisen muodon pelin Nash-tasapaino voidaan näin
määritellä ihan kuten normaalimuodon peleille.
Definition
Ekstensiivisen muodon pelissä hN, H, P, (ui )i strategiaprofiili
s ∈ ×j∈N sj on Nash-tasapaino,
jos jokaiselle pelaajalle i pätee
0
ui (si , s−i ) ≥ ui si , s−i
0
kaikille si ∈ Si .
Monesti on hyvä ajatella, että terminaalihistoriat liittyvät
reaalisiin tulemiin ja pelaajien hyödyt ovat seurausta näistä
tulemista.
Luento 6
Ekstensiivisen muodon pelit I
Mallitetaan lopuksi historiallinen tapahtuma ekstensiivisen
muodon pelinä.
Kun Cortez rantautui Meksikoon hänellä oli vastassaan omia
sotajoukkoja lukuisammat atsteekit.
Varmistaakseen miestensä taistelutahdon ja tehdäkseen tämän
selväksi atsteekeille hän poltti laivat, joilla retkikunta oli
saapunut.
Näin mitään pakotietä ei ollut.
Atsteekit vetäytyivät kukkuloille sen sijaan, että olisivat
taistelleet.
Tässä on ohitettu muutamia historiallisesti tärkeitä seikkoja ja
yksinkertaistettu kovasti.
Oletetaan, että miehistön päätöksiä ei tarvitse mallittaa, vaan
koska laivat on poltettu miehistö taistelee ankarasti.
Luento 6
Ekstensiivisen muodon pelit I
Kenties tämä peli kuvaa tilannetta.
Luento 6

Luento 6

Transcription

Similar documents

joukkue SM tilasto - Helsingin Shakkiklubi

KUVADOMINO - Finn Lectura

artikkelista

Ohjelmistojen suunnittelu

PDGA:n Kilpailuopas Johdanto

jäseri-ohje 2013.pdf

Lasten valmennus_8_9.pdf

LASTEN VALMENNUS - Tikkurilan Palloseura ry TiPS

Jalkapallojuniorin vanhemman käsikirja