Mikä on taaksepäin tapahtuva induktio?
Peliteorian taaksepäin tapahtuva induktio on iteratiivinen prosessi ajatella taaksepäin ajassa, ongelman tai tilanteen lopusta lähtien, jotta voidaan ratkaista äärellinen laaja muoto ja peräkkäiset pelit ja päätellä optimaalisten toimien sarja.
Taaksepäin-induktio selitetty
Takautuvaa induktiota on käytetty pelien ratkaisemiseen, koska John von Neumann ja Oskar Morgenstern perustivat peliteorian akateemiseksi aiheeksi, kun he julkaisivat kirjan Pelien teoria ja taloudellinen käyttäytyminen vuonna 1944.
Kussakin pelivaiheessa taaksepäin tapahtuva induktio määrittelee sen pelaajan optimaalisen strategian, joka tekee viimeisen siirron pelissä. Sitten määritetään seuraavaksi viimeiseen liikkuvan pelaajan optimaalinen toiminta ottaen viimeisen pelaajan toiminta annetulla tavalla. Tämä prosessi jatkuu taaksepäin, kunnes paras toiminto jokaiselle ajankohdalle on määritetty. Tosiasiallisesti yksi määrittelee alkuperäisen pelin kunkin alapelin Nash-tasapainon.
Taaksepäin indusoinnista johdetut tulokset eivät kuitenkaan usein pysty ennustamaan ihmisen todellista leikkiä. Kokeelliset tutkimukset ovat osoittaneet, että "rationaalista" käyttäytymistä (kuten peliteoria ennustaa) esiintyy harvoin tosielämässä. Irrationaaliset pelaajat saattavat tosiasiassa saada korkeampia voittoja kuin taaksepäin indusoimalla ennustettiin, kuten centipede-pelissä havainnollistetaan.
Tuhatjalkainen peli, kaksi pelaajaa vuorotellen saa mahdollisuuden ottaa suuremman osan kasvavasta potista rahaa tai siirtää potin toiselle pelaajalle. Voitot maksetaan siten, että jos potti siirretään vastustajalle ja vastustaja ottaa potin seuraavalla kierroksella, yksi saa vähän vähemmän kuin jos potki olisi otettu tällä kierroksella. Peli päättyy heti, kun pelaaja ottaa stashin, jolloin pelaaja saa suuremman osan ja toinen pelaaja saa pienemmän osan.
Esimerkki taaksepäin tapahtuvasta induktiosta
Oletetaan, että pelaaja A menee ensin ja hänen on päätettävä, pitäisikö hänen “ottaa” vai ”siirtää” kolikko, jonka määrä tällä hetkellä on 2 dollaria. Jos hän ottaa, niin A ja B saavat kumpikin yhden dollarin, mutta jos A kulkee, pelaaja B tekee päätöksen tehdä tai siirtää nyt. Jos B ottaa, hän saa 3 dollaria (eli edellinen käteismaksu 2 dollaria + 1 dollaria). ja A saa 0 dollaria. Mutta jos B ohittaa, A päättää nyt ottaako vai kulkeeko jne. Jos molemmat pelaajat päättävät aina ohittaa, he molemmat saavat 100 dollarin voiton pelin lopussa.
Pelin tarkoitus on, että jos A ja B molemmat tekevät yhteistyötä ja jatkavat kulkuaan pelin loppuun saakka, he saavat enintään 100 dollarin voiton. Mutta jos he luottavat toiseen pelaajaan ja odottavat heidän ottavan ”ensimmäisessä tilaisuudessa, Nash-tasapaino ennustaa pelaajien ottavan mahdollisimman pienen vaatimuksen (tässä tapauksessa 1 dollaria).
Tämän pelin Nash-tasapaino, jossa yhdelläkään pelaajalla ei ole kannustinta poiketa valitsemastaan strategiasta harkittaessaan vastustajan valintaa, ehdottaa, että ensimmäinen pelaaja ottaisi potin aivan ensimmäisen pelikierroksen aikana. Todellisuudessa suhteellisen harvat pelaajat tekevät niin. Seurauksena on, että he saavat suuremman voiton kuin tasapainoanalyysin ennustama voitto.
Sekvenssisten pelien ratkaiseminen taaksepäin tapahtuvaa induktiota käyttämällä
Alla on yksinkertainen peräkkäinen peli kahden pelaajan välillä. Tarrat, joissa on pelaaja 1 ja pelaaja 2, ovat vastaavasti yhden tai kahden pelaajan tietokokonaisuudet. Puun alaosassa suluissa olevat numerot ovat voittoja kussakin vastaavassa pisteessä. Peli on myös peräkkäinen, joten pelaaja 1 tekee ensimmäisen päätöksen (vasen tai oikea) ja pelaaja 2 tekee päätöksen pelaaja 1 (ylös tai alas) jälkeen.

Kuvio 1
Takautuva induktio, kuten kaikki peliteoriat, käyttää rationaalisuuden ja maksimoinnin oletuksia, mikä tarkoittaa, että pelaaja 2 maksimoi voitonsa kussakin tilanteessa. Kummassakin tietojoukossa meillä on kaksi vaihtoehtoa, kaikkiaan neljä. Poistamalla valinnat, joita pelaaja 2 ei valitse, voimme kaventaa puumme. Tällä tavalla lihavoidaan rivit, jotka maksimoivat pelaajan voiton annetussa tietojoukossa.

Kuvio 2
Tämän alennuksen jälkeen pelaaja 1 voi maksimoida voitonsa nyt, kun Player 2: n valinnat tunnetaan. Tuloksena on tasapaino, joka löytyy indusoimalla taaksepäin pelaaja 1 valitsemalla "oikea" ja pelaaja 2 valitsemalla "ylös". Alla on ratkaisu peliin, jossa tasapainopolku on lihavoitu.

Kuvio 3
Voidaan esimerkiksi helposti perustaa yllä olevan kaltainen peli käyttämällä pelaajia yrityksinä. Tämä peli voisi sisältää tuotevapautusskenaarioita. Jos yritys 1 halusi julkaista tuotteen, mitä yritys 2 voisi tehdä vastauksena? Julkaiseeko yritys 2 samanlaisen kilpailevan tuotteen? Ennustamalla tämän uuden tuotteen myyntiä erilaisissa tilanteissa, voimme perustaa pelin, jolla ennustetaan tapahtumien kehittymistä. Alla on esimerkki siitä, kuinka tällaista peliä voidaan mallintaa.

Kuvio 4
