College-aantekeningen Besliskunde: Speltheorie

advertisement
lOMoARcPSD
Speltheorie
Games against nature – gebeurtenisbeslisboom
Beslisknoop is een ‘zet’ door de beslisser en een kansknoop is een ‘zet’ door het lot
De uitkomst is een payoff voor de beslisser
Kansknoop kan echter ook een zet zijn van een andere actor (figuur 1 - nucleair transport)
figuur 1
Spel tussen twee spelers – vaak als tabel
Twee tabellen: verschillende combinaties van strategieën als kolommen en rijen, payoff in kolom k
en rij r voor speler 1 (R) in tabel 1 en voor speler 2 (K) in tabel 2 (figuur 2).
Zero-sum games – winst van de een is het verlies van de ander
Er is dus geen win-win situatie te behalen (figuur 2)
figuur 2
Eerste stap is om te kijken of er gedomineerde strategieën zijn: eerste alle rijen checken om te zien
of speler R ergens gedomineerd wordt, daarna alle kolommen checken om te kijken of speler K
ergens gedomineerd wordt. Deze strategieën zullen nooit gekozen worden. Ook de meest
gedomineerde strategie kan verwijderd worden (figuur 3).
figuur 3
lOMoARcPSD
Vervolgens kijken of er “zuivere” strategieën zijn waarbij één speler altijd wint, wat de tegenspeler
ook doet. Als dit er is kiest de tegenspeler natuurlijk de strategie waarbij hij het minste verlies maakt.
Gemengde strategieën – spelers houden rekening met een zekere waarschijnlijkheid van de keuze
van de opponent (niet van toepassing als er dominante strategieën zijn)
Hierbij moet een evenwichtsstrategie bepaald. Strategie waarbij voor beide spelers het verwachte
nut van de strategieën even groot is: voor het verwachte nut maakt het dan voor een speler niet uit
welke strategie hij kiest.
figuur 4
Speler R bepaald dus de waarschijnlijkheid dat speler K een bepaald alternatief kiest. Het
omgekeerde geldt voor speler K. Dit resulteert in een evenwichtspunt te zien in figuur 5.
figuur 5
Non-zero sum games – assymetrische payoffs
Zoals bij het prisoners dilemma. De twee payoffs tabellen kunnen ook als geordende paren in één
tabel weergegeven worden met de payoffs van strategie R1 bij K1 genoteerd als (R1,K1). Opvallend
aan het prisoners dilemma is dat de dominante strategie niet de beste strategie is. Dominante
strategie zegt: beide bekennen. Beste strategie is: beide zwijgen. Dominant is namelijk om te
bekennen: als de andere zwijgt heb je zelf 0 jaar cel in plaats van 1 (bij zelf bekennen) en als de
andere ook bekent hebt je zelf 5 jaar cel in plaats van 10 (bij zelf bekennen).
lOMoARcPSD
Battle of the sexes – R wil voetbal, K wil theater
figuur 6
Ze zijn ongelukkig als ze niet samen ergens heen gaan. Dit is ook een gemengde strategie. Ook hier
kunnen kansen ingeschat worden. Hiermee moet je mee kunnen rekenen op het tentamen. Figuur 7
is dus erg belangrijk.
figuur 7
In payoffmatrix aan kunnen geven of er dominante strategieën zijn, zo niet, dan kijken of er
gemengde strategieën zijn. Op het tentamen niet meer dan twee spelers (deze sommen zijn dus
representatief).
Download