Шта је дилема затвореника?

У самој игри представљају казне (и награде, где је то релевантно) корисност бројеви. Позитивни бројеви представљају добре исходе, негативни бројеви лоше исходе, а један исход је бољи од другог ако је број с њим већи. (Међутим, будите пажљиви како то делује на негативне бројеве, јер је на пример -5 већа од -20!)

У горњој табели, први број у сваком пољу односи се на исход за играча 1, а други број представља исход за играча 2. Ови бројеви представљају само један од многих скупова бројева који су у складу са дилемом постављања затвореника.

Једном када је игра дефинисана, следећи корак у анализи игре је процена стратегије играча и покушавање разумевања како се играчи вероватно понашају. Економисти дају неколико претпоставки када анализирају игре, прво претпостављају да су оба играча свесна исплативање и себи и другом играчу, и, друго, претпостављају да оба играча траже до рационално максимализујте своју исплату од игре.

Једноставан почетни приступ је тражење онога што се зове доминантне стратегије

instagram viewer

- стратегије које су најбоље без обзира на стратегију коју други играч одабере. У горњем примеру, избор за признање је доминантна стратегија за оба играча:

С обзиром да је исповедање најбоље за оба играча, није изненађујуће да је исход у којем се исповеду оба играча равнотежни исход игре. У том смислу, важно је бити мало прецизнији у нашој дефиницији.

Концепт а Насх Екуилибриум кодификовао је математичар и теоретичар игре Јохн Насх. Једноставно речено, Насх-ова равнотежа представља скуп стратегија за најбоље реаговање. За игру за два играча, Насх-ова равнотежа је исход у којем је стратегија играча 2 најбољи одговор на стратегију играча 1, а стратегија играча 1 најбољи одговор на стратегију играча 2.

Проналажење Насх-ове равнотеже помоћу овог принципа може се илустрирати у табели резултата. У овом примјеру, најбољи одговори играча 2 на играча су окружени зеленом бојом. Ако играч 1 призна, најбољи одговор играча 2 је признати, пошто је -6 бољи од -10. Ако играч 1 не призна, најбољи одговор играча 2 је признати, јер је 0 бољи од -1. (Имајте на уму да је ово резоновање веома слично ономе што се користи за идентификацију доминантних стратегија.)

Најбољи одговори играча 1 окружени су плавом бојом. Ако играч 2 призна, најбољи одговор играча 1 је признати, пошто је -6 бољи од -10. Ако играч 2 не призна, најбољи одговор играча 1 је признати, јер је 0 бољи од -1.

Насх-ова равнотежа је исход где постоји и зелени и плави круг јер то представља скуп најбољих стратегија реаговања за оба играча. Генерално, могуће је имати више Насх-ових равнотежа или их уопште нема (бар у чистим стратегијама како је овде описано).

Можда сте приметили да Насх-ова равнотежа у овом примеру делује на неки начин суптптимално (тачније зато што није Парето оптимално) јер је могуће да оба играча добију -1 а не -6. То је природан исход интеракције присутне у игри - у теорији, не би било признање оптимална стратегија за групу, али појединачни подстицаји спречавају овај резултат постићи. На пример, ако играч 1 мисли да ће играч 2 ћутати, имао би подстицај да га победи уместо да ћути и обрнуто.

Из тог разлога, Насх-ова равнотежа може се такође сматрати исходом где ниједан играч нема подстицаја да једнострано (тј. Сам од себе) одступи од стратегије која је довела до тог исхода. У горњем примеру, једном када играчи одлуче да призна признање, ниједан играч не може боље променити своје мишљење.