Artykuły

Dylemat więźnia i inne możliwości

Problem wydaje się dość prosty: Dlaczego ludzie ze sobą nie współpracują? Lub raczej, dlaczego nie współpracują ze sobą bardziej? Przecież, jeżeli ja pomogę tobie, a ty pomożesz mnie, to czy nie skorzystamy na tym obaj? Podobnie, czy nie skorzystalibyśmy wszyscy na konsekwentnym trzymaniu się sposobu postępowania wolnego od stosowania przemocy? Krótko mówiąc, co wydaje się tak trudne w słynnym pytaniu, które niegdyś postawił amerykański motocyklista Rodney King, pobity w Los Angeles przez policjantów: „Dlaczego nie możemy żyć wszyscy w zgodzie i bez przemocy?”.

Udzielenie odpowiedzi okazuje się bardziej skomplikowane, niż można by przypuszczać. Jednak cały szereg metod podejmowania decyzji, znanych jako teoria gier, pomaga wystarczająco naświetlić oba dylematy – włącznie z problemem wyboru między przemocą a niestosowaniem przemocy — a także pokazać kilka możliwych sposobów ich rozwiązania.
Teoria gier pozwala spojrzeć na różne sytuacje, angażujące w najprostszym przypadku dwie strony („graczy”), przez pryzmat „wypłat” bądź „zysków”, związanych nie tylko z działaniem każdego pojedynczego gracza oddzielnie, ale z wzajemną interakcją obu stron.
Bez założenia tej interakcji „gry” nie byłyby zbyt skomplikowane: każdy z graczy po prostu robiłby wszystko, co tylko możliwe, by uzyskać najwyższą wygraną, nie zwracając w ogóle uwagi na sytuację drugiego gracza. Na przykład, jeśli pada deszcz, prawidłowym posunięciem może być zabranie ze sobą parasola, niezależnie od tego, co zrobią w tej sytuacji inni. Stan pogody zazwyczaj nie zmienia się pod wpływem czyjegoś zachowania, każdy więc może postępować zgodnie ze swoim upodobaniem, mając w nosie to, co poczną inni.
Z drugiej strony, wyobraźmy sobie, że dwoje ludzi znajduje, powiedzmy, mały plik banknotów. Wówczas najlepiej na tym wyjdą, jeśli wezmą pod uwagę zachowanie drugiej osoby, na przykład raczej dzieląc łupy po równo, niż próbując zagarnąć całą wypłatę i w następstwie wdawać się w otwartą bójkę. Właśnie w podobnych sytuacjach, gdy potencjalny zysk zależy nie tylko od zachowania gracza A, ale także od równoległych posunięć gracza B, warto odwołać się do teorii gier.
Niestety, taki sposób podejmowania decyzji jest zazwyczaj mniej oczywisty niż zwykłe przerwanie kłótni, a co gorsza, stwarza wiele okazji do unikania współpracy, szczególnie jeżeli kooperacyjne nastawienie jednego z graczy czyni go podatnym na wykorzystanie przez innych. Z podobnymi sytuacjami mają często do czynienia zarówno pojedyncze osoby, jak i całe grupy społeczne poszukujące różnych sposobów zapobiegania konfliktom i unikania przemocy.
Krótko mówiąc, pojawia się zagrożenie, że dając pierwszeństwo współpracy przed rywalizacją, pokojowo nastawiony gracz ryzykuje utratę wszystkiego na rzecz bardziej agresywnego przeciwnika. Wyobraźmy sobie na przykład, że w przypadku wspomnianej wcześniej dwójki, która znalazła plik pieniędzy, jedna z osób nagle wyciąga broń i stwierdza, że wszystkie pieniądze należą do niej, podczas gdy druga pozostaje konsekwentna w niestosowaniu przemocy. Wydaje się, że agresywny uczestnik wydarzeń uzyskuje nagrodę za swoje zachowanie (zatrzymuje wszystkie pieniądze), podczas gdy ten łagodniejszy zostaje z niczym, lub, jak wyraził to Machiavelli:

„Ten, kto ślubuje zachowanie dobroci we wszystkim, co czyni, umiera w zgryzocie, otoczony przez tych, którzy wcale nie są dobrzy”.

Unikanie przemocyJest jednak pewna nadzieja. Teoria gier nie tylko pozwala na lepsze zrozumienie tego problemu, ale również podpowiada i wspiera pokojowe rozwiązania. Dylemat więźnia, wywiedziony z teorii gier, bardziej przemawia na rzecz rozwijania współpracy niż rywalizacji. Jak większość modelowych rozwiązań, jest dość nieskomplikowany, ale pomaga w uporządkowaniu myślenia. Załóżmy, że istnieją dwie osoby, grupy, a nawet państwa, które mogą wybierać między przemocą i powstrzymywaniem się od niej. Teoretycy mówią wówczas o nastawieniu „kooperacyjnym” i „zdradzieckim”, bądź nice i nasty, używając tego rodzaju określeń do opisania takich zagadnień międzynarodowych, jak wyścig zbrojeń czy stosowanie barier celnych. Jeżeli obie strony zrezygnują ze stosowania rozwiązań siłowych, każda z nich na tym zyskuje, na przykład poprzez pokojowe rozwiązanie konfliktu, lub, jak było w przypadku znalezionych pieniędzy, zyskując swój udział bez walki.
Jeżeli obie strony wybiorą przemoc, każda otrzymuje w grze wypłatę innej wysokości: karę w postaci potencjalnych szkód. Ale jeżeli jedna ze stron odstępuje od przyjętych zasad, a druga nadal nastawiona jest na współpracę, zdrajca zyskuje to, co nazywamy pokusą zdrady (w tym przypadku wszystkie pieniądze), a ten, który decyduje się na współpracę (kto zachowuje się uczciwie, gdy drugi wybiera przemoc) otrzymuje zapłatę frajera: nie otrzymuje żadnych pieniędzy.
Aby zrozumieć, co nastąpi dalej, wystarczy wyobrazić sobie, że znamy myśli obu graczy:

„Ten drugi może albo ze mną współpracować, albo mnie oszukać. Jeżeli będzie ze mną współpracował, najlepiej go zdradzić, ponieważ wówczas uzyskam najwyższą możliwą wypłatę, kiedy on — prawdziwy frajer — zostanie z niczym. Choć z drugiej strony, on też może mnie zdradzić lub zagrozić mi przemocą, a wówczas mój najlepszy ruch to zrobić to samo, ponieważ nawet jeśli ryzykuję karę za zdradę, co grozi uzyskaniem dość niskiej wypłaty w grze, jest to przynajmniej lepsze niż skończyć jak frajer i stracić wszystko”.

Skutek zastosowania tej bezwzględnej logiki jest taki, że każda strona jest bardziej skłonna do zastosowania rozwiązania opartego na zdradzie i przemocy, co stanowi naprawdę niepokojący dylemat, ponieważ przez takie postępowanie każdy otrzymuje karę (w przypadku osób jest nią na przykład bójka, ale w przypadku narodów może to być wyczerpujący wyścig zbrojeń lub wojna celna), kiedy najlepszym rozwiązaniem jest uzyskanie godziwej wypłaty za współpracę i powstrzymanie się od stosowania przemocy.
Dylemat więźnia jest użytecznym sposobem zobrazowania takiego sposobu myślenia, zgodnie z którym wszyscy muszą się zachowywać w sposób nieuczciwy, ponieważ są powodowani strachem, że każdy kto postępuje w dobrej wierze, pozostaje w końcu na łasce i niełasce tych, którzy nadal trwają przy swojej zdradzieckim postępowaniu (podobnie jak utrzymywał Machiavelli).
Z drugiej strony, nie jest to jedyny możliwy sposób ujęcia sprawy. Na przykład, kiedy zachodzi konieczność wyboru między przemocą i powstrzymywaniem się od jej stosowania, sytuację trafniej przedstawia gra w cykora. Przypomina ona dylemat więźnia, ale w jej przypadku otrzymanie kary jest najgorszą możliwą do uzyskania wypłatą. Koszty ewentualnej walki, a nawet tylko jej groźba, znacznie przewyższają wówczas koszty zostania frajerem za cenę uniknięcia konfliktu. Cykor jest grą, w której dwóch kierowców, jadących wprost na siebie z przeciwnych kierunków, próbuje wymusić na tym drugim uchylenie się przed kolizją. Ten, który w końcu ustąpi (jego rola przypomina gracza wybierającego współpracę w dylemacie więźnia), zostaje cykorem, a ten, który nadal jedzie prosto przed siebie (odpowiednik zdrajcy z dylematu więźnia) – wygrywa. Problem jednak polega na tym, że jeżeli żaden z kierowców nie ustąpi, i teoretycznie wygra kosztem drugiego, wynik gry dla obu z nich oznacza przecież przegraną!

Rundy wielokrotne

W wersji uproszczonej modele bazujące na teorii gier zakładają, że istnieje tylko jeden rodzaj wygranej, a do interakcji między graczami dochodzi tylko jednokrotnie. Ale w rzeczywistości jest zupełnie inaczej! Osoby i grupy stykają się ze sobą wiele razy i mogą zmieniać swój sposób postępowania w odpowiedzi na to, co je spotkało w przeszłości. W związku z tym obie strony mają wspólny interes w utrzymaniu całego ciągu pozbawionych przemocy, kooperacyjnych kontaktów, ponieważ tak w przypadku dylematu więźnia, jak w przypadku gry w cykora, nagroda za uczciwą współpracę zawsze przewyższa karę, wynikającą z zastosowania przemocy czy dopuszczenia się zdrady. Wynik gry zapewnia w ten sposób każdemu graczowi najwyższą wypłatę.
Co ciekawe, nawet gdy mamy do czynienia z izolowanymi, jednokrotnymi interakcjami, kiedy ściśle racjonalne rachuby wskazują, że nieuczciwe posunięcie jest jak najbardziej „logiczną” reakcją, większość ludzi jest bardziej skłonna, by dążyć do współpracy, szczególnie gdy zrozumieją, że interakcja ma szanse się powtórzyć.
W przypadku wielokrotnych interakcji występuje nie tylko o wiele większa groźba powtórnego otrzymania kary, związanej z wzajemną zdradą, ale również coraz bardziej obiecująca staje się perspektywa otrzymania kolejnej nagrody, wynikającej ze współpracy i unikania przemocy.
Matematyczne i komputerowe symulacje wykazały na przykład, że prosta strategia „coś za coś” („wet za wet”) może wygenerować najwyższą wypłatę dla wszystkich graczy, nawet w sytuacji klasycznego dylematu więźnia. Taka strategia zakłada początkową współpracę, po której każdy gracz jedynie powtarza ruch swojego poprzednika. W ten sposób kooperacyjne posunięcie gracza A przeradza się we współpracę gracza B, i tak bez końca- w wyniku czego, obaj uzyskują zwielokrotnioną nagrodę, wynikającą ze współpracy. W podobny sposób, zdradzieckie posunięcie gracza A skutkuje podobnym posunięciem gracza B, co chroni go przed kolejnym frajerskim zachowaniem, a jednocześnie zniechęca gracza A do wyboru oszukańczego posunięcia w pierwszym ruchu.

King i GandhiMahatma Gandhi nie był zwolennikiem zasady „wet za wet”, ale wyraźnie podkreślał, że satjagraha — jego określenie dla biernego oporu — musi zostać wyraźnie odróżniona od biernej akceptacji własnego położenia lub też pragnienia, by uniknąć konfliktu za wszelką cenę. Było dla niego oczywiste, że satjagrahi swoją konsekwentną postawą muszą w końcu doprowadzić do zmiany zachowania potencjalnych agresorów; że przez ich przykład i gotowość do akceptowania cierpienia (bycia przez jakiś czas frajerami — w terminologii teorii gier), mogą doprowadzić do tego, czego teoretycy teorii gier zwykle nie biorą pod uwagę: zmienić zachowanie drugiej strony przez odwołanie się do jej najszlachetniejszych cech.
Kiedy ofiara odpowiada na przemoc jeszcze większą przemocą, zachowuję się w sposób, który jest przewidywalny, wręcz instynktowny, i który ma skłonność do potęgowania agresji ze strony napastnika, a nawet, w pewnym sensie, może usprawiedliwiać zastosowanie przemocy w mniemaniu agresora. Skoro ofiara zachowuje się tak gwałtownie, przypuszczalnie zasłużyła sobie na to!
W dodatku w relacjach społecznych często znajduje zastosowanie zasada, przypominająca trzecią zasadę dynamiki Newtona, zgodnie z którą każda akcja pociąga za sobą przeciwną i równie silną reakcję. W ten sposób, gdy uderzy gracz A i gracz B odpowie ciosem za cios, prawie zawsze stanowi to dla gracza A zachętę do kolejnego uderzenia. Gandhi nie był zwolennikiem biblijnego zalecenia „oko za oko, ząb za ząb”, wskazując, że jeżeli wszyscy zachowalibyśmy się w ten sposób, wkrótce cały świat byłby pełen bezzębnych ślepców. Jeśli zamiast tego gracz B powstrzyma się od zastosowania przemocy, przerywa w ten sposób łańcuch gniewu i nienawiści (podobny do cyklu śmierci i ponownych narodzin w hinduizmie), ale również stawia gracza A w zaskakującej sytuacji.

„Poszukuję sposobu, zdolnego całkowicie stępić ostrze tyrańskiego miecza”— pisał Gandhi- „nie poprzez użycie jeszcze ostrzejszej broni, ale przez niespełnienie oczekiwania, że zareaguję fizycznym sprzeciwem”.

Taki sposób postępowania nie jest ani łatwy, ani całkowicie bezbolesny, ale teoria gier, jak pokazują również doświadczenia Gandhiego w Afryce Południowej i Indiach, a Martina Luthera Kinga Jr. i innych aktywistów w Stanach Zjednoczonych, potwierdza, że może być nadzwyczaj skuteczny.

Starożytny rzymski mąż stanu i filozof, Cyceron, w Listach do Przyjaciół pytał: „Co można przeciwstawić przemocy prócz przemocy?”. Znawcy problemu odpowiedzieliby: „bardzo wiele”. Co więcej, poważnie kwestionowaliby, czy w ogóle można zrobić coś skutecznego, trwałego lub wartościowego reagując przemocą na przemoc.
Jak zostało wykazane, wzajemne uciekanie się do przemocy łatwo prowadzi do sytuacji, którą teoretycy określają jako karę za zdradę, i to ze szkodą dla wszystkich. Amerykański lider ruchu praw obywatelskich, Martin Luther King, który, podobnie jak Gandhi, był realistą i w swoich działaniach zawsze pozostawał silnie zorientowany na cel, napisał, że

„reagowanie przemocą na przemoc rodzi przemoc, pomnażając ciemność już bezgwiezdnej nocy. Ciemność nie może zwalczyć ciemności; jedyne światło może to zrobić. Nienawiść nie może pokonać nienawiści, jedynie miłość”.

Podsumowując, teoria gier pomaga lepiej zrozumieć granice wzajemnej współpracy, wskazując, dlaczego „życie w zgodzie” nie jest tak proste — lub zgodne z ludzką naturą — jak niektórzy by sobie życzyli. Ale równocześnie, teoria gier pokazuje, że istoty ludzkie niekoniecznie są skazane na życie w świecie znanym z dzieł Hobbesa, czyli w świecie niekończącej się zdrady i mozolnej rywalizacji, pod warunkiem, że spojrzą szerzej na swoją własną sytuację i dostrzegą leżące w ich zasięgu możliwości.Tekst oryginału.
Barash, D. P. (2009). The Prisoner’s Dilemma and Other Opportunities. „eJournal USA”,14 (3), 26-28.
Źródło: http://www.racjonalista.pl/kk.php/s,569

 

 

Dylemat więźnia

Dylemat więźnia – problem w teorii gier. Jest oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać zdradzając przeciwnika, ale obaj stracą jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę. W odróżnieniu jednak od dylematu kurczaków w tej grze istnieje większe pole do współpracy, która może zaistnieć w strategiach wielokrotnego dylematu więźnia.

Dylemat więźnia został wymyślony przez dwóch pracowników RAND Corporation: Melvin Dreshera i Merrill Flood w 1950 roku. Albert W. Tucker sformalizował jego zasady i jako pierwszy użył nazwy dylemat więźnia (Poundstone, 1992). W klasycznej formie jest przedstawiany następująco:
Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić?

Jeśli założymy, że każdy z więźniów woli krótszy wyrok niż dłuższy i że żadnemu nie zależy na niskim wyroku drugiego, możemy opisać ten dylemat w terminach teorii gier. Więźniowie grają wtedy w grę, w której dopuszczalne strategie to: współpracuj (milcz) i zdradzaj (zeznawaj). Celem każdego gracza jest maksymalizacja swoich zysków, czyli uzyskanie jak najkrótszego wyroku.

W tej grze zdradzaj jest strategią ściśle dominującą: niezależnie od tego co robi przeciwnik, zawsze bardziej opłaca się zdradzać niż współpracować. Jeśli współwięzień milczy, zdradzanie skróci wyrok z sześciu miesięcy do zera. Jeśli współwięzień zeznaje, zdradzanie skróci wyrok z dziesięciu lat do pięciu. Każdy gracz racjonalny będzie zatem zdradzał i jedyną równowagą Nasha jest sytuacja, gdy obaj gracze zdradzają. W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali.
Iterowany dylemat więźnia (patrz niżej) polega na rozgrywaniu tej samej gry wielokrotnie. Wtedy każdy gracz ma możliwość ukarania drugiego gracza za zdradzanie w poprzedniej rundzie. W tej sytuacji, jeśli straty wynikające z ukarania będą większe niż zyski z zdradzania, współpraca obu graczy może utworzyć stan równowagi. Taka gra może mieć też wiele innych stanów równowagi.

Iterowany dylemat więźnia

W iterowanym dylemacie więźnia, ci sami gracze grają wielokrotnie ze sobą, wybierając strategie w kolejnych rundach na podstawie wcześniejszych rund. Robert Aumann pokazał w 1959 roku, że w nieskończonym ciągu takich rozgrywek, współpraca może być stanem równowagi.
W przypadku gdy wiadomo, ile dokładnie będzie rozgrywek, optymalna jest strategia Zawsze Zdradzaj. Wynika to z następującego rozumowania: w ostatniej rundzie można równie dobrze zdradzić, ponieważ przeciwnik nie będzie miał już okazji ukarać za to zagranie. Dlatego obaj gracze w ostatniej rundzie zdradzają. Zatem w przedostatniej rundzie również opłaca się zdradzić, ponieważ w ostatniej rundzie przeciwnik i tak zdradzi itd. Zatem aby pojawiła się współpraca, liczba rund musi być losowa, albo przynajmniej nieznana graczom.

W 1984 roku Robert Axelrod zaprosił akademików z całego świata do uczestnictwa w turnieju dla programów komputerowych, grających w iterowany dylemat więźnia. Przysyłane programy różniły się pod względem złożoności, startowego zachowania, reakcji na działanie przeciwnika itp. Wyniki pokazały, że przy wielokrotnych rozgrywkach, egoistyczne strategie dawały średnio bardzo małe wygrane w porównaniu z bardziej altruistycznymi. Axelrod pokazał w ten sposób możliwość ewolucyjnego wykształcenia się zachowań altruistycznych z nastawionych na własny zysk, wyłącznie za pomocą selekcji naturalnej.
Najlepszą deterministyczną strategią w tym turnieju okazała się strategia wet za wet (strategia coś za coś), którą zgłosił Anatol Rapoport. Była ona jednocześnie najprostszą zgłoszoną – jej cały program w języku BASIC zajmował cztery linie. Strategia polegała na współpracy w pierwszej rundzie, a w każdej kolejnej robieniu tego co przeciwnik robił w poprzedniej.
W niektórych sytuacjach lepsza była lekko zmodyfikowana strategia wet za wet z wybaczaniem. W strategii tej, jeśli przeciwnik zdradzał, z małym prawdopodobieństwem (1%-5%) gracz wybaczał i w kolejnej rundzie dalej współpracował. Pozwalało to na przerwanie ciągu wzajemnych zdrad, w którym dwie strategie wet za wet mogły utykać w nieskończoność.

Analizując najlepsze strategie, Axelrod przedstawił kilka cech którymi się one wyróżniały:
Przyjazność – oznaczająca nie zdradzanie dopóki przeciwnik tego nie zrobił.
Mściwość – oznaczająca reagowanie na zdradę przeciwnika. Bez tej cechy, strategia nie mogła dawać dobrych rezultatów. Przykładowo strategia Zawsze Współpracuj dawała bardzo kiepskie wyniki, gdyż wielu przeciwników bezlitośnie wykorzystywało takiego gracza.
Skłonność do wybaczania -oznaczająca wracanie do współpracy po okresie zemsty za zdradę. To pozwalało uzyskać znacznie lepsze wyniki niż ciągłe wzajemne mszczenie się.
Brak zazdrości – oznaczająca nie staranie się uzyskać lepszego wyniku niż przeciwnik.

Axelrod wywnioskował, na podstawie tego eksperymentu, że dbanie wyłącznie o własne zyski można często najlepiej realizować będąc przyjaznym i wybaczającym.
W jednorazowym dylemacie więźnia, zdradzanie jest zawsze najlepszym rozwiązaniem, niezależnie od tego co robi przeciwnik. W iterowanym, optymalna strategia zależy od tego jak grają przeciwnicy i jak reagują na współpracę i zdradę. Przykładowo, gdyby wszyscy gracze grali strategią Zawsze Zdradzaj, to jeden gracz grający strategią Wet Za Wet uzyskałby nieco gorszy wynik niż reszta. Gdyby wszyscy gracze grali strategią Zawsze Współpracuj, znacznie lepszy wynik uzyskałby jeden gracz grający strategią Zawsze Zdradzaj.
W pewnych sytuacjach optymalna okazuje się strategia zwana Pavlov. Polega ona na współpracy w pierwszej rundzie i zawsze jeśli w poprzedniej rundzie gracze zagrali tak samo. Jeśli w poprzedniej rundzie gracze zagrali różnie, strategia każe zdradzić.

Znajdowanie optymalnych strategii

W ogólności, optymalne strategie znajduje się na dwa sposoby:
1. Analitycznie: Jeśli statystyczne występowanie wszystkich strategii w grze jest znane (np. 50% wet za wet i 50% zawsze współpracuj), optymalną strategię można wyliczyć na tej podstawie.
2. Metodą Monte Carlo: Symulując wiele rozgrywek i usuwając strategie które dają najgorsze wyniki, zastępując je tymi które dają najlepsze. Aby uniezależnić końcowy wynik od początkowego rozkładu, można dodać losowe mutacje do powielanych strategii, uzyskując algorytm genetyczny do znajdowania strategii optymalnej. Eksperymenty pokazują że ta metoda zwykle prowadzi do opracowania strategii wet za wet (Chess 1988), ale nie ma dowodu że zawsze tak musi być.

Mimo że wet za wet jest uważana za najlepszą strategię, w zawodach urządzonych w dwudziestolecie zawodów Axelroda wygrała zupełnie inna strategia. Zaproponowała ją drużyna z Uniwersytetu w Southampton. Opierała się ona na współpracy pomiędzy programami przysłanymi przez tę drużynę, tak aby uzyskać maksymalny wynik jednego z tych programów. Uniwersytet przysłał 60 programów, które były napisane tak, aby rozpoznać się wzajemnie na podstawie pierwszych 5-10 posunięć. Po rozpoznaniu, jeden program zawsze współpracował a drugi zawsze zdradzał, tak aby dać maksymalny zysk zdradzającemu. Grając przeciwko przeciwnikowi nie z Southampton, program poświęcający się zawsze zdradzał, tak aby zminimalizować zysk przeciwnika, a program wygrywający stosował wet za wet. W rezultacie, drużyna zajęła pierwsze trzy miejsca (i wiele ostatnich).[4]
Powyższa strategia wykorzystała fakt, że w tym turnieju można było zgłaszać wiele programów, a wynik był mierzony dla najlepszego z nich. Dlatego poświęcanie własnych graczy pozwoliło uzyskać lepszy rezultat. Gdy każda drużyna może zgłosić tylko jednego gracza, wet za wet pozostaje optymalną możliwością. Przykład ten pokazuje dodatkowo możliwości jakie daje uzgadnianie strategii przed przystąpieniem do gry. Podobne sytuacje opisał wcześniej Richard Dawkins w książce Samolubny gen.
Dylemat więźnia stanowi podstawę niektórych teorii ludzkiej współpracy i zaufania. Zakładając że może on modelować interakcje w społeczeństwie, powstawanie zaufania można przedstawiać jako wynik iterowanego dylematu więźnia pomiędzy wieloma graczami.

Dylemat więźnia w wersji ciągłej

Większość prac dotyczących iterowanego dylematu więźnia skupia się na przypadku dyskretnych, w którym gracze mogą albo współpracować albo zdradzać. Można jednak rozważać też przypadek ciągły, w którym strategia gracza może przyjmować wartości pośrednie. Le i Boyd pokazali, że w takim przypadku współpraca pojawia się znacznie rzadziej. Wynika to z prostego argumentu: w takiej wersji, jeśli początkowo gracze zdradzają, gracze lekko współpracujący zyskują bardzo niewiele grając ze sobą. W dyskretnej wersji, gracze współpracujący ze sobą uzyskują znaczną przewagę nad graczami zdradzającymi się nawzajem. Wynik ten ma znaczenie w modelowaniu zachowań zwierząt stadnych. Ponieważ zwykle mają one znacznie więcej możliwości interakcji niż tylko dwie skrajne, może to wyjaśniać czemu zachowanie wet za wet jest spotykane bardzo rzadko, mimo że teoretycznie jest optymalne.

Wpływ doświadczenia

Jeśli gracze mogą uczyć się oceniać prawdopodobne zachowanie przeciwnika, mogą dostosowywać do tego swoje własne zachowanie. Statystyka pokazuje, że początkujący gracze z większym prawdopodobieństwem uzyskują nietypowo wysokie lub nietypowo niskie wyniki. Jeśli grają potem na podstawie tych doświadczeń (częściej współpracując lub zdradzając z ich powodu), wpływa to również na ich przyszłe wyniki. W ten sposób wczesne doświadczenia mają większy wpływ na sumaryczny wynik graczy niż takie same późniejsze doświadczenia. Ten efekt dobrze modeluje istnienie kształtujących doświadczeń u młodych ludzi.
Prawdopodobieństwo zdradzania w grupie można zredukować przez zbudowanie pomiędzy graczami zaufania bazującego na współpracy we wcześniejszych grach. Poświęcanie się niektórych graczy może po początkowym okresie strat przekonać większą część grupy do współpracy, co w efekcie przynosi zyski wszystkim grającym. Efekt ten jest szczególnie silny w małych grupach. Takie procesy są przedmiotem intensywnych badań dotyczących altruizmu odwzajemnionego, doboru grupowego i doboru krewniaczego.

Racjonalność i nadracjonalność

Douglas Hofstadter w książce Metamagical Themas zaproponował wprowadzenie konkurencyjnego pojęcia do racjonalności, która każe graczom zdradzać i uzyskiwać niższy wynik. W jego definicji, prawdziwie racjonalny gracz (nadracjonalny) powinien przewidywać również przypuszczalne zachowanie swojego przeciwnika i zakładać że przeciwnik postąpi tak samo. W takiej sytuacji bardziej opłacalne jest współpracowanie.

Przykłady w świecie rzeczywistym

Istnieje wiele sytuacji w których interakcje w społeczeństwie jak i w przyrodzie charakteryzują się podobnymi wypłatami jak w dylemacie więźnia. Z tego powodu dylemat ten jest badany w wielu naukach społecznych takich jak ekonomia, polityka czy socjologia, jak również w naukach biologicznych takich jak etologia i biologia ewolucyjna. Wiele procesów w przyrodzie można również modelować w postaci niekończącej się gry w iterowany dylemat więźnia.
W politologii, przykładowym scenariuszem są dwa państwa uwikłane w wyścig zbrojeń. Każde z nich ma dwie możliwości: albo zwiększyć wydatki na zbrojenia albo podpisać porozumienie o ich zmniejszeniu. Żadna ze stron nie może być pewna czy druga dotrzyma warunków porozumienia. W rezultacie, racjonalną decyzją każdego państwa jest rozwój militarny.
W sporcie, podobny dylemat dotyczy wszystkich szkodliwych dla zdrowia zabiegów poprawiających szanse zwycięstwa. Przykładami może być doping bądź gwałtowne tracenie wagi tak aby trafić do niższej kategorii wagowej. Zawodnik który tego nie robi (współpracuje) może stracić szanse na zwycięstwo. W momencie gdy wszyscy tak robią, sensowność zawodów staje się problematyczna.
Innym przykładem związanym ze sportem jest sytuacja w zawodach kolarskich. Częstą sytuacją jest gdy dwóch zawodników wyprzedza peleton, zmieniając się na męczącej przedniej pozycji. Jeśli żaden z zawodników nie będzie się starał jechać jako pierwszy, peleton szybko ich dogoni. Jeśli tylko jeden z nich będzie to robił, istnieje duża szansa że zawodnik który jechał za nim i dzięki temu mniej się męczył, wyprzedzi go tuż przed metą.
W przemyśle reklamowym, sytuacja podobna do dylematu więźnia odnosi się do towarów które ludzie kupują niezależnie od tego czy są reklamowane. Przykładowo gdy dwie firmy sprzedają papierosy na tym samym rynku, zysk każdej z nich zależy głównie od tego ile sprzeda druga firma. Jeśli obie przeznaczą więcej pieniędzy na reklamy, ich efekty się zniosą. Jednak jeśli tylko jedna firma będzie reklamować swoje produkty, zyska znacznie więcej niż druga. Obu firmom zależy wtedy na tym żeby wszyscy ograniczyli swoje wydatki na reklamę. W rzeczywistości w USA producenci papierosów aktywnie wspierali uchwalenie prawa zabraniającego ich reklamowania.
W informatyce, udostępnianie programów na publicznej licencji GNU (jak np. Linux) jest odpowiednikiem współpracy w dylemacie więźnia. Każda firma która udostępnia takie oprogramowanie, ułatwia prace innym firmom, które mogą z niego korzystać przy tworzeniu własnych produktów. Każde ulepszenie takiego oprogramowania musi zostać również udostępnione na publicznej licencji, co wymusza współpracę pomiędzy rywalizującymi firmami.
W ochronie środowiska, dbanie o czystość wód, powietrza, utylizacja odpadów etc., są działaniami odpowiadającymi współpracy, które wymagają wysiłku. Znacznie łatwiej jest nie podejmować tej współpracy a korzystać z wysiłku innych na rzecz czystego środowiska – to postawa zdrajcy. Kiedy jednak wszyscy będą zdradzać i zaśmiecać środowisko, życie w nim stanie się uciążliwe.
W systemie podatkowym, każdy kto płaci należne podatki przyczynia się do finansowania zadań i potrzeb publicznych. Zdrajcy, którzy starają się unikać płacenia podatków, czerpiąc z tego doraźne korzyści finansowe, najczęściej korzystają na równi z innymi z infrastruktury, edukacji, systemu opieki zdrowotnej etc., finansowanych z podatków, które płacą inni.

Źródło: https://pl.wikipedia.org/wiki/Dylemat_wi%C4%99%C5%BAnia

Komentarze

  1. […] w jego „Równowadze”. Studiował studentów na uczelni w modelowej grze określanej jako „Dylemat Więźnia” – gra, w której dwóch przeciwników przeciwstawia się w pseudo-śledztwie przez organy […]

  2. […] w jego „Równowadze”. Studiował studentów na uczelni w modelowej grze określanej jako „Dylemat Więźnia” – gra, w której dwóch przeciwników przeciwstawia się w pseudo-śledztwie przez organy […]

Leave a reply

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *