Məhbusların dilemması

Məhbusların dilemması — oyunlar nəzəriyyəsində təhlil olunan standart oyunlardan biridir. Bu dilemma əməkdaşlıq etmələri hər ikisinin ən yaxşı seçimləri olduğu halda, tam rasional iki şəxsin belə əməkdaşlıqdan yayına biləcəklərini göstərir. Bu oyun ilk dəfə RAND korporasiyasında çalışan Merrill Flood və Melvin Dresher tərəfindən 1950-ci ildə dizayn edilib. Daha sonra Albert W. Tucker oyunu həbs cəzası "mükafat"ları ilə formal hala gətirib (Poundstone 1992) və oyuna "məhbusların dilemması" adını verib. Oyun aşağıdakı kimidir:

İki nəfər cinayətkar polis tərəfindən həbs olunur. Bu şəxslər bir-biriləri ilə heç bir vasitə ilə söhbət edə və ya mesaj göndərə bilməzlər. Polis qəbul edir ki, əllərində hadisəyə dair kifayət qədər dəlil yoxdur və bu səbəbdən cinayətkarlara maksimum cəza verə bilmirlər. Nəticədə, polis hər iki şübhəlini eyni vaxtda sorğulayır və hər bir şübhəliyə digərini günahlandırmaq və ya sakit qalmaq (digər şübhəli ilə "əməkdaşlıq" etmək) haqqı verilir. Şübhəlilərin cavablarına əsasən həbs cəzaları aşağıdakı kimi olur:

A və B bir-birilərini günahlandırdıqları halda hər ikisinə 2 il həbs cəzası verilir.
Əgər A, B-ni günahlandırarsa və B sakit qalarsa, A azad olunur, B-yə isə 3 il həbs cəzası verilir (və ya əksinə, əgər B, A-nı günahlandırarsa və A sakit qalarsa, B azad olunur, A-ya isə 3 il həbs cəzası verilir).
A və B hər ikisi sakit qalarsa ("əməkdaşlıq" edərsə) hər birinə 1 il həbs cəzası verilir.

Baxmayaraq ki, hər iki oyunçunun əməkdaşlıq etmələri, onlar üçün bir-birilərini günahlandırmalarından daha yaxşıdır, oyunda xalis strategiyada yeganə Nash tarazlığı hər iki oyunçunun bir-birini günahlandırmalarıdır. Qeyd edək ki, bu nəticə tam rasional və yalnız öz maraqlarını güdən oyunçular üçün, statik (yəni təkrar olunmayan) oyunda doğrudur.