Дилемма заключенного описана в
http://ru.wikipedia.org/wiki/%D0%94%D0% ... 0%B3%D0%BE Два заключенных А и В одновременно могут выбрать два способа поведения: «сотрудничество»
или «предательство»
Таблица выигрышей каждого в четырех возможных вариантах приведена по ссылке. Выигрыши
подобраны так, что в одной игре всегда выгодно предать. (При таком подборе выигрышей дилемма заключенного не эквивалентна дилемме фермеров). Но если игра повторяется, то суммарный выигрыш
(где выигрыш на каждом шаге
,) может быть больше, чем при стратегии предательства на каждом шаге.
Некоторые стратегии можно назвать эмоциями. Я сейчас немного формализую и приведу в систему то, что написано по ссылке.
1.Если тебе сделали хорошо
, то и ты сделай хорошо в ответ
-благодарность (доброта).
2.Если тебе сделали хорошо
, то сделай в ответ плохо
- подлость.
3.Если тебе сделали плохо
, то сделай в ответ плохо
- месть.
4.Если тебе сделали плохо
, то сделай в ответ хорошо
- благородство (альтруизм, самопожертвование).
Эти четыре стратегии исчерпывают все одношаговые стратегии.
Упоминается еще эмоция прощения – если тебе сделали плохо, то отомсти, но если не последовало ответной мести, то сделай в ответ хорошо -
. Ясно, что такая стратегия является последовательным проявлением мести и благодарности. Условно запишем
Прощение = месть + благодарность.
Зачем все это нужно?
1.Уже давно психологи пытаются разложить сложные эмоции в сумму более простых
http://www.sai.vstu.edu.ru/wp-content/u ... %c9%ca.pdf. Но все эти попытки основаны только на интуитивных представлениях. Такой подход дает возможность формальных доказательств.
2. Какой алгоритм поведения является оптимальным?
Любой одношаговый алгоритм поведения описывается двумя эмоциями (их сейчас можно назвать чертами личности алгоритма). Одна указывает как реагировать на добро, другая – на зло. Итого возможны 4 одношаговых алгоритма:
Благодарность + месть
Благодарность + благородство
Подлость + месть
Подлость + благородство.
Если дополнительно варьировать первый шаг, то возможны 64 парных сочетания. Результат встречи двух алгоритмов легко вычисляется. Какой алгоритм выиграет в соревновании двух (трех, нескольких) заданных алгоритмов?
3. Как ведут себя люди?
Очень по-разному. Один может решить, что за добро будет благодарить, а за зло мстить. И будет придерживаться этого принципа несмотря ни на что. Это волевое решение об алгоритмическом поведении.
Кроме ситуационных эмоций могут возникать суммарные эмоции к противнику. Например, если противник выигрывает в сумме по очкам, то возникает зависть и все решения становятся отрицательными, независимо от предыдущего хода противника. Если же противник начнет проигрывать, то может возникнуть благодушие и все решения становятся положительными. Это более сложные алгоритмы, но тоже детерминированные и однозначно просчитываемые.
Поведение может быть и случайным. Сначала случайно выбрал одну стратегию. Потом в случайный момент выбрал другую стратегию и т.д. Случайное поведение тоже регулируется эмоциями и можно предложить некую модель случайного выбора алгоритма, зависящую от силы различных эмоций возникающих в ситуации. Все это можно сравнивать с реальным поведением.