Опубликовано 26 февраля 2018, 13:47

Объяснена нерациональность «заключенных»

Объяснена нерациональность «заключенных»

© PxHere/Getty Images/Indicator.Ru

Ученые смогли теоретически описать, почему участники экспериментов в «дилемме заключенного» — известной стратегической задаче из теории игр — сильно отклоняются от рационального поведения. После знакомства и недолгого общения участников лабораторных экспериментов, уровень их сотрудничества повысился со стандартных 20% до более чем 50%. Результат международной группы исследователей из МФТИ, Сколтеха, ТГУ и Орегонского университета был опубликован в журнале PLOS ONE.

Теория игр — это наука о принятии решений, математический метод изучения оптимальных стратегий в играх, где игроки обладают разными интересами и могут действовать нерационально. Ее методики активно используются в экономике, политологии, психологии и многих других сферах жизни. Чтобы проанализировать социальные характеристики поведения людей во время игрового взаимодействия в группах от 4 до 12 человек, ученые проводили эксперименты в течение трех лет. В опубликованной работе исследователи представили результаты восьми экспериментов, в каждом из которых принимало участие 12 игроков. Всего было задействовано 96 человек: 59 мужчин и 37 женщин.

Принимавшие участие в экспериментах студенты изначально были незнакомы, и сперва действовали по стандартной схеме выбора стратегий в игре «Дилемма заключенного». Ее суть заключалась в том, что участникам предлагалось анонимно взаимодействовать друг с другом посредством двух действий: кооперировать (К) или предавать (П). По правилам игры, если один игрок выбирает «К», а другой «П», предатель получает 10 очков, а кооператор — 0 очков. Если оба игрока выбирают «К», каждому достается по 5 очков, если «П» — каждый получает всего по 1 очку. Зная правила, можно понять, что кооперироваться выгодно, хотя с точки зрения математики рациональнее выбирать предательство. Именно эта ситуация является в данной игре равновесием по Нэшу, то есть математически верной стратегией, названной именем автора — знаменитого нобелевского лауреата Джона Форбса Нэша. Отклонение от равновесия Нэша не приводит к увеличению выигрыша, если другие участники игры своих стратегий не меняют. В начале игры уровень кооперации в группах составил в среднем 21%, то есть участники скорее выбирали рациональную стратегию предательства. Но после знакомства и «социализации», средний уровень кооперации увеличился до 53% и выше, то есть в среднем участники скорее отклонялись от равновесия Нэша, чем придерживались рациональной стратегии.

Расчеты ученых показали, что поведение участников до социализации может быть описано с помощью модели Quantal Response Equilibrium (QRE). Концепция QRE возникла на стыке теории игр и экспериментальной экономики для объяснения наблюдаемого поведения участников лабораторных экспериментов в тех случаях, когда оно отличается от равновесия Нэша. Эта модель хорошо соответствовала практике для порядка 20% процентов отклонений. Но оказалось, что стандартный подход QRE не может применяться для описания поведения участников после социализации, потому что отклонений участников от равновесия Нэша в этом случае становится слишком много — больше половины, то есть их уже нельзя считать случайными ошибками, как это делается в традиционной модели.

Чтобы объяснить эти результаты, ученые построили и проанализировали теоретическую модель повторяющейся игры «Дилемма заключенного». В ней каждый участник мог реагировать только на то, какую стратегию (кооперировать или предавать) реализовал его случайный анонимный партнер ход назад. Анализируя эту информацию, он делал выбор стратегии на текущем ходе. Такой подход в итоге позволил получить игру в нормальной форме: то есть состоящей из множества игроков, множества чистых стратегий и множества действий каждого игрока. Также удалось показать, что выигрыши нелинейно зависят от вероятностей поведения игроков. Ученые нашли в явном виде семейство внутренних симметричных равновесий Нэша: набор оптимальных стратегий, одинаковый для обоих партнеров и зависящий только от вероятностей поведения игроков.

«Парадокс индивидуальной рациональности разбирается на примере "дилеммы заключенного" уже на первой лекции практически любого курса по теории игр. Тем не менее, эта игра в чем-то сложнее шахмат: применение каждым участником своей наилучшей стратегии приводит к плохому исходу для всех, — поясняет соавтор работы Иван Меньшиков из МФТИ. — Оказалась, что поведение участников экспериментов приближается к теоретическим равновесным положениям, найденных нами, причем при разных уровнях социализации. Еще один удивительный пример, как математическая модель рождается из анализа поведения людей».

Таким образом, ученым удалось построить теоретическую модель, позволяющую описывать преобладание выбора кооперативных стратегий в повторяющейся игре «Дилемма заключенного» и соответствующую экспериментальным данным. По словам ученых, остаются открытыми вопросы теоретического обоснования результатов таких игр, как «игра на доверие» и «Ультиматум», экспериментальные данные которых не соответствуют известным теоретическим игровым моделям в рамках исследования влияния социального взаимодействия.

Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.