Математика и Computer Science

Искусственный интеллект сыграет матч-реванш с четырьмя игроками в покер

Carnegie Mellon University

Четыре профессиональных игрока в покер, одни из лучших в мире, позволят компьютерной программе сыграть матч-реванш после поражения, которое ей нанесли в 2015 году. Об этом сообщается в пресс-релизе Университета Карнеги — Меллон.

Начиная с 11 января 2017 года Джейсон Лес, Дун Ким, Дэниель МакОли и Джимми Чу на протяжении 20 дней будут состязаться с компьютером за приз в 200 тысяч долларов (речь идет о разновидности игры, известной как безлимитный техасский холдем).

В 2015 году разработанная в университете программа Claudico проиграла трем из четырех игроков. Однако 80 тысяч разыгранных тогда рук оказалось недостаточно для статистически безупречного признания победы одной из сторон (человека или компьютера). Поэтому при подготовке к матчу-реваншу было принято решение увеличить общее число рук на 50%.

Новую систему искусственного интеллекта, Libratus, спроектировали специально для матча-реванша. Ученые разработали алгоритм, который рассчитывает стратегии для игр с неполной информацией. Для создания Libratus потребовалось около 15 миллионов часов вычислений на суперкомпьютере Bridges. Libratus отличается использованием равновесия Нэша, а также новой стратегией завершения игры: в отличие от Claudico, он будет не использовать очевидные ходы, а рассчитывать свое поведение каждый раз заново.