Искусственный интеллект сыграет матч-реванш с четырьмя игроками в покер
Четыре профессиональных игрока в покер, одни из лучших в мире, позволят компьютерной программе сыграть матч-реванш после поражения, которое ей нанесли в 2015 году. Об этом сообщается в пресс-релизе Университета Карнеги — Меллон.
Начиная с 11 января 2017 года Джейсон Лес, Дун Ким, Дэниель МакОли и Джимми Чу на протяжении 20 дней будут состязаться с компьютером за приз в 200 тысяч долларов (речь идет о разновидности игры, известной как безлимитный техасский холдем).
В 2015 году разработанная в университете программа Claudico проиграла трем из четырех игроков. Однако 80 тысяч разыгранных тогда рук оказалось недостаточно для статистически безупречного признания победы одной из сторон (человека или компьютера). Поэтому при подготовке к матчу-реваншу было принято решение увеличить общее число рук на 50%.
Новую систему искусственного интеллекта, Libratus, спроектировали специально для матча-реванша. Ученые разработали алгоритм, который рассчитывает стратегии для игр с неполной информацией. Для создания Libratus потребовалось около 15 миллионов часов вычислений на суперкомпьютере Bridges. Libratus отличается использованием равновесия Нэша, а также новой стратегией завершения игры: в отличие от Claudico, он будет не использовать очевидные ходы, а рассчитывать свое поведение каждый раз заново.