Подписаться на новости
logo logo
Сообщество робототехников

Человек победил искусственный интеллект в игре в покер

Человек победил искусственный интеллект в игре в покер
Среда, 3 Июня 2015, в 8:29
Искусственный интеллект

Спустя 80 000 раздач в безлимитном техасском холдеме 4 лучших игрока в мире – Даг Полк, Донг Ким, Бьорн Ли и Джейсон Лес – обыграли искусственный интеллект под названием Claudico, созданный в Университете Карнеги–Меллон для игры в покер, с суммарным выигрышем в $732 713 в виртуальной валюте.

Claudico сыграл 20 000 раздач против каждого из профессионалов во время выставки Brains Vs. Artificial Intelligence. Ли выиграл самую большую сумму – $529 033, Полк пришел вторым с $213 671, Ким – $70 491, а Лес стал единственным игроком, проигравшим Claudico $80 482 виртуальных фишек.

Блайнды составляли $50/$100, а выигрыш $732 713 представляет собой 7327 больших блайндов.

Но Томас Сендхолм, профессор информатики в университете, который руководил разработкой Claudico, считает, что результат турнира – статистическая ничья. Он говорит, что коллективный выигрыш $732 713 игроками-людьми составил менее половины процента от общей суммы виртуальных денег – $170 миллионов, поставленных во время турнира.

 

Мы знали, что Claudico – самая сильная компьютерная программа для игры в покер во всем мире, но мы не представляли, как она может преуспеть против самых лучших игроков, – говорит Сендхолм. – Для нас было бы не стыдно проиграть таким талантливым профессионалам, так что даже статистическая ничья против них – невероятное достижение.

 

Полк не соглашается: «И хотя выигрыш людей в коэффициентном соотношении невелик (9.15/100), я бы не сказал, что это ничья. У людей есть преимущество».

 


Профессиональные игроки (слева направо): Бьорн Ли, Даг Полк, Донг Ким и Джейсон Лес

 

Майкл Боулинг, профессор информатики в Альбертском университете (Канада), который разработал передовую программу покера, говорит, что люди долго не задержатся на пьедестале победителя: «Теперь, после этого турнира, понадобится всего один-три года, прежде чем компьютер обыграетчеловека. До этого мы просто не знали, насколько близко подошли к этому».

Полк за первую неделю турнира выиграл у компьютера $400 368, но затем тот изменил стратегию и отыграл практически половину к концу соревнования. Но Полк все равно не считает Claudico первоклассным игроком.

 

Были моменты, в которых он играл хорошо, а в других я просто не понимал его действий. К примеру, некоторые его ставки были очень необычными. Там, где человек поставил бы три четверти от суммы на кону, Claudico иногда ставил всего 10 процентов, или наоборот – 1000 процентов. Человек вряд ли поставит $19 000, чтобы выиграть 700 долларов.

 

Тем не менее, Полк отметил отсутствие сомнений у Claudico: «Вы играете с хладнокровным убийцей, потому что когда он идет ва-банк, а Вы его раскусили и выигрываете его деньги, он не пугается, а просто делает вычисления».

Лес проигрывал $228 066 после первой недели. Но он сумел добиться успеха на поздних стадиях турнира.

 

Компьютер умеет блефовать и применяет разные трюки, которые знают реальные игроки, но фокус в том, что мы не программируем блеф, – говорит Сендхолм. – Так что алгоритмы просчитывают всю стратегию блефа – как, когда, в каких ситуациях, и т. д.

 

Стратегия Claudico была создана с помощью алгоритмов, а не программирования по схеме игры человека. Алгоритм был запущен на компьютере Blacklight в Питтсбургском центре суперкомпьютеров, в который просто ввели правила игры.

Те же алгоритмы можно использовать для создания стратегий для приложений кибербезопасности, бизнес-транзакций и здравоохранения. К примеру, искусственный интеллект вроде Claudico мог бы  помогать врачам прописывать поэтапный план лечения для пациентов или создавать лекарства, вызывающие меньше противодействия. Или же подобрать самое выгодное предложение при покупке дома или машины.

 


Даг Полк обыгрывает Claudico

 

Более ранняя версия программы Tartanian7 выиграла с большим преимуществом в безлимитный техасский холдем на ежегодном соревновании по покеру, организованном Ассоциацией продвинутого искусственного интеллекта в июле.

Покер стал отличным тестом для искусственного интеллекта, потому что это игра с неполной информированностью, и у двоих игроков не может быть одинаковой стратегии. Получив информацию из 80 000 карточных раздач, Сендхолм говорит, что его команда уже представляет, как улучшить Claudico:

 

Наша цель – не обыграть людей, это просто очередной шаг на пути прогресса. Мы хотим создать искусственный интеллект, который поможет людям вести переговоры и принимать решения, в которых они не владеют всеми фактами.

 

Во время выставки не было ставок на реальные деньги, хотя профессионалы и получили премию за участие, исходя из своих результатов, из призового фонда в 100 000 долларов от казино Rivers Casino и команды Microsoft Research.

 

рейтинг

1676

просмотров

0

комментариев

порекомендовать друзьям

комментарии

Нет комментариев

Гость

Дорогие друзья! Помните, что администрация сайта будет удалять:

  • Комментарии с грубой и ненормативной лексикой
  • Прямые или косвенные оскорбления героя поста или читателей
  • Короткие оценочные комментарии ("ужасно", "класс", "отстой")
  • Комментарии, разжигающие национальную и социальную рознь