Новости

Искуcственный разум победил в Покер — Libratus

Март 15, 2017 | Новости Ev4ik

Свое преобладание над человеческим разумом на старте 2017 года продемонстрировал искусственный интеллект, названный Libratus, когда обыграл в холдем четырех лучших мировых игроков. Джейсон Лес, Даниэль Макалей, Донг Ким и Джимми Чоу собрались вместе, чтобы сразиться с Libratus в рамках покерного сражения «Brains Vs. Artificial Intelligence: Upping the Ante». Соперничество состоялось в Питтсбурге, штат Пенсильвания.

Техасский холдем – одна из популярнейших разновидностей покера, отличающаяся множественностью вариантов развития событий. Как и в любой карточной игре, покеристы просто обязаны распознавать блеф и уметь сами ввести противника в заблуждение, ведь никому из них неизвестно, какие карты находятся на руках у соперника. Важно научиться мастерски адаптироваться, анализировать информацию и просчитывать действия соперников наперед исходя из их действий – ставки, рейз, колл, фолд.

Команде людей не особенно везло с самого начала соревнования, хотя первую неделю им удалось закончить с нулевым результатом: игроки ни разу не выиграли у Libratus, но и не проиграли ей. Однако дальше система взяла ситуацию под свой контроль, сокрушая лучших игроков в покер раз за разом. Отыграв половину турнира, Libratus обошла команду людей на 40 стеков. За время турнира было сыграно свыше 120 раздач. Выигрыш машины составил 1 766 250 виртуальных долларов США. Больше всего машине проиграл Джейсон Лес – 880 087 долларов. Лучший результат у Донга Кима: он задолжал искусственному интеллекту всего 85 649 долларов. Первую половину марафона ему удавалось оставаться в плюсе, но во второй части турнира он все-таки уступил Libratus и завершил игру в небольшом (по сравнению с другими участниками команды) минусе.

Успех машины в очередной раз позволил доказать, что система искусственного мышления при некоторых обстоятельствах действует логичней человека. Победу Libratus тут же отметили эксперты, поставив ее в ряды лучших систем — Alpha Go, Deep Blue, Watson.
После тщательного анализа алгоритма действий Libratus стало ясно, что залогом победы стали навыки машины к самообучению и совершенствованию мастерства игры прямо в ходе покерного марафона. В конце каждой раздачи искусственный интеллект пошагово анализировал партию, вычислял степень эффективности, определял ошибки и вносил коррективы в свои стратегии для усовершенствования игры. Ближе к середине марафона искусственный разум определил для себя наилучшую стратегию, что было подтверждено ослаблением нагрузки на компьютер. Кстати, система оказалась невероятно прилежной ученицей – во время подготовки к соревнованию Libratus сыграла сама с собой свыше 1 триллиона партий.

Поражение игроков можно объяснить и их физиологическими потребностями. Ведь после каждой игры они анализировали свои действия и действия машины, выискивали допущенные ошибки и планировали стратегию на завтра. После этого люди отправлялись ужинать и спать. Libratus, которая не нуждалась в отдыхе и пище, продолжала анализировать игру, определять слабости соперников и разрабатывать стратегию в течение всей ночи.

Немаловажную роль имела и производительность машины. Чтобы Libratus смогла полноценно функционировать, компьютер Bridges разместили в вычислительном центре в самом Питтсбурге и снабдили мощностью в 846 узлов (суммарно 1,35 Пфлопс). В ходе покерного соревнования Libratus задействовала шестьсот из них. Для сравнения, общая мощность Bridges в 7250 раз превысила производительность высококлассного игрового компьютера. Объем ОЗУ компьютера составил 274 Тбайта. Таким образом, размер оперативной памяти Bridges оказался в 17500 раз выше, чем объем памяти довольно мощного игрового компьютера.

Искусственный интеллект Libratus – детище команды разработчиков из Университета Карнеги-Меллона. Система представляет собой усовершенствованную версию программы Claudico, которая в 2015 году в ходе аналогичного покерного турнира не смогла обыграть команду людей. «Отцы» алгоритма – профессор компьютерных наук Туомас Сандхольм и аспирант Ноам Браун.

Естественно, они невероятно горды своим творением и не скрывают, что ожидали победу искусственного разума. Сандхольм отметил, что способности искусственного интеллекта мыслить стратегически наконец-то превзошли человеческое мышление. Причем убедительную победу Libratus ни в коей мере нельзя списать на везение или удачу. Сандхольм неоднократно подчеркивал, что систему наделили способностями анализировать, делать выводы, рисковать и блефовать даже при наличии минимума информации. А ведь до этого момента такие способности демонстрировали только люди. Судя по словам разработчиков, обучение искусственного интеллекта навыкам блефа – очередной прорыв в информационных технологиях. Не исключено, что в самом ближайшем будущем ваши гаджеты сами смогут торговаться с продавцами и выбивать для своих владельцев скидки.

У создателей Libratus на нее большие планы. Ведь игра в покер – лишь один из многочисленных навыков системы искусственного интеллекта. Предполагается найти ей применение в военной области (построение военных стратегий), медицине (для разработки успешного плана лечения), кибербезопасности, использовать для оценки биржевых рисков и организации процесса деловых переговоров с выгодой для заинтересованной стороны. Все секреты работы Libratus исполнители пообещали раскрыть в самое ближайшее время.

Сами игроки остались довольны полученным опытом. К тому же они покинули Пенсильванию не с пустыми руками. Соперники искусственного интеллекта разделили между собой денежный приз, переданный им за участие в покерном турнире. Сумма фонда – 200 тыс. долларов. Участники команды людей были едины во мнении: им казалось, что они играют не с компьютером, а с живым человеком, который умеет великолепно блефовать и анализировать игру. Макалей подчеркнул, что игра была жесткая, а противник превзошел все его ожидания. То ли еще будет.