poker

Штучний розум переміг в Покер – Libratus

Своє переважання над людським розумом на старті 2017 року продемонстрував штучний інтелект – Libratus, коли обіграв в холдем чотирьох кращих світових гравців. Джейсон Ліс, Даніель Макалей, Донг Кім і Джиммі Чоу зібралися разом, щоб битися з Libratus в рамках покерного битви «Brains Vs. Artificial Intelligence: Upping the Ante». Суперництво відбулося в Піттсбурзі, штат Пенсільванія.

Техаський холдем – одна з найпопулярніших різновидів покеру, що відрізняється множинністю варіантів розвитку подій. Як і в будь-який картковій грі, покеристи просто зобов’язані розпізнавати блеф і вміти самі ввести противника в оману, адже нікому з них не відомо, які карти знаходяться на руках у суперника. Важливо навчитися майстерно адаптуватися, аналізувати інформацію і прораховувати дії суперників наперед виходячи з їх дій – ставки, рейз, колл, фолд.

Команді людей не особливо щастило з самого початку змагання, хоча перший тиждень їм вдалося закінчити з нульовим результатом: гравці жодного разу не виграли у Libratus, але і не програли їй. Однак далі система взяла ситуацію під свій контроль, трощачи кращих гравців в покер раз по раз. Відігравши половину турніру, Libratus обійшла команду людей на 40 стеків. За час турніру було зіграно понад 120 роздач. Виграш машини склав 1 766 250 віртуальних доларів США. Найбільше машині програв Джейсон Ліс – 880 087 доларів. Кращий результат у Донга Кіма: він заборгував штучного інтелекту всього 85 649 доларів. Першу половину марафону йому вдавалося залишатися в плюсі, але у другій частині турніру він все-таки поступився Libratus і завершив гру в невеликому (в порівнянні з іншими учасниками команди) мінусі.

Успіх машини в черговий раз дозволив довести, що система штучного мислення при деяких обставинах діє логічніше людини. Перемогу Libratus тут же відзначили експерти, поставивши її в ряди кращих систем – Alpha Go, Deep Blue, Watson.
Після ретельного аналізу алгоритму дій Libratus стало ясно, що запорукою перемоги стали навички машини до самонавчання і вдосконалення майстерності гри прямо в ході покерного марафону. В кінці кожної роздачі штучний інтелект покроково аналізував партію, обчислював ступінь ефективності, визначав помилки і вносив корективи в свої стратегії для вдосконалення гри. Ближче до середини марафону штучний розум визначив для себе найкращу стратегію, що було підтверджено ослабленням навантаження на комп’ютер. До речі, система виявилася неймовірно старанною ученицею – під час підготовки до змагання Libratus зіграла сама з собою понад 1 трильйона партій.

Поразка гравців можна пояснити і їх фізіологічними потребами. Адже після кожної гри вони аналізували свої дії і дії машини, вишукували допущені помилки і планували стратегію на завтра. Після цього люди відправлялися вечеряти і спати. Libratus, яка не потребувала відпочинку і їжі, продовжувала аналізувати гру, визначати слабкості суперників і розробляти стратегію протягом всієї ночі.

Важливу роль мала і продуктивність машини. Щоб Libratus змогла повноцінно функціонувати, комп’ютер Bridges розмістили в обчислювальному центрі в самому Піттсбурзі і забезпечили потужністю в 846 вузлів (сумарно 1,35 Пфлопс). В ході покерного змагання Libratus задіяла шістсот з них. Для порівняння, загальна потужність Bridges в 7250 разів перевищила продуктивність висококласного ігрового комп’ютера. Обсяг ОЗУ комп’ютера склав 274 Тбайта. Таким чином, розмір оперативної пам’яті Bridges виявився в 17500 разів вище, ніж обсяг пам’яті досить потужного ігрового комп’ютера.

Штучний інтелект Libratus – дітище команди розробників з Університету Карнегі-Меллона. Система являє собою вдосконалену версію програми Claudico, яка в 2015 році в ході аналогічного покерного турніру не змогла обіграти команду людей. «Батьки» алгоритму – професор комп’ютерних наук Туомас Сандхольм і аспірант Ноам Браун.

Вони неймовірно горді своїм творінням і не приховують, що очікували на перемогу штучного розуму. Сандхольм зазначив, що здатності штучного інтелекту мислити стратегічно нарешті перевершили людське мислення. Причому переконливу перемогу Libratus ні в якому разі не можна списати на везіння або удачу. Сандхольм неодноразово підкреслював, що систему наділили здібностями аналізувати, робити висновки, ризикувати і блефувати навіть при наявності мінімуму інформації. Але ж до цього моменту такі здібності демонстрували тільки люди. Судячи зі слів розробників, навчання штучного інтелекту навичкам блефу – черговий прорив в інформаційних технологіях. Не виключено, що в найближчому майбутньому ваші гаджети самі зможуть торгуватися з продавцями і вибивати для своїх власників знижки.

У творців Libratus на неї великі плани. Адже гра в покер – лише один з численних навичок системи штучного інтелекту. Передбачається знайти їй застосування у військовій області (побудова військових стратегій), медицині (для розробки успішного плану лікування), кібербезпеки, використовувати для оцінки біржових ризиків і організації процесу ділових переговорів з вигодою для зацікавленої сторони. Всі секрети роботи Libratus виконавці пообіцяли розкрити в самий найближчий час.

Самі гравці залишилися задоволені отриманим досвідом. До того ж вони покинули Пенсільванію не з порожніми руками. Суперники штучного інтелекту розділили між собою грошовий приз, переданий їм за участь в турнірі покеру. Сума фонду – 200 тис. доларів. Учасники команди людей були єдині в думці: їм здавалося, що вони грають не з комп’ютером, а з живою людиною, яка вміє чудово блефувати і аналізувати гру. Макалей підкреслив, що гра була жорстка, а противник перевершив всі його очікування. Чи то ще буде.

Поділитися
Tweet