Искусственный интеллект подчистую обыграл четверых самых сильных игроков в покер. Изящно и не оставив мясным машинам ни малейшего шанса, он все двадцать дней турнира доказывал, что интуиция, «счастливая рука» и блеф — это просто пустые слова по сравнению с бездушными, но верно выбранными алгоритмами суперкомпьютера. Человечество снова оказалось посрамлено, а робот выиграл 1.7 миллиона долларов фишками.
Программа Libratus, созданная в университете Карнеги — Меллон, победила в соревновании «Brains Vs. Artificial Intelligence: Upping the Ante». Турнир в техасский холдем (разновидность покера) шел в казино долгих двадцать дней, и наблюдать за его ходом можно было в Twitch.
Результат вам уже известен, но изначально он был не так уж очевиден: предыдущая подобная попытка ИИ обыграть игроков в покер провалились с треском. Тогда, в 2015, программа Claudico не смогла сравниться с людьми в мастерстве и проиграла 750 тысяч долларов фишками. Libratus оказался гораздо сильнее по всем характеристикам: он не просто играл по правилам, он вычислял блефующих, рисковал в удачные для него моменты и предугадывал действия людей. Сами игроки были обескуражены и сломлены, некоторые из них признались, что в какой-то момент начало казаться, будто искусственный интеллект просто считывает их мысли.
Вообще, ИИ, обыгрывающий чемпионов в интеллектуальные игры, вроде шахмат и го, — не такая уж новость. Но покер — совершенно иное дело и другой уровень задач для машины. Здесь требуется не просто играть, зная расположение всех фигур и пытаясь предугадать действия противника. В покере приходится действовать в ситуации неопределенности, когда многие данные неизвестны и фрагментарны. Игроки блефуют, а их позиция и возможности изначально неизвестны. Но искусственный интеллект справился, и это стало большим прорывом для его создателей.
Кроме того, Libratus оказался еще и первой подобной системой, которая обучалась не благодаря наблюдению за реальными партиями, а играя только сама с собой и постоянно улучшая свои навыки. За время подготовки она сыграла больше триллиона партий, прежде чем впервые встретился за покерным столом с человеком. Все эти двадцать дней турнира профессиональные игроки пытались найти слабости в работе ИИ и отыскать ошибки, но он делал их крайне редко. К тому же, искусственный интеллект сам распознает их и постоянно корректирует дальнейшую игру в зависимости от промахов, которые сделал он сам и его противники.
Еще одна причина, по которой Libratus смог выиграть у людей, обнаружилась, в общем-то, неожиданно. Оказалось, что существуют моменты, когда люди почти никогда не рискуют, боясь моментально проиграться в пух и прах. В то же самое время, ИИ плевать хотел на условности. Он не подвержен страху риска и просто идет к своей цели. Один из создателей программы, Туомас Сэндхолм, с восторгом говорит, что это похоже на победу Давида над Голиафом, когда Давид не побоялся бросить свой камень.
Планируется, что такая способность действовать в ситуации непредсказуемости и минимальных данных проявит себя в областях, где подобная стрессовая ситуация — норма. Например, во время военных действий. Звучит довольно логично: сначала мы научили их обыгрывать нас в покер как детей, а теперь думаем о том, как научить их убить как можно больше народу. Кажется, у человечества нет никаких шансов.