Компьютер побеждает: люди проиграли в покер

Первого февраля стало известно, что люди проиграли компьютеру в очередную игру. Лучшие игроки в покер один на один оказались слабее программы Libratus. После 20-дневного матча люди проиграли компьютеру два миллиона долларов.

Издание«Медуза» опубликовало большую статью на эту тему. «Чудо техники», с разрешения коллег, публикуют самые интересные моменты из этого материала.

Компьютер уже победил людей в шашки, шахматы и даже го — древнейшую игру, где важна интуиция. Гроссмейстеры го сдались последними: в 2016 году программа Alpha Go, созданная в Google DeepMind, победила Ли Седоля — одного из сильнейших игроков.

Шашки, шахматы и го — игры с полной информацией. Оба игрока видят, что происходит на доске и просчитывают свои ходы в зависимости от предполагаемых ходов противника. В покере по-другому: соперники не знают карт друг друга. Это делает задачу для компьютера сложнее — он не может просчитать все.

Программу Libratusбаланс» на латинском) создали ученые из Университета Карнеги Меллон — профессор Тумас Сандхольм и его студент Ноам Браун.

Сначала Libratus знала только правила покера — какие карты есть, какие комбинации сильнее, в какой последовательности ходят игроки. Создатели программы сказали ей играть самой с собой в покер, и она училась на своих ошибках. После нескольких триллионов раздач компьютер научился понимать, какие действия ведут к выигрышу, а какие к проигрышу — и действовал так, чтобы получить наибольшую прибыль.

Против Libratus играли четверо профессионалов, заработавших на покере миллионы долларов. Донг Ким, Джейсон Леc, Джимми Чу и Дэниэл МакАлэй — специалисты по игре в покер один на один. Лес и Ким в 2015 году играли против Claudico. Ким тогда выиграл, Лес — проиграл.

Liberatus выигрывает в покер (1) | фото: post-gazette.com

Матч проходил в течение 20 дней. Каждый день каждый из четырех игроков проводил за компьютером по 12 и больше часов. Они должны были сыграть 120 тысяч раздач. При каждой раздаче противникам давалось по 20 тысяч фишек.

В первые дни игроки думали, что им легко удастся найти изъян в программе. Со временем они убедились — это невозможно или как минимум непросто. Libratus начала выигрывать с первого же дня. Только на шестой день людям удалось сократить преимущество, но днем позже оказалось, что компьютер стал играть еще лучше. И так происходило раз за разом.

Как рассказывает Лес, однажды у него было на руках два валета. Это достаточно сильная карта, особенно при игре один на один. Лес сделал первую ставку, компьютер ответил. На столе появились три карты — восемь, семь, два, причем разных мастей. Соответственно, Лес был уверен, что сейчас он почти наверняка побеждает и сделал следующую ставку. В ответ компьютер поднял ставку в десятки раз.

Liberatus выигрывает в покер (5) | фото: post-gazette.com

«Я бы не сказал, что это было неправильно, но это выглядело как „Да что ж это за хрень“», — вспоминал потом Лес. Компьютер научился и блефовать, и считывать блефы — то есть у него появились навыки, без которых невозможно выиграть в покер.

В итоге на всех люди проиграли 1,8 миллиона долларов. Игра шла не на настоящие деньги, хотя и проходила в казино. Игроки поделят между собой 200 тысяч долларов, предоставленные спонсорами.

Libratus работал на суперкомпьютере с десятками процессоров, но Сандхольм уверен, что 99% игроков Libratus обыграет даже если ее запустить на обычном компьютере. Как подчеркивают создатели программы, их алгоритм не заточен под покер: технологию можно применять для любых игр с неполной информацией — для оценки рисков на бирже, при переговорах и в других областях.

источник: meduza