Люди обыграли компьютер в покер — с трудом

Заядлые игроки в видеопокер, часами просиживающие в казино, могут вздохнуть свободно: люди пока еще обыгрывают компьютер. Но не исключено, что скоро компьютеры будут доминировать за суконным столом, как они уже доминируют за шахматной доской.

В битве умов между человеком и машиной, которая проходила на этой неделе в Ванкувере, программа, исполняемая на обычном ноутбуке, сражалась на равных — но проиграла двум известным профессиональным игрокам в покер. В состязании с призовым фондом $50 тыс., которое преподносилось как «Первый чемпионат по покеру между человеком и машиной», два профессионала, Фил Лаак и Али Эслами, играли против программы Polaris, созданной командой исследователей в области искусственного интеллекта из университета провинции Альберта.

Считается, что покер представляет более трудную задачу для программистов, чем такие игры, как шашки и шахматы, — приходится разрабатывать разные стратегии и алгоритмы для решения неопределенностей, вносимых скрытыми картами и действиями с трудно оцениваемым риском, такими как блеф. В прошлом исследователи увлекались шахматами и шашками. В 1997 году суперкомпьютер IBM Deep Blue обыграл чемпиона мира по шахматам Гарри Каспарова. Команда университета Альберта в 1994 году выиграла чемпионат мира по шашкам, а недавно сообщила о создании программы, которую невозможно обыграть в принципе.

Однако в последние годы интерес исследователей сместился в направлении игр типа покера — отчасти потому, что шахматы уже не вызывают былого энтузиазма, а отчасти благодаря быстрому прогрессу в области новых алгоритмов с широкими возможностями практического применения в таких областях, как ведение переговоров и торговля. Д-р Джонатан Шеффер, декан отделения вычислительной техники университета Альберта, который 16 лет назад начал изыскания в области покера, утверждает, что достижения в сфере программного обеспечения для этой игры могут иметь более важное прикладное значение, чем шахматные программы.

В матче, проходившем в понедельник и вторник в рамках ежегодной конференции Ассоциации по развитию искусственного интеллекта, использовалась версия покера, называемая лимитным покером «с глазу на глаз» Texas Hold ’Em. Это игра для двух игроков, в которой сдается по две карты лицом вниз каждому игроку и пять общих карт лицом вверх. После четырех кругов ставок, каждый из которых занимает около четырех часов, победителем объявляется тот, у кого больше денег.

В отличие от игры в шахматы, которая требует максимальной концентрации и длительных периодов тишины, обстановка в отеле, где проходил матч, была праздничной, и каждый участник охотно комментировал аудитории из нескольких сотен человек стиль игры Polaris. Лаак, по прозвищу Unabomber, которым он обязан своему фирменному балахону с капюшоном и темным очкам, активно жестикулировал перед экраном ноутбука и то и дело обзывал компьютер «припадочным» (sick) в ответ на неожиданные или экстраординарные действия с его стороны. В числе болельщиков Лаака была актриса Дженнифер Тилли, тоже известный игрок в покер.

Формат состязаний был приспособлен для игры с компьютером. Чтобы исключить влияние удачи — доминирующий фактор при игре в покер, игроки-люди находились в отдельных комнатах. Карты, сданные человеку в одной комнате, совпадали с картами компьютера в другой. Исключался также один из важных аспектов традиционного покера, когда игрок может угадать скрытые карты своего противника по еле заметным изменениям выражения его лица.

Эслами и Лаак широко известны в мире покера, имеют математическое образование и знакомы с методами, используемыми их оппонентами. Хотя это не чемпионы мира, ученые утверждают, что их знание вычислительной техники делает их более серьезными противниками по сравнению с другими высококлассными игроками в покер.

Первый раунд команда людей сыграла вничью, хотя их общий выигрыш был несколько меньшим, чем у компьютера. По правилам матча небольшие различия не учитывались ввиду статистической ошибки. Второй раунд в понедельник вечером закончился убедительной победой Polaris, и игроки были заметно деморализованы. Однако в третьем раунде, во вторник, они взяли реванш, воспользовавшись изменением стратегии командой Polaris, которая применила программу с повышенным уровнем адаптируемости и «обучаемости».

В отличие от шахматных программ, которые требуют огромной вычислительной мощности для просчета предполагаемых ходов, покерная программа Polaris проделывает основную работу до начала игры, неделями составляя серии агентов, называемых «ботами», которым свойственны разные стили игры: от агрессивного до пассивного. Перед матчем команда Альберта смоделировала 10 ботов, а затем выбрала одну программу, которая играла в двух первых раундах. В третьем раунде исследователи использовали более сложную комбинацию, в которой программа-«тренер» контролировала результаты трех ботов, а затем заменяла их, как футболистов на поле.

Лаак и Эслами уверенно выиграли финальный раунд, однако перед этим Polaris удалось сорвать пот в $240, предъявив комбинацию royal flush, а затем побить «тройку» (three-of-a-kind) Эслами. Оба игрока сказали, что с Polaris играть гораздо труднее, чем с одушевленными соперниками.

Фил Лаак играет против Polaris

Предыдущие публикации:

2007-07-20

18 лет и — в дамках!

← июнь 2007

20 22 23 24 25 26 27 30 31

август 2007 →