Робот, играющий в покер теперь работает в Пентагоне
В 2017 ГОДУ покерный бот под названием Libratus попал в заголовки, когда он победил четырех лучших игроков в безлимитном Техасском Холдеме. Теперь технология Libratus адаптируется для борьбы с противниками другого рода — на службе вооруженных сил США.
Libratus — латинский для сбалансированного — был создан исследователями из Университета Карнеги-Меллона для проверки идей для автоматического принятия решений на основе теории игр. В начале прошлого года профессор, который руководил проектом, Туомас Сандхольм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию своей лаборатории для государственного использования, например, в военных играх и симуляциях, используемых для изучения военной стратегии и планирования. В конце августа, согласно публичным отчетам, компания получила двухлетний контракт на сумму до 10 миллионов долларов с армией США. Он описывается как «в поддержку» агентства Пентагона под названием «Инновационная группа по обороне», созданного в 2015 году для того, чтобы добиться Силиконовой долины и ускорить внедрение в США новых технологий.
Победа Libratus над покерными профессионалами в 2017 году была признана важной вехой в искусственном интеллекте, потому что карточная игра имеет сложные особенности, которых не хватает в настольных играх, наиболее широко используемых компьютерами. В шахматах и гоу каждая фигура доступна для просмотра обоим игрокам, что делает их так называемыми идеальными информационными играми. В покере не все карты видны, а это означает, что, как и во многих реальных сценариях, некоторая информация, необходимая для расчета истинного состояния игры, неизвестна.
Libratus был основан на технологии, называемой вычислительной теорией игр. Он выиграл более 1,8 миллиона долларов в игровых деньгах от чемпионов покера, рассчитав, как они могут реагировать на его решения. Программное обеспечение разработало мощные стратегии ставок и даже показало способность блефовать.
Сандхольм говорит, что этот подход может быть применен ко многим другим играм, а также к военным симуляциям. По его словам, военные игровые упражнения обычно тестируют только небольшое количество стратегий для воображаемых противников, даже если они выполняются как компьютерные симуляции. «Это открывает для вас много возможностей для эксплуатации, потому что настоящий противник может не играть в соответствии с вашими предположениями», — говорит Сандхольм.
Сандхольм отказывается обсуждать особенности проектов Strategy Robot, которые включают, по крайней мере, еще один государственный контракт. Он говорит, что он может решать задачи, связанные с принятием решений в моделируемом физическом пространстве, например, где размещать воинские части. Отдел оборонных инноваций отказался комментировать проект, а армия не ответила на запросы о комментариях.
Техника покера Libratus предполагает, что Strategy Robot может дать военным персонал несколько неожиданных рекомендаций. Профессиональные игроки, принявшие бота, обнаружили, что он нервно переключается между прирученной и сверхагрессивной тактикой, все время неуклонно надрезая победы, когда рассчитывает пути к победе. «Это странно, потому что не кажется, что это ошеломляет вас, но затем вы смотрите на счет и понимаете, что произошло», — говорит Сандхольм.
Грег Аллен, адъюнкт-исследователь в мозговом центре «Центр новой американской безопасности», говорит, что технология, которая привела в действие Libratus, могла бы сделать упражнения в военных играх и симуляции более полезными. «Это все еще далеко от реального, но это лучший прокси для реального мира», — говорит он. Тем не менее, по его словам, результаты, скорее всего, останутся лишь одним из компонентов стратегического планирования и исследований, потому что мир намного сложнее и запутаннее, чем сценарии, которые может освоить даже лучшая технология искусственного интеллекта.
Стратегический робот — не единственная новая попытка Пентагона в теории игр с улучшенным ИИ. Его исследовательское агентство Darpa начинает программу по изучению того, как эта технология может быть использована для принятия военных решений. Майкл Веллман, профессор Мичиганского университета, говорит, что его группа работает над применением теории вычислительных игр к кибербезопасности в рамках этой программы. Он говорит, что Libratus можно рассматривать как признак зрелости технологии. «Настало время попробовать это в более реальных областях», — говорит он. «Прорыв в покере был просто поразительным, и в других играх дела идут быстро».
В дополнение к Strategy Robot, Сандхольм основал второй стартап под названием Strategic Machine, который развертывает свои методы решения игр в коммерческих условиях, таких как рынки электроэнергии, спорт, и превращает игроков, управляемых компьютером, в более жестких противников в видеоиграх. Сандхольм говорит, что обе компании полностью загружены, имеют примерно шесть сотрудников и являются прибыльными.
Вернувшись в свою компьютерную лабораторию CMU, Сандхольм также думает о том, как сделать его технологию более портативной. Когда Libratus взял в покер профессионалов, он работал на суперкомпьютере Bridges в Питтсбургском суперкомпьютерном центре, финансируемом из федерального бюджета; Сандхольм говорит, что его стартапы также использовали суперкомпьютеры. На NeurIPS, крупнейшей в мире конференции по искусственному интеллекту в прошлом месяце, он и его сотрудник по Libratus Ноам Браун представили доклад о менее мощном, но более компактном покерном боте Modicum, который может работать на одном сервере. «В некоторых приложениях он должен быть миниатюрным, если он есть на борту», - говорит Сандхольм. «Некоторые платформы не могут переносить большие компьютеры».
Пентагон стремится шире использовать технологию искусственного интеллекта. В 2017 году тогдашний министр обороны США Джеймс Маттис посетовал, что его отдел отстает от технологических компаний в принятии таких технологий, как машинное обучение. В том же году Пентагон запустил программу под названием Project Maven, предназначенную для использования коммерчески доступных методов искусственного интеллекта в миссиях США. В его первоначальном проекте использовалось машинное обучение для пометки объектов в видео наблюдения за беспилотниками с помощью сообразительных AI-стартапов и крупных компаний, включая Google .
Другие нации тоже изучают военное использование ИИ. Президент России Владимир Путин заявил, что тот, кто возглавляет ИИ, «станет правителем мира» . Военные приложения занимают важное место в национальной стратегии ИИ Китая . В 2017 году в Национальном университете обороны Китая состоялся национальный конкурс военных игр, в котором человеческие команды использовали систему искусственного интеллекта.
Растущий военный интерес к ИИ сбивает с толку некоторых технологов, которые продвигают основную технологию. Некоторые из исследователей искусственного интеллекта Google присоединились к тысячам сотрудников, которые протестовали против работы компании над Project Maven.
Сандхольм считает, что опасения по поводу использования ИИ в США чрезмерно раздуты. По его словам, эта технология важна для того, чтобы помочь Пентагону обезопасить США и повысить операционную эффективность. «Я думаю, что ИИ сделает мир намного безопаснее», — говорит Сандхольм.