Искусственный интеллект впервые обыграл в покер одновременно пять игроков

✔ Искусственный интеллект впервые обыграл в покер одновременно пять игроков - «Технологии»

Shackley 14-07-2019, 04:42 193 Новости дня / Технологии

Происшествия и криминал / Новости дня / Мир / Видео / Политика / Технологии / Энергетика / Большой КавказПочему мы сгибаем руки во время бега? - Новости... 0

Политика / Новости дня / Чемпионат / Происшествия и криминал / Видео / Большой Кавказ / ЭнергетикаПочему гулять по мягкому песку трудно? - Новости... 0

Новости дня / Здоровье / ТехнологииОгромные залежи нефти открыты под Южно-Китайским морем - Новости... 0

Новости дня / Видео / ЗдоровьеДвижение гор рождает новые виды - Новости... 0

14 июля 2019
02:52

Ученные создали искусственный интеллект (ИИ), которому удалось обыграть в техасский холдем (популярная разновидность покера) пятерых профессиональных игроков. Каждый из принявших участие в эксперименте заработал на покере более $ 1 млн. Об успехах ученых из Университета Карнеги — Меллона (CPU) сообщил журнале Science.

«В последние два десятилетия системы ИИ осваивали все более сложные формы покера. Однако все предыдущие прорывы были ограничены участием только двух игроков», — говорится в статье.

По сравнению с парными играми, партии с большим количеством игроков вызывали у ИИ трудности. Чтобы преодолеть их ученые оснастили систему «абстрактным действием» и «абстрактной информацией». Эти свойства необходимы, чтобы помочь системе сократить количество вариантов и выделить те, которые нужны для принятия решения.
Для этого специалисты разработали программу под названием Pluribus, которая научилась играть в Техасский холдем с пятью своими копиями. Играя раз за разом наугад, Pluribus постепенно определял, какие действия и с какой вероятностью дают лучшие результаты. Анализируя эти данные, система постепенно улучшала свою стратегию.
Игру компьютера оценивали в двух форматах: пять игроков против Pluribus и один игрок против пяти копий Pluribus. Каждый из принявших участие в эксперименте заработал на покере более $ 1 млн. Участниками стали игроки Джимми Чоу, Сет Дэвис, Майкл Гальяно, Энтони Грегг, Донг Ким, Джейсон Лес, Линус Лелигер, Дэниел МакАулей, Грег Мерсон, Николас Петранжело, Шон Руан, Тревор Саваж, Джейкоб Тул.
Каждый день для игры отбирались пять профессионалов. При этом они не знали других участников. Каждому человеку давался псевдоним, который оставался неизменным на протяжении всего эксперимента. По нему можно было отслеживать успехи игроков. Между людьми разделили $ 50 тыс., чтобы мотивировать их на игру с полной отдачей. Игрокам гарантировали не менее $ 0,40 за раздачу. Сумма могла увеличиться до $ 1,60 за раздачу в зависимости от результатов игры.
В матче с пятью профессиональными игроками в покер или с пятью копиями Pluribus, играющими против одного игрока, ИИ за 12 дней эксперимента показал лучшие результаты в более чем 10 тыс. раздач.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.

Иллюстрация к статье - Яндекс. Картинки.

Есть вопросы. Напишите нам.

Общие правила поведения на сайте.

14 июля 2019 02:52 Ученные создали искусственный интеллект (ИИ), которому удалось обыграть в техасский холдем (популярная разновидность покера) пятерых профессиональных игроков. Каждый из принявших участие в эксперименте заработал на покере более $ 1 млн. Об успехах ученых из Университета Карнеги — Меллона (CPU) сообщил журнале Science. «В последние два десятилетия системы ИИ осваивали все более сложные формы покера. Однако все предыдущие прорывы были ограничены участием только двух игроков», — говорится в статье. По сравнению с парными играми, партии с большим количеством игроков вызывали у ИИ трудности. Чтобы преодолеть их ученые оснастили систему «абстрактным действием» и «абстрактной информацией». Эти свойства необходимы, чтобы помочь системе сократить количество вариантов и выделить те, которые нужны для принятия решения. Для этого специалисты разработали программу под названием Pluribus, которая научилась играть в Техасский холдем с пятью своими копиями. Играя раз за разом наугад, Pluribus постепенно определял, какие действия и с какой вероятностью дают лучшие результаты. Анализируя эти данные, система постепенно улучшала свою стратегию. Игру компьютера оценивали в двух форматах: пять игроков против Pluribus и один игрок против пяти копий Pluribus. Каждый из принявших участие в эксперименте заработал на покере более $ 1 млн. Участниками стали игроки Джимми Чоу, Сет Дэвис, Майкл Гальяно, Энтони Грегг, Донг Ким, Джейсон Лес, Линус Лелигер, Дэниел МакАулей, Грег Мерсон, Николас Петранжело, Шон Руан, Тревор Саваж, Джейкоб Тул. Каждый день для игры отбирались пять профессионалов. При этом они не знали других участников. Каждому человеку давался псевдоним, который оставался неизменным на протяжении всего эксперимента. По нему можно было отслеживать успехи игроков. Между людьми разделили $ 50 тыс., чтобы мотивировать их на игру с полной отдачей. Игрокам гарантировали не менее $ 0,40 за раздачу. Сумма могла увеличиться до $ 1,60 за раздачу в зависимости от результатов игры. В матче с пятью профессиональными игроками в покер или с пятью копиями Pluribus, играющими против одного игрока, ИИ за 12 дней эксперимента показал лучшие результаты в более чем 10 тыс. раздач.

Нашли ошибку?