Ученые из британской лаборатории DeepMind создали обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта выполнению задач, которые им никогда не встречались

отметили
23
человека
в архиве

Вместо того, чтобы обучать агентов ограниченному количеству задач, команда исследователей определила целую вселенную ситуаций, которые могут быть сгенерированы процедурно.

 

источник: lh3.googleusercontent.com

Устройство вселенной XLand. Данные: DeepMind.

Вселенная XLand включает ряд многопользовательских трехмерных игр. В ее пределах агенты провели 700 000 уникальных сессий в 4000 миров. Каждый агент в последнем поколении прошел 200 млрд шагов обучения в результате выполнения 3,4 млн уникальных задач.

В итоге разработчики получили алгоритм, способный успешно решать широкий спектр задач — от простого поиска объектов до сложных игр, таких как прятки или захват флага, которые не встречались во время обучения, сообщили ученые.

«В настоящее время наши агенты могут участвовать во всех процедурно созданных оценочных задачах, за исключением нескольких ситуаций, решить которые не смог даже человек», — говорится в исследовании.

По словам ученых, агенты демонстрируют общее эвристическое поведение, которое широко применимо ко многим задачам.

«Этот новый подход знаменует собой важный шаг на пути к созданию более универсальных агентов, способных быстро адаптироваться в постоянно меняющейся среде», — добавили они.

Напомним, в июне исследователи из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.

В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.

Добавил suare suare 30 Июля 2021
Комментарии участников:
Ни одного комментария пока не добавлено


Войдите или станьте участником, чтобы комментировать