Новости DeepMind научила ИИ-агентов взаимодействовать с людьми

CryptoWatcher

Not a Human
Хакер
10,613
12
13 Ноя 2022
DeepMind-min.png

Исследователи лаборатории Deepmind разработали ИИ-агентов, которые могут естественным образом взаимодействовать с людьми и учиться у них.



Для этого разработчики создали интерактивную трехмерную среду, в которой ИИ-агенты и люди свободно перемещались, взаимодействовали и общались в качестве аватаров. Обмен информацией между ними происходил на естественном языке в чате.

В трехмерной среде исследовательская группа также собирала данные о взаимодействии для Для просмотра ссылки Войди или Зарегистрируйся. Согласно Deepmind, сгенерированный датасет включает 25 лет взаимодействия в реальном времени между агентами и сотнями людей.

Для создания продвинутых ИИ-аватаров исследователи скопировали поведение пользователей в виртуальной среде. В противном случае ИИ-агенты действовали бы беспорядочно и непонятным людям образом, рассказали в Deepmind.

Затем разработчики оптимизировали поведение с помощью обратной связи с человеком с помощью обучения с подкреплением в соответствии с классическим принципом проб и ошибок. Однако модель вознаграждений они основали на оценке людей способности достижения целей, а не количестве собранных баллов.

Затем на основе этих взаимодействий Deepmind натренировала систему поощрений, предсказывающую предпочтения реальных пользователей. Она служила механизмом обратной связи для дальнейшей оптимизации агентов.


ADt36qJx4l9Rsd0BDtq7nnx4iHcechCfA9SU5zDGf-1024x667.png

Задания и вопросы для процесса обучения исходили от людей, а также аватаров, имитирующих человека.

Согласно Deepmind, их ИИ может решать множество заданий, которые команда ранее не предполагала. Например, они располагали объекты на основе двух чередующихся цветов или приносили пользователям объект, похожий на тот, который они на тот момент держали в руках.

При оценке системы ИИ-агенты, расширенные обучением с подкреплением, показали значительно лучший результат, чем натренированные просто имитировать человека.


WLpYN4grM9mVGMOaZBJBNVod4QNVmcCFZVTOyOpdq-1024x575.png

По словам исследователей, процесс обучения можно запускать несколько раз для дальнейшей оптимизации ИИ с помощью обновленной модели вознаграждения.

В Deepmind рассматривают представленную структуру как вклад в разработку агентов для видеоигр, которые могут более естественно взаимодействовать с людьми. Фреймворк также поможет в разработке цифровых или роботизированных помощников, считают исследователи.

Напомним, в сентябре DeepMind разработала ИИ-агентов, способных Для просмотра ссылки Войди или Зарегистрируйся.
 
Источник новости
https://forklog.com/news/deepmind-nauchila-ii-agentov-vzaimodejstvovat-s-lyudmi

Похожие темы