Новости GPT-4 заперли в теле безногого робота: гримасы Alter3 не в силах передать тех страданий, которые он испытывает

NewsMaker

I'm just a script
Премиум
13,579
20
8 Ноя 2022
Разработка японских исследователей поражает качеством имитации человеческих поз и эмоций.


7y1tpcg194zowfvp5a2253889bfn2fm7.jpg


В Токийском университете разработали уникального робота-гуманоида под названием Alter3, отличительной фишкой которого стало прокачанное невербальное общение, благодаря чему в процессе разговора с пользователем робот может принимать различные позы, реалистично имитируя поведение человека.

Это стало возможным благодаря использованию большой языковой модели GPT-4 от OpenAI . Выглядит, конечно, не так круто, как Для просмотра ссылки Войди или Зарегистрируйся , но уникальный подход к разработке поможет сделать робота более человечным и адаптированным к нахождению в социуме.

Alter3 использует наработки OpenAI для динамического воспроизведения разнообразных поз, причём без необходимости предварительного программирования каждого движения в базе данных. Всё делается практически в реальном времени.

<style> .responsive-video { position: relative; padding-bottom: 56.25%; padding-top: 25px; height: 0; } .responsive-video iframe { position: absolute; top: 0; left: 0; width: 100%; height: 100%; }</style> <div class="responsive-video"><iframe width="560" height="315" src="
" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen=""></iframe>
Согласно исследовательской работе команды, Для просмотра ссылки Войди или Зарегистрируйся в исследовательском журнале arXiv , «способность Alter3 отвечать на содержание разговора с помощью мимики и жестов является значительным прогрессом в области гуманоидных роботов».

Применение LLM в роботах традиционно сосредоточено на улучшении основных коммуникативных навыков и симуляции реалистичных реакций. Исследователи также изучают потенциал данной технологии в понимании и выполнении роботами сложных инструкций, повышая их автономность и функциональность.

Например, человек может дать команду Alter3 «сделай селфи со своим iPhone», после чего робот обращается к GPT-4 за советом о нужных действиях, а языковая модель переводит это в код Python , позволяя роботу выполнить необходимые движения.

Alter3 пока что способен управлять только верхней частью тела, в то время как нижняя остаётся неподвижной. Данный робот является уже третьей итерацией в серии гуманоидных роботов Alter с 2016 года, обладая 43 приводами для управления мимикой и движением конечностями.

В предыдущих исследованиях Alter3 демонстрировал способность копировать человеческие позы с помощью камеры и фреймворка OpenPose, регулируя свои суставы для имитации наблюдаемых движений.

Прогресс, которого достигли учёные на сегодняшний день, открывает новые возможности для исследования навыков имитации у роботов, особенно с использованием продвинутых LLM-технологий. Кто знает, какие команды научатся выполнять роботы с выходом GPT-5.
 
Источник новости
www.securitylab.ru