Spot теперь не просто бегает и танцует. Он и разговаривает!
Мы видели, как Spot бегает, прыгает и даже танцует... но теперь мы можем видеть, как Spot разговаривает. В немного тревожном видео, опубликованном Boston Dynamics, робот-собака был украшен цилиндром, усами и глазами на пружинках. Он общается с сотрудниками компании с британским акцентом, проводя их по территории компании. "Начнем наше путешествие?" - спрашивает Spot. "Станции зарядки, где роботы Spot отдыхают и заряжаются, - наша первая точка интереса. Следуйте за мной, господа". Как показано в демонстрации, Spot способен отвечать на вопросы и даже открывает свой "рот", чтобы создать иллюзию разговора.
Для того чтобы Spot "разговаривал", Boston Dynamics использовала API ChatGPT от OpenAI, а также некоторые открытые модели большого языка для тщательного обучения его ответов. Затем они оснастили робота динамиком, добавили функции текста в речь и сделали так, чтобы его "рот" имитировал речь "как рот куклы".
Мэтт Клингенсмит, главный инженер-программист в Boston Dynamics, говорит, что команда дала Spot "очень краткий сценарий" для каждой из комнат в своих помещениях. Затем робот сочетал этот сценарий с изображениями, которые он получает от камер на своем захвате и теле, что позволяло ему "получать больше информации о том, что он видит, прежде чем формировать ответ". Согласно компании, Spot использует модели визуального ответа на вопросы, чтобы по сути подписывать изображения и отвечать на вопросы о них.
Видео также показывает, что Spot может принимать на себя различные личности, включая археолога 1920-х годов, подростка и путешественника времени в стиле Шекспира. Он даже проявляет саркастическую личность, которая, когда ее попросили придумать хайку, сказала: "Генератор тихо гудит в комнате, лишенной радости. Как и моя душа".
Boston Dynamics говорит, что обнаружила несколько сюрпризов при экспериментировании со Spot в качестве экскурсовода. В одном случае команда спросила Spot, кто его "родители", и он подошел к месту, где старые модели Spot выставлены в офисе компании.
"Мы рады продолжать изучение пересечения искусственного интеллекта и робототехники", - пишет Клингенсмит в сообщении на сайте Boston Dynamics. "Эти модели могут помочь предоставить культурный контекст, общие знания здравого смысла и гибкость, которые могут быть полезны для многих робототехнических задач".
Несмотря на то что Spot может звучать и выглядеть довольно смешно в видео, трудно не думать о способности робота-собаки открывать двери и следить за людьми. В конце концов, он используется в качестве инструмента для полиции и армии.
<iframe width="560" height="315" src="
" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen=""></iframe>
Мы видели, как Spot бегает, прыгает и даже танцует... но теперь мы можем видеть, как Spot разговаривает. В немного тревожном видео, опубликованном Boston Dynamics, робот-собака был украшен цилиндром, усами и глазами на пружинках. Он общается с сотрудниками компании с британским акцентом, проводя их по территории компании. "Начнем наше путешествие?" - спрашивает Spot. "Станции зарядки, где роботы Spot отдыхают и заряжаются, - наша первая точка интереса. Следуйте за мной, господа". Как показано в демонстрации, Spot способен отвечать на вопросы и даже открывает свой "рот", чтобы создать иллюзию разговора.
Для того чтобы Spot "разговаривал", Boston Dynamics использовала API ChatGPT от OpenAI, а также некоторые открытые модели большого языка для тщательного обучения его ответов. Затем они оснастили робота динамиком, добавили функции текста в речь и сделали так, чтобы его "рот" имитировал речь "как рот куклы".
Мэтт Клингенсмит, главный инженер-программист в Boston Dynamics, говорит, что команда дала Spot "очень краткий сценарий" для каждой из комнат в своих помещениях. Затем робот сочетал этот сценарий с изображениями, которые он получает от камер на своем захвате и теле, что позволяло ему "получать больше информации о том, что он видит, прежде чем формировать ответ". Согласно компании, Spot использует модели визуального ответа на вопросы, чтобы по сути подписывать изображения и отвечать на вопросы о них.
Видео также показывает, что Spot может принимать на себя различные личности, включая археолога 1920-х годов, подростка и путешественника времени в стиле Шекспира. Он даже проявляет саркастическую личность, которая, когда ее попросили придумать хайку, сказала: "Генератор тихо гудит в комнате, лишенной радости. Как и моя душа".
Boston Dynamics говорит, что обнаружила несколько сюрпризов при экспериментировании со Spot в качестве экскурсовода. В одном случае команда спросила Spot, кто его "родители", и он подошел к месту, где старые модели Spot выставлены в офисе компании.
"Мы рады продолжать изучение пересечения искусственного интеллекта и робототехники", - пишет Клингенсмит в сообщении на сайте Boston Dynamics. "Эти модели могут помочь предоставить культурный контекст, общие знания здравого смысла и гибкость, которые могут быть полезны для многих робототехнических задач".
Несмотря на то что Spot может звучать и выглядеть довольно смешно в видео, трудно не думать о способности робота-собаки открывать двери и следить за людьми. В конце концов, он используется в качестве инструмента для полиции и армии.
<iframe width="560" height="315" src="
- Источник новости
- www.securitylab.ru