Уже совсем скоро каждый владелец мохнатого питомца сможет понять, что у него на уме.
Исследователи из Университета Мичигана, Национального института астрофизики Мексики и Института оптики и электроники используют модели искусственного интеллекта для расшифровки языка собак. Для просмотра ссылки Войдиили Зарегистрируйся представленное на международной конференции, демонстрирует, как современные ИИ-модели могут помочь людям в понимании животных.
Рада Михалча, директор Лаборатории ИИ Университета Мичигана, подчеркнула значимость этого исследования: «Мы многого не знаем о животных, с которыми делим этот мир. Достижения в области ИИ могут революционизировать наше понимание общения животных».
Для исследования использовалась передовая модель распознавания речи Wav2Vec2, способная определять эмоции, пол и породу собаки по лаю. Были использованы два разных набора данных для обучения и сравнения: один обучен исключительно на собачьих лаях, другой — на человеческой речи и доработан на лаях.
Модель, предварительно обученная на 1000 часах записей человеческой речи, показала лучшие результаты. После доработки на наборе данных, включающем вокализации 74 собак (42 чихуахуа, 21 французский пудель и 11 шнауцеров), она смогла определить эмоции с точностью 62%, породу — с точностью 62%, пол — с точностью 69%, и конкретную собаку среди группы — с точностью 50%.
Эти результаты превышают показатели модели, обученной только на собачьих лаях, что указывает на то, что звуки и паттерны, выявленные в человеческой речи, могут стать основой для понимания животных.
Предыдущие исследования показывают, что звуки, издаваемые обезьянами и луговыми собачками (грызунами из семейства беличьих), можно предсказать по контексту. Исследователи предполагают, что вокализация собак также тесно связана с контекстом.
В этом исследовании к эмоциям собак были отнесены агрессивный лай, обычный лай, негативные визги и ворчание. Несмотря на то, что собаки испытывают гораздо больше эмоций, именно эти звуки были представлены в наборе данных.
Михалча отметила: «Используя модели обработки речи, первоначально обученные на человеческой речи, наше исследование открывает новое окно в том, как можно использовать уже созданные технологии для понимания нюансов собачьих лаяний».
Исследователи из Университета Мичигана, Национального института астрофизики Мексики и Института оптики и электроники используют модели искусственного интеллекта для расшифровки языка собак. Для просмотра ссылки Войди
Рада Михалча, директор Лаборатории ИИ Университета Мичигана, подчеркнула значимость этого исследования: «Мы многого не знаем о животных, с которыми делим этот мир. Достижения в области ИИ могут революционизировать наше понимание общения животных».
Для исследования использовалась передовая модель распознавания речи Wav2Vec2, способная определять эмоции, пол и породу собаки по лаю. Были использованы два разных набора данных для обучения и сравнения: один обучен исключительно на собачьих лаях, другой — на человеческой речи и доработан на лаях.
Модель, предварительно обученная на 1000 часах записей человеческой речи, показала лучшие результаты. После доработки на наборе данных, включающем вокализации 74 собак (42 чихуахуа, 21 французский пудель и 11 шнауцеров), она смогла определить эмоции с точностью 62%, породу — с точностью 62%, пол — с точностью 69%, и конкретную собаку среди группы — с точностью 50%.
Эти результаты превышают показатели модели, обученной только на собачьих лаях, что указывает на то, что звуки и паттерны, выявленные в человеческой речи, могут стать основой для понимания животных.
Предыдущие исследования показывают, что звуки, издаваемые обезьянами и луговыми собачками (грызунами из семейства беличьих), можно предсказать по контексту. Исследователи предполагают, что вокализация собак также тесно связана с контекстом.
В этом исследовании к эмоциям собак были отнесены агрессивный лай, обычный лай, негативные визги и ворчание. Несмотря на то, что собаки испытывают гораздо больше эмоций, именно эти звуки были представлены в наборе данных.
Михалча отметила: «Используя модели обработки речи, первоначально обученные на человеческой речи, наше исследование открывает новое окно в том, как можно использовать уже созданные технологии для понимания нюансов собачьих лаяний».
- Источник новости
- www.securitylab.ru