Исследователи находят уникальный способ обучения ИИ, исследуя жизнь малыша.
В новом исследовании, Для просмотра ссылки Войдиили Зарегистрируйся в журнале Science, ученые использовали записи из жизни полугодовалого ребенка, чтобы обучить искусственный интеллект пониманию языка. Эксперимент с записями малыша Сэма, который с помощью крепящейся на лоб камеры фиксировал свои ежедневные переживания в течение полутора лет, открыл новые возможности для понимания процесса обучения ребенка языку и концепциям.
В совокупности общий объем записей составил более 600 000 видеокадров в сочетании с 37 500 расшифрованными высказываниями. Хотя цифры кажутся большими, они составляют примерно 1% от ежедневной жизни Сэма в бодрствующем состоянии и незначительный объем по сравнению с объемом данных, используемых для обучения больших языковых моделей.
Ученые Для просмотра ссылки Войдиили Зарегистрируйся в своем пресс-релизе, что ИИ, получивший название Child’s View for Contrastive Learning (CVCL), способен улавливать связь между словами и их визуальными аналогами, имитируя процесс обучения малышей. Такой подход кардинально отличается от методов обучения больших языковых моделей (Large Language Model, LLM ), которым для развития навыков требуются триллионы слов из самых разных источников.
Авторы исследования использовали Для просмотра ссылки Войдиили Зарегистрируйся SAYCam, который использует видеозаписи, сделанные камерами на голове трех детей в возрасте от 6 до 32 месяцев. Дважды в неделю камеры, закрепленные на лбу детей, записывали около часа видео и аудио, включая взаимодействие ребенка с окружающим миром. Полученные данные стали основой для обучения ИИ, который научился связывать визуальные образы с соответствующими словами.
Девочка с камерой SAYCam, фиксирующей ее повседневную деятельность
Чтобы протестировать систему, команда адаптировала общий когнитивный тест, используемый для измерения языковых способностей детей. Они показали ИИ четыре новых изображения — кошку, кроватку, мяч и лужайку — и спросили, какое из них — мяч. В целом ИИ выбирал правильное изображение примерно в 62% случаев.
Производительность почти соответствовала современному алгоритму, обученному на 400 миллионах пар изображений и текста из Интернета — на порядки больше данных, чем было использовано для обучения ИИ в исследовании. Ученые обнаружили, что соединение видеоизображений со звуком имеет решающее значение. Когда команда перетасовала видеокадры и связанные с ними высказывания, модель полностью сломалась. ИИ также мог «думать» нестандартно и обобщать новые ситуации.
Результаты исследования открывают новые перспективы для понимания процесса обучения детей языку и могут способствовать разработке новых методов искусственного интеллекта, обучающихся подобно детям. В то же время, эксперты подчеркивают важность дальнейших исследований, включая социальные сигналы и рассуждения, для улучшения алгоритмов ИИ.
В новом исследовании, Для просмотра ссылки Войди
В совокупности общий объем записей составил более 600 000 видеокадров в сочетании с 37 500 расшифрованными высказываниями. Хотя цифры кажутся большими, они составляют примерно 1% от ежедневной жизни Сэма в бодрствующем состоянии и незначительный объем по сравнению с объемом данных, используемых для обучения больших языковых моделей.
Ученые Для просмотра ссылки Войди
Авторы исследования использовали Для просмотра ссылки Войди
Девочка с камерой SAYCam, фиксирующей ее повседневную деятельность
Чтобы протестировать систему, команда адаптировала общий когнитивный тест, используемый для измерения языковых способностей детей. Они показали ИИ четыре новых изображения — кошку, кроватку, мяч и лужайку — и спросили, какое из них — мяч. В целом ИИ выбирал правильное изображение примерно в 62% случаев.
Производительность почти соответствовала современному алгоритму, обученному на 400 миллионах пар изображений и текста из Интернета — на порядки больше данных, чем было использовано для обучения ИИ в исследовании. Ученые обнаружили, что соединение видеоизображений со звуком имеет решающее значение. Когда команда перетасовала видеокадры и связанные с ними высказывания, модель полностью сломалась. ИИ также мог «думать» нестандартно и обобщать новые ситуации.
Результаты исследования открывают новые перспективы для понимания процесса обучения детей языку и могут способствовать разработке новых методов искусственного интеллекта, обучающихся подобно детям. В то же время, эксперты подчеркивают важность дальнейших исследований, включая социальные сигналы и рассуждения, для улучшения алгоритмов ИИ.
- Источник новости
- www.securitylab.ru