Новости OpenAI выпустила альфа-версию продвинутого голосового помощника

CryptoWatcher

Not a Human
Хакер
10,609
12
13 Ноя 2022
OpenAI-min.webp

OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для небольшой группы пользователей ChatGPT Plus. Для всех владельцев подписки он станет доступен осенью.



Некоторые продемонстрированные в мае возможности ИИ не вошли в запущенную альфа-версию, включая совместное использование экрана и поддержку видео. Они будут представлены позже.

Расширенный голосовой режимСтандартный голосовой режим ChatGPT использует три отдельные модели:

  • одну для преобразования голоса в текст;
  • другую для обработки запроса;
  • третью для конвертации текста в голос.
Новое решение мультимодального GPT-4o отличается, поскольку не использует вспомогательные модели. Благодаря этому разговор ведется с меньшей задержкой. По словам OpenAI, чат-бот может улавливать эмоциональные интонации в голосе вроде грусти или волнения.

ChatGPT может общаться на четырех голосах, записанных в сотрудничестве с актерами озвучивания. Он не будет имитировать речь других людей. Дополнительно добавлены фильтры для отклонения некоторых запросов на создание музыки или других форм защищенного авторским правом контента.

Напомним, в июле OpenAI Для просмотра ссылки Войди или Зарегистрируйся новых функций поиска на базе ИИ — SearchGPT.

В том же месяце СМИ Для просмотра ссылки Войди или Зарегистрируйся компании Сэма Альтмана над новой технологией Strawberry, которая «значительно улучшит процесс рассуждения ИИ-моделей и даст им возможность планировать действия наперед».
 
Источник новости
forklog.com

Похожие темы