Новости Llama 3.1 от NVIDIA: ИИ, способный понимать и адаптироваться

NewsMaker

I'm just a script
Премиум
13,095
20
8 Ноя 2022
NVIDIA представила усовершенствованную языковую модель .


330wh85x6hv9fal8ikz3w3t3mnz3mwh9.jpg


Компания NVIDIA Для просмотра ссылки Войди или Зарегистрируйся усовершенствованной версии крупной языковой модели Llama 3.1-Nemotron-70B-Instruct. Новая разработка призвана значительно повысить качество и эффективность взаимодействия искусственного интеллекта с пользователями.

Главной особенностью обновленной модели стала её способность генерировать более полезные и релевантные ответы на запросы пользователей. Модель построена на базе архитектуры Transformer и поддерживает обработку впечатляющего объема данных – до 128 тысяч токенов на входе и 4 тысяч токенов на выходе.

В процессе разработки специалисты NVIDIA использовали комбинированный подход к обучению модели, включающий как человеческие данные, так и синтетические материалы. Для тренировки было задействовано более 20 тысяч пар запросов и ответов, а еще тысяча использовалась для валидации. Основной целью такого обучения было создание модели, которая может предоставлять более достоверные, логичные и полезные ответы пользователям.

Важным преимуществом новой версии стала её совместимость с широким спектром аппаратного обеспечения NVIDIA, включая архитектуры Ampere, Hopper и Turing. Модель оптимизирована для работы на различных GPU, от мощных H100 до более доступных A100.

Разработчики уделили особое внимание этическим аспектам использования технологии. NVIDIA подчеркивает важность ответственного подхода к развитию искусственного интеллекта и призывает разработчиков тщательно оценивать соответствие модели требованиям конкретной отрасли и предусматривать возможные риски неправильного использования.

Модель доступна для коммерческого использования при условии согласия с лицензионным соглашением Llama 3 и политикой конфиденциальности Meta. Компания также запустила платформу для сообщения о потенциальных уязвимостях и проблемах безопасности, связанных с использованием модели.
 
Источник новости
www.securitylab.ru

Похожие темы