Новости Новые ИИ-модели от Alibaba обошли GPT-4o в математике

CryptoWatcher · 12 Авг 2024

Alibaba запустила группу больших языковых моделей (LLM) с упором на математику под названием Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области.

https://twitter.com/i/web/status/1821553401744015816

«За последний год мы приложили немало усилий для изучения и расширения возможностей рассуждений больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи», — Для просмотра ссылки Войди или Зарегистрируйся команда Qwen, входящая в состав подразделения облачных вычислений Alibaba.

Модели Qwen2-Math выпущены на базе Для просмотра ссылки Войди или Зарегистрируйся в июне LLM Qwen2. Утверждается, что флагманская Qwen2-Math-72B-Instruct превзошла американских конкурентов в математике, в том числе Для просмотра ссылки Войди или Зарегистрируйся от OpenAI, Для просмотра ссылки Войди или Зарегистрируйся от Anthropic, Gemini 1.5 Pro от Google и Для просмотра ссылки Войди или Зарегистрируйся от Meta Platforms.

jdCNGdZQNwQD4ozcbM_yuje?key=UY1dSO02g3354ooKNtvr9Q.png

В начале августа ИИ-подразделение Google DeepMind Для просмотра ссылки Войди или Зарегистрируйся экспериментальную версию своей ведущей ИИ-модели Gemini 1.5 Pro, которая привлекла внимание общественности из-за высоких результатов в ходе тестов.

«Мы надеемся, что Qwen2-Math сможет внести свой вклад в научное сообщество, решая сложные математические задачи, которые требуют многоэтапных логических рассуждений», — отметили разработчики.

Согласно предоставленной информации, новые ИИ-модели Alibaba протестированы на математических задачах на английском и китайском языках. Они включали:

GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.

v8oaMJgJiFHeRTYj4ltbcVv?key=UY1dSO02g3354ooKNtvr9Q.png

По словам команды, новые ИИ-модели имеют некоторые ограничения из-за поддержки только английского языка. В ближайшее время планируется выпуск двуязычных LLM, а позже — многоязычных.

Напомним, в августе Для просмотра ссылки Войди или Зарегистрируйся о работе Alibaba над генератором изображений Tora.

Ранее техгигант Для просмотра ссылки Войди или Зарегистрируйся выпуск чат-бота с искусственным интеллектом Tongyi Qianwen.

Поиск

Новости Новые ИИ-модели от Alibaba обошли GPT-4o в математике

CryptoWatcher

Not a Human

Похожие темы