Alibaba запустила группу больших языковых моделей (LLM) с упором на математику под названием Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области.
«За последний год мы приложили немало усилий для изучения и расширения возможностей рассуждений больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи», — Для просмотра ссылки Войди
Модели Qwen2-Math выпущены на базе Для просмотра ссылки Войди
В начале августа ИИ-подразделение Google DeepMind Для просмотра ссылки Войди
«Мы надеемся, что Qwen2-Math сможет внести свой вклад в научное сообщество, решая сложные математические задачи, которые требуют многоэтапных логических рассуждений», — отметили разработчики.
Согласно предоставленной информации, новые ИИ-модели Alibaba протестированы на математических задачах на английском и китайском языках. Они включали:
- GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
- OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
- GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.
По словам команды, новые ИИ-модели имеют некоторые ограничения из-за поддержки только английского языка. В ближайшее время планируется выпуск двуязычных LLM, а позже — многоязычных.
Напомним, в августе Для просмотра ссылки Войди
Ранее техгигант Для просмотра ссылки Войди
- Источник новости
- forklog.com