Китайская компания Alibaba представила большую языковую модель Qwen 3.5 с открытыми весами. В компании называют ее нативной мультимодальной моделью и рассказывают о достижении весомых показателей в ряде бенчмарков.
Модель содержит 397 млрд параметров, из которых активно используются только 17 млрд. Все это возможно благодаря гибридной архитектуре, повышающей скорость и стоимость работы без потери в производительности. Еще разработчики увеличили число поддерживаемых языков и диалектов со 119 до 201.
В официальном пресс-релизе отмечено, что Qwen3.5-397B-A17B хорошо справляется с задачами, связанными с обработкой текста, программированием, рассуждениями и мультимодальным пониманием. Вдобавок новая нативная мультимодальная нейросеть качественно выполняет агентские задачи.
Некоторые тесты новинка проходит лучше конкурентов. Например, в расширенной версии теста MMLU-Pro на 12 тысяч вопросов с 10 вариантами ответов на каждый Qwen3.5-397B-A17B набирает 87,8 балла – это на 0,4 балла меньше, чем у GPT-5.2, обновленной модели от OpenAI. Есть и бенчмарки, в которых нейросеть обходит прямых конкурентов – к примеру, в C-Eval Qwen3.5 превзошла Claude 4.5 Opus и Gemini 3 Pro.

Источник: Qwen AI (здесь и на обложке)
Модель Qwen 3.5 доступна в бесплатном чат-боте компании Qwen Chat и через API, также данные по ней опубликовали на платформах HuggingFace, GitHub и ModelScope. В рамках фирменного чат-бота Qwen она работает в трех режимах – «автоматический», «режим размышления» и «быстрый».
Комментарии