Китайский технологический гигант Alibaba выпустил новое поколение языковых моделей Qwen 3 – семейство ИИ обладает открытой лицензией и конкурирует с решениями OpenAI и Google, а в ряде тестов показывает более высокие результаты.
Главная модель линейки – Qwen3-235B-A22B – включает 235 миллиардов параметров и построена на архитектуре MoE. ИИ способен самостоятельно решать, когда переключиться на режим рассуждений – как правило, это происходит, если пользователь ставит сложную задачу. Если же модели задают простой вопрос, она отвечает быстро. Такой подход позволяет экономить ресурсы и повышать производительность. В тестах на программирование и математику флагман Alibaba обошел DeepSeek-R1, o3-mini и Grok-3, уступив лишь Gemini 2.5 Pro от Google.
Источник: Alibaba (здесь и на обложке)
Кроме текстовой генерации Qwen3 умеет создавать изображения и видео: картинки – за несколько секунд, а короткие видеоролики – примерно за 5 минут. Также модель поддерживает 119 языков, среди которых есть русский.
Alibaba уже разместила открытый код версий Qwen3 на Hugging Face и GitHub – в том числе, для моделей от 600 млн до 32 млрд параметров. Использовать их можно в браузерной версии Qwen Chat и мобильном приложении.
Если учесть масштабное обновление обучающих данных в 36 триллионов токенов, улучшенную архитектуру и открытую лицензию Apache 2.0, в будущем Qwen 3 вполне способна стать альтернативой западным ИИ.
Комментарии