Яндекс представил Alice AI LLM Flash – это более легкая и быстрая версия флагманской нейросети Alice AI LLM, оптимизированная под популярные задачи бизнеса. Новая модель уже доступна для пользования в рамках Yandex AI Studio.
Новая модель подходит для решения однотипных задач, требующих быстрого ответа, например, в диалогах, при модерации контента или классификации обращений, также других вариантах обработки большого количества данных. В том числе она подходит для работы с документами, так как по статистике компании это почти 60% от всех b2b-запросов к их фирменным моделям.
Новая модель позволит малому бизнесу использовать нейросети с минимальными затратами, а крупным компаниям она подойдет для экономии на обработке массовых запросов при сохранении качества и высокой скорости выдачи ответов. В блоге Яндекса в качестве целевой аудитории отметили банки, ритейлеров, операторов связи и другие компании с большим объемом однотипных задач.
По результатам внутренних замеров, Alice AI LLM Flash в 56% случаев превосходит нейросеть GPT-5.4 mini по качеству решения бизнес‑задач. При этом она сохраняет все преимущества флагманской модели Alice AI LLM, превосходя GPT-5.4 mini в диалоговых сценариях в 73% случаев, обобщении и структуризации текста в 66% случаев, и в поиске данных по файлам и базам знаний в 61%. Важный момент – речь идет о сравнительных данных самого Яндекса, в то время как независимых публичных бенчмарков, подтверждающих эти цифры, на момент анонса нет.
Параллельно с собственной разработкой компания открыла доступ к модели DeepSeek V4 Flash. По словам компании, это первая в России доступная в облаке модель с контекстным окном в 1 млн токенов.
Комментарии