Яндекс опубликовал новое семейство моделей YandexGPT 5, в том числе версию Pro, сопоставимую по мощностям с GPT-4o, и Lite Pretrain – большую языковую модель (LLM) на 8 млрд параметров с поддержкой контекста в 32 тысяч токенов. Кроме того, компания внедрила новую мощную нейросеть YandexGPT 5 Pro в чат с Алисой.
Семейство моделей YandexGPT 5
Семейство моделей YandexGPT 5 включает мощную языковую модель Pro и облегченную версию Lite. По данным замеров компании методом слепого сравнения (Side by Side, SBS), YandexGPT 5 Pro сравнима по качеству ответов с GPT-4o и в 64% случаев превосходит китайскую модель Qwen-2.5-32b-Instruct в решении стандартных задач.
Источник: Яндекс (здесь, далее и на обложке)
По результатам международных тестов и их адаптаций для русского языка, модель вплотную приблизилась к GPT-4o, а в ряде задач не уступает или превосходит ее по качеству. Представителям бизнеса YandexGPT 5 Pro доступна для интеграции на платформе Yandex Cloud AI Studio, также она используется в сервисе Yandex SpeechSense. С помощью этой нейросети можно классифицировать тексты и создавать ИИ-ассистентов, способных отвечать на вопросы на основе документов.
Заявлено, что YandexGPT 5 Lite Pretrain превосходит по качеству ответов зарубежные аналоги в большинстве бенчмарков. Она представляется как решение для разработчиков, бизнеса и научных исследователей, которые смогут дополнительно обучить нейросеть для оптимизации под свои задачи и не тратить время на создание собственной модели. К тому же, она компактна и не требует больших вычислительных мощностей.
Обучение YandexGPT 5 Lite Pretrain проводилось в два этапа. На первом этапе было обучение на русскоязычных и англоязычных текстах, коде, вычислениях и прочих сведениях общим объемом 15 трлн токенов, сопоставимых с 2,5 млрд веб-страниц. На втором этапе использовались высококачественные данные объемом 320 млрд токенов, в том числе тексты образовательной тематики.
Для обогащения знаний модели Яндекс улучшил метод отбора данных, чтобы использовать больше полезных текстовых материалов из интернета, не теряя в их качестве. В результате, Pretrain-версия получила достаточно обширные знания с пониманием контекста и закономерностей языка.
Обновленный чат с Алисой
Благодаря работе на базе модели YandexGPT 5 Pro в чате с Алисой теперь можно решать самые разные задачи, от образовательных до профессиональных. Кроме того, с ее помощью можно писать код, считать и выполнять задания на логику, при этом ответы стали гораздо точнее и с соблюдением заданного формата. Ответы, предоставляемые из поиска, выбираются из подходящих для российской аудитории источников с целью формирования релевантного ответа.
В блоге отметили, что YandexGPT 5 Pro в чистом виде уже доступна на alice.yandex.ru, в приложении Яндекс с Алисой, в мобильной и десктопной версии фирменного браузера, на умных устройствах, а в скором времени появится и в приложении Алиса. Чтобы все желающие могли протестировать Алису Про и саму модель, число бесплатных запросов временно увеличили с 5 до 20 в день. Для пользователей, имеющих подписку Про, ограничения отсутствуют.
Комментарии