Реклама АО ТаймВэб
Реклама АО ТаймВэб

Яндекс представил новое семейство моделей YandexGPT 5

Обсудить
Яндекс представила новое семейство моделей YandexGPT 5
Реклама. АО «ТаймВэб». erid: 2W5zFHc6Yji

Яндекс опубликовал новое семейство моделей YandexGPT 5, в том числе версию Pro, сопоставимую по мощностям с GPT-4o, и Lite Pretrain – большую языковую модель (LLM) на 8 млрд параметров с поддержкой контекста в 32 тысяч токенов. Кроме того, компания внедрила новую мощную нейросеть YandexGPT 5 Pro в чат с Алисой.

Семейство моделей YandexGPT 5

Семейство моделей YandexGPT 5 включает мощную языковую модель Pro и облегченную версию Lite. По данным замеров компании методом слепого сравнения (Side by Side, SBS), YandexGPT 5 Pro сравнима по качеству ответов с GPT-4o и в 64% случаев превосходит китайскую модель Qwen-2.5-32b-Instruct в решении стандартных задач.

Сравнение показателей YandexGPT 5 Pro с другими моделями в бенчмарках

Источник: Яндекс (здесь, далее и на обложке)

По результатам международных тестов и их адаптаций для русского языка, модель вплотную приблизилась к GPT-4o, а в ряде задач не уступает или превосходит ее по качеству. Представителям бизнеса YandexGPT 5 Pro доступна для интеграции на платформе Yandex Cloud AI Studio, также она используется в сервисе Yandex SpeechSense. С помощью этой нейросети можно классифицировать тексты и создавать ИИ-ассистентов, способных отвечать на вопросы на основе документов.

Заявлено, что YandexGPT 5 Lite Pretrain превосходит по качеству ответов зарубежные аналоги в большинстве бенчмарков. Она представляется как решение для разработчиков, бизнеса и научных исследователей, которые смогут дополнительно обучить нейросеть для оптимизации под свои задачи и не тратить время на создание собственной модели. К тому же, она компактна и не требует больших вычислительных мощностей.

Обучение YandexGPT 5 Lite Pretrain проводилось в два этапа. На первом этапе было обучение на русскоязычных и англоязычных текстах, коде, вычислениях и прочих сведениях общим объемом 15 трлн токенов, сопоставимых с 2,5 млрд веб-страниц. На втором этапе использовались высококачественные данные объемом 320 млрд токенов, в том числе тексты образовательной тематики.

Для обогащения знаний модели Яндекс улучшил метод отбора данных, чтобы использовать больше полезных текстовых материалов из интернета, не теряя в их качестве. В результате, Pretrain-версия получила достаточно обширные знания с пониманием контекста и закономерностей языка.

Комьюнити теперь в Телеграм
Подпишитесь и будьте в курсе последних IT-новостей
Подписаться

Обновленный чат с Алисой

Благодаря работе на базе модели YandexGPT 5 Pro в чате с Алисой теперь можно решать самые разные задачи, от образовательных до профессиональных. Кроме того, с ее помощью можно писать код, считать и выполнять задания на логику, при этом ответы стали гораздо точнее и с соблюдением заданного формата. Ответы, предоставляемые из поиска, выбираются из подходящих для российской аудитории источников с целью формирования релевантного ответа.

Работа новой YandexGPT 5 Pro в чате с Алисой

В блоге отметили, что YandexGPT 5 Pro в чистом виде уже доступна на alice.yandex.ru, в приложении Яндекс с Алисой, в мобильной и десктопной версии фирменного браузера, на умных устройствах, а в скором времени появится и в приложении Алиса. Чтобы все желающие могли протестировать Алису Про и саму модель, число бесплатных запросов временно увеличили с 5 до 20 в день. Для пользователей, имеющих подписку Про, ограничения отсутствуют.

Если человек настраивает сервер, это не новость; новость – если сервер настраивает человека.
Новый подкаст от Timeweb

Комментарии

С помощью соцсетей
У меня нет аккаунта Зарегистрироваться
С помощью соцсетей
У меня уже есть аккаунт Войти
Инструкции по восстановлению пароля высланы на Ваш адрес электронной почты.
Пожалуйста, укажите email вашего аккаунта
Ваш баланс 10 ТК
1 ТК = 1 ₽
О том, как заработать и потратить Таймкарму, читайте в этой статье
Чтобы потратить Таймкарму, зарегистрируйтесь на нашем сайте