Яндекс представил новое поколение своей фирменной нейросети YandexART 2.0, о чем рассказал в своем блоге. Модель научилась добавлять надписи прямо на изображениях, придерживаться единой стилистики картинки. Представителям бизнеса могут подойти новые функции по созданию логотипов или этикеток, иллюстраций для сайта или постов в социальные сети.
Новое поколение YandexART основано на собственной разработке компании – это гибридная архитектура модели, сочетающая качество работы сверточной и трансформерной нейросетей. И если первая работает по принципу человеческого глаза, определяя на картинке края, текстуры и формы, то вторая учитывает длинный контекст. В сочетании повышается точность обработки и следования текстовым запросам.
Источник: блог Яндекса (здесь, далее и на обложке)
Обучение нейросети проводилось на сотнях миллионов пар картинок и текстовых описаний к ним. Чтобы повысить качество этих текстов и сделать их более точными, Яндекс использовал собственную VLM-модель. Она анализировала изображения и детально описывала, что на них находится. YandexART 2.0 обучили на улучшенных сведениях, что помогло ИИ учитывать больше деталей из запроса пользователя.
Измерение качества работы нейросети проводилось по новой системе оценки, созданной в Яндексе. Она включает четыре основных параметра: релевантность, эстетичность, дефектность и комплексность, то есть сложность и детализация картинки. По таблице ниже видно, что YandexART 2.0 выиграла у Midjourney v6.1 в 66% случаев по критерию комплексности, а в 58% – по эстетичности.
Представителям бизнеса YandexART 2.0 уже доступна на облачной платформе Yandex Cloud. Ее можно использовать через API, чтобы интегрировать генерацию изображений в свои приложения, а также протестировать в демо-режиме, чтобы подобрать оптимальный промт.
Пользователи же могут использовать функционал нейросети нового поколения в чате с виртуальным ассистентом Алисой при подключении опции Про. Им доступна возможность безлимитной генерации изображении в мобильной и десктопной версии в разных форматах, при этом создание картинок будет занимать всего несколько секунд.
Комментарии