Реклама ООО Таймвэб
Реклама ООО Таймвэб

Сбер запустил обновленную нейросеть Kandinsky 2.1

Обсудить
Сбер запустил нейросеть Kandinsky 2.1, создающую изображения по описанию

Разработчики Сбера представили новую версию нейросети Kandinsky – отечественного аналога популярного алгоритма Midjourney. Модель можно использовать для создания или дорисовки изображений по текстовому описанию. Доступ к ней открыт всем желающим пользователям.

Нейросеть может также смешивать несколько рисунков, изменять их по текстовому описанию, генерировать иллюстрации, похожие на заданные, и даже формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Отмечено, что модель понимает запросы на 101 языке, включая русский и английский, и умеет рисовать в различных стилях.

Разработку и обучение Kandinsky 2.1 проводили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices.

ИИ-модель дополнительно обучали на 170 млн парах «текст – изображение» высокого разрешения к уже имеющемуся набору в 1 млрд аналогичных пар. Затем проводилось дообучение на отдельно собранном датасете из 2 млн пар изображений. В этот сет также попали картинки с описаниями в таких областях, как тексты и лица людей.

Пример работы нейросети Kandinsky 2.1

Пример работы нейросети Kandinsky 2.1

Нейросеть усовершенствовали с помощью новой обученной модели автоэнкодера, используемой и в качестве декодера векторных представлений изображений. Именно это решение позволило достичь высокого разрешения при генерации картин. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.

Первая версия Kandinsky была представлена еще в июне 2022 г. Тогда это была улучшенная версия нейросети ruDALL-E, генерирующей картинки по описанию на русском языке. В ноябре того же года Сбер запустил Kandinsky 2.0 на международной конференции по искусственному интеллекту Artificial Intelligence Journey, о чем мы писали в Комьюнити.

Если человек настраивает сервер, это не новость; новость – если сервер настраивает человека.
Новый подкаст от Timeweb

Комментарии

С помощью соцсетей
У меня нет аккаунта Зарегистрироваться
С помощью соцсетей
У меня уже есть аккаунт Войти
Инструкции по восстановлению пароля высланы на Ваш адрес электронной почты.
Пожалуйста, укажите email вашего аккаунта
Ваш баланс 10 ТК
1 ТК = 1 ₽
О том, как заработать и потратить Таймкарму, читайте в этой статье
Чтобы потратить Таймкарму, зарегистрируйтесь на нашем сайте