Сбер представил новую версию нейросети Kandinsky 2.2, в которой появилась возможность генерации реалистичных изображений с более высоким разрешением. Также разработчики обучили ИИ создавать стикеры, которые могут стать основой собственного стикерпака для мессенджера Telegram.
Помимо создания фотореалистичных изображений, в интерфейсе также добавлена возможность изменения соотношения сторон. Отмечено и улучшение качества при создании портретов. Для дополнительного обучения использовался датасет, содержащий 1,5 млрд пар «текст – изображение», что на 300 млн больше по сравнению с предыдущей версией. О выпуске предыдущей версии Kandinsky 2.1 мы ранее писали в Комьюнити.
Как Kandinsky 2.2 создает портреты
В блоге компании на Хабре сообщается и об обучении новой версии Kandinsky созданию стикеров – пример представлен ниже. А за счет внедрения структурного блока управляемых изменений ControlNet нейросеть может редактировать отдельные элементы или объекты по текстовому описанию, сохраняя при этом исходную композицию.
Пример создания стикера с помощью бота Kandinsky 2.2
Воспользоваться нейросетью можно не только на платформе FusionBrain.AI, но и с помощью ботов в мессенджере Telegram и в соцсети ВКонтакте. Также для желающих доступна команда «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.
Комментарии