На этой неделе команда Яндекса представила прототип своей нейросети, которая способна генерировать изображения по текстовому описанию. Сейчас протестировать ее способности можно в мобильных приложениях для Android и iOS: нужно скачать Шедеврум, отправить заявку и дождаться подтверждения.
В блоге Яндекса отмечено, что Шедеврум понимает русский и английский языки, любит конкретику, способен подражать известным художникам и работать в определенном стиле. Нейросеть создает картинки по методу каскадной диффузии, т.е. сначала формирует изображения по запросу, а затем постепенно увеличивает их разрешение, насыщая деталями.
База для обучения первой бета-версии модели – 240 млн примеров «текст – картинка», сейчас обучение продолжается на наборе данных из 500 млн примеров. Разработчики Яндекса отмечают, что это только первые шаги в развитии их генеративной нейросети, и в будущем с помощью Шедеврума можно будет создавать баннеры, иллюстрации и изображения для интернет-витрин.
Пример работы Шедеврума по запросам «Ночь, улица, фонарь, аптека», «Рыцари любят есть артишоки» и «Уютный маленький дом на облаках». Изображение: yandex.ru
В приложении есть лента готовых работ: их можно лайкать – самые популярные попадут в топ на отдельной вкладке. Создавать изображения самостоятельно можно после одобрения заявки, в будущем эта возможность появится у всех зарегистрированных пользователей.
Ранее мы писали про еще одну российскую нейросеть – Kandinsky 2.1 от Сбера, которая также была представлена на этой неделе.
Комментарии