В исходной версии GauGAN система могла создавать изображения из грубого наброска, а теперь алгоритмы научились рисовать картины, используя всего 3-4 слова пользователя.
В основе ИИ лежит модель глубокого обучения, которая способна генерировать иллюстрации по короткой фразе. Причем она может реагировать и «перерисовывать» изображения, если добавить в словосочетание описательное прилагательное или изменить одно слово.
Посмотреть демонстрацию работы GauGAN2 можно здесь. Пользователь способен задать сюжет, а затем редактировать объекты, подстраивая их под себя. А вот так будут выглядеть два изображения, созданных только по текстовым фразам «winter forest» и «sunny winter forest»:
Создатели этой нейросети использовали возможности суперкомпьютера NVIDIA Selene и обучали GauGAN2 на 10 млн пейзажных изображений. Как отмечает компания, их разработка способна обеспечить большее количество сюжетов и более высокое качество создаваемых иллюстраций в сравнении с другими моделями, превращающими текст в картинку.
Напомним, летом NVIDIA представила приложение Canvas, где можно было рисовать на виртуальном холсте.
Комментарии