Google запустила новый инструмент Whisk, в котором можно создавать изображения без использования традиционных текстовых подсказок. Вместо этого пользователь сможет отправлять картинки в качестве вводных данных для получения их переработанных вариантов.
В сервисе пользователи смогут задать объект, сцену и стилистику изображения, отправляя для этого отдельные референсы. Есть даже возможность комбинирования нескольких образцов для каждой категории. Сервис же примет их и смешает для получения нужного эффекта.
Источник (здесь, далее и на обложке): Google
Инструмент функционирует на базе модели Gemini, которая при загрузке исходных картинок автоматически формирует их подробное описание. Эти сведения передаются в модель Imagen 3, которая, по заявлению компании, может генерировать картинки с еще большей детализацией, лучшим освещением и меньшим числом отвлекающих артефактов.
В сервисе можно настроить текстовую подсказку, чтобы не потерять существенные элементы на выходе. Разработчики предупреждают, что он не всегда может попадать в задуманный результат. Для этого реализована возможность просмотра и редактирования базовых текстовых подсказок на любом этапе генерации.
Пока Whisk доступен по программе раннего тестирования только для пользователей из США, зарегистрированным в программе Google Labs. На этом этапе привлекаются художники и представители других творческих профессий.
Комментарии