Google тестирует сервис Whisk для генерации картинок без промптов

Google запустила новый инструмент Whisk, в котором можно создавать изображения без использования традиционных текстовых подсказок. Вместо этого пользователь сможет отправлять картинки в качестве вводных данных для получения их переработанных вариантов.

В сервисе пользователи смогут задать объект, сцену и стилистику изображения, отправляя для этого отдельные референсы. Есть даже возможность комбинирования нескольких образцов для каждой категории. Сервис же примет их и смешает для получения нужного эффекта.

Пример изображения, созданном с помощью сервиса Whisk от Google

Источник (здесь, далее и на обложке): Google

Инструмент функционирует на базе модели Gemini, которая при загрузке исходных картинок автоматически формирует их подробное описание. Эти сведения передаются в модель Imagen 3, которая, по заявлению компании, может генерировать картинки с еще большей детализацией, лучшим освещением и меньшим числом отвлекающих артефактов.

В сервисе можно настроить текстовую подсказку, чтобы не потерять существенные элементы на выходе. Разработчики предупреждают, что он не всегда может попадать в задуманный результат. Для этого реализована возможность просмотра и редактирования базовых текстовых подсказок на любом этапе генерации.

Как сервис Whisk генерирует изображения

Пока Whisk доступен по программе раннего тестирования только для пользователей из США, зарегистрированным в программе Google Labs. На этом этапе привлекаются художники и представители других творческих профессий.

Google тестирует сервис Whisk для генерации картинок без промптов

Комментарии

Рекомендуем