Нейросеть Imagen работает по привычной для таких систем схеме: пользователь задает текстовое описание, а нейросеть предлагает подходящую картинку. Пока оценить это в действии невозможно – компания не предоставила широкого доступа, а лишь анонсировала возможности.
Вот несколько примеров, которые Google предлагает оценить: под каждым изображением можно увидеть словесный запрос, данный Imagen.
Изображение: imagen.research.google
В описании нейросети сказано, что изначально она генерирует изображение 64x64 пикселя, после чего последовательно улучшает его, дорисовывает детали и выдает итоговый результат в формате 1024x1024 пикселя.
Отмечается, что нейросеть Imagen – это прямой конкурент аналогичной разработке DALL-E 2 от компании OpenAI. К примеру, на этапе тестирования разработчики предлагали фокус-группе сравнить изображения, которые создали Imagen, DALL-E 2 и две других модели. В итоге многие выбирали картинки, сгенерированные нейросетью Google.
Команда Google также останавливается на вопросе этики, который всегда возникает при создании подобных моделей. Речь идет про использование нейросетью различных данных в процессе обучения, в том числе неприемлемого и оскорбительного контента, который она также может предлагать в качестве результата. Разработчики решили не проводить публичную демонстрацию Imagen, пока не получат дополнительных гарантий о безопасной работе нейросети.
Комментарии