Сбер добавил в GigaChat возможность редактирования изображений – об этом рассказали в блоге компании на Хабре. Функционал доступен на сайте и в Telegram. Заявлено, что нейросеть сохраняет детали исходного снимка.
Для реализации данного функционала компания отдельно разработала и внедрила в GigaChat модель Malvina (Multimodal Artificial Language VIsion Neural Assistant). Она «попиксельно» редактирует только определенные участки изображения изображения. Внутренние тесты Сбера показали, что модель превосходит Gemini и GPT-4o, генерирующие картинку с нуля.
Источник: Сбер (здесь, далее и на обложке)
Модель Malvina предлагают использовать для реставрации старых фотографий, удаления лишних объектов, замены фона, также изменения образа и внешности.
Чтобы отредактировать фото в Telegram-боте, нужно сделать следующее:
- открыть диалог с GigaChat;
- выбрать в меню пункт «Редактирование картинок»;
- прислать изображение и написать, что конкретно требуется изменить;
- дождаться завершения генерации, после при необходимости продолжить редактирование или сохранить результат. Также можно начать заново, нажав на кнопку «Перезапустить диалог».
Чтобы получить нужный результат, команда GigaChat рекомендует более точно описывать требуемые изменения. Если результат не подходит, можно перефразировать запрос. В случае внесения сложных изменений их следует вносить поэтапно.
Комментарии