Google представила новую модель для генерации изображений Nano Banana 2 (Gemini 3.1 Flash Image). Она сочетает высокую скорость работы с продвинутыми возможностями модели Nano Banana Pro.
Нейросеть использует базу знаний о мире у Gemini и актуальные данные Google Поиска, тем самым повышая точность при создании объектов, инфографики, диаграмм и визуализаций. Для сложных задач разработчикам добавили настройку «уровня мышления» ИИ перед началом отрисовки, но только через Google AI Studio.
Nano Banana 2 лучше работает с текстом, генерирует четкие надписи на картинке, умеет переводить и локализовать текст прямо внутри изображения с сохранением визуального стиля.

Источник: Google (здесь, далее и на обложке)
Заявлено, что модель сохраняет сходство до 5 персонажей и точно воспроизводит до 14 объектов в одном рабочем процессе. Она строго следует сложным запросам, поддерживает разные форматы и разрешения вплоть до 4K. Дополнительно в модели улучшено освещение, текстуры стали детализированнее, повышена фотореалистичность картинок.

Nano Banana 2 разворачивается в приложении Gemini, где заменит Nano Banana Pro в режимах Fast, Thinking и Pro, а также в поиске Google и других сервисах корпорации. Разработчики смогут интегрировать ИИ с поддержкой разрешений до 4K через Google AI Studio, Gemini API, Vertex AI, Firebase и платформу Google Antigravity.
В этой же новости компания сообщила о развитии системы проверки происхождения контента. Технология SynthID, применяемая в Gemini для выявления ИИ-контента, скоро получит поддержку совместимости со стандартом C2PA. По итогу она предоставит более детальную информацию о том, как именно создавался тот или иной материал с помощью ИИ.
Комментарии