В конце апреля 2025 года OpenAI представила GPT Image 1 – ИИ-модель для генерации изображений. Новый инструмент сразу стал популярным – всего за неделю пользователи сгенерировали с его помощью больше 700 миллионов изображений. Давайте разберемся, почему эта нейросеть так быстро завоевала рынок и как ей пользоваться на русском языке.
Что такое GPT Image 1
GPT Image 1 – это нейросеть от OpenAI, которая превращает текстовые запросы в детализированные изображения. В ее основе лежит модель GPT-4o, способная понимать сложные описания и воплощать их в визуальной форме. ИИ анализирует контекст и генерирует картинки, сохраняя баланс между точностью и творческой свободой.
Что умеет GPT Image 1:
-
Генерировать изображения по тексту. Просто сформулируйте идею – и ИИ воплотит ее в жизнь. Хотите космический закат над океаном или кота в шляпе магната? Опишите – GPT Image 1 создаст визуализацию с проработанными деталями.
-
Следовать стилю. Можно уточнить: «в духе Ван Гога», «как мрачный фэнтези-арт» или «фотореалистичный портрет». Модель поймет и подстроится.
-
Работать с референсами. Загрузите изображение – и нейросеть добавит что-то в том же духе или доработает исходник. Например, превратит ваш набросок в законченную иллюстрацию.
Главные преимущества GPT Image 1 – модель понимает, что именно хочет увидеть пользователь. Она хорошо учитывает логику сцены: если попросить ее нарисовать «кофе с дымящейся чашкой на деревянном столе», напиток не окажется на полу, и пар будет выглядеть естественно. Это особенно заметно при сравнении с другими ИИ, где такие огрехи – обычное дело.
Как пользоваться GPT Image 1
Сайт OpenAI не работает в России, поэтому протестировать GPT Image 1 можно только на площадках-агрегаторах нейросетей. Ниже – пошаговая инструкция, как сделать генерацию в одном из телеграм-ботов с ИИ.
Шаг 1. Заходим в бота MazAi. В меню нажимаем /start. Затем кликаем на пункт «Создать фото»:
Шаг 2. Выбираем «GPT Image 1»:
Шаг 3. Знакомимся с возможностями нейросети. Есть два варианта работы – отправить текстовый запрос или добавить до 10 фотографий и попросить ИИ объединить их в одну картинку:
Шаг 4. Пишем промпт. Добавляем максимум деталей. Я сделала такой запрос: «Молодая женщина в развевающемся розовом сарафане стоит на травянистом склоне холма, ветер развевает ее волосы и ткань. За ее спиной вдаль простирается эпический пейзаж. Возвышающиеся скалы, полевые цветы и золотое небо. Снято на 50-миллиметровый объектив с малой глубиной резкости, мягким освещением и кинематографической композицией. Сверхреалистичная текстура и естественные тона кожи».
Шаг 5. Получаем картинку. Вот результат генерации по моему запросу:
Если вы не планируете создавать за раз много картинок, то пользоваться ботом MazAi можно бесплатно. На старте всем подписчикам дается 10 000 токенов, еще по 5000 можно получить за каждого приглашенного друга. На одну генерацию в GPT Image 1 у меня ушло 4800 токенов.
Попробуйте оживить картинку
За счет высокой детализации изображения от GPT Image 1 отлично для этого подходят. В меню бота можно выбрать пункт «Создать видео», а затем кликнуть на название любой нейросети из списка:
Я чаще генерирую видео в Kling, поэтому и сейчас выберу эту модель. Нейросеть работает с текстовыми запросами, картинками и гибридными промптами (текст + картинка). Результат получился максимально реалистичным – посмотреть можно по ссылке на RuTube. А здесь прикреплю скрин:
Поделитесь в комментариях, как вам GPT Image 1? Понравился, или всё же Midjourney лучше?
Комментарии