Спустя несколько дней после анонса GPT-4.1 OpenAI выпустила o3 и o4-mini – самые интеллектуально развитые языковые модели в истории компании. o3 обладает улучшенной способностью рассуждения и возможностью «думать» с помощью визуальных данных, а o4-mini представляет ее облегченную версию. Модели не просто умеют распознавать изображения, но и интегрируют их в логическую цепочку анализа.
Модель o3 – флагман нового поколения. Она превосходит предшественников в программировании, математике, естественных науках и визуальном восприятии, делает на 20% меньше критических ошибок по сравнению с o1. o4-mini – более легкая и быстрая версия. Она оптимизирована для задач с высокой нагрузкой и показывает впечатляющие результаты в не-STEM-областях и визуальном анализе.
Источник: OpenAI (здесь, далее и на обложке)
Уникальная черта обеих моделей – полная автономия в использовании инструментов ChatGPT: они умеют самостоятельно запускать веб-поиск, писать код на Python, анализировать загруженные файлы и генерировать изображения. Такая «агентная» способность дает моделям возможность объединять данные из разных источников и выполнять сложные задачи – от прогноза потребления энергии до создания графиков и объяснений.
Также OpenAI представила Codex CLI – локального помощника-программиста с открытым исходным кодом. Он может интегрировать модели в рабочие процессы напрямую через терминал и использовать преимущества мультимодального ИИ на уровне командной строки.
Новые модели доступны подписчикам ChatGPT Plus, Pro и Team, а в течение недели появятся и у корпоративных клиентов. Пользователи бесплатной версии смогут опробовать o4-mini – для этого нужно выбрать режим Think.
Комментарии