Компания OpenAI завершила марафон анонсов презентацией моделей нового поколения – o3 и o3-mini. Улучшенные нейросети обладают способностью «рассуждать» перед выдачей ответа. Размышления позволяют разбивать запросы на мелкие задачи и выдавать более точные ответы.
OpenAI назвала новую линейку о3 и пропустила имя о2 намеренно – чтобы избежать конфликтов с британской компанией О2.
Модели o3 и o3-mini значительно превосходят предшественника o1 под кодовым названием Strawberry. В тесте ARC-AGI, который оценивает способность ИИ осваивать навыки за пределами обучающих данных, o3 достигла 87,5% – это выше среднего результата человека (85%). Версия o3 обогнала главного специалиста OpenAI в спортивном программировании, также модель на 22% быстрее пишет код. А еще – она справилась с одним из сложнейших математических экзаменов AIME 2024 и пропустила в нем только один вопрос.
Источник: OpenAI
В The Verge отмечают, что при работе с нейронкой пользователи могут самостоятельно настраивать время для «рассуждений»: чем больше его выделить, тем точнее будут ответы. Впрочем, такой подход требует значительных вычислительных мощностей – это делает модель дороже в эксплуатации.
Пока o3 и o3-mini доступны только для тестирования специалистам по безопасности. Полноценный релиз запланирован на 2025 год: o3-mini появится в январе, позднее будет представлена o3.
Ранее OpenAI уже удивила пользователей выпуском мощной модели o1 и эксклюзивной подпиской ChatGPT Pro за $200. Однако, как утверждают разработчики, новые модели поднимают производительность ИИ на совершенно новый уровень.
Изображение на обложке: Unsplash
Комментарии