Anthropic создали нейросеть Claude Sonnet 4.5 для программирования и решения сложных задач

Обсудить
Anthropic создали нейросеть Claude Sonnet 4.5 для программирования и решения сложных задач
Реклама. АО «ТаймВэб». erid: 2W5zFJNCRm2

Компания Anthropic разработала мощную языковую модель Claude Sonnet 4.5, ориентированную на программирование, решение сложных задач и создание ИИ-агентов. По итогам тестирования в профильных бенчмарках, ИИ демонстрирует значительный скачок в понимании программного кода, математических вычислениях и управлении компьютером.

Нейросеть Claude Sonnet 4.5 заняла первую строчку в отраслевом тесте SWE-bench Verified, измеряющем способности ИИ-моделей к написанию и анализу программного кода. Как сообщают разработчики, новинка может поддерживать концентрацию более 30 часов при работе над многоэтапными задачами, обходя предыдущие версии Claude и ближайших конкурентов.

Тесты ИИ Claude Sonnet 4.5 в SWE-bench Verified

Источник (здесь, далее и на обложке): Anthropic 

В тесте OSWorld, проверяющем выполнение искусственным интеллектом реальных компьютерных задач, Sonnet 4.5 показал результат 61,4 % против 42,2 % у версии Sonnet 4. 

Тесты ИИ Claude Sonnet 4.5 в OSWorld

Помимо этого, разработчики проводили внутренние независимые тесты, по итогам которых Sonnet 4.5 демонстрирует серьезный прогресс в задачах логического вывода и математики, а также в ряде специализированных областей, включая финансы, медицину, право и STEM-дисциплины. 

Был добавлен экспериментальный режим Imagine with Claude. В его рамках ИИ может создавать программные решения за короткий срок, адаптируя код под текущие запросы пользователя.

В Claude Sonnet 4.5 снизили число опасных и нежелательных паттернов поведения, такие как подыгрывание пользователю, попытки обойти ограничения или выполнение вредных запросов. Для защиты пользователей Anthropic применяет многоуровневые фильтры (AI Safety Level 3), особенно в отношении тем, связанных с химическими, биологическими, ядерными и другими видами оружия.

Сравнение по нежелательному поведению нейросетей

С выпуском Sonnet 4.5 представлены и крупные обновления экосистемы Claude. В сервисе Claude Code появились чекпоинты для сохранения прогресса, обновленный терминал и расширение для Visual Studio Code. В приложениях Claude можно работать с кодом, создавать таблицы, презентации или документы прямо в диалоге, а пользователи с подпиской Max получили расширение для Chrome.

Для разработчиков добавили набор инструментов Claude Agent SDK. С его помощью можно создавать собственных ИИ-агентов на базе тех же технологий, что лежат в основе Claude Code. SDK реализует сложную работу с памятью, управлением правами и координацией подзадач между агентами, позволяя создавать продвинутые решения под любые задачи.

Протестировать новинку можно через веб-версию чат-бота, а также в мобильных приложениях на iOS и Android. Также ИИ-модель доступна по API, стоимость ее использования – от 3 долларов за миллион токенов. Новые возможности Claude Code и Agent SDK доступны всем разработчикам и корпоративным клиентам.

Если человек настраивает сервер, это не новость; новость – если сервер настраивает человека.
Новый подкаст от Timeweb

Комментарии

С помощью соцсетей
У меня нет аккаунта Зарегистрироваться
С помощью соцсетей
У меня уже есть аккаунт Войти
Инструкции по восстановлению пароля высланы на Ваш адрес электронной почты.
Пожалуйста, укажите email вашего аккаунта
Ваш баланс 10 ТК
1 ТК = 1 ₽
О том, как заработать и потратить Таймкарму, читайте в этой статье
Чтобы потратить Таймкарму, зарегистрируйтесь на нашем сайте