Компания Anthropic представила обновлённую версию флагманской языковой модели Claude Opus 4.8, которая отличается повышенной точностью в кодинге, способностью дольше работать без вмешательства пользователя и более честной оценкой собственных результатов. Модель доступна по той же цене, что и предыдущая версия.
Anthropic обновила свою флагманскую модель Claude Opus до версии 4.8, сделав акцент на улучшении автономности и качества работы с кодом. По данным компании, новая версия набрала 69,2% в бенчмарке SWE-bench Pro — на 4,9 процентных пункта больше, чем Opus 4.7, и опережает GPT-5.5 от OpenAI (62%). Модель также стала заметно «честнее»: она в четыре раза реже пропускает ошибки в собственном коде и чаще признаёт неопределённость в своих выводах.
Ключевое нововведение — функция «динамических рабочих процессов» (dynamic workflows), доступная в режиме предварительного просмотра в инструменте Claude Code. Она позволяет модели самостоятельно планировать сложные задачи, распределять их между сотнями параллельных суб-агентов и проверять результаты перед отправкой пользователю. Как отметил сооснователь Anthropic Майк Кригер (Mike Krieger), эта функция уже использовалась для масштабных проектов, включая портирование кодовой базы Bun с Zig на Rust (около 750 тыс. строк кода) за 11 дней.
Opus 4.8 работает в режиме «высоких усилий» по умолчанию, что требует примерно столько же токенов, сколько и предыдущая версия, но обеспечивает лучшие результаты. Для особо сложных задач можно переключиться на режим «экстра-высоких усилий» (xhigh), для которого в Claude Code увеличены лимиты на токены. Борис Черни (Boris Cherny), сотрудник Anthropic, подчеркнул, что динамические процессы особенно эффективны для крупных рефакторингов и миграций — работ, которые обычно откладываются из-за высоких трудозатрат.
Модель также получила улучшения в работе с системными инструкциями: разработчики теперь могут обновлять их в процессе выполнения задачи без сброса кэша промптов. Это упрощает адаптацию модели к меняющимся требованиям без необходимости начинать диалог заново. В ближайшие недели Anthropic планирует выпустить для всех клиентов модели класса Mythos, о которых упоминалось в анонсе.
«Opus 4.8 — это наша рекомендуемая модель для ежедневного использования в Claude Code», — заявила представитель Anthropic Кэт Ву (Cat Wu). По её словам, модель лучше распознаёт нюансы и эффективнее взаимодействует с пользователями в задачах от кодинга до аналитической работы.