Компания Anthropic выпустила Claude Opus 4.8 и отдельно представила для Claude Code функцию динамических рабочих процессов.
Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors.Available today at the same price. pic.twitter.com/EufxL7T1kb— Claude (@claudeai) May 28, 2026
Инструмент позволяет ИИ самому писать оркестрационные скрипты, запускающие десятки или сотни параллельных субагентов, и проверять работу до передачи результата пользователю.
Он рассчитан на сложные задачи в крупных кодовых базах: аудит безопасности, поиск ошибок, миграция между фреймворками и языками программирования, модернизация проектов.
Функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии и расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry.
Запустить режим можно прямой командой на создание рабочего процесса или через ultracode. Он повышает уровень вычислительных усилий до максимального и позволяет модели самостоятельно решать, когда задействовать многошаговую схему.
В Anthropic предупредили: динамические рабочие процессы потребляют существенно больше токенов, чем стандартная сессия Claude Code.
Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет выводы после взаимной проверки и попыток опровергнуть найденные решения.
В качестве примера Anthropic привела перенос Bun с языка программирования Zig на Rust. Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода. Порт добился прохождения 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней. При этом Anthropic уточнила, что версия пока не используется в продакшене.
Показатели новой модели Opus 4.8:
69,2% в SWE-Bench Pro;
49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними;
83,4% в OSWorld-Verified;
1890 баллов в GDPval-AA;
53,9% в Finance Agent v2.
В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%.
В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю.
Напомним, в мае Anthropic опубликовала первый отчет по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos.