Следующее поколение флагманской модели Anthropic, находящееся выше уровня Opus в новом классе моделей с кодовым названием Capybara. Обучение завершено, публичный релиз не объявлен. · Статус…

Claude Mythos

Следующее поколение флагманской модели Anthropic, находящееся выше уровня Opus в новом классе моделей с кодовым названием Capybara. Обучение завершено, публичный релиз не объявлен.

Статус

Restricted preview: примерно 50 партнёрских организаций
Проект Glasswing: приоритет доступа — организации в сфере кибербезопасности

Ключевые бенчмарки (gated evaluations)

SWE-bench Verified: 93.9%
GPQA Diamond: 94.6%

Для сравнения: [[claude-opus-4.7]] лидирует среди публичных моделей на SWE-Bench Pro с 64.3%.

Кибербезопасность: пересечение рубежа

Claude Mythos Preview стала первой моделью, прошедшей 32-шаговую симуляцию «The Last Ones» (TLO) от UK AISI — от reconnaissance до полного захвата домена (задача, требующая ~20 часов работы человека-редтимера). ^[raw/articles/ai-news/2026-05-07-state-of-ai-may-2026-airstreet.md]

Модель	Полных прохождений	Expert-level tasks
Claude Mythos Preview	3 из 10	73%
GPT-5.5	2 из 10	71.4%

AISI оценивает рост возможностей фронтирных моделей в области кибер-оффенса как удвоение каждые 4 месяца.

Связи

[[claude-opus-4.7]] — текущий публичный флагман Anthropic
[[ai-agent-frameworks-2026]] — тренды агентных фреймворков, где надежность инструментов критична
[[ai-offensive-cyber-2026]] — обзор тренда наступательных кибервозможностей ИИ

Takeaway

Mythos меняет расчёт инвесторам в кибербезопасность: статические сигнатуры и legacy-архитектуры уязвимы. Выживут платформы с AI-native архитектурой (CrowdStrike, Palo Alto, Microsoft Defender) как оркестраторы будущих оборонительных агентов.