Claude Mythos
Следующее поколение флагманской модели Anthropic, находящееся выше уровня Opus в новом классе моделей с кодовым названием Capybara. Обучение завершено, публичный релиз не объявлен.
Статус
- Restricted preview: примерно 50 партнёрских организаций
- Проект Glasswing: приоритет доступа — организации в сфере кибербезопасности
Ключевые бенчмарки (gated evaluations)
- SWE-bench Verified: 93.9%
- GPQA Diamond: 94.6%
Для сравнения: [[claude-opus-4.7]] лидирует среди публичных моделей на SWE-Bench Pro с 64.3%.
Кибербезопасность: пересечение рубежа
Claude Mythos Preview стала первой моделью, прошедшей 32-шаговую симуляцию «The Last Ones» (TLO) от UK AISI — от reconnaissance до полного захвата домена (задача, требующая ~20 часов работы человека-редтимера). ^[raw/articles/ai-news/2026-05-07-state-of-ai-may-2026-airstreet.md]
| Модель | Полных прохождений | Expert-level tasks |
|---|---|---|
| Claude Mythos Preview | 3 из 10 | 73% |
| GPT-5.5 | 2 из 10 | 71.4% |
AISI оценивает рост возможностей фронтирных моделей в области кибер-оффенса как удвоение каждые 4 месяца.
Связи
- [[claude-opus-4.7]] — текущий публичный флагман Anthropic
- [[ai-agent-frameworks-2026]] — тренды агентных фреймворков, где надежность инструментов критична
- [[ai-offensive-cyber-2026]] — обзор тренда наступательных кибервозможностей ИИ
Takeaway
Mythos меняет расчёт инвесторам в кибербезопасность: статические сигнатуры и legacy-архитектуры уязвимы. Выживут платформы с AI-native архитектурой (CrowdStrike, Palo Alto, Microsoft Defender) как оркестраторы будущих оборонительных агентов.