Claude Mythos

Следующее поколение флагманской модели Anthropic, находящееся выше уровня Opus в новом классе моделей с кодовым названием Capybara. Обучение завершено, публичный релиз не объявлен.

Статус

  • Restricted preview: примерно 50 партнёрских организаций
  • Проект Glasswing: приоритет доступа — организации в сфере кибербезопасности

Ключевые бенчмарки (gated evaluations)

  • SWE-bench Verified: 93.9%
  • GPQA Diamond: 94.6%

Для сравнения: [[claude-opus-4.7]] лидирует среди публичных моделей на SWE-Bench Pro с 64.3%.

Кибербезопасность: пересечение рубежа

Claude Mythos Preview стала первой моделью, прошедшей 32-шаговую симуляцию «The Last Ones» (TLO) от UK AISI — от reconnaissance до полного захвата домена (задача, требующая ~20 часов работы человека-редтимера). ^[raw/articles/ai-news/2026-05-07-state-of-ai-may-2026-airstreet.md]

МодельПолных прохожденийExpert-level tasks
Claude Mythos Preview3 из 1073%
GPT-5.52 из 1071.4%

AISI оценивает рост возможностей фронтирных моделей в области кибер-оффенса как удвоение каждые 4 месяца.

Связи

  • [[claude-opus-4.7]] — текущий публичный флагман Anthropic
  • [[ai-agent-frameworks-2026]] — тренды агентных фреймворков, где надежность инструментов критична
  • [[ai-offensive-cyber-2026]] — обзор тренда наступательных кибервозможностей ИИ

Takeaway

Mythos меняет расчёт инвесторам в кибербезопасность: статические сигнатуры и legacy-архитектуры уязвимы. Выживут платформы с AI-native архитектурой (CrowdStrike, Palo Alto, Microsoft Defender) как оркестраторы будущих оборонительных агентов.