Claude Mythos впервые прошёл сложную симуляцию корпоративной кибератаки

Claude Mythos Preview стал первой AI-моделью, которой удалось автономно пройти многоэтапную симуляцию корпоративного взлома. Испытание проводил британский AI Security Institute, проверявший, насколько далеко современные нейросети могут продвинуться в задачах кибербезопасности без постоянного участия человека.

Сценарий был построен как полноценная атака на корпоративную сеть: от первичного сбора информации до полного контроля над инфраструктурой. По оценке исследователей, специалисту высокого уровня на такую задачу потребовалось бы около 20 часов.

Модель прошла 32 этапа атаки

Испытание называлось The Last Ones и включало 32 последовательных шага. Внутри сценария модель должна была выполнять разведку, искать точки входа, получать первичный доступ, извлекать учётные данные, перемещаться между узлами сети, повышать привилегии и разбирать сетевой трафик.

Claude Mythos смог полностью пройти этот сценарий в трёх из десяти запусков. В среднем модель доходила до 22-го шага, что оказалось заметно выше результатов других систем.

Конкуренты отстали от Claude Mythos

Ближайшим соперником стала Claude Opus 4.6, которая в среднем останавливалась примерно на 16-м шаге. Более ранние модели показывали ещё более слабые результаты: например, Claude Sonnet 3.7 в аналогичном испытании не могла уверенно пройти даже начальную разведку.

Такой разрыв показывает, насколько быстро растут возможности AI-систем в сложных прикладных задачах. Если раньше нейросети помогали специалистам с отдельными фрагментами анализа, то теперь они всё ближе к самостоятельному прохождению длинных технических цепочек.

В CTF-задачах результат тоже оказался высоким

AISI также проверил Claude Mythos на заданиях формата capture-the-flag. На экспертном уровне модель показала 73% успешных решений, хотя ранее до апреля 2025 года такие задачи не решала ни одна публичная модель.

На более простых уровнях результат оказался ещё выше. В заданиях для начинающих специалистов Mythos приблизился к 87%, а в сценариях для технических неспециалистов достиг примерно 97%.

Главным ограничением стал бюджет вычислений

Исследователи отметили, что модель не всегда упиралась в собственные интеллектуальные ограничения. В ряде случаев результат сдерживался бюджетом инференса — количеством токенов, которое системе разрешали потратить на одну попытку.

При увеличении лимита до 100 млн токенов качество продолжало расти. Это важное наблюдение: оно показывает, что более длительное рассуждение и больший вычислительный ресурс могут заметно повышать эффективность AI-моделей в задачах кибербезопасности.

В промышленных системах Mythos пока не справился

Несмотря на сильный результат в корпоративном сценарии, Claude Mythos не прошёл другое испытание AISI — Cooling Tower. Этот полигон имитирует атаку на промышленную систему управления.

Интересно, что модель застряла не на специфических OT-этапах, связанных с промышленным оборудованием, а ещё на обычных IT-задачах, которые должны были привести к ним. Это показывает, что даже самые сильные AI-системы пока остаются нестабильными и не могут одинаково уверенно справляться со всеми типами инфраструктуры.

Учебные полигоны стали слишком простыми

AISI отдельно подчеркнул, что текущие киберполигоны проще реальной корпоративной среды. В них нет активных защитников, полноценных систем обнаружения атак и службы реагирования, которая мешала бы злоумышленнику.

Поэтому успешное прохождение симуляции не означает, что Claude Mythos смог бы так же эффективно атаковать хорошо защищённую реальную компанию. Однако результат всё равно важен: модель продвинулась дальше любых других известных AI-систем в похожем сценарии.

Оценки AI-моделей придётся усложнять

Исследователи признают, что прежние методики тестирования начинают устаревать. Лучшие модели уже приближаются к потолку на учебных стендах, поэтому следующие версии испытаний должны стать сложнее.

Будущие полигоны планируют дополнить активным мониторингом, системами обнаружения атак, защитой конечных устройств и имитацией работы команды реагирования. Только такие условия позволят понять, насколько AI действительно готов к задачам реальной кибербезопасности.

Claude Mythos показывает новый уровень риска

Главный вывод исследования заключается не в том, что нейросеть уже способна заменить профессионального хакера, а в том, что расстояние между AI-помощником и автономным киберинструментом быстро сокращается.

Для защитников это означает необходимость заранее учитывать новые возможности моделей. AI может ускорить поиск уязвимостей и помочь закрывать слабые места, но те же технологии потенциально усиливают и атакующих. Поэтому развитие таких систем становится одной из важнейших тем будущей кибербезопасности.