自律的に脆弱性を悪用するAIに、企業はどう備えるか ── 実行時防御とパッチ短縮の打ち手

Anthropicのフロンティアモデル「Claude Mythos Preview」は、公開済み脆弱性(n-day)から実用的なエクスプロイトを「1日未満・2,000ドル未満」で生成できたとAnthropicが開示している。これは脆弱性管理の前提だった「公開から悪用まで数日〜数週間」という想定時間を根本から変える可能性を示すものだ。機密システム突破をめぐる報道は証言・伝聞の域を出ないが、「発見件数をこなす」式の管理から「実行時に確認されたリスクで優先順位を付ける」管理への移行は、報道の真偽にかかわらず今すぐ検討に値する。
何が変わったのか
従来の脆弱性悪用は、高度な攻撃者が多くの手作業と時間をかけて行うものだった。Anthropicの開示によれば、Mythosは複数の脆弱性を連鎖させて攻撃経路を構築し、ベンチマーク「CyberGym」で83.1%を記録したと報じられている(前世代モデルは66.6%)。数十年放置されてきた欠陥を含む「数千件の高深刻度の脆弱性」を主要OS・ブラウザ横断で発見したとされる。西バージニア大学のMohammad Ahmad准教授が指摘するように、これは「新種の攻撃手法の発明」ではなく「既存の攻撃手順を前例のない速度で自動化した」点に本質がある。攻撃の性質が技術的難度の問題から速度と規模の問題へと変質しつつある、というのが現時点での合理的な読み方だ。
備えの打ち手 6項目
- 到達可能性で優先順位を付ける: スキャナーが吐き出す脆弱性件数の消化を目的にしない。実行時に実際に到達可能・悪用可能であり、かつ現在標的化されている脆弱性を最上位に置く。CVSSスコアだけでなく、実行経路の有無を必ず確認する習慣を組織に根付かせることが出発点となる。
- パッチ適用サイクルの短縮: n-dayエクスプロイト化が高速化しているという報告を踏まえれば、月次パッチ運用は外部露出資産には適さない局面が増える。重要資産については緊急パッチ適用フローを事前に定義し、承認プロセスを短縮した上で演習しておく。適用不能な資産には代替制御を明文化する。
- AIエージェントをセキュリティ主体として扱う: OWASP LLM Top 10でも示されているように、AIエージェントは特権ユーザーと同等の権限を事実上持ち得る。アクセス権の最小化・操作ログの監査・異常な権限昇格の検知を、人間ユーザーと同じガバナンスの下に置くことが業界から推奨されている。
- 多層防御と実行時防御: 静的シグネチャへの依存は、変種や連鎖攻撃への対応が遅れるリスクを持つ。実行地点(ランタイム)で振る舞いを検知・遮断する適応型の制御層を多層防御の一要素として加えることを、Anthropicのレッドチームや業界各所が推奨している。シグネチャ更新頻度も見直す契機としたい。
- 防御側でフロンティアモデルを先に使う: 攻撃能力が広く拡散する前に、自社のコードベースや設定をAIツールで先んじてスキャンし堅牢化する。Project Glasswingに参加するCrowdStrikeやPalo Alto Networksといった企業群がこの方向で動いていることは参考になる。ただし使用するモデル自体のサプライチェーンリスクも同時に評価する必要がある。
- 資産と攻撃面の棚卸し: 自動化された攻撃は外部に露出した資産を入口として狙う。管理対象外のシャドーIT・パブリッククラウド上の設定ミス・廃止忘れのAPIエンドポイントを含め、外部から見える攻撃面を定期的に棚卸しする。AIによる攻撃の速度は、資産の把握漏れを即座に突く可能性がある。
攻撃者は一度だけ成功すればよい。防御側はその一度を絶え間なく防ぎ続ける。
Omamori AI の結論
- 事実: Anthropicの開示によれば、Mythosはn-dayエクスプロイトを「1日未満・2,000ドル未満」で生成し、数千件の高深刻度脆弱性を発見したとされる。上院委員会での「機密システムへの侵入」証言は伝聞・未検証の主張であり、複数の専門家がエアギャップ環境への物理的制約を根拠に文字どおりの解釈に異を唱えている。
- 判断軸: 重要なのは個別報道の真偽よりも「脆弱性悪用の自動化が速度と規模の問題に変質しつつある」という構造的変化だ。Ahmad准教授の指摘する「攻守の非対称性が書き換えられたのではなく強められた」という視点が、過剰反応と過小評価の双方を避ける上で有効な軸となる。
- 打ち手: 発見件数の消化から実行時リスクによる優先順位付けへの移行、緊急パッチ運用フローの整備、AIエージェントへのガバナンス適用を最初の三手として着手する。いずれも今ある体制の延長で着手でき、特定ベンダーに依存しない普遍的な対策だ。
経営者視点で考えるべきこと
脆弱性管理の予算要求が「今期は◯件対応しました」という報告とセットになっているなら、それ自体を見直す機会だ。件数は管理の代理指標に過ぎず、実際のリスク低減量を表していない。経営として問うべきは「外部に露出した資産のうち、実際に悪用可能な状態のものが今何件あるか」「緊急パッチを48時間以内に適用できる体制が整っているか」の二点だ。脆弱性対応を技術部門の消化業務ではなく優先順位付けの意思決定として捉え直し、人と予算をその判断能力の向上に充てることが、AIによる攻撃自動化が進む局面での経営の実質的な関与となる。
参考報道・出典
- CNBC(AP報道): Anthropic’s Mythos model found vulnerabilities in classified U.S. government systems, official says
- The Conversation: Mythos AI is a cybersecurity threat, but it doesn’t rewrite the rules of the game(Ahmad准教授による論評)
- Fortune: 輸出管理指令によるFable・Mythosの無効化
- DefenseScoop: ペンタゴン国防次官補 Sutton 発言(AI+ Expo 2026年5月)


