1Mコンテキスト・長時間自律実行のモデルを業務導入する前のセキュリティ統制7項目

Anthropicが2026年6月9日に公開したClaude Fable 5 の一般公開は、100万トークンのコンテキスト・最大12.8万トークンの出力・長時間の自律実行という三つの特性を同時に備える。能力の向上は業務効率に直結する一方、「一度の操作で扱える情報量と付与できる権限」が従来比で桁違いに広がることを意味する。本稿では、こうした高能力モデルを業務導入する前に情報システム担当者・CISOが確認すべき統制7項目を整理する。
なぜ高能力モデルほど統制設計が要るのか
100万トークンのコンテキストは、A4換算で数百ページ相当のドキュメントを一度に投入できることを意味する。社内規程・契約書・顧客データを束ねてプロンプトに渡す運用が技術的に可能になる結果、「何を入力してよいか」の判断が組織的に曖昧なまま運用が始まるリスクが高まる。従来のチャットモデルでは物理的に扱えなかった情報量が、今後は「入れようと思えば入れられる」状態になるからだ。さらに長時間自律実行は、人間が逐一承認しない状態でモデルが複数ステップの操作を連続して行うことを前提とする。ここで設計上の問題となるのは承認境界だ。ファイル作成・外部API呼び出し・メール送信といった操作を、どの時点で人間の確認を挟むかを事前に定義していなければ、エラーや意図しないデータ送出が連鎖しても検知が遅れる。モデルの賢さが増すほど「任せた結果の影響半径」も広がる。統制設計とはモデルを信頼しないことではなく、影響半径を経営が許容できる範囲に収める技術的・ガバナンス的な仕組みを整えることだ。企業文書を全部ぶち込む前の3リスクで詳述したように、大容量コンテキストへの情報投入は利便性と情報漏えいリスクをトレードオフの関係に置く。
導入前チェックリスト 7項目
- 投入データの機微度分類: 100万トークンに「何を入れてよいか」を組織のデータ分類ポリシーに照らして明示する。個人情報・営業秘密・未公開財務情報はコンテキストへの投入可否を使用目的・契約条件と照合したうえで書面で定める。分類が先、利用ルールはその後。
- 学習・データ保持の確認: Anthropicの公式発表によれば、Mythos 5 相当のモデルは安全目的で全トラフィックを30日間保持する。自社のデータ処理契約(DPA)がこの保持に対応しているか、保持期間中の第三者アクセス可否を契約レベルで確認しなければならない。
- 自律実行の承認境界: 外部へのデータ送信・ファイル削除・APIコール・メール送付など破壊的または不可逆的な操作については、モデルが単独で実行を完了させない設計にする。「確認ステップなしで実行できる操作の上限」を文書化し、エージェントフレームワークのツール定義に反映させる。
- フォールバック/拒否時の挙動把握: Fable 5 はセーフティ分類器がリクエストにフラグを立てた場合、自動的にClaude Opus 4.8 に切り替えて処理する設計だ。Anthropicはセッションの95%超でこの切り替えは発生しないと説明するが、切り替えが起きた場合の応答遅延・コスト変動・ログ上の識別方法を運用手順書に明記しておく。
- 権限とスコープの最小化: モデルに接続するツール(データベース・ファイルシステム・外部API)は、業務に必要な最小のスコープのみ付与する。読み取り専用で済む用途に書き込み権限を与えない。ツールごとに認可スコープを文書化し、定期的に棚卸しするプロセスを設ける。
- 利用ログの自社保全: ベンダー側の保持ポリシーに監査証跡を依存しない。プロンプト・レスポンス・実行したツール呼び出しの記録を自社管理のログ基盤に転送・保全する仕組みを構築する。インシデント発生時の調査と規制対応の両面で、自社ログは不可欠な証拠となる。
- 利用ポリシーと教育の更新: 高能力モデルの登場は既存のAI利用規程の想定を超えることが多い。長時間自律実行・大容量コンテキストの利用可否と手順を既存ポリシーに明示的に追記し、担当者向けに改訂内容の周知訓練を実施する。ポリシーは発行して終わりではなく、モデルの能力更新に合わせて見直し周期を短くする。
モデルの能力は上がる。承認境界は人間が設ける。
Omamori AI の結論
- 事実: Claude Fable 5 は100万トークンコンテキスト・長時間自律実行・セーフティ分類器によるフォールバック機構を備える。Mythos 5 はサイバーセキュリティ分野の安全策を解除した上位版であり、政府・限定パートナー向けの「Project Glasswing」経由での提供となる。外部バグバウンティの1000時間超のテストで普遍的なジェイルブレイクは発見されなかった一方、英国AI安全機構(UK AISI)の初期テストでは「それに近い進展」が示されたとCNBCが報じている。
- 判断軸: セーフティ機構の存在はリスクをゼロにするものではなく、リスクを「経営が受け入れられる水準に設計する」ための部品の一つにすぎない。投入データの機微度・自律実行の承認境界・ログの自社保全の三点が、内部統制として最も整備されていないケースが多い。ここを先に固めることが導入判断の前提となる。
- 打ち手: 本チェックリスト7項目を、AI活用推進部門・情報システム部門・法務・コンプライアンスが共同でレビューするワークショップを導入前に一度設ける。承認境界の定義とデータ分類ポリシーの更新を最優先タスクとし、完了後にパイロット運用に移行する段取りを組む。
経営者視点で考えるべきこと
Stripeが「数ヶ月分の開発を数日に圧縮した」とNBC Newsが伝えるように、高能力モデルが生産性に与えるインパクトは実績として出始めている。経営層がここで問うべきは「導入するかどうか」よりも「どの統制を整えてから導入するか」だ。コンテキスト長が100万トークンに達し自律実行が可能になると、業務プロセスの変化は単なる「ツール追加」ではなく、情報の流れと意思決定の一部をシステムに委譲する組織変更に近くなる。取締役会が問われるのは、その委譲範囲を経営として承認した証跡があるかどうかだ。CISO・情報システム担当者は、7項目のチェックリストを「技術的な作業リスト」としてではなく、「経営リスクの所在を明確化するための合意形成プロセス」として位置づけ、導入判断に先行して経営層と共有することが実務上の最善手となる。


