Anthropic、Claude Fable 5 を一般公開 ― 「Mythos級」フロンティアモデルがセーフティ分類器付きで解禁

admin · 2026年6月11日 · 7 min read

Claude Fable 5 — Mythos-class frontier model, now public with classifiers. Illustrations by Storyset — Illustration: Storyset (line, brand-recolored)

2026年6月9日、AnthropicはClaude Fable 5を一般公開した。「Mythos級」と称されるフロンティアモデルの基盤能力が、セーフティ分類器を装備した形でAPIおよびエンタープライズプランを通じて誰でも利用できる状態になった。高性能モデルへのアクセス民主化と、デュアルユースリスクの管理責任が同時に問われる局面に入った。

何が発表されたのか

Anthropicは2026年6月9日、Claude Fable 5とClaude Mythos 5の2モデルを同日発表・公開した。Fable 5はAPIと従量課金エンタープライズプランで即日提供が開始され、既存のサブスクリプションプランには6月22日まで追加費用なしで含まれる（以降は利用クレジットが必要で、容量次第で延長の可能性がある）。Mythos 5は米国政府との協働プログラム「Project Glasswing」を通じて、サイバーセキュリティのパートナーに限定して提供される。両モデルとも100万トークンのコンテキストウィンドウと最大12.8万トークンの出力に対応し、長コンテキスト利用でも価格は変動しない。ソフトウェア開発、知識労働、ビジョン、科学研究でいずれも高性能を示すとされ、Stripeは「数ヶ月分の開発を数日に圧縮した」と報告している。

Fable と Mythos の違い ― 能力は同じ、分けるのは安全策

FableとMythosは同一の基盤モデルを共有しており、基盤能力に差はない。両者を分けるのは安全策の有無だけである。モデル名の由来もその設計思想を反映している。Fableはラテンのfabulaからギリシャ語のMythosへと通じる語で、「語られるもの」という同根の意味を持つ。Fable 5はこの基盤モデルを一般利用向けに安全化したもの、Mythos 5は一部領域の安全策を解除したものと位置づけられる。Mythos 5のサイバーセキュリティ領域の安全策はProject Glasswing参加のサイバーパートナー向けに解除されており、バイオ・化学領域の安全策を外す信頼アクセスプログラムも今後予定されている。フロンティア能力へのアクセス範囲を制度的に段階管理する、という設計方針が両モデルの命名と提供体制に一貫して現れている。

安全制御の仕組み

Fable 5のセーフティ分類器は3領域をカバーする。①攻撃的サイバー・エクスプロイト作業を遮断するサイバーセキュリティ領域、②大半のリクエストを遮断するバイオ・化学領域、③競合モデル向けの能力抽出（蒸留）を遮断する領域、である。分類器がフラグを立てたリクエストはClaude Opus 4.8に自動フォールバックされる。Anthropicはこのフォールバックについて「Fableセッションの95%超では一切発生しない」と説明している。なおMythos級モデルは安全目的で全トラフィックを30日間保持する。レッドチームについては、外部バグバウンティで1000時間超のテストが実施され「普遍的なジェイルブレイク（universal jailbreak）」は発見されていない。ただし英国AI安全機構（UK AISI）は短い初期テスト期間で「それに近づく進展」を示したとされており、完全な耐性を主張できる状況にはない。

セキュリティ視点での論点

今回の発表が持つ構造的な意味は、「能力を削減して安全を保つ」のではなく「能力を保ったままガードレールで制御する」という設計思想の選択にある。フロンティアモデルの能力をそのままに、分類器とフォールバックで出力を制御するアーキテクチャは、制御精度が高ければ有効だが、分類器を迂回するプロンプト設計が洗練されるにつれ、その有効性は継続的な更新を要する。攻撃的サイバー活動の支援を遮断するとされる一方、Mythos 5ではその制御がサイバーパートナー向けに解除されており、Claude Mythos Previewが示した脆弱性の自律発見能力がより広い範囲に開放される方向性にある。組織のセキュリティ担当者が認識すべきは、社員がFable 5を業務利用する際に送信するプロンプトの内容と、そのデータが30日間保持されるという事実の両面である。デュアルユースリスクは「悪意ある外部者」の問題に留まらず、自組織からの情報流出経路としての側面も持つ。

価格と提供

価格は入力100万トークンあたり$10、出力100万トークンあたり$50。これはMythos Previewの半額未満、Opus 4.8の2倍の水準とされる。コンテキストは100万トークン、最大出力は12.8万トークン。長コンテキスト利用でも追加費用は発生しない。APIと従量課金エンタープライズプランで即日利用可能。サブスクリプションプランでは6月22日まで追加費用なしで利用できるが、以降は利用クレジットが必要となる。

能力の解放は制御の精度と常に等速で進まない。

Omamori AI の結論

事実: Anthropicは2026年6月9日、Mythos級の基盤能力を持つClaude Fable 5を一般公開した。セーフティ分類器（サイバー・バイオ化学・蒸留の3領域）とOpus 4.8へのフォールバック機構を備えるが、UK AISIは短期テストで普遍的ジェイルブレイクに近づく進展を確認しており、制御の完全性は保証されていない。
判断軸: 「ガードレール付き高性能モデル」の導入可否は、能力の有用性だけでなく、プロンプトに含まれる情報の機密性評価と、30日間のトラフィック保持を前提とした契約・コンプライアンス上の許容性を基準に判断すべきである。全社員がフロンティアモデルを利用できる前提で、情報分類とアクセスポリシーが整備されているかを確認する機会と捉えたい。
打ち手: 短期的には社内AIアクセスポリシーにFable 5の位置づけを明記し、機密・個人情報を含むプロンプト送信の制限ルールを更新する。中期的には外部サービスへのデータ送信に関するリスク評価プロセスに、長期データ保持条件を審査項目として追加することを推奨する。一次情報はAnthropic公式発表を参照。

経営者視点で考えるべきこと

フロンティアモデルが従量課金で即日利用可能になったことは、全社員が実質的にMythos級の能力を持つAIを業務に組み込める状態を意味する。善管注意義務の観点から問われるのは、この事実を前提とした情報資産管理体制の見直しが行われているかどうかだ。Fable 5を使う社員が送信するプロンプトには、顧客情報・契約内容・未公開の経営情報が含まれ得る。これらが30日間外部に保持されるリスクは、従来のSaaSサービスと同水準ではなく、AI特有の利用パターン（長文・反復・文脈連鎖）を考慮した評価が必要である。「生成AI利用ガイドライン」が既存のまま更新されていない組織では、Fable 5の提供開始を機に、利用可能サービスのリスト化、送信可能な情報分類の明文化、および違反時の対応手順の整備を取締役会レベルで確認することが求められる。

出典
・Anthropic 公式発表 — Claude Fable 5 & Mythos 5
・CNBC — Anthropic releases Fable 5 and Mythos 5
・NBC News — Fable 5: Anthropic releases public Mythos Claude model
・Simon Willison — Notes on Claude Fable 5

編集部

Omamori AI 編集部

CISO・情シス・経営層向けに、AIセキュリティの一次情報を編集視点で整理

記事の論点を、自社のリスク評価に

90秒の自己診断 or CISO/情シス向け月次レビュー（顧問契約）でアクションに繋げます。

無料 90秒自己診断顧問契約詳細