OpenAI DMCA削除要請事件 ― 学習データの責任範囲

Picsum ID: 25

OpenAI DMCA削除要請事件 ― 学習データの責任範囲

生成AIの普及は著作権法の根幹を揺るがしている。2023年12月のNYT v. OpenAI/Microsoft提訴以降、米国では出版社・作家・報道機関・画像事業者による訴訟が雪崩を打つ[1]。論点は三つ――学習データのスクレイピングはフェアユースか、出力の「逐語再現リスク」をどう評価するか、DMCA削除要請は「学習済みモデルの記憶痕跡」に届くのか。CISO・法務にとって他人事ではない。自社利用中の生成AIサービスを巡る訴訟の帰結が、利用契約・IP補償条項・社内ガイドラインの前提を根底から変えうるからだ(日本語:訴訟リスクは「ベンダー任せ」で済む段階を過ぎた)。

OpenAI/Microsoft等を被告とする訴訟群の全体像

主要訴訟を原告属性別に整理する。報道機関系:NYT v. OpenAI/MS(2023年12月)[1]、The Intercept・Raw Story v. OpenAI(2024年2月)[2]、Daily News等8紙連合(同4月)[3]、カナダ報道機関連合(同11月)[4]作家系:Authors Guild(Martin、Grisham他17名、2023年9月)[5]、Silverman/Kadrey v. OpenAI/Meta(同7月)[6]画像系:Getty Images v. Stability AI(米デラウェア・英国高等法院並行係属)[7]。共通骨格は「無許諾学習」「出力の逐語再現」「著作権管理情報(CMI)除去によるDMCA §1202違反」の三層主張だ。

代表事案――NYT、Authors Guild、Getty Imagesの論点

NYT v. OpenAIは訴状にChatGPTがNYT記事冒頭を数百語単位で逐語再現したスクリーンショット100例以上を添付[1]。OpenAIは2024年2月「原告は契約交渉決裂後にバグを誘発させた」と反論し、争点は誘発条件と市場代替性(フェアユース第4要素)に移った[8]Authors Guild v. OpenAIは書籍全文学習の「変容性」が争点で、2023年Warhol最高裁判決[9]の厳格化が直撃する。Getty Images v. Stability AIはGetty透かしの出力再現の具体性が高く、英国訴訟は2025年に一部判決が始動。米国フェアユース法理の射程外で判断されるため日米事業者双方に重い示唆を持つ[7]

DMCAとAI学習の関係――削除要請は「モデル」に届くのか

DMCA §512のセーフハーバーは「保管・送信する侵害コンテンツ」を通知削除する仕組みだが[10]、生成AIには二つの致命的ミスマッチがある。第一に、モデルパラメータは個別著作物を「保管」せず確率分布として「記憶」しており、特定削除は技術的困難・除外再学習は数千万ドル規模を要する。第二に §1202(CMI除去禁止)は学習過程でメタデータ剥落を問題視するが、現行モデルは訓練段階でCMIを保存する設計になっていない[2]。OpenAIは2023年8月にGPTBotのrobots.txt除外を可能にし[11]、2024年5月に権利者単位オプトアウトのMedia Manager構想を発表したが[12]リリースは延期続き。BraveはIndexNow派生のAIクローラ同意プロトコルを提案するが業界標準化には至らず[13]、立法解決待ちが続く。

日本30条の4・米国フェアユース・EU TDM例外の三極比較

各法域の免責規定は表面的に似るが運用射程が大きく異なる。自社AI活用がどの法域に服するかの把握が前提となる。

観点 日本(著作権法30条の4) 米国(フェアユース) EU(DSM指令3条・4条)
根拠 2018年改正・「享受目的でない利用」を広範に許容[14] 17 USC §107。4要素テストで個別判断[8] 2019年DSM指令3条(研究)/4条(商用)[15]
商用利用 原則可。ただし書で除外あり 個別判断。第4要素の比重増大 商用可だがオプトアウト有効
オプトアウト 明文規定なし[16] 規定なし 機械可読形式で明文化
出力責任 出力が複製・翻案なら侵害判断 学習・出力ともフェアユース評価 出力は各国一般則
事業者リスク RAG用途は「享受目的」認定リスク Warhol後は厳格化 オプトアウト未確認スクレイピングは違法

日本30条の4は「世界で最も寛容」とされたが、文化庁2024年3月「AIと著作権に関する考え方について」で、海賊版データ利用や特定著作物の再現を狙った学習はただし書で違法と明示された[16]。米国はWarhol判決[9]で変容性のハードルが上がりフェアユース防御の見通しが悪化。EUはオプトアウトが機械可読でなければ無効とする運用が固まりつつあり、robots.txt整備が事実上の遵守要件となる。

立法動向――ARTSAI Act、NO FAKES Act、生成AI透明化要件

米国議会では複数法案が並行審議中。NO FAKES Act(2024年提出・2025年再提出)は声・容姿のAI模倣を連邦規制しプラットフォームに通知削除義務を課す[17]。Schiff議員のGenerative AI Copyright Disclosure Actは学習データセットの著作権コンテンツリスト開示を義務化[18]。EUAI Act(2024年8月発効)は汎用AIモデル提供者に学習データの詳細要約公開と著作権遵守ポリシー策定を義務化[19]。日本も2024年AI事業者ガイドライン、2025年「AI関連技術の研究開発・活用推進法」成立で政府関与が強化された[20]

企業利用への示唆――契約・運用・ガバナンスの再設計

実務的含意は三点。第一に、利用LLM/画像生成サービスのIP補償条項を確認する。Microsoft Copilot Copyright Commitment[21]、OpenAI Copy Shield[22]、Google Cloud Generative AI Indemnification[23]は補償範囲・上限・前提条件(ガードレール維持等)が異なる。第二に、自社サイトのrobots.txt整備(GPTBot、ClaudeBot、CCBot、Google-Extended、PerplexityBot等)は対外的な「権利留保」表明として法的意味を持つ[11]。第三に、社内データ投入時は第三者著作物の混入リスクを切り分ける運用設計が要る(日本語:「社内文書だから安全」は通用しない)。

チェックリスト――AI訴訟リスクの自社診断5項目

  1. 利用LLMサービス契約にIP補償条項があり、補償発動の前提条件(ガードレール維持、出力検証義務等)を遵守できているか
  2. 自社サイトのrobots.txt/ai.txtがGPTBot・ClaudeBot・Google-Extended・CCBot等の主要AIクローラへの許可/拒否方針を明示しているか
  3. RAG構成で外部記事・有償DBを取り込む場合、ライセンス確認と引用元表示のフローが運用されているか
  4. 生成AI出力(画像・文章・コード)の逐語再現・酷似チェックが公開前の必須ゲートになっているか
  5. 従業員ガイドラインに特定アーティスト作風の模倣プロンプト禁止と違反時処分基準が明記されているか

打ち手――90日アクションプラン

30日以内:全社利用中の生成AIサービス棚卸し、IP補償・データ取扱条項を法務レビュー。robots.txtにAIクローラ制御方針を反映。60日以内:従業員ガイドライン改訂(禁止プロンプト、出力検証義務、報告フロー)。法務・情シス・事業部の合同AIガバナンス委員会を立ち上げ四半期レビュー体制を構築。90日以内:自社サイト・ナレッジベースのライセンス棚卸し、納品物への生成AI出力混入時の表示ポリシー策定。サプライヤ(広告制作・翻訳等)へ生成AI利用申告を契約上義務化する。

「生成AIは過去の知の集積に立脚して新しい創作を可能にするが、その集積の取得方法が違法であれば、出力もまた違法性を帯びる。フェアユース防御は『市場代替性がない』という前提が崩れた瞬間に瓦解する」――Authors Guild訴訟原告代理人の口頭弁論より[5]

結論――三つのテーゼ

  1. DMCA削除要請は学習済みモデルに事実上届かない。立法解決まで、企業はベンダーIP補償と契約上の手当てで自衛するしかない。
  2. 日本30条の4は無条件の免罪符ではない。海賊版データ利用・特定著作物再現を狙う学習・RAGの享受目的利用はただし書で違法となりうる。
  3. robots.txt/ai.txt整備は「最低限の権利留保」として法務的価値を持つ。未整備サイトは権利者意思を表明していないと解されるリスクがある。

経営者視点――訴訟リスクのオフロードとIP補償の経済学

経営者にとって生成AI訴訟リスクは、サイバー・PL保険と同じく「自社で抱えるかベンダー転嫁か」の意思決定対象だ。Copilot Copyright Commitmentは年商規模に応じた補償上限を設定するが「ガードレール維持」「侵害判明出力の使用停止」等が前提条件で、社内ガイドラインが整合しなければ発動しない[21]。OpenAI Copy ShieldもEnterprise契約以上が条件[22]。経営判断のレバーは三つ――(1)利用シーン別最大エクスポージャ算定、(2)ベンダー補償の射程可視化(OSS・自社チューニング・社内データ混入分は通常補償外)、(3)サイバー・E&O保険の生成AI付保特約整備。IP補償をベンダー丸投げにする時代は終わり、CISO・法務・経営の三者が四半期で訴訟動向と契約条件をレビューする体制こそが、生成AI時代の競争力の前提条件となる(日本語:「使うか/使わないか」ではなく「いかに守りながら攻めるか」が論点)。

参考文献

  1. The New York Times Company v. Microsoft Corporation, OpenAI, Inc. et al., Case No. 1:23-cv-11195 (S.D.N.Y. filed Dec. 27, 2023). 訴状全文。
  2. Raw Story Media, Inc. and AlterNet Media, Inc. v. OpenAI, Inc., Case No. 1:24-cv-01514 (S.D.N.Y. filed Feb. 28, 2024); The Intercept Media v. OpenAI, Case No. 1:24-cv-01515 (S.D.N.Y. 2024). DMCA §1202違反主張。
  3. Daily News, LP, Chicago Tribune Company, et al. v. Microsoft Corporation and OpenAI, Case No. 1:24-cv-03285 (S.D.N.Y. filed Apr. 30, 2024).
  4. Canadian News Media Coalition v. OpenAI, Ontario Superior Court of Justice, Court File No. CV-24-00731536-0000 (filed Nov. 29, 2024).
  5. Authors Guild, et al. v. OpenAI Inc., Case No. 1:23-cv-08292 (S.D.N.Y. filed Sept. 19, 2023). George R.R. Martin、John Grisham他17名共同原告。
  6. Silverman, Golden, Kadrey v. OpenAI, Case No. 3:23-cv-03416 (N.D. Cal. filed July 7, 2023); Kadrey v. Meta Platforms, 3:23-cv-03417 (N.D. Cal. 2023).
  7. Getty Images (US), Inc. v. Stability AI, Inc., Case No. 1:23-cv-00135 (D. Del. filed Feb. 3, 2023); Getty Images v. Stability AI Ltd., England and Wales High Court [2023] EWHC 3090 (Ch).
  8. OpenAI Motion to Dismiss in NYT v. OpenAI, S.D.N.Y., Feb. 26, 2024; “Fair Use, Transformative Use, and Generative AI” (Stanford CIS Working Paper, 2024).
  9. Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S. 508 (2023). 米国連邦最高裁判決。
  10. 17 U.S.C. §512 (Digital Millennium Copyright Act, 1998), §1202 (Copyright Management Information).
  11. OpenAI, “GPTBot” documentation, https://platform.openai.com/docs/gptbot (2023年8月公開、robots.txt経由のクローラ制御).
  12. OpenAI, “Our approach to data and AI” / Media Manager announcement, May 2024.
  13. Brave Software, “Web Discovery Project” / IndexNow派生のAI同意プロトコル提案, 2024.
  14. 著作権法第30条の4(平成30年法律第30号改正、平成31年1月1日施行)。
  15. Directive (EU) 2019/790 on Copyright in the Digital Single Market, Articles 3 & 4 (Text and Data Mining Exceptions).
  16. 文化庁文化審議会著作権分科会法制度小委員会「AIと著作権に関する考え方について」(令和6年3月15日)。
  17. NO FAKES Act of 2024 (S.4875), 118th Congress; 2025年再提出版。
  18. Generative AI Copyright Disclosure Act of 2024 (H.R.7913), introduced by Rep. Adam Schiff.
  19. Regulation (EU) 2024/1689 (EU AI Act), Article 53 (汎用AIモデル提供者の透明性義務), 2024年8月1日発効。
  20. 「人工知能関連技術の研究開発及び活用の推進に関する法律」(令和7年法律、2025年通常国会成立);総務省・経済産業省「AI事業者ガイドライン」第1.0版(2024年4月).
  21. Microsoft, “Copilot Copyright Commitment” (Sept. 2023, 拡張版2024). https://blogs.microsoft.com/.
  22. OpenAI, “Copy Shield” / Enterprise IP indemnification policy (Nov. 2023 DevDay発表).
  23. Google Cloud, “Generative AI Indemnification” terms (Oct. 2023更新).
SHARE 𝕏 in f

あわせて読みたい