著作権 × 生成AI ― 日本著作権法30条の4が企業に与える実務影響

Picsum ID: 457

著作権 × 生成AI ― 日本著作権法30条の4が企業に与える実務影響

生成AIの業務利用は2024年以降、PoCから本番運用へと移行しつつある。一方で、学習データの著作権侵害を主張する訴訟が米国で相次ぎ、国内クリエーターからもAI学習への反発が広がる。日本では2018年改正で導入された著作権法第30条の4により「情報解析のための利用」が広範に認められ、いわゆる「機械学習パラダイス」と評されてきた[1]。しかし2024年3月の文化庁文化審議会報告書[2]は「享受目的の併存」「権利者の利益を不当に害する場合」という二つの限界を明示し、企業の実務に重い検討事項を突き付けた。本稿は法務・経営層を対象に、30条の4の構造、文化庁の最新解釈、海外比較、そして社内導入時のチェックフローまでを整理する。

1. 第30条の4の制定経緯 ― なぜ「世界最先端」と呼ばれたか

第30条の4は、2018年の著作権法改正(平成30年改正、2019年1月施行)により創設された権利制限規定である[3]。前身は2009年改正で導入された旧第47条の7(情報解析のための複製等)であり、当初は「電子計算機による情報解析」のうち複製・翻案に限定されていた。2018年改正では、AI・ビッグデータ時代に対応するため、目的を「著作物に表現された思想又は感情の享受を目的としない利用」に一般化し、複製のみならず「いずれの方法によるかを問わず、利用することができる」と大幅に拡張された[4]

立法担当者の解説によれば、本条の趣旨は「著作物の本来的な利用(享受)に該当しない利用は、著作権者の対価回収機会を損なわず、市場を阻害しない」という経済的損失不在の論理にある[5]。これにより、テキスト・画像・音声を問わず、機械学習モデルの訓練データとしての利用は原則として権利者の許諾不要となった。海外の研究者・スタートアップが、日本のサーバを用いた学習を選好する「データ・ハブ化」の議論が起こったのもこの時期である[6]

2. 条文解釈の3階層 ― 享受目的・非享受目的・権利者侵害

第30条の4の適用判断は、以下の3階層で構造化される[2]

  • 第1階層:享受目的の有無。 「思想又は感情の享受」とは、著作物の視聴・読書・鑑賞等、人間が表現を知覚することを通じて知的・精神的欲求を満たす行為を指す。AI学習はこれに該当しないため原則適用される。
  • 第2階層:享受目的の併存。 学習データの一部を、生成物として再現させる目的(過剰学習・追加学習による特定作家のスタイル再現など)が併存する場合、その併存部分について第30条の4は適用されない。
  • 第3階層:権利者の利益を不当に害する場合(但書)。 形式的に非享受目的でも、市場で取引されるデータベースの著作物を学習用に複製する行為等は、本条の適用が排除される[7]

この3階層構造は、企業の生成AI利用において「学習」「ファインチューニング」「RAG(検索拡張生成)」「推論」という工程ごとに評価されるべきであり、一律に「30条の4で適法」と判断することは法的に危ういと言える。

3. 文化庁2024年文書の論点 ― 7つの実務インパクト

2024年3月15日、文化庁文化審議会著作権分科会法制度小委員会は「AIと著作権に関する考え方について」を取りまとめた[2]。約100ページにわたる本文書は、立法ではなく現行法の解釈指針を示すものだが、実務に対する影響は大きい。主要論点は以下の7点である。

  • 論点1:追加学習における享受目的併存。 特定の作家・キャラクターの作品のみを意図的に収集してファインチューニングする行為は、当該作家のスタイル再現を意図する以上、享受目的が併存し30条の4の適用外となりうる。
  • 論点2:海賊版データセットの学習。 違法複製物と知りながら学習に利用する行為は、権利者の利益を不当に害するとして但書に該当する可能性が高い。LAION-5B等の大規模データセット中に違法アップロード画像が含まれることが報告されており[8]、利用企業の調査義務が事実上問われる。
  • 論点3:RAGにおける生成段階。 検索拡張生成は、外部文書を都度参照しプロンプトに注入する構造のため、学習段階の30条の4ではなく、第47条の5(軽微利用)または通常の複製・公衆送信権の問題として評価される。
  • 論点4:生成物の類似性・依拠性。 出力物が既存著作物に類似し、かつ学習データに含まれていれば「依拠性」が事実上推認される可能性があり、生成物利用者が著作権侵害責任を負うリスクがある。
  • 論点5:オプトアウト表明の効果。 robots.txtやメタタグでAI学習拒否を明示した場合、これを無視した収集行為が但書該当性を高めるかについては、文化庁は「個別判断」と留保しつつも考慮要素となりうると示唆した。
  • 論点6:作風・画風の保護範囲外性。 著作権法はアイデアではなく具体的表現を保護するため、画風・作風自体は保護されない。ただし「ほぼ同一の表現」を再現する場合は侵害となりうる。
  • 論点7:AI生成物の著作物性。 人間の創作的寄与が認められない純粋なAI出力には著作権が発生しない。プロンプト設計・選択・修正の関与度合いが判断要素となる。

4. 米国・EUとの比較 ― 制度設計の哲学差

諸外国のTDM(テキスト・データ・マイニング)例外規定と比較すると、日本法の特徴が浮き彫りになる。

  • EU:CDSM指令第3条・第4条[9] 第3条は研究機関による非商用TDMを許容、第4条は商用利用を含む一般TDMを認めるが、権利者が「機械可読な形でオプトアウト」した場合は適用されない。日本にはこのオプトアウト規定が条文上存在しない。
  • 米国:フェアユース法理。 統一的なTDM条項は存在せず、第107条のフェアユースで個別判断される。Authors Guild v. Google(Google Books事件、2015年第二巡回区控訴審)[10]では検索目的のスキャンが変容的利用として認められたが、生成AIについてはNew York Times v. OpenAI(2023年提訴)[11]等が継続審理中であり、判例は未確立である。
  • 日本:30条の4の包括許容+但書。 オプトアウト規定はないが、「権利者の利益を不当に害する場合」の解釈で柔軟な調整を行う構造。条文上は世界で最も広範な機械学習許容と評される一方、個別判断の幅も広く、実務の予見可能性は必ずしも高くない。

EU AI Act(2024年成立)[12]は、汎用AIモデル提供者に対して学習データの概要公表義務およびEU著作権法遵守義務を課しており、域外適用も視野に入る。日本企業がEU市場でモデルを提供する場合は、日本法上は適法でもEU法対応が必要となる二重構造に注意すべきである。

5. 企業が生成AI利用時に確認すべき実務事項

30条の4の解釈を前提に、企業が生成AIを業務導入する際の確認事項を整理する。重要なのは「利用工程の切り分け」である。学習・追加学習・推論・出力利用の4段階それぞれで著作権リスクが異なる。

  • 第1段階:基盤モデル選定。 利用する基盤モデル(GPT-4、Claude、Gemini、Stable Diffusion等)の学習データの透明性、提供事業者の補償条項(IP indemnification)の有無を確認する。Microsoft、Google、OpenAI、Anthropicは商用顧客向けに補償を提供している[13]
  • 第2段階:追加学習・ファインチューニング。 自社で追加学習を行う場合、データソースが正規ライセンスを持つことを確認。特定作家の作品のみを学習させる場合は享受目的併存リスクが高く、原則回避すべきである。
  • 第3段階:RAG導入。 検索対象文書の利用権限、社内文書の機密区分、外部公開ドキュメントのライセンス条項を整理する。RAGは30条の4ではなく通常の複製・送信権の問題として処理される点に注意。
  • 第4段階:生成物利用。 出力物を商用利用する前に、既存著作物との類似性チェック、第三者権利調査、社内承認フローを設ける。画像生成では特に類似性問題が顕在化しやすい。

チェックリスト:生成AI業務導入5項目

  • [ ] 利用する基盤モデルの提供事業者から、学習データの適法性に関する保証とIP補償条項を契約で確保しているか。
  • [ ] 追加学習・ファインチューニングを行う場合、学習データのライセンス・権利関係を文書化し、特定作家・特定スタイルへの偏りがないことを確認したか。
  • [ ] RAGや社内文書連携において、参照文書の著作権者・利用許諾範囲を整理し、社外配布・公衆送信に該当する利用形態を識別したか。
  • [ ] 生成物の商用利用前に、画像・テキストの類似性チェックツールまたは専門家レビューによる第三者権利調査を実施しているか。
  • [ ] AI利用ガイドライン・社内規程に「30条の4の限界(但書・享受目的併存)」を明記し、従業員教育・記録保存体制を整備しているか。

6. 打ち手 ― 法務・経営の実装プライオリティ

実務上の打ち手は3層に整理できる。第1層はガバナンス層で、社内AI利用ガイドライン、データ取扱規程、ベンダー契約レビュー基準の整備。第2層はオペレーション層で、案件ごとの著作権チェックフロー、生成物の出典記録、類似性検証ツール導入。第3層はリスクヘッジ層で、IP補償条項の獲得、サイバー保険・知財保険の検討、社外専門家との顧問契約である。優先順位としては、第1層を6か月以内に完了させ、第2層は重要案件から順次適用、第3層は年次予算化が現実的である。中堅企業であれば、初期投資は数百万円規模、年次運用コストは1000万円前後で構築可能と見込まれる。

「30条の4は『学習段階の自由』を保障する規定であって、『生成物利用の自由』を保障するものではない。日本の制度的優位は学習基盤の構築には有利だが、生成物の市場利用段階では諸外国と同様の依拠性・類似性判断に服する。経営層は『日本は緩いから安心』ではなく、『学習は緩いが出力は厳格』という二段階理解を持つ必要がある。」

7. 結論 ― 経営層が押さえるべき3点

  1. 第30条の4は学習段階の特例であって、生成物の利用責任を免責するものではない。 出力物の著作権侵害責任は通常通り類似性・依拠性で判断される。
  2. 「享受目的の併存」「権利者を不当に害する場合」という二つの但書が、追加学習・特定作家学習・海賊版データ利用を制約する。 安易なファインチューニングは法的リスクを高める。
  3. EU AI Act等、域外適用法の影響を受ける可能性がある。 グローバル展開する場合、日本法のみで設計したガバナンスは不十分である。

8. 経営者視点 ― 「機械学習パラダイス」の活用と限界

日本法の包括的な情報解析許容は、研究開発・モデル構築のコストを世界水準で下げる戦略的優位を提供する。LLM・画像生成モデルの学習基盤を国内に置く意義はここにある。一方、競争優位を生むのはモデルそのものではなく、業務組込み・ドメイン特化・データ独自性であり、ここでは30条の4の射程外、すなわちRAG・生成物利用・契約上のデータ取扱いが論点となる。経営判断として重要なのは、(1) 学習段階の優位を活かす研究開発投資、(2) 業務段階のリスク管理体制、(3) 海外法制への適応コスト、を分けて意思決定することである。さらに、クリエーター・著作権者との対話姿勢は企業ブランドにも直結する。AI絵師問題に象徴されるように、法的に適法でも社会的批判を浴びるケースは増加している[14]。生成AIの導入はテクノロジー戦略であると同時に、ステークホルダー・マネジメントの戦略でもある。法務・知財・広報・事業部門が連携した「AI ガバナンス委員会」を設置し、四半期単位で運用状況をレビューする体制が、これからの標準形となるだろう。

参考文献

  1. 上野達弘「日本は機械学習パラダイスか」コピライト No.715 (2020年11月)
  2. 文化庁文化審議会著作権分科会法制度小委員会「AIと著作権に関する考え方について」(2024年3月15日)
  3. 著作権法 第30条の4(情報解析のための利用)平成30年法律第30号により改正
  4. 文化庁著作権課「平成30年著作権法改正の概要」(2018年)
  5. 奥邨弘司「AI生成物と著作権」ジュリスト No.1581 (2023年)
  6. 福井健策「AIと著作権の現在地」骨董通り法律事務所コラム (2023年)
  7. 中山信弘『著作権法(第3版)』有斐閣 (2020年)
  8. Birhane, A. et al. “Multimodal datasets: misogyny, pornography, and malignant stereotypes” arXiv:2110.01963 (2021)
  9. Directive (EU) 2019/790 on copyright in the Digital Single Market, Articles 3-4
  10. Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015)
  11. The New York Times Company v. Microsoft Corporation and OpenAI, S.D.N.Y. (2023年12月提訴)
  12. Regulation (EU) 2024/1689 (EU AI Act), Article 53
  13. Microsoft Copilot Copyright Commitment (2023年9月発表)、OpenAI Copyright Shield (2023年11月発表)
  14. 日本俳優連合・日本漫画家協会等によるAI学習に関する声明 (2023-2024年)
  15. 愛知靖之「AI生成物・機械学習と著作権法」パテント Vol.74 No.8 (2021年)
  16. 経済産業省・特許庁「AI・データの利用に関する契約ガイドライン (1.1版)」(2019年)
SHARE 𝕏 in f

あわせて読みたい