Authors Guild et al. v. OpenAI Inc. et al.

Authors Guild et al. v. OpenAI Inc. et al.

Case Metadata

Basic Information

1. Case Name: The Authors Guild et al. v. OpenAI Inc. and Microsoft Corporation
2. Court: United States District Court for the Southern District of New York
3. Filing Date: September 19, 2023
4. Judgment Date: Case pending (as of September 2025)
5. Case Number: 1:23-cv-08292
6. Current Status: Pending – Pre-trial motions and discovery phase

Parties

7. Plaintiff(s):
– The Authors Guild (professional organization representing authors’ interests)
– John Grisham (bestselling author of legal thrillers)
– Jodi Picoult (bestselling contemporary fiction author)
– George R.R. Martin (author of “A Song of Ice and Fire” series)
– And 14 other prominent authors

8. Defendant(s):
– OpenAI Inc. (AI research and deployment company, creator of GPT models and ChatGPT)
– Microsoft Corporation (technology company, major investor and partner of OpenAI)

9. Key Law Firms:
– For Plaintiffs: Cowan, DeBaets, Abrahams & Sheppard LLP
– For OpenAI: Keker, Van Nest & Peters LLP
– For Microsoft: Davis Wright Tremaine LLP

10. Expert Witnesses: Technical and literary experts to be determined during discovery phase

Legal Framework

11. Case Type: Copyright infringement in AI training data and generative AI outputs
12. Primary Legal Claims:
– Direct copyright infringement under 17 U.S.C. § 501
– Vicarious copyright infringement
– Violation of Digital Millennium Copyright Act (DMCA) § 1202
– Unfair competition and unjust enrichment

13. Secondary Claims:
– Contributory copyright infringement
– Negligence in data handling
– Breach of implied contract

14. Monetary Relief:
– Actual damages and profits attributable to infringement
– Statutory damages of up to $150,000 per infringed work
– Injunctive relief to prevent future use of copyrighted materials

Technical Elements

15. AI/Technology Involved:
– GPT-3, GPT-3.5, and GPT-4 large language models
– ChatGPT consumer application
– Microsoft Azure AI infrastructure
– Web scraping and data collection technologies

16. Industry Sectors:
– Publishing and literary works
– Artificial intelligence and machine learning
– Cloud computing services
– Consumer technology applications

17. Data Types:
– Copyrighted literary works (novels, non-fiction books)
– Text corpora from internet scraping
– Training datasets including Common Crawl, WebText, and Books1/Books2 datasets

Database Navigation

18. Keywords/Tags: AI copyright, generative AI, large language models, ChatGPT, fair use, training data, copyright infringement, OpenAI litigation, author rights, DMCA

19. Related Cases:
– Silverman v. OpenAI Inc., No. 3:23-cv-03416 (N.D. Cal.)
– Tremblay v. OpenAI Inc., No. 3:23-cv-03223 (N.D. Cal.)
– Kadrey v. Meta Platforms Inc., No. 3:23-cv-03417 (N.D. Cal.)
– Getty Images v. Stability AI Inc., No. 1:23-cv-00135 (D. Del.)
– The New York Times Company v. OpenAI Inc., No. 1:23-cv-11195 (S.D.N.Y.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係:
2023年9月、米国の著名な作家17名と作家団体であるAuthors Guildが、OpenAI社とMicrosoft社を相手取り、大規模な著作権侵害訴訟を提起した。原告らは、被告が彼らの著作物を無断で使用してGPTシリーズのAI言語モデルを訓練し、これらのモデルが原告の作品の派生物を生成する能力を持つことで、著作権を侵害していると主張している。

訴訟の背景には、OpenAIが2015年の設立以来、インターネット上の膨大なテキストデータを収集し、その中に著作権で保護された書籍が含まれていたという事実がある。特に「Books1」「Books2」と呼ばれる訓練データセットには、違法な電子書籍配布サイトから取得されたと推測される大量の書籍データが含まれていた可能性が指摘されている。

中心的争点:
– AIモデルの訓練における著作物の使用が「フェアユース」に該当するか
– 訓練されたAIモデルが原告の著作物の「派生的作品」を生成することが著作権侵害にあたるか
– 被告が著作権管理情報(CMI)を意図的に削除・改変したか
– Microsoft社のOpenAIへの投資と技術提供が寄与侵害にあたるか

原告の主張:
原告は以下の点を主張している:
1. OpenAIは数百万冊の著作権で保護された書籍を無断で複製し、商業的なAI製品の訓練に使用した
2. ChatGPTは原告の作品の要約、続編、スタイルを模倣した文章を生成でき、これは派生的作品の無断作成にあたる
3. 被告は著作権管理情報を意図的に除去し、著作者の帰属を隠蔽した
4. この行為により、原告は正当な対価を得る機会を失い、作品の価値が毀損された

被告の主張:
被告側の予想される主な抗弁:
1. AI訓練におけるデータ使用は変容的(transformative)であり、フェアユースの範囲内
2. 訓練されたモデルは原作品そのものを保存・再現するものではない
3. AIの発展は公共の利益に資するものであり、著作権法の目的に合致する
4. 原告は具体的な損害を立証できていない

AI/技術要素:
GPTモデルは、Transformerアーキテクチャを基盤とする大規模言語モデルで、数千億のパラメータを持つ。訓練プロセスでは、次の単語を予測する「教師なし学習」を通じて、テキストのパターンと構造を学習する。原告は、このプロセスで著作物全体がモデルの重みパラメータに「エンコード」され、実質的に複製されていると主張している。

手続きの経過 (Procedural History)

重要な手続き上の決定:
2024年前半、裁判所は被告による却下申立て(Motion to Dismiss)の一部を棄却し、著作権侵害の主張について本案審理に進むことを認めた。ただし、一部の州法に基づく請求は連邦法による専占(preemption)を理由に却下された。

証拠開示:
現在、広範な証拠開示手続きが進行中で、以下の重要な情報が争点となっている:
– GPTモデルの訓練に使用された具体的なデータセットの内容
– 訓練データの取得方法と処理プロセス
– OpenAIの内部文書とMicrosoftとの契約関係
– モデルが特定の著作物を「記憶」している程度の技術的検証

専門家証言:
両当事者は、AI技術、著作権法、出版業界の専門家を証人として申請している。特に、言語モデルの技術的仕組みと著作権侵害の関係について、専門家の見解が重要な役割を果たすと予想される。

判決の概要 (Judgment Summary)

注:本件は2025年9月現在、係争中であり、最終判決は出されていない。以下は、これまでの中間的な司法判断と今後の展望を記載する。

裁判所の判断 (Court’s Decision)

暫定的な判断:
裁判所は、却下申立てに関する判断において、以下の点を示唆した:
– AI訓練における著作物使用のフェアユース該当性は、事実に関する詳細な検討が必要
– 原告の著作権侵害の主張には、本案審理に値する法的根拠がある
– 技術の革新性だけでは著作権侵害を正当化できない

今後の重要な争点:
1. フェアユースの4要素分析(使用の目的と性質、著作物の性質、使用された部分の量と実質性、市場への影響)
2. AIモデルと訓練データの関係の技術的理解
3. 損害の算定方法と因果関係の立証

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本件は、生成AIと著作権法の関係を定義する画期的な判例となる可能性が高い。特に以下の点で重要な先例となると考えられる:

1. AI訓練とフェアユース: 大規模なデータセットを用いたAI訓練が、どのような条件下でフェアユースとして認められるかの基準を確立する
2. 派生的作品の定義: AIが生成するコンテンツが、訓練データの派生的作品にあたるかの判断基準
3. 技術的複製の法的評価: デジタル環境における「複製」の概念の再定義

法理論の発展:
本件は、デジタル時代における著作権法の適用に関して、以下の新たな法理論の発展に寄与する:
– 「変容的使用」(transformative use)の概念の拡張または制限
– 機械学習における「学習」と「複製」の法的区別
– AIシステムの「創作性」と著作権の関係

解釈の明確化:
既存の著作権法のAI分野への適用について、以下の点が明確化される可能性がある:
– DMCA第1202条の著作権管理情報に関する規定のAIへの適用
– 寄与侵害と代位責任の理論のAI開発企業への適用
– 法定損害賠償の算定方法

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
本件の結果は、AI開発における以下のガバナンス要件に影響を与える:

1. データ収集とライセンシング: AI企業は訓練データの適法な取得とライセンス管理体制の構築が必要
2. 透明性の確保: 使用データセットの開示と追跡可能性の確保
3. リスク評価プロセス: 著作権リスクの事前評価と軽減措置の実装

コンプライアンス:
企業が取るべき対応策:
– 訓練データの出所と権利関係の詳細な記録保持
– オプトアウト機構の実装
– 著作権者との協力関係の構築
– 代替的なライセンスモデルの検討

業界への影響:
AI開発・展開実務への具体的効果:
1. 開発コストの増大(ライセンス料、コンプライアンスコスト)
2. イノベーションへの潜在的な制約
3. オープンソースAI開発への影響
4. 新たなビジネスモデルの出現(収益分配、ライセンスプール等)

リスク管理:
類似リスクを回避するための考慮事項:
– 包括的な知的財産権監査の実施
– 保険商品の活用(知財侵害保険等)
– 技術的対策(フィルタリング、ブロッキング)の実装
– 法務部門とエンジニアリング部門の密接な連携

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法との主要な相違点:

1. フェアユース vs 権利制限規定:
– 米国:一般的なフェアユース条項による柔軟な対応
– 日本:限定列挙された権利制限規定(著作権法30条の4等)により、AI学習は一定の条件下で許容

2. AI学習に関する規定:
– 日本:2018年改正で「情報解析」目的での著作物利用を明文で許容(著作権法30条の4)
– 米国:個別事案ごとのフェアユース判断に依存

3. 損害賠償:
– 米国:法定損害賠償制度により高額賠償の可能性
– 日本:実損害の立証が必要、懲罰的損害賠償なし

他国判例との関係:
欧州やその他の地域での類似事案:
– EU:AI法案とDSM指令によるより厳格な規制アプローチ
– 英国:著作権法改正議論において、AI訓練の例外規定を検討
– カナダ:フェアディーリング条項の適用可能性

グローバルな影響:
多国籍企業への影響:
1. 地域ごとの異なる法的要件への対応必要性
2. データローカライゼーション要件の考慮
3. 国際的な業界標準の形成への圧力
4. クロスボーダーでのAIサービス提供の複雑化

重要なポイント (Key Takeaways)

実務家への示唆:
1. 予防法務の重要性: AI開発プロジェクトの初期段階から著作権リスクを評価し、適切な対策を講じることが不可欠

2. 契約実務の見直し: データ提供契約、ライセンス契約において、AI利用に関する明確な条項を含める必要性

3. 技術的理解の必要性: 法務担当者もAI技術の基本的な仕組みを理解し、技術チームと効果的に協働することが重要

4. 国際的視野: グローバルにサービスを展開する場合、各国の規制動向を注視し、最も厳格な基準に合わせた対策を検討

今後の展望:
1. 立法的解決の可能性: 司法判断と並行して、議会による立法的解決の動きが加速する可能性

2. 業界自主規制: AI企業による自主的なガイドラインや業界標準の策定

3. 新たなライセンスモデル: 集中管理団体による包括的ライセンススキームの出現

4. 技術的ソリューション: 著作権に配慮したAI訓練手法の開発(フェデレーテッドラーニング、差分プライバシー等)

注意すべき事項:
– 本件の判決が他のAI関連訴訟に与える波及効果を慎重に分析する必要がある
– 技術の急速な進化により、法的判断が陳腐化するリスクがある
– 国際的な規制の調和に向けた動きを注視し、グローバルコンプライアンス戦略を構築することが重要
– 特許法の観点からも、AIの学習プロセスや生成物に関する知的財産権の問題を総合的に検討する必要がある(注:日本では特許法は一般の法律実務とは別の専門分野であるため、特許弁理士との協働が推奨される)

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です