Authors Guild v. OpenAI Inc.

Authors Guild v. OpenAI Inc.

Case Metadata

Basic Information

1. Case Name: The Authors Guild et al. v. OpenAI Inc. et al., 1:23-cv-08292 (S.D.N.Y. 2023)
2. Court: United States District Court for the Southern District of New York (Federal District Court, Manhattan Division)
3. Filing Date: September 19, 2023
4. Judgment Date: Not yet determined (case pending)
5. Case Number: 1:23-cv-08292-SHS
6. Current Status: Pending – In discovery phase with fact discovery deadline extended to April 30, 2025

Parties

7. Plaintiff(s):
– The Authors Guild (non-profit organization representing professional writers)
– 17 Individual Authors including John Grisham (bestselling novelist), George R.R. Martin (fantasy author), David Baldacci (thriller writer), Jodi Picoult (contemporary fiction author), Douglas Preston (thriller author), George Saunders (literary fiction author), Scott Turow (legal thriller author), and others
8. Defendant(s):
– OpenAI Inc. (artificial intelligence research company, developer of ChatGPT and GPT models)
– Microsoft Corporation (technology conglomerate, major investor in OpenAI, added as defendant in December 2023)
9. Key Law Firms:
– For Plaintiffs: Cowan, DeBaets, Abrahams & Sheppard LLP
– For Defendants: Morrison & Foerster LLP (OpenAI); Wilmer Cutler Pickering Hale and Dorr LLP (Microsoft)
10. Expert Witnesses: To be disclosed during discovery (technical AI experts and copyright valuation experts anticipated)

Legal Framework

11. Case Type: AI-related copyright infringement litigation involving unauthorized use of copyrighted literary works for training large language models
12. Primary Legal Claims:
– Direct copyright infringement under 17 U.S.C. §501
– Systematic reproduction and distribution of copyrighted works without authorization
– Commercial exploitation of protected literary content
13. Secondary Claims:
– Vicarious copyright infringement
– Contributory copyright infringement
– Unfair competition (in some related cases)
14. Monetary Relief: Actual damages and defendants’ profits, or statutory damages up to $150,000 per infringed work; injunctive relief sought to prevent continued use of copyrighted materials

Technical Elements

15. AI/Technology Involved:
– ChatGPT (versions 3.5 and 4.0)
– GPT-3 and GPT-4 large language models
– Natural language processing systems
– Web scraping and data ingestion technologies
– Training dataset compilation and processing systems
16. Industry Sectors: Publishing, literature, artificial intelligence, technology services, creative industries, digital content creation
17. Data Types: Copyrighted literary works, published books, fiction and non-fiction texts, author manuscripts, training datasets for language models

Database Navigation

18. Keywords/Tags: AI copyright infringement, ChatGPT litigation, authors’ rights, fair use AI, training data copyright, generative AI lawsuit, OpenAI legal challenges, literary works AI training, transformative use doctrine, machine learning copyright
19. Related Cases:
– The New York Times Company v. Microsoft Corporation & OpenAI Inc., 1:23-cv-11195 (S.D.N.Y. 2023)
– Silverman v. OpenAI Inc., 3:23-cv-03416 (N.D. Cal. 2023)
– Kadrey v. Meta Platforms Inc., 3:23-cv-03417 (N.D. Cal. 2023)
– Tremblay v. OpenAI Inc., 3:23-cv-03223 (N.D. Cal. 2023)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係: 2023年9月19日、米国の作家団体であるAuthors Guildと17名の著名作家が、OpenAI社およびMicrosoft社を相手取り、著作権侵害訴訟を提起した。原告らは、被告らが大規模言語モデル(LLM)であるChatGPTの訓練に、原告らの著作物を無断で使用したと主張している。具体的には、OpenAI社がインターネット上から大量のテキストデータを収集する過程で、原告らの出版された書籍を含む著作権で保護された文学作品を系統的に複製し、これらを商業的なAIシステムの開発に利用したとされる。

中心的争点: 本件の核心は、AI開発における著作物の利用が著作権法上どのように評価されるべきかという点にある。主要な争点として、①AIの訓練データとしての著作物使用が「フェアユース」に該当するか、②大規模な著作物の複製が「変容的使用」として正当化されるか、③AIが生成するテキストが原著作物の派生的著作物に該当するか、④損害賠償の算定方法、⑤技術的に訓練データから特定の著作物を除去することの実現可能性、などが挙げられる。

原告の主張: 原告らは、OpenAI社が数十億ものウェブページやテキストデータを収集する過程で、原告らの著作物を含む大量の著作権保護された作品を無断で複製したと主張している。さらに、ChatGPTが時として原告らの作品の文章をほぼそのまま出力することがあり、これは明白な著作権侵害であると論じている。原告らは、実損害賠償と被告らが得た利益の返還、または法定損害賠償として侵害された各作品につき最大15万ドルの賠償を求めている。また、侵害行為の差止めと、違法に取得されたデータセットの破棄も要求している。

被告の主張: OpenAI社は、AIの訓練における著作物の使用はフェアユースの範疇に含まれると主張している。具体的には、①AIモデルの訓練は変容的使用であり、原著作物とは異なる目的と性質を有する、②学習過程における一時的な複製は著作権侵害を構成しない、③ChatGPTの出力は新たな創作物であり、原著作物の市場を害するものではない、④AI開発は公益に資する技術革新であり、社会的価値を考慮すべきである、と反論している。

AI/技術要素: 本件で問題となっているChatGPTは、Transformer アーキテクチャに基づく大規模言語モデルで、数千億のパラメータを持つニューラルネットワークである。訓練プロセスでは、インターネットから収集された膨大なテキストデータ(Common Crawl、WebText、Books1、Books2などのデータセット)を使用し、教師なし学習と強化学習を組み合わせて言語パターンを学習する。技術的には、テキストをトークン化し、注意機構(Attention Mechanism)を用いて文脈を理解し、確率的に次の単語を予測する仕組みとなっている。

手続きの経過 (Procedural History)

重要な手続き上の決定: 2023年12月にMicrosoft社が被告として追加された。2024年12月には、Ona T. Wang判事が事実審理の期限を2025年4月30日まで延長することを決定した。この延長は、訓練データの特定と分析に関する技術的複雑性を考慮したものである。2025年4月15日が訴状修正の最終期限として設定されている。

証拠開示: 証拠開示段階では、訓練データセットの構成と原告作品の使用状況の特定が主要な争点となっている。OpenAI社は、技術的制約と企業秘密の観点から、訓練データの完全な開示に抵抗している。一方、原告側は、侵害の規模と性質を立証するために、包括的なデータ開示を求めている。特に、どの作品がどの程度の頻度で訓練に使用されたかを示す技術的証拠の提出が焦点となっている。

専門家証言: 本件では、AI技術、著作権法、経済的損害の評価に関する複数の専門家証人が予定されている。技術専門家は、LLMの訓練プロセスと著作物の使用方法について証言し、著作権専門家は、フェアユースの適用可能性と変容的使用の概念について意見を述べる予定である。経済専門家は、原告らが被った損害の規模と、被告らが得た利益の算定方法について証言することが見込まれている。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)
本件はまだ審理中であり、最終判決は下されていない。しかし、関連する他の訴訟における裁判所の判断から、今後の展開を予測することができる。

主要な判決内容: 現時点では最終判決は出ていないが、証拠開示段階での裁判所の判断から、以下の傾向が見られる:①裁判所は、AI訓練における著作物使用の法的評価について慎重な姿勢を示している、②フェアユースの抗弁については、個別具体的な検討が必要であるとの見解が示されている、③技術的複雑性を考慮し、十分な証拠開示期間を設定している。

命令された救済措置: 最終的な救済措置はまだ決定されていないが、原告らは以下を求めている:①実損害賠償および被告らの利益の返還、②法定損害賠償(各作品につき最大15万ドル)、③将来的な侵害行為の差止命令、④違法に収集されたデータセットの破棄命令。

重要な法的判断: 本件の結果は、AI開発における著作物利用の法的枠組みを決定づける可能性がある。特に、①大規模な著作物の機械学習への利用がフェアユースとして認められるか、②AIの出力が原著作物の派生的著作物として扱われるか、③技術革新と著作権保護のバランスをどのように取るか、という点で先例的価値を持つことが予想される。

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理: 本件では、米国著作権法第107条のフェアユース規定が中心的な法理となる。フェアユースの判断には、①使用の目的と性質(商業的か非商業的か、変容的か)、②著作物の性質、③使用された部分の量と実質性、④潜在的市場への影響、の4要素が考慮される。また、Campbell v. Acuff-Rose Music判例で確立された「変容的使用」の概念が重要な役割を果たすと考えられる。

事実認定: 裁判所が認定すべき重要な事実として、①原告らの著作物が実際に訓練データに含まれていたか、②どの程度の量が使用されたか、③ChatGPTの出力が原著作物と実質的に類似しているか、④被告らの行為が原告らの市場に与えた影響、などが挙げられる。これらの事実認定には、高度な技術的理解が必要とされる。

技術的理解: 裁判所は、LLMの訓練プロセス、トークン化、埋め込み表現、注意機構などの技術的概念を理解し、これらが著作権法上どのように評価されるべきかを判断する必要がある。特に、機械学習における「学習」と著作権法上の「複製」の関係、AIの出力における創作性の有無、技術的な侵害防止措置の実現可能性などが重要な検討事項となる。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響: 本判決は、AI時代における著作権法の適用に関する重要な先例となることが確実視されている。特に、①生成AIの開発における著作物利用の合法性基準、②フェアユース抗弁の適用範囲、③AI企業の法的責任の範囲、④創作者の権利保護メカニズム、などについて、今後の訴訟の指針となる判断が示されることが期待される。

法理論の発展: 本件は、デジタル時代における著作権法理論の発展に大きく貢献する可能性がある。特に、「変容的使用」概念のAI文脈での解釈、機械学習と人間の学習の法的区別、AIによる創作物の著作権帰属、データの大規模利用に関する新たな法的枠組みの構築などが期待される。

解釈の明確化: 既存の著作権法がAI技術にどのように適用されるかについて、以下の点で明確化が図られることが予想される:①コンピュータによる一時的複製の法的評価、②商業的AIサービスにおけるフェアユースの限界、③技術的中立性の原則とその限界、④国際的なAI開発競争における著作権法の役割。

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス: 本判決は、AI開発企業に対して以下のガバナンス要件を示唆する可能性がある:①訓練データの出所と権利関係の明確化、②オプトアウトメカニズムの実装、③透明性とアカウンタビリティの確保、④倫理的AI開発のガイドライン策定、⑤定期的な監査とコンプライアンス体制の構築。

コンプライアンス: 企業が取るべき対応策として、①訓練データのライセンス取得プロセスの確立、②著作権リスク評価の実施、③技術的保護措置の導入、④創作者との協力関係の構築、⑤法務部門とAI開発部門の連携強化、などが必要となる可能性がある。

業界への影響: AI業界全体に対して、①ビジネスモデルの見直し(ライセンス費用の組み込み)、②技術開発アプローチの変更(合法的データソースの優先利用)、③新たな産業標準の確立、④創作者との収益分配モデルの開発、⑤国際的な規制調和への対応、などの影響が予想される。

リスク管理: 類似リスクを回避するための考慮事項として、①包括的な知的財産権デューデリジェンスの実施、②訓練データの来歴管理システムの構築、③著作権侵害保険の検討、④定期的な法的リスク評価、⑤ステークホルダーとの継続的な対話、などが重要となる。

比較法的観点 (Comparative Law Perspective)

日本法との比較: 日本の著作権法においても、AI学習における著作物利用については議論がある。日本著作権法第30条の4は、情報解析のための複製等を一定の条件下で許容しているが、その適用範囲は米国のフェアユースよりも限定的である。日本では、①非営利目的の研究開発、②情報解析用途に限定、③著作権者の利益を不当に害しない、という要件が課されている。本件の米国での判決は、日本におけるAI開発と著作権の議論にも影響を与える可能性がある。

他国判例との関係: EUでは、デジタル単一市場指令(DSM指令)により、テキスト・データマイニングに関する例外規定が設けられている。英国では、AI訓練のための著作権例外規定の導入が検討されたが、創作者団体の反対により撤回された。中国では、AI生成コンテンツに関する規制が急速に整備されつつある。これらの国際的動向と本件判決の相互作用が注目される。

グローバルな影響: 本判決は、多国籍AI企業の事業戦略に重大な影響を与える可能性がある。特に、①国際的なデータ収集・利用ポリシーの統一化、②各国規制への対応コストの増大、③技術開発拠点の選択(規制が緩い国への移転リスク)、④国際的な業界標準の形成、⑤創作者の権利保護に関する国際協調の必要性、などが課題となることが予想される。

重要なポイント (Key Takeaways)

実務家への示唆:
– AI開発企業の法務担当者は、訓練データの権利関係を事前に精査し、必要に応じてライセンス取得を検討すべきである
– 創作者側の代理人は、クライアントの作品がAI訓練に使用されている可能性を調査し、適切な権利行使の機会を探るべきである
– 契約実務において、AI利用に関する条項を明示的に規定することが重要となる
– 技術的保護措置とオプトアウトメカニズムの実装が、将来的な紛争予防の鍵となる

今後の展望:
– 2025年中に本件の重要な判断が示される可能性が高く、AI業界全体に大きな影響を与えることが予想される
– 立法的対応として、AI開発における著作物利用に関する特別法の制定が検討される可能性がある
– 業界団体による自主規制やベストプラクティスの策定が進むことが期待される
– 国際的な規制調和に向けた議論が活発化することが予想される

注意すべき事項:
– 本件はまだ審理中であり、最終的な判断は変更される可能性がある
– 技術的複雑性により、証拠開示と事実認定に長期間を要する可能性がある
– 和解による解決の可能性も残されており、その場合は先例的価値が限定される
– 控訴審での判断変更の可能性を考慮し、最終確定まで慎重な対応が必要である

このレポートに関する注意事項 (Warnings/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です