Authors Guild v. OpenAI, Inc.

Authors Guild v. OpenAI, Inc.

Case Metadata

Basic Information

1. Case Name: Authors Guild et al. v. OpenAI, Inc. et al., No. 1:23-cv-08292 (S.D.N.Y. 2023)
2. Court: United States District Court for the Southern District of New York
3. Filing Date: September 19, 2023
4. Judgment Date: Case pending (as of September 2025)
5. Case Number: 1:23-cv-08292-SHS
6. Current Status: Pending – Motion to dismiss partially granted February 2024; discovery ongoing

Parties

7. Plaintiff(s):
– Authors Guild (professional organization representing authors’ interests)
– Individual authors including George R.R. Martin, John Grisham, Jodi Picoult, and fourteen other prominent writers
8. Defendant(s):
– OpenAI, Inc. (AI research and deployment company)
– OpenAI GP, LLC (General Partner entity)
– OpenAI LLC (Operating entity)
– Microsoft Corporation (technology company and OpenAI partner, added as defendant)
9. Key Law Firms:
– For Plaintiffs: Cowan, DeBaets, Abrahams & Sheppard LLP
– For Defendants: Morrison & Foerster LLP (OpenAI); Kirkland & Ellis LLP (Microsoft)
10. Expert Witnesses: Technical and economic experts pending disclosure in discovery phase

Legal Framework

11. Case Type: Copyright infringement in AI training data; unfair competition; violation of Digital Millennium Copyright Act (DMCA)
12. Primary Legal Claims:
– Direct copyright infringement (17 U.S.C. § 501)
– Vicarious copyright infringement
– Contributory copyright infringement
– Violation of DMCA Section 1202 (removal of copyright management information)
13. Secondary Claims:
– Unfair competition under New York common law
– Unjust enrichment
– Negligence
14. Monetary Relief: Actual damages and defendants’ profits; statutory damages up to $150,000 per infringed work; injunctive relief

Technical Elements

15. AI/Technology Involved:
– GPT-3, GPT-3.5, GPT-4 large language models
– ChatGPT conversational AI interface
– Web crawling and data scraping technologies
– Transformer-based neural network architectures
16. Industry Sectors: Publishing, media, education, creative industries, technology
17. Data Types: Copyrighted literary works, books, articles, web content, training datasets

Database Navigation

18. Keywords/Tags: AI copyright, fair use, generative AI, large language models, training data, web scraping, DMCA, authors’ rights, transformative use
19. Related Cases:
– Doe v. GitHub, Inc., No. 4:22-cv-06823 (N.D. Cal. 2022)
– Andersen v. Stability AI Ltd., No. 3:23-cv-00201 (N.D. Cal. 2023)
– Kadrey v. Meta Platforms, Inc., No. 3:23-cv-03417 (N.D. Cal. 2023)
– Getty Images v. Stability AI, Inc., No. 1:23-cv-00135 (D. Del. 2023)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係:
2023年9月、著者団体Authors Guildと17名の著名な作家らが、OpenAI社およびその関連会社を相手取り、著作権侵害訴訟を提起した。原告らは、OpenAIが同社の大規模言語モデル(GPT-3、GPT-3.5、GPT-4)の訓練において、許可なく原告らの著作物を複製・使用したと主張している。特に問題とされているのは、これらのAIモデルが原告らの文体や内容を模倣した文章を生成する能力を有している点である。

中心的争点:
1. AI訓練における著作物の使用がフェアユース(公正利用)に該当するか
2. AIが生成する派生的コンテンツが著作権侵害を構成するか
3. 訓練データから著作権管理情報を除去したことがDMCA違反にあたるか
4. OpenAIの行為が不正競争を構成するか

原告の主張:
原告らは、OpenAIが数百万冊の書籍を含む大量の著作権保護されたコンテンツを、権利者の許可なく複製・使用したと主張。これらの著作物は「Books1」「Books2」と呼ばれるデータセットに含まれており、違法な海賊版サイトから取得された可能性があると指摘している。さらに、ChatGPTが原告らの作品の詳細な要約や文体の模倣を生成できることを証拠として提示し、これが市場における原告らの作品の価値を損なうと主張している。

被告の主張:
OpenAIは、AI訓練における著作物の使用はフェアユースの範囲内であると反論。技術革新と表現の自由の観点から、AIモデルの訓練は変容的使用(transformative use)であり、原作品とは異なる目的と性質を持つと主張している。また、生成されるコンテンツは新たな創作物であり、単なる複製ではないとしている。

AI/技術要素:
GPTシリーズは、Transformerアーキテクチャに基づく自己回帰型言語モデルである。数千億のパラメータを持ち、インターネット上のテキストデータ、書籍、論文などから学習している。訓練プロセスには次の段階が含まれる:
– データ収集:ウェブクローリング、データセット購入、パートナーシップによる取得
– 前処理:テキストの正規化、トークン化、フィルタリング
– 事前学習:大規模コーパスでの教師なし学習
– ファインチューニング:人間のフィードバックによる強化学習(RLHF)

手続きの経過 (Procedural History)

重要な手続き上の決定:
2024年2月、連邦地方裁判所は被告の一部棄却申立てについて判断を下した。裁判所は、直接的な著作権侵害請求とDMCA違反の主張については訴訟継続を認めたが、派生的著作物に関する一部の請求は棄却した。この決定は、AI訓練におけるフェアユースの抗弁が事実問題として審理される必要があることを示唆している。

証拠開示:
現在進行中の証拠開示手続きでは、以下の重要な情報が争点となっている:
– OpenAIの訓練データセットの完全な内容と出所
– 書籍データの取得方法と処理プロセス
– モデルアーキテクチャと訓練手法の詳細
– 収益モデルと商業的利用の範囲

専門家証言:
両当事者は、以下の分野の専門家を指名する予定:
– 機械学習とAI技術の専門家
– 著作権法とフェアユース判例の法律専門家
– 出版市場と経済的影響の評価専門家
– コンピュータフォレンジックとデータ分析の専門家

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)
(注:本件は係属中のため、現時点では最終判決は出ていない。以下は2024年2月の中間判断について記載)

主要な判決内容:
裁判所は、原告の主張の多くに法的メリットがあることを認め、以下の点について審理継続を決定:
1. 訓練データの複製が著作権侵害を構成する可能性
2. DMCA第1202条違反(著作権管理情報の除去)の主張の妥当性
3. 不正競争法に基づく請求の一部

一方で、以下の請求は棄却:
1. ChatGPTのすべての出力が派生的著作物であるという包括的な主張
2. 過度に広範な差止請求の一部

法的推論の分析:
裁判所は、AI訓練におけるフェアユース判断について、Campbell v. Acuff-Rose Music判決の4要素テストを適用する必要性を強調:
1. 使用の目的と性質(商業的vs教育的、変容的使用か)
2. 著作物の性質(事実的vs創造的)
3. 使用された部分の量と実質性
4. 市場への影響

裁判所は、これらの要素の評価には事実認定が必要であり、申立段階での判断は時期尚早であるとした。

技術的理解:
裁判所は、大規模言語モデルの訓練プロセスと、それが著作権法にもたらす新たな課題について相当程度の理解を示した。特に、AIモデルが単なるデータベースではなく、学習したパターンを基に新たなコンテンツを生成する点を認識している。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本件は、生成AIと著作権法の交差点における最重要判例となる可能性が高い。特に以下の点で先例的価値を持つ:
1. AI訓練におけるフェアユースの範囲の明確化
2. 大規模な著作物使用に対する権利者の救済方法
3. AI生成コンテンツの法的地位の確立
4. 技術革新と著作権保護のバランス

法理論の発展:
本件は、デジタル時代における著作権法の適用に関する重要な法理論の発展に寄与する:
– 「変容的使用」概念のAI文脈での再定義
– 機械学習における「複製」の法的意味
– AIシステムの「創造性」と著作権の関係
– データの大規模使用に関する新たな法的枠組み

解釈の明確化:
既存の著作権法がAI技術にどのように適用されるかについて、以下の点が明確化される見込み:
– DMCAの技術的保護手段回避禁止のAIへの適用
– 派生的著作物の定義とAI生成コンテンツ
– 商業的使用と研究目的使用の区別
– ライセンスモデルの必要性と実現可能性

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
本件の結果は、AI開発における以下のガバナンス要件を形成する可能性がある:
1. 訓練データの透明性と追跡可能性の確保
2. 著作権コンプライアンスプログラムの実装
3. データ使用に関する内部監査体制の構築
4. 倫理的AI開発ガイドラインの策定

コンプライアンス:
AI開発企業および利用企業は、以下の対応策を検討する必要がある:
– ライセンス取得またはオプトアウトメカニズムの実装
– 訓練データの出所と権利関係の文書化
– 生成コンテンツの著作権リスク評価プロセス
– 権利者との協力関係構築

業界への影響:
出版業界とAI業界の両方に重大な影響を与える:
– 新たなライセンスモデルとビジネスモデルの創出
– AI開発コストの増大可能性
– クリエイティブ産業の収益構造の変化
– 技術革新のペースへの影響

リスク管理:
企業は以下のリスク管理策を講じる必要がある:
1. 訓練データの法的監査
2. 保険coverage の見直し
3. 契約条項の更新(補償条項等)
4. 代替的なデータ調達戦略の開発

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法(平成30年改正)では、第30条の4により、情報解析目的での著作物利用が一定程度許容されている。これは米国のフェアユース原則とは異なるアプローチであり、以下の相違点がある:

1. 目的制限:日本法は「情報解析」目的に限定、米国は事案ごとの総合判断
2. 商業利用:日本法でも非営利に限定されず、米国も商業性は一要素
3. 権利制限の範囲:日本法は明文規定、米国は判例法理
4. 国際的調和:両国とも技術発展と権利保護のバランスを模索

他国判例との関係:
– EU:DSM指令第3条、第4条でテキスト・データマイニング例外規定
– 英国:2024年に提案されたAI訓練例外規定(その後撤回)
– 中国:AI訓練データに関する規制強化の動き
– カナダ:フェアディーリング原則の適用検討

グローバルな影響:
本件の判決は、国際的なAI規制の標準形成に影響を与える可能性がある:
– 多国籍企業のグローバルコンプライアンス戦略
– 国際的なデータ共有協定の必要性
– AIモデルの越境移転に関する法的枠組み
– 技術標準と法的標準の国際調和

重要なポイント (Key Takeaways)

実務家への示唆:

1. AI開発企業の法務担当者向け:
– 訓練データの権利処理プロセスを早急に確立すべき
– 技術文書と法的文書の整合性を確保する必要がある
– 予防的なライセンス取得戦略を検討すべき

2. コンテンツ権利者の代理人向け:
– AI使用に関する契約条項の見直しが必要
– 集団的権利管理の枠組み構築を検討すべき
– 技術的保護手段の実装を強化する必要がある

3. 企業内弁護士向け:
– AI利用に関するリスク評価フレームワークの構築
– ベンダー契約における補償条項の強化
– 内部的なAI利用ガイドラインの策定

今後の展望:
生成AI技術の急速な発展に伴い、以下の法的論点が今後重要になると予測される:
– AIの「創作者」としての地位
– 合成データ使用の法的評価
– 国際的な規制調和の必要性
– 新たなライセンスモデルの確立

注意すべき事項:
1. 本件の最終判決まで、AI訓練における著作物使用の適法性は不確定
2. 各国の法制度により扱いが異なるため、国際展開時は個別検討が必要
3. 技術的対策と法的対策の両面からのアプローチが重要
4. 業界標準やベストプラクティスの形成過程に注意を払うべき

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です