The New York Times Company v. Microsoft Corporation et al.

The New York Times Company v. Microsoft Corporation et al.

Case Metadata

Basic Information

1. Case Name: The New York Times Company v. Microsoft Corporation, OpenAI Inc., OpenAI GP LLC, OpenAI LLC, OpenAI OpCo LLC, OpenAI Global LLC, OAI Corporation LLC, and OpenAI Holdings LLC
2. Court: United States District Court for the Southern District of New York
3. Filing Date: December 27, 2023
4. Judgment Date: Case pending (Key ruling on April 29, 2024 denying motion to dismiss)
5. Case Number: 1:23-cv-11195
6. Current Status: Pending – Discovery phase ongoing with trial expected in 2025

Parties

7. Plaintiff(s): The New York Times Company – Major American news media organization and digital publisher with over 9.7 million subscribers
8. Defendant(s):
– Microsoft Corporation – Multinational technology corporation and primary investor in OpenAI
– OpenAI Inc. and related entities – Artificial intelligence research and deployment companies developing ChatGPT and GPT models
9. Key Law Firms:
– For Plaintiff: Susman Godfrey LLP (lead counsel)
– For Defendants: Latham & Watkins LLP (OpenAI), Orrick, Herrington & Sutcliffe LLP (Microsoft)
10. Expert Witnesses: Technical AI experts pending designation (discovery ongoing)

Legal Framework

11. Case Type: Copyright infringement in artificial intelligence training and output generation; unfair competition; trademark dilution
12. Primary Legal Claims:
– Direct copyright infringement under 17 U.S.C. § 501
– Vicarious copyright infringement
– Contributory copyright infringement
– Digital Millennium Copyright Act (DMCA) violations – 17 U.S.C. § 1202
13. Secondary Claims:
– Unfair competition by misappropriation under New York common law
– Trademark dilution under 15 U.S.C. § 1125(c)
14. Monetary Relief: Actual damages and statutory damages potentially in billions of dollars; disgorgement of profits; permanent injunctive relief sought

Technical Elements

15. AI/Technology Involved:
– OpenAI’s GPT-3, GPT-3.5, GPT-4 large language models
– ChatGPT consumer-facing chatbot
– Microsoft Bing Chat (Copilot) integration
– Common Crawl dataset and WebText training data
16. Industry Sectors: Media and journalism, artificial intelligence, technology platforms, digital publishing
17. Data Types: Copyrighted news articles, investigative reporting, opinion pieces, reviews, how-to guides, proprietary journalism content

Database Navigation

18. Keywords/Tags: AI copyright, generative AI litigation, fair use doctrine, web scraping, training data, LLM copyright, media rights, DMCA Section 1202, ChatGPT lawsuit, transformative use
19. Related Cases:
– Authors Guild v. OpenAI Inc., No. 1:23-cv-08292 (S.D.N.Y.)
– Silverman v. OpenAI Inc., No. 3:23-cv-03416 (N.D. Cal.)
– Getty Images (US), Inc. v. Stability AI, Inc., No. 1:23-cv-00135 (D. Del.)
– Anderson v. Stability AI Ltd., No. 3:23-cv-00201 (N.D. Cal.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係:
2023年12月27日、ニューヨーク・タイムズ社は、MicrosoftおよびOpenAI各社に対し、著作権侵害訴訟を提起した。同社は、被告らが同社の膨大な著作権保護されたコンテンツを無断で使用してGPTモデルを訓練し、ChatGPTやBing Chatを通じて同社の記事をほぼそのまま再現する出力を生成していると主張している。NYTによれば、被告らは数百万件に及ぶ同社の記事を体系的にコピーし、AIシステムの訓練に使用したとされる。

中心的争点:
– AIモデルの訓練における著作権保護コンテンツの大規模使用が著作権侵害を構成するか
– 生成AIによる著作物の出力が「フェアユース」の抗弁で保護されるか
– AIシステムが訓練データから記事を「記憶」し、逐語的に再現することの法的意味
– 著作権管理情報(CMI)の削除がDMCA違反を構成するか
– AIによるコンテンツ生成が報道機関のビジネスモデルに与える経済的影響

原告の主張:
NYTは、被告らが同社のジャーナリズムに「ただ乗り」していると主張し、以下の救済を求めている:
– 著作権侵害の認定と侵害行為の差止
– 実損害賠償および法定損害賠償(潜在的に数十億ドル規模)
– NYTコンテンツで訓練されたAIモデルの破壊
– 被告らが得た利益の返還

被告の主張:
OpenAIとMicrosoftは、以下の抗弁を展開している:
– AIモデルの訓練は変容的使用(transformative use)でありフェアユースに該当
– 学習プロセスは人間の読書と学習に類似した行為
– 出力の類似性は「幻覚」(hallucination)や偶発的な現象
– 原告は技術革新を阻害しようとしている

AI/技術要素:
本件の核心には、大規模言語モデル(LLM)の訓練プロセスがある。GPT-4等のモデルは、インターネットから収集された数兆のトークンを含むデータセットで訓練される。このプロセスには:
– Common Crawlデータセットを通じたウェブコンテンツの大規模収集
– トークン化と埋め込み処理による文章のベクトル化
– トランスフォーマーアーキテクチャによるパターン学習
– 訓練データの「記憶」と再現能力の問題

手続きの経過 (Procedural History)

重要な手続き上の決定:
– 2024年4月29日:Sidney H. Stein判事が被告らの却下申立を大部分棄却し、主要な請求について訴訟継続を認める
– 2024年7月:証拠開示に関する重要な命令で、ChatGPTの400万人以上のユーザーに関する情報開示を命令
– 2024年9月:専門家証人の指定期限と証拠開示スケジュールの設定

証拠開示:
裁判所は以下の証拠開示を命令:
– AIモデルの訓練データセットの詳細
– NYTコンテンツへのアクセスと使用に関する内部文書
– ChatGPTユーザーのプロンプトと出力データ(プライバシー懸念あり)
– 訓練プロセスと技術的実装に関する文書

専門家証言:
AI技術、著作権法、経済的損害に関する専門家証人の選定が進行中。機械学習の専門家による訓練プロセスの説明と、メディア経済学者による市場への影響分析が予定されている。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)

主要な判決内容:
2024年4月29日のStein判事の決定は、本案審理前の重要な判断を示した:

著作権侵害請求の維持: 直接侵害、寄与侵害、代位責任の各請求について、訴答段階での棄却を否定
フェアユース抗弁の早期判断回避: フェアユースは事実集約的な判断であり、証拠開示後の判断が必要と判示
DMCA請求の一部維持: 著作権管理情報の削除に関する請求について審理継続を認める
不正競争請求の維持: ニューヨーク州法に基づく不正利用の請求を認容

勝敗の結果:
現時点では中間的判断のみで、最終的な勝敗は未定。ただし、原告の主要請求が維持されたことは、原告にとって重要な手続き的勝利となった。

命令された救済措置:
最終判決前のため、恒久的救済措置は未定。ただし、証拠開示命令により、被告らは訓練データとユーザー情報の開示を義務付けられている。

重要な法的判断:
– AIによる著作物の使用が prima facie での著作権侵害を構成し得ることを認定
– 訓練目的での複製も著作権法上の「複製」に該当する可能性を示唆
– 変容的使用の判断には、AIの目的と性質の詳細な分析が必要

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理:
裁判所は以下の確立された法理を適用:
– フェアユースの4要素テスト(17 U.S.C. § 107)
– 著作権侵害の要件(実質的類似性と接触)
– DMCAにおける著作権管理情報の保護
– 代位責任と寄与侵害の法理

事実認定:
訴答段階のため、裁判所は原告の主張を真実と仮定。重要な事実認定には:
– 被告らがNYTコンテンツにアクセスし、訓練に使用した可能性
– ChatGPTがNYT記事を逐語的に再現する能力の存在
– 経済的影響の可能性(購読者減少のリスク)

技術的理解:
Stein判事は、LLMの技術的複雑性を認識しつつ、著作権法の基本原則が新技術にも適用されることを強調。AIの「学習」が人間の学習と法的に同等かという問題については、更なる証拠が必要と判断。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本件は、生成AI時代における著作権法の適用に関する最初の主要な判例となる可能性がある。特に:
– AIモデル訓練におけるフェアユースの境界線の確立
– 技術企業とコンテンツ創作者間の権利バランスの再定義
– AIによる著作権侵害の責任帰属の明確化

法理論の発展:
– 「変容的使用」概念のAI文脈での再解釈
– 機械学習における「複製」の法的定義
– AIシステムの「創作性」と著作権の関係

解釈の明確化:
– デジタル時代における著作権の経済的価値の評価方法
– 技術的必然性と法的責任の区別
– AIの「幻覚」現象の法的取り扱い

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
企業は以下のガバナンス強化が必要:
– 訓練データの出所と権利関係の徹底的な記録管理
– コンテンツライセンスとデータ使用ポリシーの明確化
– AI出力の著作権チェックメカニズムの実装
– 透明性とトレーサビリティの確保

コンプライアンス:
AI開発企業が取るべき対応策:
– 著作権クリアランスプロセスの確立
– オプトアウトメカニズムの提供
– コンテンツ所有者との積極的なライセンス交渉
– 技術的保護手段の実装(出力フィルタリング等)

業界への影響:
– AI開発コストの大幅な上昇可能性
– オープンソースAIプロジェクトへの影響
– メディア企業とAI企業間の新たなビジネスモデルの必要性
– 訓練データの「クリーン化」への投資増加

リスク管理:
– 訴訟リスク評価の定期的実施
– 保険カバレッジの見直し(AI関連リスク)
– 契約における免責条項と補償条項の強化
– 証拠保全とドキュメンテーション体制の構築

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法(著作権法第30条の4)は、2018年改正により「情報解析」目的での著作物利用に一定の例外を設けている。主な相違点:
– 日本法は非享受目的利用に寛容な立場
– ただし、著作権者の利益を不当に害する場合は除外
– AIの学習を「情報解析」として捉える可能性
– 出力段階での侵害は日本でも問題となり得る

他国判例との関係:
– EU:DSM指令によるテキスト・データマイニング例外(オプトアウト権付き)
– 英国:AI訓練のための著作権例外規定の検討(現在保留中)
– カナダ:フェアディーリング規定の柔軟な解釈傾向

グローバルな影響:
– 国際的なAI企業のコンプライアンス戦略の見直し
– 訓練データの地理的分離の可能性
– 国際条約(ベルヌ条約等)との整合性の議論
– AIガバナンスの国際標準化への影響

重要なポイント (Key Takeaways)

実務家への示唆:
1. 契約実務: AI開発・利用契約において、訓練データの権利処理と表明保証条項の重要性が増大
2. デューデリジェンス: M&AやAI企業への投資において、訓練データの適法性確認が必須
3. リスク評価: AI導入企業は、ベンダーの著作権コンプライアンス体制を詳細に検証すべき
4. ライセンス戦略: コンテンツ所有者は、AI訓練用ライセンスの新たな収益モデルを検討すべき

今後の展望:
– 2025年の本案判決により、AI著作権法の基本的枠組みが確立される可能性
– 立法的解決への動き(米国議会でのAI規制法案)
– 業界自主規制とベストプラクティスの発展
– 国際的な調和への圧力増大

注意すべき事項:
– 現在使用中のAIシステムの訓練データ監査の実施
– 将来的な損害賠償リスクへの財務的備え
– 技術的対策と法的対策の両面からのアプローチ
– ステークホルダー(コンテンツ所有者)との早期対話の重要性

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です