Daily News LP v. Microsoft Corporation

Daily News LP v. Microsoft Corporation

Case Metadata

Basic Information

1. Case Name: Daily News LP et al. v. Microsoft Corporation et al., No. 1:24-cv-03285 (S.D.N.Y. 2024)
2. Court: United States District Court for the Southern District of New York, Federal Court with Jurisdiction over Manhattan
3. Filing Date: April 30, 2024
4. Judgment Date: Not yet adjudicated (ruling on motion to dismiss issued April 4, 2025)
5. Case Number: 1:24-cv-03285-VEC (consolidated with 1:23-cv-11195 and 1:24-cv-02440)
6. Current Status: Pending – Discovery phase ongoing following denial of motion to dismiss; consolidated with related cases as “In re: OpenAI Inc.”

Parties

7. Plaintiff(s):
– Daily News LP (New York Daily News – major metropolitan newspaper)
– Chicago Tribune Company LLC (Chicago Tribune – major regional newspaper)
– The Denver Post Inc. (Denver Post – regional newspaper serving Colorado)
– The Mercury News (San Jose Mercury News – technology hub regional newspaper)
– The Orange County Register (Orange County Register – Southern California regional newspaper)
– Orlando Sentinel Communications Company LLC (Orlando Sentinel – Florida regional newspaper)
– South Florida Sun Sentinel LLC (Sun Sentinel – South Florida regional newspaper)
– MediaNews Group Inc. (Parent company operating multiple regional newspapers)

8. Defendant(s):
– Microsoft Corporation (Technology giant, developer and operator of Copilot AI assistant)
– OpenAI Inc. (AI research company, developer of ChatGPT and GPT models)

9. Key Law Firms:
– Plaintiff’s Counsel: Susman Godfrey LLP (lead counsel for news publishers)
– Defendant Microsoft’s Counsel: Wilmer Cutler Pickering Hale and Dorr LLP
– Defendant OpenAI’s Counsel: Latham & Watkins LLP

10. Expert Witnesses: Not yet disclosed (case in discovery phase)

Legal Framework

11. Case Type: AI training data copyright infringement, algorithmic content appropriation, trademark dilution in generative AI systems
12. Primary Legal Claims:
– Copyright infringement under 17 U.S.C. § 501 (unauthorized reproduction and distribution of copyrighted news articles)
– Vicarious copyright infringement (benefiting from and controlling infringing AI systems)
– Contributory copyright infringement (knowingly facilitating infringement through AI model design)
– Digital Millennium Copyright Act (DMCA) violations under 17 U.S.C. § 1202 (removal of copyright management information)

13. Secondary Claims:
– Trademark dilution under Lanham Act (use of news brands in AI outputs)
– Unfair competition (appropriation of proprietary content without compensation)
– Common law misappropriation (taking time-sensitive news content)

14. Monetary Relief: Actual damages or statutory damages up to $150,000 per willfully infringed work; seeking injunctive relief and destruction of AI models trained on copyrighted content

Technical Elements

15. AI/Technology Involved:
– GPT-3.5 and GPT-4 large language models
– ChatGPT conversational AI interface
– Microsoft Copilot (formerly Bing Chat) AI assistant
– Web crawling and content scraping technologies
– Training datasets allegedly containing millions of copyrighted news articles

16. Industry Sectors: Media and journalism, artificial intelligence, technology services, digital publishing, information services

17. Data Types: Copyrighted news articles, investigative journalism content, editorial content, photojournalism, copyright management information (CMI), news archives

Database Navigation

18. Keywords/Tags: AI copyright infringement, generative AI litigation, ChatGPT lawsuit, news media copyright, fair use defense AI, training data copyright, DMCA CMI removal, journalism AI appropriation, LLM copyright liability

19. Related Cases:
– The New York Times Company v. Microsoft Corporation, No. 1:23-cv-11195 (S.D.N.Y.)
– Center for Investigative Reporting Inc. v. OpenAI Inc., No. 1:24-cv-02440 (S.D.N.Y.)
– Authors Guild v. OpenAI Inc., No. 1:23-cv-08292 (S.D.N.Y.)
– Andersen v. Stability AI Ltd., No. 3:23-cv-00201 (N.D. Cal.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係: 本件は、アメリカの主要新聞社8社が、Microsoft CorporationとOpenAI Inc.を相手取り、2024年4月30日にニューヨーク州南部地区連邦地方裁判所に提起した著作権侵害訴訟である。原告らは、被告らが数百万件に及ぶ報道記事を無断で複製し、ChatGPTおよびMicrosoft Copilotと呼ばれる生成AIシステムの訓練に使用したと主張している。原告らによれば、これらの記事には、調査報道、独占インタビュー、編集コンテンツなど、多大な投資と労力を要して作成された価値あるジャーナリズムコンテンツが含まれている。

中心的争点: 本件の核心的な法的争点は、生成AIモデルの訓練における著作権で保護されたコンテンツの大規模な使用が、著作権法上のフェアユース(公正使用)の抗弁で保護されるか否かという点である。さらに、AIシステムが訓練データから学習した内容を基に、元の記事と実質的に類似したコンテンツを生成することが著作権侵害を構成するか、そして著作権管理情報(CMI)の除去がDMCA違反に該当するかが争われている。

原告の主張: 原告らは、被告らが組織的かつ意図的に報道機関のコンテンツを無断で収集・複製し、商業的利益を得るためのAI製品開発に利用したと主張している。具体的には、被告らのAIシステムが原告らの記事を逐語的に再現する能力を有し、これにより原告らの購読収入や広告収入に直接的な損害を与えていると述べている。原告らは、実損害賠償または法定損害賠償(故意の侵害1件あたり最大15万ドル)、差止命令、および原告らのコンテンツで訓練されたAIモデルの破棄を求めている。

被告の主張: 被告らは、AIモデルの訓練におけるコンテンツの使用は変容的(transformative)であり、フェアユースの法理により保護されると主張している。また、AIシステムは単に記事を複製するのではなく、学習したパターンから新たなコンテンツを生成するものであり、原告らの市場を代替するものではないと反論している。さらに、技術革新と表現の自由の観点から、AIの発展を阻害するような判決は公共の利益に反すると主張している。

AI/技術要素: 本件で問題となっているのは、OpenAIのGPT-3.5およびGPT-4と呼ばれる大規模言語モデル(LLM)、およびこれらを基盤とするChatGPTとMicrosoft Copilot(旧Bing Chat)である。これらのシステムは、インターネット上の膨大なテキストデータを学習することで、人間のような自然な文章を生成する能力を獲得している。原告らは、被告らが「Common Crawl」などのウェブクローリング技術を用いて、原告らのウェブサイトから記事を系統的に収集したと主張している。

手続きの経過 (Procedural History)

重要な手続き上の決定: 2025年4月4日、Stein判事は被告らの却下申立て(motion to dismiss)に対して重要な判断を下した。裁判所は、原告らの主要な請求のほとんどについて、訴答段階(pleading stage)において十分な主張がなされているとして、却下申立てを棄却した。特に、著作権直接侵害、DMCA違反、および寄与侵害の請求について、原告らが「もっともらしい」(plausible)請求を述べているとの判断を示した。本件は、関連する他の訴訟(New York Times対Microsoft訴訟およびCenter for Investigative Reporting対OpenAI訴訟)と併合され、「In re: OpenAI Inc.」として統一的に管理されることとなった。

証拠開示: 現在、本件は証拠開示(discovery)段階にあり、原告らは被告らのAIモデルの訓練データセット、訓練プロセス、およびデータ収集方法に関する詳細な情報の開示を求めている。被告らは、企業秘密と競争上の機密情報を理由に、一部の情報開示に抵抗している。裁判所は、適切な保護命令(protective order)の下で、関連する技術文書の開示を命じる可能性が高いとされている。

専門家証言: 証拠開示段階のため、専門家証人はまだ正式に指名されていないが、両当事者とも、AI技術、著作権法、メディア経済学の分野から専門家を起用することが予想されている。特に、AIモデルの訓練プロセスの技術的側面と、原告らの市場への経済的影響に関する専門家証言が重要となる見込みである。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)

主要な判決内容: 2025年4月4日のSteen判事による中間判断において、裁判所は被告らの却下申立てを大部分において棄却した。裁判所は、原告らが著作権侵害の「直接的証拠」(direct evidence)を提示していることを認め、特にAIシステムが原告らの記事を「逐語的または準逐語的」(verbatim or near-verbatim)に再現する能力を有することが、著作権侵害の一応の証明(prima facie case)を構成すると判示した。

勝敗の結果: 現段階では最終判決は下されていないが、却下申立ての棄却により、原告らは本案審理(trial on the merits)に進む権利を獲得した。これは原告らにとって重要な手続き上の勝利であり、被告らにとっては、フェアユースの抗弁を事実審理において立証する必要が生じたことを意味する。

命令された救済措置: 現時点では最終的な救済措置は命じられていないが、裁判所は原告らが求める以下の救済について審理を進めることを認めた:著作権侵害に対する実損害賠償または法定損害賠償、将来的な侵害を防ぐための差止命令、原告らのコンテンツで訓練されたAIモデルの破棄または修正。

重要な法的判断: 裁判所は、AIモデルの訓練における著作物の使用に関して、フェアユースの判断は「事実集約的」(fact-intensive)な調査を要するものであり、訴答段階での判断には適さないとした。また、DMCA第1202条に基づく著作権管理情報の除去に関する請求についても、AIシステムがメタデータを除去して記事を処理することが違反を構成する可能性があると認めた。

反対意見・補足意見: 現段階では中間判断のため、反対意見や補足意見は存在しない。

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理: 裁判所は、著作権侵害の判断において伝統的な「実質的類似性」(substantial similarity)のテストを適用しつつ、AI文脈における新たな考慮事項を認識した。フェアユースの4要素テスト(使用の目的と性質、著作物の性質、使用された部分の量と実質性、市場への影響)について、AI訓練という新しい文脈での適用には慎重な検討が必要であるとの見解を示した。

事実認定: 裁判所は、原告らが提示した証拠から、被告らのAIシステムが実際に原告らの記事を含む大規模なデータセットで訓練されたことを認定した。また、ChatGPTやCopilotが特定のプロンプトに対して原告らの記事と実質的に類似した出力を生成する事例があることを、著作権侵害の可能性を示す重要な事実として認定した。

技術的理解: 裁判所は、大規模言語モデルの訓練プロセスについて相当程度の理解を示し、単なるデータの「学習」と「複製」の区別、変容的使用の概念、そしてAI出力における元データの「記憶」(memorization)の問題について、技術的な複雑性を認識した上で判断を下している。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響: 本件は、生成AIシステムの訓練における著作権で保護されたコンテンツの使用に関する最初の主要な判例となる可能性が高い。特に、報道機関のコンテンツという、時事性と公共性を有する著作物に関する判断は、AI開発における「訓練データの適法性」という根本的な問題に対する法的枠組みを提供することになる。

法理論の発展: 本件は、デジタル時代におけるフェアユース法理の適用範囲を明確化し、「変容的使用」の概念をAI文脈でどのように解釈すべきかという新たな法的基準を確立する可能性がある。また、AIシステムの「学習」と著作権法上の「複製」の関係について、重要な先例を形成することが期待される。

解釈の明確化: 裁判所の判断は、既存の著作権法とDMCA規定がAI技術にどのように適用されるかを明確にし、特に著作権管理情報の自動的な除去や変更がDMCA違反を構成する可能性について、具体的な指針を提供している。

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス: 本件の結果は、AI開発企業に対して、訓練データの収集と使用に関するより厳格なガバナンス体制の構築を要求することになる可能性がある。特に、著作権で保護されたコンテンツの識別、ライセンス取得、または除外のためのプロセスの確立が必要となる。

コンプライアンス: 企業は、AIモデルの訓練において使用するデータの出所と権利状態を詳細に文書化し、著作権侵害のリスクを最小化するための包括的なコンプライアンスプログラムを実施する必要がある。また、AI出力が既存の著作物を侵害しないよう、技術的および法的な保護措置を講じることが求められる。

業界への影響: 本件の判決は、AI業界全体のビジネスモデルに重大な影響を与える可能性がある。仮に原告らが勝訴した場合、AI開発企業は訓練データのライセンス費用を負担する必要が生じ、これによりAI開発のコストが大幅に増加する可能性がある。一方で、報道機関にとっては、コンテンツのライセンス収入という新たな収益源が生まれる可能性もある。

リスク管理: AI開発企業は、以下のリスク管理策を検討する必要がある:訓練データの適法性に関するデューデリジェンスの強化、著作権侵害保険の検討、技術的措置による侵害コンテンツのフィルタリング、ライセンス契約やデータ共有協定の締結。

比較法的観点 (Comparative Law Perspective)

日本法との比較: 日本の著作権法第30条の4は、「情報解析」のための著作物の利用について一定の制限規定を設けているが、これは主に非営利的な研究目的を想定したものであり、商業的なAI開発への適用については議論がある。本件のような大規模な商業的AI訓練が日本法下でどのように扱われるかは、今後の立法や判例の発展を待つ必要がある。また、日本では著作権法第47条の5により、電子計算機による情報処理の過程における軽微利用が認められているが、AIの学習過程がこれに該当するかは明確ではない。

他国判例との関係: EUでは、著作権指令(DSM指令)により、テキストおよびデータマイニング(TDM)に関する例外規定が設けられているが、権利者がオプトアウトする権利を有している。本件の判決は、このようなオプトアウト制度の導入に関する議論に影響を与える可能性がある。英国では、AI訓練のための著作権例外規定の導入が検討されたが、クリエイティブ産業からの反対により撤回された経緯がある。

グローバルな影響: 本件の判決は、国際的なAI開発競争における法的枠組みの形成に重要な影響を与える。特に、多国籍AI企業にとって、各国の著作権法制度の違いをどのように管理し、グローバルなAI製品を展開するかという課題がより複雑になる可能性がある。また、国際的なデータ共有や越境データ移転に関する新たな法的考慮事項を生み出す可能性もある。

重要なポイント (Key Takeaways)

実務家への示唆:
法務担当者および弁護士は、AI開発・利用に関する契約において、訓練データの権利関係を明確にする条項を含めることが不可欠である。特に、データ提供者との間で、AI訓練への使用許諾の有無、派生物の取り扱い、収益分配などを詳細に規定する必要がある。また、AI生成コンテンツの利用に際しては、元の著作物との類似性チェックを行うプロセスを確立し、侵害リスクを最小化する措置を講じることが推奨される。

企業法務においては、AI製品の開発・展開に先立って、包括的な知的財産権クリアランスを実施し、使用するデータセットの適法性を確認する必要がある。また、AI倫理委員会の設置や、定期的な法的コンプライアンス監査の実施も検討すべきである。

今後の展望:
本件を契機として、AIと著作権に関する立法的対応が加速する可能性が高い。米国議会では、AI訓練データの透明性要件や、権利者への補償メカニズムを含む新法の検討が進められている。また、国際的には、WIPO(世界知的所有権機関)においてAIと知的財産に関する国際的枠組みの策定が議論されている。

技術的には、「クリーンな」訓練データの使用を保証する技術的ソリューション、ブロックチェーンを活用した権利管理システム、AIによる自動的な著作権チェック機能などの開発が進むことが予想される。

注意すべき事項:
本件はまだ審理中であり、最終的な判決によって法的枠組みが大きく変わる可能性がある。また、和解によって終結する可能性もあり、その場合は先例としての価値が限定的となる。企業は、現時点での不確実性を認識しつつ、リスク管理の観点から保守的なアプローチを採用することが賢明である。特に、新規のAIプロジェクトを開始する際には、訓練データの適法性について慎重な検討を行い、必要に応じて権利者との事前のライセンス交渉を行うことが推奨される。

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です