Thomson Reuters Enterprise Centre GmbH v. Ross Intelligence Inc.
Case Metadata
Basic Information
1. Case Name: Thomson Reuters Enterprise Centre GmbH and West Publishing Corporation v. Ross Intelligence Inc., Case No. 1:20-cv-613 (D. Del. filed May 6, 2020)
2. Court: United States District Court for the District of Delaware
3. Filing Date: May 6, 2020
4. Judgment Date: September 25, 2024 (Summary judgment ruling on fair use defense)
5. Case Number: 1:20-cv-613-CFC-SRF
6. Current Status: Partially decided on summary judgment; trial pending on remaining issues
Parties
7. Plaintiff(s):
– Thomson Reuters Enterprise Centre GmbH (German subsidiary, legal content provider)
– West Publishing Corporation (American legal publisher, subsidiary of Thomson Reuters)
8. Defendant(s):
– Ross Intelligence Inc. (AI legal research startup, ceased operations December 2020)
9. Key Law Firms:
– For Plaintiffs: Morris, Nichols, Arsht & Tunnell LLP; Latham & Watkins LLP
– For Defendant: Potter Anderson & Corroon LLP; Susman Godfrey L.L.P.
10. Expert Witnesses: Technical and economic experts provided testimony regarding AI training methodologies and market impact (specific names sealed in court documents)
Legal Framework
11. Case Type: Copyright infringement in AI training data; unauthorized use of proprietary legal content for machine learning
12. Primary Legal Claims:
– Copyright infringement under 17 U.S.C. § 501
– Violation of Terms of Service
– Unfair competition
13. Secondary Claims:
– Tortious interference with contract
– Unjust enrichment
– Trade secret misappropriation (dismissed)
14. Monetary Relief: Actual damages and profits attributable to infringement (amount to be determined at trial); statutory damages; attorneys’ fees
Technical Elements
15. AI/Technology Involved:
– Ross Intelligence’s natural language processing AI system for legal research
– Machine learning models trained on Westlaw legal database content
– Large language model (LLM) technology for legal query processing
16. Industry Sectors: Legal technology (LegalTech), artificial intelligence, legal publishing and research
17. Data Types: Proprietary legal content including judicial opinions with editorial enhancements, headnotes, key number system classifications, case summaries
Database Navigation
18. Keywords/Tags: AI training data, fair use doctrine, copyright infringement, legal AI, machine learning, web scraping, transformative use, LegalTech litigation, Westlaw database
19. Related Cases:
– Authors Guild v. Google Inc., 804 F.3d 202 (2d Cir. 2015)
– Oracle America, Inc. v. Google LLC, 141 S. Ct. 1183 (2021)
– Silverman v. OpenAI, Inc., No. 23-cv-03416 (N.D. Cal. filed July 7, 2023)
– Kadrey v. Meta Platforms, Inc., No. 23-cv-03417 (N.D. Cal. filed July 7, 2023)
詳細分析 (Detailed Analysis)
事件の概要 (Case Overview)
背景と争点 (Background and Issues)
事実関係: 本件は、法律調査AIスタートアップ企業であるRoss Intelligence社が、Thomson ReutersのWestlaw法律データベースから大量のコンテンツを無断で取得し、自社のAIシステムの訓練に使用したとされる著作権侵害訴訟である。Ross社は2015年に設立され、IBMのWatson技術を基盤として、弁護士向けの自然言語処理による法律調査ツールを開発していた。
2019年、Ross社は、Westlawデータベースへのアクセス権を持つ第三者(LegalEase Solutions社)と契約を締結し、同社を通じてWestlawのコンテンツを大規模に取得した。Thomson Reuters社の調査によると、Ross社は約25,000件の判例文書を含む大量のデータを組織的に収集し、これらのデータには、Thomson Reuters社が付加した独自の編集要素(ヘッドノート、要約、Key Numberシステムによる分類等)が含まれていた。
中心的争点:
– AIシステムの訓練目的での著作権保護されたコンテンツの使用が、米国著作権法第107条のフェアユース(公正使用)の抗弁として認められるか
– 大規模言語モデル(LLM)の訓練データとしての使用が「変容的使用」(transformative use)に該当するか
– 商業的競合関係にある企業間でのデータ使用がフェアユース分析にどのような影響を与えるか
– 利用規約違反を通じた不正アクセスが著作権侵害の判断に与える影響
原告の主張: Thomson Reuters社は、Ross社が組織的かつ意図的に著作権で保護された独自のコンテンツを盗用し、直接競合する製品の開発に使用したと主張。特に、単なる判例文そのものではなく、多大な投資と編集作業によって作成された付加価値情報(ヘッドノート、要約、分類体系等)が無断使用されたことを強調した。また、Ross社の行為により、Westlawの市場価値が損なわれ、ライセンス収入の機会が失われたと主張した。
被告の主張: Ross社は、AIモデルの訓練は研究目的の使用であり、フェアユースの範囲内であると主張。Google Books訴訟等の先例を引用し、機械学習のためのデータ使用は変容的であり、元の著作物とは異なる目的と性質を持つと論じた。また、AIシステムは元のコンテンツを複製するのではなく、パターンと関係性を学習するだけであり、市場への悪影響は限定的であると反論した。
AI/技術要素: Ross社のAIシステムは、自然言語処理技術を用いて弁護士の質問を理解し、関連する法的情報を提供する。システムの訓練には、大量の法律文書から言語パターン、法的概念の関係性、引用パターン等を学習させる必要があった。Ross社は、Westlawのデータを使用してモデルの精度を向上させ、特に判例間の関連性理解と法的推論能力を強化しようとしていた。
手続きの経過 (Procedural History)
重要な手続き上の決定:
– 2020年11月:Ross社が営業停止を発表(訴訟継続中)
– 2021年3月:被告の却下申立てが棄却され、訴訟継続が決定
– 2023年6月:証拠開示手続きにおいて、Ross社の内部文書が開示され、組織的なデータ収集の詳細が明らかに
– 2024年7月:両当事者がフェアユースに関する部分的サマリージャッジメントを申立て
証拠開示: 証拠開示手続きにおいて、Ross社の内部メール、技術文書、契約書等が開示された。特に重要な証拠として、Ross社がLegalEase社を通じてWestlawのコンテンツを取得する計画を詳細に記述した内部文書、AIモデルの訓練にWestlawデータを使用することの重要性を説明した技術仕様書、競合分析においてWestlawを直接のターゲットとして位置づけた事業計画書等が提出された。
専門家証言: 両当事者から複数の専門家が証言を提供。原告側の専門家は、Ross社のAIシステムがWestlawの編集要素を実質的に複製し、同様の機能を提供していることを技術的に分析。被告側の専門家は、機械学習プロセスの変容的性質と、訓練データが最終製品において認識不可能な形に変換されることを強調した。
判決の概要 (Judgment Summary)
裁判所の判断 (Court’s Decision)
主要な判決内容: 2024年9月25日、デラウェア地区連邦地方裁判所のColm F. Connolly判事は、Ross社のフェアユース抗弁を棄却する部分的サマリージャッジメントを下した。裁判所は、フェアユースの4要素分析を詳細に行い、すべての要素がThomson Reuters社に有利であると判断した。
勝敗の結果: Thomson Reuters社が部分的勝訴。裁判所は、Ross社によるWestlawコンテンツの使用が著作権侵害に該当し、フェアユースの抗弁は適用されないと判断。ただし、損害賠償額等については今後の審理で決定される。
命令された救済措置:
– フェアユース抗弁の棄却
– 著作権侵害の責任に関する判断(損害賠償額は未定)
– 今後の審理で具体的な救済措置(差止命令、損害賠償額等)を決定予定
重要な法的判断:
1. AIモデルの訓練目的でのコンテンツ使用は、必ずしも変容的使用とは認められない
2. 商業的競合関係にある当事者間でのデータ使用は、フェアユース認定に不利に働く
3. 利用規約違反を通じた不正アクセスは、使用の性質を悪質化させる要因となる
4. 著作権で保護された編集要素の実質的使用は、単なる事実情報の使用とは区別される
反対意見・補足意見: 本件はサマリージャッジメントであり、反対意見は存在しない。
法的推論の分析 (Analysis of Legal Reasoning)
適用された法理: 裁判所は、Campbell v. Acuff-Rose Music, Inc.判決で確立された4要素テストを適用:
1. 使用の目的と性質(商業的性質、変容的使用の有無)
2. 著作物の性質
3. 使用された部分の量と実質性
4. 潜在的市場への影響
事実認定:
– Ross社が組織的かつ計画的にWestlawのコンテンツを取得した事実
– 取得したデータに著作権で保護された編集要素が含まれていた事実
– Ross社とThomson Reuters社が直接競合する市場で事業を行っている事実
– Ross社の製品がWestlawの代替として市場に提供されていた事実
技術的理解: 裁判所は、AIモデルの訓練プロセスについて詳細な理解を示し、単なる「中間的複製」の議論を退けた。特に、訓練データが最終的なモデルに与える影響と、競合製品開発における役割を慎重に評価した。
法的意義 (Legal Significance)
先例価値 (Precedential Value)
将来への影響: 本判決は、AI企業が訓練データとして第三者の著作権コンテンツを使用する際の法的リスクを大幅に高めた。特に、商業目的でのAI開発において、競合他社のデータを使用することは、フェアユース抗弁の適用を困難にすることが明確になった。
法理論の発展: 本判決は、デジタル時代における著作権法の適用に関して、以下の重要な原則を確立:
– AI訓練データの使用に関する初めての明確な司法判断
– 「変容的使用」概念のAI文脈での限定的解釈
– 技術的中立性よりも商業的文脈を重視する判断枠組み
解釈の明確化: 既存のフェアユース法理をAI技術に適用する際の具体的な判断基準を提示。特に、Google Books判決との区別を明確にし、大規模データ使用が自動的にフェアユースとなるわけではないことを示した。
規制・実務への影響 (Regulatory and Practical Impact)
AIガバナンス:
– AI開発企業は、訓練データの取得と使用に関する包括的なコンプライアンスプログラムの確立が必要
– データソースの適法性確認、ライセンス取得、利用規約遵守の重要性が増大
– 「クリーンルーム」アプローチによるAI開発の必要性
コンプライアンス: 企業が取るべき具体的対応策:
1. 訓練データの出所と権利関係の完全な文書化
2. 競合他社のデータ使用に関する厳格な内部統制
3. 利用規約とライセンス条件の徹底的な確認
4. フェアユース依存からライセンスベースのアプローチへの移行
業界への影響:
– LegalTech業界における既存プレーヤーの優位性強化
– スタートアップ企業の参入障壁上昇
– データパートナーシップとライセンシングモデルの重要性増大
– オープンソースデータセットへの依存度上昇
リスク管理:
– 訴訟リスク評価における訓練データ監査の必要性
– 保険商品の見直し(AI関連の知的財産権侵害リスクのカバレッジ)
– M&Aデューデリジェンスにおけるデータ権利の精査強化
比較法的観点 (Comparative Law Perspective)
日本法との比較:
日本の著作権法第30条の4(著作物に表現された思想又は感情の享受を目的としない利用)は、AI学習のための著作物利用により寛容な枠組みを提供している。本件のような商業的競合関係や利用規約違反があっても、日本法では情報解析目的での利用が認められる可能性が高い。ただし、2023年の文化庁による解釈指針では、「享受目的」の有無や権利者の利益を不当に害する場合の制限が明確化されており、本件のような悪質な事案では日本でも違法と判断される可能性がある。
他国判例との関係:
– EU:2019年のデジタル単一市場著作権指令では、テキスト・データマイニングに関する例外規定があるが、商業目的での使用には権利者のオプトアウト権が認められている
– 英国:2023年にAI訓練のための著作権例外規定の導入が検討されたが、権利者団体の反対により撤回
– 中国:著作権法改正により、ビッグデータとAIの発展を促進する例外規定が検討されているが、具体的な範囲は未確定
グローバルな影響:
– 多国籍AI企業は、各国の法制度の違いを考慮したデータ戦略の構築が必要
– 国際的なデータライセンシング標準の確立への動き
– AI開発拠点の立地選択における法的環境の重要性増大
重要なポイント (Key Takeaways)
実務家への示唆:
1. デューデリジェンスの強化: AI関連案件において、訓練データの権利関係確認は最重要事項
2. 契約実務の見直し: データライセンス契約にAI訓練使用に関する明示的条項の追加
3. 紛争予防策: 競合他社データの使用禁止ポリシーの確立と社内教育の徹底
4. 代替戦略の検討: 合成データ、公開データセット、ライセンスデータの活用
今後の展望:
– 連邦議会によるAI訓練データに関する立法の可能性
– 業界団体による自主規制ガイドラインの策定
– 大手テック企業による訴訟戦略の変化(和解優先からライセンス交渉へ)
– 生成AI訴訟への波及効果(OpenAI、Meta等の係争中案件への影響)
注意すべき事項:
– フェアユース抗弁への過度の依存は高リスク
– 「研究目的」の主張だけでは商業利用を正当化できない
– 技術的な「変容」と法的な「変容的使用」は異なる概念
– 訴訟コストと事業継続性リスクの慎重な評価が必要
このレポートに関する注意事項 (Warning/Notes)
– このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。
コメントを残す