Bartz v. Anthropic PBC

Case Metadata

Basic Information

  1. Case Name: Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417
  2. Court: U.S. District Court for the Northern District of California (Federal District Court)
  3. Filing Date: August 19, 2024
  4. Judgment Date: Partial Summary Judgment on June 23, 2025; Settlement reached August 26, 2025
  5. Case Number: 3:24-cv-05417-WHA
  6. Current Status: Settled (Class-wide settlement agreement reached August 2025, pending final approval)

Parties

  1. Plaintiff(s):
    • Andrea Bartz (Author)
    • Charles Graeber (Author)
    • Kirk Wallace Johnson (Author)
    • Class action representing copyright owners of books downloaded from pirate libraries LibGen and PiLiMi
  2. Defendant(s):
    • Anthropic PBC (AI company, developer of Claude large language models)
  3. Key Law Firms:
    • Plaintiffs: Susman Godfrey LLP (Justin Nelson, lead counsel), Lieff Cabraser Heimann & Bernstein LLP, Cowan Debaets Abrahams & Sheppard LLP, Edelson PC, Oppenheim + Zebrak LLP
    • Defendant: Cooley LLP, Arnold & Porter Kaye Scholer LLP, Latham & Watkins LLP, Lex Lumina LLP, Morrison & Foerster LLP
  4. Expert Witnesses: Technical experts on AI training processes and copyright valuation (specific names not disclosed in public records)

Legal Framework

  1. Case Type: AI copyright infringement – Book piracy for LLM training
  2. Primary Legal Claims:
    • Copyright infringement under 17 U.S.C. § 501
    • Unauthorized reproduction and distribution
    • Violation of exclusive rights in copyrighted works
  3. Secondary Claims:
    • Fair use defense (17 U.S.C. § 107)
    • Transformative use defense
    • Market harm analysis
  4. Monetary Relief: Statutory damages potentially up to $900 billion if willful infringement found; Settlement amount confidential

Technical Elements

  1. AI/Technology Involved:
    • Claude large language models (LLMs)
    • Training datasets from LibGen and PiLiMi pirate libraries
    • Anthropic’s “central library” of digitized books
    • Text generation and natural language processing systems
  2. Industry Sectors:
    • Artificial Intelligence and Machine Learning
    • Publishing and Media
    • Digital Content Creation
    • Educational Technology
  3. Data Types:
    • Over 7 million copyrighted books from pirate libraries
    • Legally purchased books (scanned and digitized)
    • Literary works (novels, non-fiction)
    • Training corpus for language model development

Database Navigation

  1. Keywords/Tags: AI copyright, LLM training, book piracy, fair use, transformative use, Anthropic, Claude, class action, LibGen, digital libraries, generative AI, copyright infringement
  2. Related Cases:
    • Kadrey v. Meta Platforms, Inc., No. 23-CV-03417-VC (N.D. Cal.)
    • Authors Guild v. OpenAI, Inc., No. 1:23-cv-08292 (S.D.N.Y.)
    • The N.Y. Times Co. v. Microsoft Corp., No. 1:23-cv-11195 (S.D.N.Y.)
    • Getty Images v. Stability AI, No. 1:23-cv-00135-JLH (D. Del.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係: 本件は、AI開発会社Anthropic PBC(Claudeチャットボットの開発者)が著作権で保護された書籍を無許可でAI言語モデルの訓練に使用したとして、複数の著作者らが提起した集団訴訟である。Anthropicは「世界中の全ての書籍」を「永続的に」保存する「中央図書館」の構築を目指し、約700万冊の著作権保護された書籍をLibGenやPiLiMiなどの海賊版サイトから無料でダウンロードし、同時に数百万冊の書籍を正規に購入してスキャン・デジタル化した後、紙の原本を廃棄した。

中心的争点: 主要な争点は以下の通りである:

  1. AI言語モデルの訓練目的での著作権保護作品の使用がフェアユース(公正利用)に該当するか
  2. 海賊版サイトからの書籍ダウンロードが著作権侵害に該当するか
  3. 正規購入した書籍のデジタル化がフェアユースに該当するか
  4. 著作者のライセンス市場への潜在的影響

原告の主張: 原告著作者らは、Anthropicが「何十万冊もの著作権保護書籍を盗用」して「数十億ドル規模の事業」を構築したと主張し、以下を求めた:

  • 著作権侵害に対する法定損害賠償(故意的侵害の場合、1作品あたり最大15万ドル)
  • 差止命令による侵害行為の停止
  • 集団訴訟としての認定

被告の主張: Anthropicは以下の抗弁を展開した:

  • AI訓練におけるフェアユース抗弁(変容的使用)
  • 著作物の学習目的での使用は数世紀にわたり行われてきた合法的行為
  • LLMの出力は原作品を置き換えるものではなく、新たな創作物である
  • 市場への害が証明されていない

AI/技術要素: 本件で問題となったのは、Anthropicが開発したClaudeシリーズの大規模言語モデル(LLM)である。これらのモデルは人間の文体を模倣したテキスト生成が可能で、膨大な文章データで訓練される。Anthropicは訓練用に各作品を4つの主要な方法でコピーし、その総数は実用的に推定不可能なほど多数に及んだ。

手続きの経過 (Procedural History)

重要な手続き上の決定:

  • 2024年8月19日:原告3名による提訴
  • 2024年10月10日:初回事件管理会議、2025年12月1日の陪審裁判日程設定
  • 2025年3月:集団訴訟認定申立予定
  • 2025年6月23日:Judge William Alsupによる部分的略式判決
  • 2025年7月:集団訴訟認定
  • 2025年8月26日:和解合意に到達

証拠開示: 証拠開示手続きにおいて、Anthropicが「盗用した」作品について「真実を明かすことを拒否」したとして、裁判所から厳しく批判された。

専門家証言: AI訓練プロセスの技術的側面および著作権価値評価に関する専門家証言が予定されていたが、和解により実現しなかった。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)

主要な判決内容: Judge William Alsupは2025年6月23日に部分的略式判決を下し、Anthropicの行為を以下のように区分して判断した:

  1. LLM訓練目的での使用: 「極めて変容的」であり、著作権法第107条に基づくフェアユースに該当
  2. 正規購入書籍のデジタル化: 単なる「形式変更」であり、フェアユースに該当
  3. 海賊版書籍の使用: フェアユースに該当せず、陪審による審理が必要

勝敗の結果: 部分的勝利となった。Anthropicは訓練目的での使用についてはフェアユース抗弁が認められたが、海賊版使用については責任を免れず、2025年12月1日に陪審裁判が予定されていた。しかし、2025年8月26日に和解が成立した。

命令された救済措置: 和解により最終的な救済措置は確定していないが、Anthropicが著作者らに補償を行うことが合意された。

重要な法的判断:

  • AI訓練における著作物使用が「生涯で最も変容的な技術の一つ」として評価
  • 「読者として学び、作家になることを志望する」行為との類推
  • 著作者は他者による自己作品からの「学習」を排除できないとの原則確立

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理: 裁判所は以下の法理を適用した:

  1. 変容的使用の原則: AI訓練が原作品を置き換えるのではなく、全く新しいものを創造する目的であることを重視
  2. フェアユースの4要素分析: 特に使用の目的・性質(第1要素)と潜在的市場への影響(第4要素)を詳細に検討
  3. 学習権の概念: 数世紀にわたる読書・学習の伝統を援用

事実認定: 重要な事実認定として、Anthropicの訓練プロセスが原作品の創作的要素を外部に複製・配布していないこと、および海賊版ダウンロードが著作者の作品需要を「コピーごとに」代替したことを認定。

技術的理解: 裁判所はAI技術に対し、従来の著作権法理の枠組みでも理解可能な「学習」プロセスとして捉える姿勢を示した。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響: 本判決は、AI訓練目的での著作物使用に関する初の実質的司法判断として、今後のAI関連訴訟に重大な先例的価値を持つ。ただし、同時期に下されたKadrey v. Meta判決とは異なる法的推論を採用しており、統一的基準の確立には更なる上級審判決が必要である。

法理論の発展: フェアユース法理のAI分野への適用において、「変容的使用」概念の大幅な拡張を図った。この判断は従来の著作権保護とAI技術革新のバランスを再定義する可能性がある。

解釈の明確化: 著作物取得方法(合法購入 vs 海賊版ダウンロード)によってフェアユース判断が分岐することを明確化し、AI企業に対し合法的なデータ取得の重要性を示した。

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス: AI開発企業は以下の対応が必要となる:

  • 訓練データの合法的取得プロセスの確立
  • 海賊版サイトからのデータ使用回避
  • 著作権リスク評価システムの構築
  • 透明性のあるデータソース開示

コンプライアンス: 企業が取るべき対応策:

  1. データ取得方法の全面的見直し
  2. 法務・コンプライアンス体制の強化
  3. 著作権者との事前ライセンス交渉検討
  4. リスク評価に基づく訓練データセット構築

業界への影響:

  • AI企業間での「クリーン」データセット確保競争の激化
  • データライセンシング市場の成熟化促進
  • 著作者団体との協力的関係構築の必要性増大

比較法的観点 (Comparative Law Perspective)

日本法との比較: 日本の著作権法では、平成30年改正により機械学習等のためのデータ解析について第30条の4(著作物に表現された思想又は感情の享受を目的としない利用)が規定されているが、米国のフェアユース法理とは異なる要件・効果を持つ。日本では「享受目的」の有無が重要な判断基準となるのに対し、米国では「変容的使用」が重視される。

他国判例との関係: EUでは「Text and Data Mining Exception」(情報社会指令第3条、第4条)により一定の研究目的でのテキストマイニングが認められているが、商業目的での利用については各国で対応が分かれている。本判決は国際的なAI規制調和における重要な参考例となる。

グローバルな影響: 多国籍AI企業は、米国での本判決を踏まえつつも、各国の著作権法制の差異を考慮した地域別コンプライアンス戦略の構築が不可欠となる。

重要なポイント (Key Takeaways)

実務家への示唆:

  • AI企業の法務担当者は、データ取得段階でのコンプライアンス確保が最重要課題
  • 著作権者側弁護士は、海賊版使用の立証に注力することで有効な請求が可能
  • 技術的側面と法的評価の架橋について、専門的知識の習得が不可欠

今後の展望:

  • 上級審での統一的基準確立への期待
  • AI出力物による著作権侵害の論点への発展
  • 立法的解決の必要性に関する議論の活発化

注意すべき事項:

  • 各ケースの事実関係(特にデータ取得方法)による結論の大きな差異
  • フェアユース4要素の総合的判断における予測困難性
  • 技術進歩に伴う法的論点の継続的変化

このレポートに関する注意事項 (Warning/Notes)

  • このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。

Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です