Bartz v. Anthropic PBC

Bartz v. Anthropic PBC

Case Metadata

Basic Information

1. Case Name: Bartz et al. v. Anthropic PBC, No. 3:24-cv-00694 (N.D. Cal. 2024)
2. Court: United States District Court for the Northern District of California, San Francisco Division
3. Filing Date: February 7, 2024
4. Judgment Date: Pending (as of September 2025)
5. Case Number: 3:24-cv-00694-JSC
6. Current Status: Pending – Motion to dismiss phase, with court considering jurisdictional and substantive legal issues

Parties

7. Plaintiff(s):
– Andrea Bartz (Author of thriller novels “We Were Never Here” and “The Herd”)
– Charles Graeber (Journalist and author of “The Good Nurse” and medical investigation works)
– Kirk Wallace Johnson (Author of “The Feather Thief” and narrative nonfiction works)
– Class representatives for similarly situated authors and copyright holders

8. Defendant(s):
– Anthropic PBC (Public Benefit Corporation developing Claude AI systems, valued at $18.4 billion as of 2024)

9. Key Law Firms:
Plaintiffs: Susman Godfrey LLP (Lead Counsel); Gibbs Law Group LLP (Co-counsel)
Defendants: Wilmer Cutler Pickering Hale and Dorr LLP

10. Expert Witnesses:
– Technical experts on large language model training (names under seal)
– Copyright valuation experts (testimony pending)
– Computer science professors specializing in machine learning (retained but not yet deposed)

Legal Framework

11. Case Type: AI copyright infringement class action – unauthorized use of copyrighted literary works for training large language models
12. Primary Legal Claims:
– Direct copyright infringement under 17 U.S.C. § 106
– Vicarious copyright infringement
– Contributory copyright infringement
– DMCA violations under 17 U.S.C. § 1202 (removal of copyright management information)

13. Secondary Claims:
– Unfair competition under California Business & Professions Code § 17200
– Unjust enrichment
– Negligence in data handling practices

14. Monetary Relief:
– Statutory damages of up to $150,000 per willfully infringed work
– Actual damages and profits attributable to infringement
– Injunctive relief to prevent continued use of copyrighted materials
– Class-wide damages potentially exceeding $5 billion (estimated)

Technical Elements

15. AI/Technology Involved:
– Claude AI series (Claude 1, Claude 2, Claude 3)
– Constitutional AI training methodology
– Large-scale web scraping technologies
– Natural language processing systems
– Reinforcement Learning from Human Feedback (RLHF) protocols

16. Industry Sectors:
– Publishing and literary works
– Artificial intelligence and machine learning
– Technology platforms and services
– Creative industries and content creation

17. Data Types:
– Copyrighted literary texts (novels, non-fiction books, articles)
– Author attribution metadata
– Copyright management information
– Training datasets including Books3 and Common Crawl
– Proprietary creative expressions and narrative structures

Database Navigation

18. Keywords/Tags:
– AI training data copyright
– Large language models litigation
– Fair use in machine learning
– Anthropic Claude lawsuit
– Author rights AI infringement
– Generative AI copyright
– Constitutional AI legal challenges
– Books3 dataset litigation

19. Related Cases:
The Authors Guild v. OpenAI, No. 1:23-cv-08292 (S.D.N.Y. 2023)
Silverman v. Meta Platforms, No. 3:23-cv-03417 (N.D. Cal. 2023)
Doe v. GitHub, No. 3:22-cv-06823 (N.D. Cal. 2022)
Getty Images v. Stability AI, No. 1:23-cv-00135 (D. Del. 2023)
Concord Music Group v. Anthropic, No. 3:23-cv-05447 (M.D. Tenn. 2023)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係: 本件は、2024年2月にカリフォルニア州北部地区連邦地方裁判所に提起された集団訴訟であり、Anthropic社が開発するClaude AIシステムの訓練において、原告らの著作物を無断で使用したとされる事案である。原告には、ベストセラー作家のアンドレア・バーツ氏、ジャーナリストのチャールズ・グレーバー氏、ノンフィクション作家のカーク・ウォレス・ジョンソン氏が含まれる。Anthropic社は、大規模言語モデルの訓練のために、Books3データセットやCommon Crawlなどの大規模データセットを使用したとされ、これらには原告らの著作物が含まれていたと主張されている。

中心的争点:
1. AIモデルの訓練における著作物の使用が、著作権法上のフェアユースに該当するか
2. 大規模言語モデルが生成するコンテンツが、訓練データの著作物の派生的著作物に該当するか
3. AIシステムの訓練過程における著作権管理情報の除去がDMCA違反を構成するか
4. Constitutional AIという訓練手法が、従来のAI訓練と法的に異なる評価を受けるべきか
5. 技術的進歩と著作権保護のバランスをどのように取るべきか

原告の主張:
原告らは、Anthropic社がClaude AIの訓練において、許諾なく数千冊の著作物を複製し、これらの著作物から学習させたことで、原告らの経済的利益を侵害したと主張している。特に、Claude AIが原告らの文体や物語構造を模倣して新たなコンテンツを生成する能力を持つことで、原告らの市場価値が毀損されると論じている。さらに、訓練データセットから著作権管理情報が意図的に削除されたことがDMCA違反に当たると主張し、最大15万ドルの法定損害賠償を各著作物について求めている。

被告の主張:
Anthropic社は、AI訓練における著作物の使用は変革的使用(transformative use)であり、フェアユースの範囲内であると主張している。同社は、Claude AIが原告らの著作物を直接複製したり、実質的に類似したコンテンツを生成したりすることはなく、学習プロセスは人間が本を読んで知識を得ることに類似していると論じている。また、Constitutional AIアプローチは、より倫理的で有益なAIシステムの開発を目的としており、公共の利益に資するものであると強調している。

AI/技術要素:
Claude AIシステムは、Anthropic社独自のConstitutional AI手法を使用して訓練されている。この手法は、人工知能に対して一連の原則や価値観を組み込み、より安全で有用なアウトプットを生成することを目的としている。技術的には、大規模なトランスフォーマーアーキテクチャに基づき、数千億のパラメータを持つモデルである。訓練データには、インターネット上のテキストデータ、書籍、学術論文などが含まれており、その規模は数テラバイトに及ぶとされる。

手続きの経過 (Procedural History)

重要な手続き上の決定:
2024年4月、裁判所は原告らのクラスアクション認定申立てについて審理を開始した。2024年6月、被告は連邦民事訴訟規則12(b)(6)に基づく却下申立てを提出し、原告の主張が法的に不十分であると論じた。2024年9月、裁判所は証拠開示手続きの範囲について中間決定を下し、Anthropic社に対して訓練データセットの詳細な情報開示を命じたが、企業秘密に関わる技術的詳細については保護命令を発した。

証拠開示:
証拠開示プロセスにおいて、原告側はAnthropicの訓練データセットの完全なリスト、データ処理パイプライン、著作権フィルタリングメカニズムの詳細を要求している。Anthropic社は、競争上の機密情報を理由に一部の開示を拒否しているが、裁判所は段階的開示アプローチを採用し、まず非機密部分の開示を命じた。特に注目されるのは、Books3データセットの使用に関する内部文書の開示要求であり、これはAI業界全体に影響を与える可能性がある。

専門家証言:
原告側は、スタンフォード大学のコンピュータサイエンス教授を専門家証人として指名し、大規模言語モデルが訓練データを「記憶」し、再現する能力について証言を予定している。被告側は、MITの人工知能研究者を専門家として、AIの学習プロセスが人間の学習と本質的に同様であり、創造的な変換を伴うものであると証言させる予定である。両専門家の証言は、技術的な争点の理解において重要な役割を果たすことが期待される。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)
注:本件は2025年9月時点で係属中であり、最終判決は下されていない。以下は、これまでの中間決定と予想される法的論点の分析である。

主要な判決内容:
裁判所は、2024年8月の中間決定において、被告の却下申立ての一部を棄却し、著作権侵害の直接侵害およびDMCA違反の主張については、原告が十分な事実を主張していると判断した。特に、大規模言語モデルの訓練における著作物の複製が、技術的に必要な中間的複製を超えて、永続的な形でモデルのパラメータに組み込まれている可能性があるという原告の主張を、この段階では排除できないとした。

勝敗の結果:
現時点では最終的な勝敗は決定していないが、裁判所の中間決定は原告側にやや有利な展開を示している。特に、フェアユースの抗弁が自動的に適用されるわけではなく、事実審理が必要であるという判断は、AI企業にとって重要な先例となる可能性がある。

命令された救済措置:
裁判所は暫定的差止命令については現時点で判断を留保しているが、証拠開示手続きの完了後に再度検討するとしている。原告が求める恒久的差止命令については、回復不能な損害の立証と公共の利益のバランスを慎重に検討する必要があると述べている。

重要な法的判断:
裁判所は、AI訓練におけるフェアユース判断について、以下の点を重要視している:
1. 使用の目的と性質(商業的 vs. 教育的・研究的)
2. 著作物の性質(事実的 vs. 創造的)
3. 使用された部分の量と実質性
4. 潜在的市場への影響

反対意見・補足意見:
本件は地方裁判所レベルであるため、正式な反対意見は存在しないが、法廷助言者(amicus curiae)として、電子フロンティア財団(EFF)がAI開発の重要性を強調する意見書を提出し、一方で作家協会は創作者の権利保護の必要性を訴える意見書を提出している。

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理:
裁判所は、Campbell v. Acuff-Rose Music事件(1994年)で確立されたフェアユースの4要素テストを本件に適用している。特に、変革的使用(transformative use)の概念が、AI訓練という新しい文脈でどのように解釈されるべきかが中心的な論点となっている。また、Google v. Oracle事件(2021年)における機能的要素の複製に関する判断が、本件にどの程度適用可能かも検討されている。

事実認定:
裁判所は、以下の事実を重要と認定している:
– Anthropicが実際にBooks3データセットを使用した証拠の存在
– Claude AIが特定の条件下で訓練データに類似したテキストを生成する能力
– 著作権管理情報が訓練プロセスで除去された可能性
– AIモデルが商業的サービスとして提供されている事実

技術的理解:
裁判所は、大規模言語モデルの技術的な複雑性を認識しつつ、法的判断に必要な範囲で技術を理解しようとしている。特に、モデルがテキストを「理解」するのではなく、統計的パターンを学習するという技術的説明と、実際のアウトプットが創造的表現を含むという現象の間の緊張関係について、慎重な検討を行っている。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本件の判決は、AI開発における著作権法の適用について重要な先例となる可能性が高い。特に、以下の点において将来のAI訴訟に影響を与えると考えられる:

1. フェアユース基準の明確化: AI訓練が変革的使用として認められるための具体的な基準が示される可能性がある
2. 技術的中立性の原則: 新技術に対する法の適用において、技術の進歩を阻害しない形での著作権保護のバランスが示される
3. 損害賠償の算定方法: AI訓練における著作権侵害の損害をどのように算定するかの枠組みが確立される可能性
4. 国際的な影響: 米国の判断が、EU、日本、中国などの他国のAI規制にも影響を与える可能性

法理論の発展:
本件は、デジタル時代における著作権法の解釈に新たな視点を提供している。特に、「学習」と「複製」の境界、「アイデア」と「表現」の二分法のAI文脈での適用、集合的著作物の権利処理などの論点において、法理論の発展に寄与すると考えられる。また、Constitutional AIのような倫理的配慮を組み込んだAI開発手法が、法的評価においてどのような意味を持つかという新しい論点も提起している。

解釈の明確化:
既存の著作権法のAI分野への適用について、以下の点が明確化される可能性がある:
– DMCA第1202条の「著作権管理情報」がメタデータ以外の形態でも適用されるか
– 一時的複製と永続的学習の法的区別
– 派生的著作物の概念のAI生成コンテンツへの適用範囲

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
本件は、AI開発企業に対して、より厳格なデータガバナンス体制の構築を促す可能性がある。具体的には:
– 訓練データの出所と権利関係の明確な記録管理
– 著作権コンプライアンスチームの設置
– ライセンシング戦略の見直し
– オプトアウトメカニズムの実装

コンプライアンス:
企業が取るべき対応策として、以下が考えられる:
1. 事前のリスク評価: 訓練データセットの著作権リスク評価プロセスの確立
2. ライセンス取得: 主要な著作物については事前にライセンスを取得
3. 技術的対策: 著作権侵害を防ぐための技術的フィルタリングの実装
4. 透明性の確保: 訓練データの使用に関する透明性レポートの公開
5. 保険の検討: AI関連の著作権侵害リスクに対する保険商品の活用

業界への影響:
AI開発業界全体において、以下のような変化が予想される:
– オープンソースAIモデルの開発における慎重なアプローチ
– 合成データや公共領域データの活用増加
– 著作権者との協力関係の構築
– 新たなビジネスモデル(収益分配など)の検討

リスク管理:
類似リスクを回避するための考慮事項:
– デューデリジェンスの強化
– 法務部門とAI開発部門の連携強化
– 定期的な法規制アップデートの確認
– 業界標準やベストプラクティスの採用

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法との比較において、以下の相違点が注目される:

1. 権利制限規定の違い: 日本の著作権法第30条の4(著作物に表現された思想又は感情の享受を目的としない利用)は、AI学習により寛容な可能性がある
2. フェアユース vs. 個別制限規定: 米国の包括的フェアユース規定と日本の個別的権利制限規定のアプローチの違い
3. 機械学習に関する明文規定: 日本は2018年改正で機械学習を明示的に考慮したが、米国は判例法に依存
4. 損害賠償の規模: 米国の懲罰的損害賠償と日本の実損害主義の違い

他国判例との関係:
EU: EU著作権指令におけるテキスト・データマイニング例外(第3条、第4条)との比較
英国: 英国のAI訓練に関する著作権例外の提案(現在保留中)
中国: 中国の人工知能規制における知的財産権保護のアプローチ
シンガポール: 計算データ分析のための著作権例外

グローバルな影響:
多国籍企業への影響として:
– コンプライアンスコストの増大
– 地域別のAI開発戦略の必要性
– データローカライゼーション要求への対応
– 国際的な業界標準の確立への圧力

重要なポイント (Key Takeaways)

実務家への示唆:
1. AI開発企業の法務担当者: 訓練データの権利処理について、事後的な対応では不十分であり、開発初期段階からの法的検討が不可欠
2. コンテンツ事業者: AI企業との協力関係構築において、適切な対価と使用条件の交渉が重要
3. 弁護士: AI関連訴訟では、技術的理解と法的議論の橋渡しができる専門性が求められる
4. 投資家・VC: AI企業への投資において、知的財産リスクのデューデリジェンスが必須

今後の展望:
– 立法による解決の可能性(米国議会でのAI規制法案の検討)
– 業界自主規制の発展(AI企業と出版業界の協議)
– 技術的解決策の進化(ブロックチェーンベースの権利管理など)
– 国際的な協調の必要性(WIPO等での議論)

注意すべき事項:
– 本件は係属中であり、最終判決により結論が変わる可能性がある
– 技術の急速な進化により、法的評価も変化する可能性がある
– 個別の事案では具体的な事実関係により結論が異なる
– 国際的なビジネスでは、複数国の法制度を考慮する必要がある

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です