Kadrey v. Meta Platforms, Inc.

Kadrey v. Meta Platforms, Inc.

Case Metadata

Basic Information

1. Case Name: Kadrey v. Meta Platforms, Inc., No. 3:23-cv-03417 (N.D. Cal. 2025)
2. Court: United States District Court for the Northern District of California
3. Filing Date: July 7, 2023
4. Judgment Date: June 2025 (Summary Judgment)
5. Case Number: 3:23-cv-03417
6. Current Status: Summary judgment granted for defendant; potential for appeal pending

Parties

7. Plaintiff(s):
– Richard Kadrey (author of urban fantasy novels including “Sandman Slim” series)
– Sarah Silverman (comedian and author)
– Christopher Golden (horror and fantasy author)
– Class representatives for authors whose copyrighted works were allegedly used in AI training
8. Defendant(s): Meta Platforms, Inc. (technology conglomerate, developer of LLaMA large language models)
9. Key Law Firms:
– For Plaintiffs: Joseph Saveri Law Firm, LLP; Lockridge Grindal Nauen P.L.L.P.
– For Defendant: Cooley LLP
10. Expert Witnesses: Technical experts on AI training methodologies and economic impact analysis (specific names sealed in proceedings)

Legal Framework

11. Case Type: Copyright infringement in AI model training; unauthorized use of copyrighted literary works for machine learning
12. Primary Legal Claims:
– Direct copyright infringement under 17 U.S.C. § 106
– Vicarious copyright infringement
– Violation of Digital Millennium Copyright Act (DMCA) § 1202(b)
– Unfair competition under California Business and Professions Code § 17200
13. Secondary Claims:
– Negligence
– Unjust enrichment
– Claims under California common law
14. Monetary Relief: Statutory damages sought; specific amounts under seal; no damages awarded due to summary judgment

Technical Elements

15. AI/Technology Involved:
– LLaMA (Large Language Model Meta AI) – 7B, 13B, and 70B parameter versions
– Training datasets including Books3 (196,640 books) and Project Gutenberg corpus
– Transformer-based neural network architecture
16. Industry Sectors: Technology, publishing, entertainment, artificial intelligence development
17. Data Types: Copyrighted literary works, training datasets, text corpora

Database Navigation

18. Keywords/Tags: AI training, copyright infringement, fair use, LLaMA, generative AI, machine learning datasets, Books3, literary works, transformative use, market harm, DMCA
19. Related Cases:
– Authors Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015)
– Silverman v. OpenAI, Inc., No. 3:23-cv-03416 (N.D. Cal.)
– Tremblay v. OpenAI, Inc., No. 3:23-cv-03223 (N.D. Cal.)
– Andersen v. Stability AI Ltd., No. 3:23-cv-00201 (N.D. Cal.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係:
本件は、著名な作家たちがMeta Platforms社を相手取って提起した集団訴訟である。原告らは、Meta社が同社の大規模言語モデル「LLaMA」の訓練において、原告らの著作権で保護された書籍を無断で使用したと主張した。問題となったデータセットには、「Books3」と呼ばれる196,640冊の書籍を含むコーパスが含まれており、これらは主に違法な電子書籍共有サイトから取得されたものとされる。Meta社は2023年2月にLLaMAモデルを研究コミュニティ向けに限定公開したが、その後モデルが流出し、広く利用可能となった。

中心的争点:
1. AIモデルの訓練における著作物の使用が著作権侵害を構成するか
2. そのような使用がフェアユース(公正利用)の抗弁により保護されるか
3. AI訓練が著作物の市場価値に与える影響の評価
4. 生成AIが作成するコンテンツと原著作物との競合関係
5. デジタルミレニアム著作権法(DMCA)違反の成否

原告の主張:
– Meta社は原告らの書籍全文を無断でコピーし、商業的AIモデルの訓練に使用した
– この使用は変形的(transformative)ではなく、単なる大規模な著作権侵害である
– LLaMAモデルは原告らの作品と競合する派生的コンテンツを生成する能力を持つ
– Meta社は著作権管理情報を故意に除去・改変した(DMCA違反)
– 経済的損害として、ライセンス料の逸失と市場価値の毀損を被った

被告の主張:
– AI訓練は研究目的の変形的使用であり、フェアユースに該当する
– モデルは原著作物を保存・再現せず、統計的パターンを学習するのみ
– 生成されるコンテンツは原著作物の実質的複製ではない
– 原告らは具体的な市場損害を立証していない
– 技術革新は社会全体の利益に資する

AI/技術要素:
LLaMAは、トランスフォーマーアーキテクチャに基づく自己回帰型言語モデルである。70億、130億、700億パラメータの3つのバージョンが開発され、それぞれ異なる計算資源と性能特性を持つ。訓練プロセスでは、テキストを トークン化し、次の単語を予測するタスクを通じて言語パターンを学習する。Books3データセットは、Shawn Presser氏が作成した研究用データセットで、The Eyeと呼ばれる海賊版書籍サイトから取得された書籍を含んでいたとされる。

手続きの経過 (Procedural History)

重要な手続き上の決定:
– 2023年11月:被告の棄却申立てを部分的に認容、主要な著作権侵害請求は維持
– 2024年3月:クラスアクション認定に関する審理
– 2024年9月:証拠開示に関する保護命令発行
– 2025年6月:被告の略式判決申立てを認容

証拠開示:
裁判所は、Meta社の内部文書、訓練データの詳細、モデル開発プロセスに関する広範な証拠開示を命じた。しかし、営業秘密と技術的詳細の多くは封印された。原告側は、Meta社が意図的に著作権で保護された作品を選択し、使用したことを示す内部通信の開示を求めたが、部分的にのみ認められた。

専門家証言:
両当事者は、AI技術、著作権評価、市場影響分析に関する専門家を提出した。被告側の専門家は、LLaMAが原著作物を「記憶」していないことを技術的に説明し、原告側の専門家は、モデルが訓練データから実質的に類似したコンテンツを生成できることを主張した。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)

主要な判決内容:
Vince Chhabria判事は、2025年6月にMeta社に有利な略式判決を下した。裁判所は、AIモデルの訓練における著作物の使用がフェアユースに該当すると判断したが、この判断は原告らの主張立証の不十分さに大きく依拠していた。

勝敗の結果:
被告Meta社が全面的に勝訴。原告らの全ての請求が棄却された。しかし、判事は判決文において、この結果が必ずしもAI訓練における著作物使用の包括的な合法性を示すものではないことを明確にした。

命令された救済措置:
救済措置は認められなかった。原告らの損害賠償請求、差止請求のいずれも棄却された。

重要な法的判断:
1. AI訓練は変形的使用として認定されたが、条件付きである
2. 市場への影響の立証責任は原告にあり、推測的な損害では不十分
3. 技術的な複製と著作権法上の複製の区別が明確化された
4. 将来の原告が成功する可能性のある法的理論への「ロードマップ」が示された

反対意見・補足意見:
地方裁判所のため反対意見はないが、判事は異例なほど詳細な説明を付し、この判決が先例として過度に広く解釈されることへの警告を発した。

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理:
裁判所は、Campbell v. Acuff-Rose Music, Inc.で確立されたフェアユースの4要素テストを適用した:
1. 使用の目的と性質(商業的vs教育的、変形的性質)
2. 著作物の性質
3. 使用された部分の量と実質性
4. 潜在的市場への影響

事実認定:
– LLaMAの訓練は新たな目的(言語理解の創出)のための変形的使用である
– モデルは原著作物の表現ではなく、統計的パターンを学習する
– 原告らは具体的な市場損害の証拠を提示できなかった
– 生成されるコンテンツは原著作物の代替品ではない

技術的理解:
裁判所は、機械学習の技術的側面について相当程度の理解を示した。特に、モデルが「学習」することと「複製」することの違い、パラメータの調整と著作物の保存の区別について、技術的に正確な認識を示した。ただし、判事は、技術の急速な進化により、この理解が将来も有効であるとは限らないことも認めた。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本判決は、AI訓練におけるフェアユース適用の初期的な枠組みを提供したが、判事自身が強調したように、これは決定的な先例ではない。むしろ、より洗練された法的主張により、異なる結果が得られる可能性を示唆している。特に重要なのは、判事が提供した「ロードマップ」である:

1. 市場代替理論の精緻化:AIが生成するコンテンツが原著作物の市場を直接侵食することの立証
2. ライセンス市場への影響:AI訓練用ライセンス市場の存在と、無断使用によるその破壊の立証
3. 派生的作品の理論:AIモデル自体が巨大な派生的作品であるとの主張の展開

法理論の発展:
本件は、デジタル時代における著作権法の適用に関する重要な論点を提起した。特に、大規模データ処理と従来の複製概念の不整合、変形的使用の概念の拡張可能性、そして技術革新と著作者の権利のバランスについて、今後の議論の基礎を提供した。

解釈の明確化:
– 「中間的複製」(intermediate copying)の法的地位
– 研究目的と商業目的の区別の曖昧化
– フェアユースにおける「変形性」の技術的文脈での意味

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
企業は以下の対応を検討すべきである:
– 訓練データの出所と権利関係の明確な文書化
– オプトアウト機構の実装
– 透明性レポートの作成
– 著作権者との事前のライセンス交渉の検討

コンプライアンス:
1. データセット選択における法務レビューの強化
2. 著作権リスク評価プロセスの確立
3. 技術的保護手段の実装(著作物の直接的な再現を防ぐ)
4. 業界標準やベストプラクティスへの準拠

業界への影響:
AI開発企業は、短期的には本判決により一定の安心感を得たが、長期的には不確実性が残る。特に、EUのAI法やその他の管轄区域での異なるアプローチにより、グローバルなコンプライアンス戦略が複雑化している。

リスク管理:
– 訴訟リスク:判事の「ロードマップ」に基づく、より洗練された訴訟の可能性
– 規制リスク:議会による新たな立法の可能性
– レピュテーションリスク:創作者コミュニティとの関係悪化
– 国際的リスク:異なる管轄区域での矛盾する判決

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法では、機械学習のための著作物利用について、著作権法第30条の4で一定の制限規定が設けられている。これは「情報解析」のための利用として、一定の条件下で著作権者の許諾なく利用可能としている。しかし、日本法の規定は:
1. 非享受目的に限定されている
2. 情報解析の結果物の提供については別途考慮が必要
3. 営利目的の利用についての明確性に欠ける部分がある

米国のフェアユース理論と比較すると、日本法はより明文化された例外規定を持つが、その適用範囲は必ずしも明確ではない。

他国判例との関係:
– 英国:英国では2023年にAI訓練のための著作権例外規定の導入が検討されたが、創作者団体の反対により撤回された
– EU:EU AI法は著作権コンプライアンスを要求しているが、具体的な基準は未確定
– カナダ:フェアディーリング規定の下でのAI訓練の合法性は未解決

グローバルな影響:
多国籍AI企業は、最も厳格な管轄区域の基準に合わせる必要があり、「規制のフラグメンテーション」への対応が課題となっている。本判決は米国での一定の指針を示したが、国際的な調和は達成されていない。

重要なポイント (Key Takeaways)

実務家への示唆:

1. AI開発企業の法務担当者向け:
– 訓練データの権利クリアランスプロセスを文書化する
– 著作権者との積極的なライセンス交渉を検討する
– 技術的措置により、訓練されたモデルが原著作物を直接出力しないよう確保する
– 透明性とオプトアウトのメカニズムを実装する

2. コンテンツ創作者・権利者向け:
– 判事の「ロードマップ」に従った、より精緻な法的主張の構築
– 市場への具体的影響の文書化と証拠収集
– AI訓練ライセンスの新たなビジネスモデルの検討
– 技術的保護手段の強化

3. 政策立案者向け:
– AI訓練に関する明確な立法的枠組みの必要性
– 国際的な調和の重要性
– イノベーションと創作者の権利のバランス

今後の展望:
本件は控訴される可能性が高く、第9巡回区控訴裁判所での判断が注目される。また、議会による立法的対応の可能性もある。技術の進化により、より高度な著作物の「理解」と「生成」が可能になるにつれ、法的枠組みの再検討が必要となるであろう。

注意すべき事項:
– 本判決は事案限定的であり、全てのAI訓練を合法化するものではない
– より強力な証拠と法的理論により、異なる結果が得られる可能性がある
– 国際的な規制動向に注意を払い、グローバルなコンプライアンス戦略を策定する必要がある
– 技術的進化により、現在の法的枠組みが陳腐化する可能性がある

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です