Chabon et al v. Meta Platforms Inc.
Case Metadata
Basic Information
1. Case Name: Michael Chabon, et al. v. Meta Platforms, Inc., No. 3:23-cv-04663-CRB (N.D. Cal. 2024)
2. Court: United States District Court for the Northern District of California
3. Filing Date: September 8, 2023
4. Judgment Date: June 24, 2024 (Ruling on Motion to Dismiss)
5. Case Number: 3:23-cv-04663-CRB (consolidated with related cases)
6. Current Status: Partially dismissed; proceeding on limited claims with leave to amend
Parties
7. Plaintiff(s):
   – Michael Chabon (Award-winning novelist, author of “The Amazing Adventures of Kavalier & Clay”)
   – David Henry Hwang (Playwright, author of “M. Butterfly”)
   – Matthew Klam (Novelist and short story writer)
   – Rachel Louise Snyder (Journalist and author)
   – Ayelet Waldman (Novelist and essayist)
   – Class representatives for all authors whose copyrighted works were allegedly used without permission
8. Defendant(s):
   – Meta Platforms, Inc. (Social media and technology conglomerate, developer of LLaMA large language model)
9. Key Law Firms:
   – For Plaintiffs: Joseph Saveri Law Firm, LLP; Lockridge Grindal Nauen P.L.L.P.
   – For Defendants: Cooley LLP
10. Expert Witnesses: Technical experts on AI training and copyright (specific names not disclosed in available documents)
Legal Framework
11. Case Type: Copyright infringement in AI model training; unauthorized use of copyrighted literary works for training large language models
12. Primary Legal Claims:
    – Direct copyright infringement under 17 U.S.C. § 501
    – Vicarious copyright infringement
    – Contributory copyright infringement
    – Violation of Digital Millennium Copyright Act (DMCA) § 1202(b)
    – Unfair competition under California Business & Professions Code § 17200
13. Secondary Claims:
    – Negligence
    – Unjust enrichment
    – Common law claims related to unauthorized use of intellectual property
14. Monetary Relief: Statutory damages, actual damages, and profits attributable to infringement (specific amounts not yet determined)
Technical Elements
15. AI/Technology Involved:
    – LLaMA (Large Language Model Meta AI) – 7B, 13B, 30B, and 65B parameter versions
    – Natural language processing and generation technology
    – Training datasets including Books3 corpus (allegedly containing 196,640 pirated books)
16. Industry Sectors: Technology, publishing, artificial intelligence, creative industries, social media
17. Data Types: Copyrighted literary works, training datasets, text corpora, pirated e-books
Database Navigation
18. Keywords/Tags: AI training, copyright infringement, LLaMA, generative AI, fair use, Books3, machine learning, intellectual property, DMCA, unfair competition, class action
19. Related Cases:
    – Kadrey v. Meta Platforms, Inc., No. 3:23-cv-03417 (N.D. Cal.)
    – Silverman v. Meta Platforms, Inc., No. 3:23-cv-03416 (N.D. Cal.)
    – Authors Guild v. OpenAI, Inc., No. 1:23-cv-08292 (S.D.N.Y.)
    – Tremblay v. OpenAI, Inc., No. 3:23-cv-03223 (N.D. Cal.)
詳細分析 (Detailed Analysis)
事件の概要 (Case Overview)
背景と争点 (Background and Issues)
事実関係: 本件は、2023年9月に著名な作家グループがMeta Platforms社を相手取って提起した集団訴訟である。原告らは、Metaが大規模言語モデル「LLaMA」の訓練において、彼らの著作権で保護された書籍を無断で使用したと主張している。訴訟の中核には、Books3と呼ばれるデータセットの使用がある。このデータセットには、違法にダウンロードされた約196,640冊の書籍が含まれており、原告らの作品もその中に含まれていたとされる。
MetaはLLaMAモデルを2023年2月に発表し、研究コミュニティに向けて公開した。このモデルは70億から650億のパラメータを持つ複数のバージョンで構成され、自然言語処理と生成において高い性能を示している。原告らは、Metaがこれらのモデルの訓練に著作権で保護された作品を使用したことが、著作権侵害に当たると主張している。
中心的争点:
1. AIモデルの訓練における著作権で保護された作品の使用が、フェアユースの範囲内かどうか
2. LLaMAが原告の作品を複製する能力が、市場への実害を構成するか
3. 著作権管理情報(CMI)の削除がDMCA違反に該当するか
4. AIモデル訓練における大量の著作物使用に対する適切な補償メカニズムの必要性
5. 技術革新と著作権保護のバランスをどのように取るべきか
原告の主張: 原告らは、Metaが彼らの創作物を無断で複製し、LLaMAの訓練に使用したことで、直接的な著作権侵害を行ったと主張している。さらに、Metaが違法に入手されたBooks3データセットを使用したことを知っていた、または知るべきであったにもかかわらず使用を続けたことで、寄与侵害と代位責任を負うべきだと主張している。原告らは、LLaMAが訓練データから学習した内容に基づいて、原作品と実質的に類似したテキストを生成する能力があることを懸念している。
被告の主張: Metaは、AIモデルの訓練は変革的使用(transformative use)であり、フェアユースの原則の下で保護されると主張している。同社は、LLaMAが原告の作品をそのまま複製するのではなく、大量のテキストから言語パターンを学習しているだけだと主張している。また、原告らが具体的な市場への害や、LLaMAが実際に彼らの作品を逐語的に再現することを証明していないと反論している。
AI/技術要素: LLaMAは、トランスフォーマーアーキテクチャに基づく大規模言語モデルで、自己回帰的な方法でテキストを生成する。訓練プロセスでは、大量のテキストデータから統計的パターンを学習し、文脈に応じた確率的な予測を行う。Books3データセットは、Shadow LibraryサイトBibliotikから取得されたとされ、学術研究目的で作成されたが、商業的AIシステムの訓練にも使用された。
手続きの経過 (Procedural History)
重要な手続き上の決定: 2024年6月24日、Vince Chhabria判事は、Metaの棄却申立てに対して部分的な判断を下した。裁判所は、原告の主要な著作権侵害請求を維持したが、いくつかの州法に基づく請求を棄却した。特に重要なのは、裁判所がフェアユースの抗弁について、この段階では決定的な判断を下すには時期尚早であると判断したことである。
証拠開示: 証拠開示プロセスは進行中であるが、原告らはMetaの訓練データセットの詳細、特にBooks3の使用に関する内部文書へのアクセスを求めている。技術的な証拠開示には、モデルアーキテクチャ、訓練プロトコル、データ処理手法に関する情報が含まれる。
専門家証言: 両当事者は、AI技術、著作権法、市場への影響に関する専門家を準備している。専門家証言は、LLaMAの技術的能力、訓練データの使用方法、潜在的な市場への影響に焦点を当てる予定である。
判決の概要 (Judgment Summary)
裁判所の判断 (Court’s Decision)
主要な判決内容: Chhabria判事の2024年6月の判決は、技術的にはMetaに有利な部分的棄却であったが、その内容は原告らに将来の訴訟のロードマップを提供するものであった。裁判所は以下の判断を下した:
1. 著作権侵害請求の維持: 直接侵害の請求は継続が認められた
2. 州法請求の棄却: カリフォルニア州の不正競争法に基づく請求は、著作権法による専占を理由に棄却
3. DMCA請求の一部棄却: 著作権管理情報の削除に関する請求は、より具体的な主張が必要として棄却(修正の機会付き)
4. 過失および不当利得請求の棄却: 連邦著作権法による専占を理由に棄却
勝敗の結果: 形式的にはMetaが部分的勝利を収めたが、裁判所の意見書は、AI企業に対する重要な警告を含んでいた。判事は、現在の証拠では市場への害を証明するには不十分であるとしながらも、より良い証拠があれば結果は異なる可能性があることを示唆した。
命令された救済措置: 現段階では具体的な救済措置は命令されていないが、裁判所は原告に対して、修正訴状を提出する機会を与えた。これにより、原告らは市場への害に関するより具体的な証拠を提示することができる。
重要な法的判断: 判事は、AI訓練におけるフェアユースの適用について、包括的な判断を避けたが、以下の重要な示唆を行った:
– AI企業が大規模に著作物を使用することは、必然的に何らかの形での補償メカニズムを必要とする可能性が高い
– 現行の著作権法の枠組みは、AI時代の課題に対処するには不十分である可能性がある
– 議会による立法的解決が望ましい
反対意見・補足意見: 単独判事による判決のため、反対意見はないが、判事の意見書には、AI業界全体への警告として読める多くの傍論が含まれている。
法的推論の分析 (Analysis of Legal Reasoning)
適用された法理: 裁判所は、Campbell v. Acuff-Rose Music, Inc.で確立されたフェアユースの4要素テストを参照したが、AI訓練という新しい文脈での適用には慎重なアプローチを取った。特に、変革的使用の概念をAI訓練にどのように適用すべきかについて、明確な判断を避けた。
事実認定: 裁判所は以下の事実を重視した:
– MetaがBooks3データセットを使用したことは争いがない
– Books3には著作権で保護された作品が含まれていた
– LLaMAは訓練データから学習したパターンに基づいてテキストを生成する
– 原告らは、LLaMAが彼らの作品を逐語的に再現する具体例を十分に示していない
技術的理解: 判事は、大規模言語モデルの仕組みについて相当な理解を示し、単純な複製と統計的学習の違いを認識していた。しかし、この技術的理解が、必ずしも法的な免責を意味するものではないことも明確にした。
法的意義 (Legal Significance)
先例価値 (Precedential Value)
将来への影響: この判決は、AI訓練における著作権問題に関する初期の重要な判例として、今後の訴訟に大きな影響を与える可能性がある。特に、判事が示した「補償の必要性」に関する見解は、将来の原告にとって強力な論拠となる可能性がある。
法理論の発展: 本件は、フェアユース理論をAI時代にどのように適応させるべきかという根本的な問題を提起している。判決は、現行法の限界を認識し、新たな法的枠組みの必要性を示唆している。
解釈の明確化: 判決は、AI訓練が自動的にフェアユースとして保護されるわけではないことを明確にした。各ケースは、使用の性質、規模、市場への影響を個別に評価する必要がある。
規制・実務への影響 (Regulatory and Practical Impact)
AIガバナンス: この判決は、AI開発企業に対して以下のガバナンス要件を示唆している:
– 訓練データの出所と合法性の確認
– 著作権者との適切なライセンス契約の締結
– 透明性のあるデータ使用ポリシーの策定
– リスク評価と軽減策の実施
コンプライアンス: 企業は以下の対応を検討すべきである:
– 訓練データの監査とドキュメンテーション
– 著作権クリアランスプロセスの確立
– オプトアウトメカニズムの実装
– 著作権者との協力的な関係の構築
業界への影響: AI業界全体に対して、以下の実務的影響が予想される:
– 訓練データの取得コストの増加
– ライセンシングモデルの開発
– 技術的な著作権保護措置の実装
– 業界標準とベストプラクティスの確立
リスク管理: 類似のリスクを回避するため、以下の考慮事項が重要である:
– 法的リスクの事前評価
– 保険によるリスク転嫁
– 代替的な訓練データソースの開発
– 著作権者とのパートナーシップの構築
比較法的観点 (Comparative Law Perspective)
日本法との比較: 日本の著作権法(著作権法第30条の4)は、2018年の改正により、情報解析のための著作物の利用について一定の例外を設けている。これは、非享受目的での利用を許可するもので、AI訓練に適用される可能性がある。しかし、この規定も無制限ではなく、著作権者の利益を不当に害する場合には適用されない。米国のフェアユース原則と比較すると、日本法はより明確な枠組みを提供しているが、商業的AI開発への適用については依然として不確実性が残る。
他国判例との関係: EUでは、著作権指令(2019/790)により、テキストおよびデータマイニングに関する例外規定が設けられているが、商業目的での使用には著作権者のオプトアウト権が認められている。英国では、AI訓練のための広範な例外規定の導入が検討されたが、創作者団体の反対により撤回された。これらの国際的動向は、AI訓練と著作権のバランスについて、世界的にコンセンサスが得られていないことを示している。
グローバルな影響: 多国籍AI企業にとって、この判決は以下の影響を持つ:
– 地域ごとに異なる法的要件への対応の必要性
– グローバルなデータガバナンス戦略の再考
– 国際的な著作権ライセンシングの複雑性の増大
– 規制のフラグメンテーションによるコンプライアンスコストの増加
重要なポイント (Key Takeaways)
実務家への示唆:
1. 予防的措置の重要性: AI開発企業は、訓練データの合法性を事前に確認し、適切なライセンスを取得すべきである
2. 文書化の必要性: データの出所、使用方法、決定プロセスを詳細に文書化することが、将来の訴訟リスクを軽減する
3. 協力的アプローチ: 著作権者との対立ではなく、協力的な関係構築が長期的には有益である
4. 技術的対策: オプトアウトメカニズムや著作権管理情報の保持など、技術的な対策の実装が重要
5. 継続的な法的モニタリング: この分野の法律は急速に発展しているため、継続的な法的動向の監視が不可欠
今後の展望:
– 議会による立法的介入の可能性が高まっている
– 業界標準とベストプラクティスの確立が進む
– 著作権者とAI企業間の新たなライセンシングモデルの開発
– 国際的な規制調和の必要性が認識される
– 技術的ソリューション(ブロックチェーン、DRMなど)の役割が増大する
注意すべき事項:
– 現在の法的枠組みの不確実性を認識し、保守的なアプローチを取ることが賢明
– 単にフェアユースに依存するのではなく、積極的な権利クリアランスを検討すべき
– 訓練データの選択と使用において、透明性と説明責任を重視する
– 著作権者の懸念に真摯に対応し、建設的な対話を維持する
– 規制環境の変化に柔軟に対応できる体制を構築する
このレポートに関する注意事項 (Warning/Notes)
– このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。

コメントを残す