J.L. v. Alphabet Inc.
Case Metadata
Basic Information
1. Case Name: J.L. v. Alphabet Inc., No. 3:23-cv-03440-WHO (N.D. Cal. 2023), consolidated as In re Google Generative AI Copyright Litigation, MDL No. 3073
2. Court: United States District Court for the Northern District of California, San Francisco Division
3. Filing Date: July 11, 2023
4. Judgment Date: Case remains pending (as of January 2025)
5. Case Number: 3:23-cv-03440-WHO; MDL No. 3073
6. Current Status: Pending – Active litigation with amended complaints permitted, motion to dismiss partially granted, consolidated with related cases
Parties
7. Plaintiff(s):
   – J.L. (Individual plaintiff, privacy rights holder)
   – P.M. Battles (Individual plaintiff, professional photographer and copyright holder)
   – Class representatives on behalf of all persons whose personal information and copyrighted works were allegedly used without consent
8. Defendant(s):
   – Google LLC (Technology company, developer of AI products including Bard, Imagen, and Duet AI)
   – Originally included: Alphabet Inc. (Parent company – dismissed), DeepMind Technologies Limited (AI research subsidiary – dismissed)
9. Key Law Firms:
   – For Plaintiffs: Clarkson Law Firm P.C. (Lead Counsel), Milberg Coleman Bryson Phillips Grossman PLLC
   – For Defendants: Wilson Sonsini Goodrich & Rosati P.C.
10. Expert Witnesses: Not yet disclosed (case in pre-trial phase)
Legal Framework
11. Case Type: Class action lawsuit involving AI training data collection, copyright infringement, data privacy violation, and unfair competition
12. Primary Legal Claims:
    – Copyright infringement under 17 U.S.C. § 501
    – Violation of Digital Millennium Copyright Act (DMCA) § 1202
    – Privacy violations under California Constitution Article I, Section 1
    – Unfair competition under California Business & Professions Code § 17200
13. Secondary Claims:
    – Breach of contract (Terms of Service violations)
    – Unjust enrichment
    – Conversion of personal property
    – Negligence in data handling
14. Monetary Relief: Unspecified damages sought; requesting statutory damages for copyright violations, restitution of profits, and punitive damages
Technical Elements
15. AI/Technology Involved:
    – Google Bard (Large Language Model chatbot)
    – Imagen (Text-to-image generation AI)
    – Duet AI (Code generation assistant)
    – PaLM and PaLM 2 (Pathways Language Model)
    – Training datasets allegedly scraped from internet without authorization
16. Industry Sectors: Technology, creative industries, online services, education, healthcare (through data collection)
17. Data Types:
    – Copyrighted creative works (photographs, text, artwork)
    – Personal identifying information
    – Browsing history and user interactions
    – Educational content
    – Professional creative portfolios
Database Navigation
18. Keywords/Tags: Generative AI, copyright infringement, data scraping, privacy rights, class action, DMCA, unfair competition, training data, LLM litigation, AI ethics, Bard, California privacy
19. Related Cases:
    – Doe v. GitHub Inc., No. 4:22-cv-06823 (N.D. Cal. 2022) – AI code generation copyright case
    – Andersen v. Stability AI Ltd., No. 3:23-cv-00201 (N.D. Cal. 2023) – AI image generation copyright case
    – Tremblay v. OpenAI Inc., No. 3:23-cv-03223 (N.D. Cal. 2023) – ChatGPT training data copyright case
    – Getty Images v. Stability AI Inc., No. 1:23-cv-00135 (D. Del. 2023) – Stock photo copyright infringement
詳細分析 (Detailed Analysis)
事件の概要 (Case Overview)
背景と争点 (Background and Issues)
事実関係: 本件は、GoogleがBard、Imagen、Duet AIなどの生成AI製品を開発・訓練する過程で、インターネット上から大量のデータを無断で収集・使用したとして提起された集団訴訟である。2023年7月11日、個人原告J.L.らが、Googleが著作権で保護されたコンテンツや個人情報を含むデータを、権利者の同意なく収集し、商業的AI製品の訓練に使用したと主張して訴訟を提起した。原告らは、Googleが「robots.txt」ファイルやその他の技術的保護手段を無視してウェブスクレイピングを行い、収集したデータから著作権管理情報を削除したと主張している。
中心的争点:
– AI訓練データとしてのインターネットコンテンツの無断使用が著作権侵害に該当するか
– 大規模言語モデル(LLM)の訓練におけるフェアユース抗弁の適用範囲
– 個人情報を含むデータの収集がプライバシー権侵害に該当するか
– AI生成物が元の著作物の派生物として扱われるべきか
– 技術的保護手段の回避がDMCA違反を構成するか
原告の主張: 原告らは、Googleが数十億のウェブページ、画像、その他のコンテンツを無断で収集し、これらを使用してAIモデルを訓練したことで、著作権者の排他的権利を侵害したと主張。さらに、収集過程で著作権管理情報(CMI)を削除したことがDMCA違反に該当し、個人情報の無断収集がカリフォルニア州憲法上のプライバシー権を侵害すると主張。原告らは、差止命令、損害賠償、不当利得の返還を求めている。
被告の主張: Googleは、AI訓練のためのデータ使用は変革的使用(transformative use)でありフェアユースに該当すると主張。また、公開されているインターネット上のコンテンツの使用は、暗黙の許諾があると反論。さらに、原告らが具体的な損害を立証していないとして、訴訟要件を満たしていないと主張している。技術革新と表現の自由の観点から、AIの発展を阻害する判決は公益に反すると主張。
AI/技術要素: 本件の中核となる技術は、Googleの大規模言語モデル(LLM)とその訓練プロセスである。Bardは、PaLM 2モデルを基盤とする対話型AIで、数兆のパラメータを持つ。Imagenは、テキストから画像を生成する拡散モデルで、LAION-400Mなどの大規模データセットで訓練されている。これらのモデルは、教師なし学習により、インターネットから収集した膨大なテキスト、画像データから言語パターンや画像特徴を学習している。
手続きの経過 (Procedural History)
重要な手続き上の決定:
2023年11月、裁判所は関連する複数の訴訟を「In re Google Generative AI Copyright Litigation」として併合し、多地区訴訟(MDL)として処理することを決定。2024年2月、被告の訴え却下申立てに対し、裁判所は一部認容・一部棄却の判断を下した。著作権侵害の直接的請求は維持されたが、一部の州法に基づく請求は連邦法による専占(preemption)を理由に棄却された。2024年5月、原告らに修正訴状の提出が許可され、より詳細な事実主張が追加された。
証拠開示: 現在、証拠開示手続きが進行中。原告らは、Googleの訓練データセットの詳細、データ収集方法、著作権管理情報の処理に関する内部文書の開示を要求。Googleは、営業秘密と競争上の機密情報を理由に、一部の情報について保護命令を求めている。技術的詳細に関する専門家証言の準備が両当事者により進められている。
専門家証言: 予定される専門家証言には、AI技術の専門家による訓練プロセスの技術的説明、著作権法の専門家によるフェアユース分析、経済学者による市場への影響評価が含まれる見込み。特に、AI生成物と元の著作物との類似性評価、変革的使用の程度、市場代替性の分析が重要な争点となる。
判決の概要 (Judgment Summary)
裁判所の判断 (Court’s Decision)
本件は現在も係属中であるが、2024年2月の中間判断において重要な法的判断が示されている。
主要な判決内容: 裁判所は、著作権侵害の直接的請求について、原告らが訴訟要件を満たしているとして却下申立てを棄却。特に、大規模なデータ収集と使用が著作権侵害の一応の証明(prima facie case)を構成すると判断。しかし、州法に基づく一部の請求については、著作権法による連邦法専占の原則により棄却された。
命令された救済措置: 現段階では最終的な救済措置は決定されていないが、裁判所は証拠開示手続きの続行を命じ、両当事者に和解協議への参加を勧告している。
重要な法的判断:
– AI訓練のためのデータ使用がフェアユースに該当するかは、事実に基づく詳細な分析が必要であり、申立て段階での判断は不適切
– 著作権管理情報の削除に関するDMCA違反の主張は、具体的な削除行為の立証が必要
– プライバシー権侵害の請求は、著作権法とは異なる法益を保護するため、連邦法専占の対象外
法的推論の分析 (Analysis of Legal Reasoning)
適用された法理: 裁判所は、Campbell v. Acuff-Rose Music判決のフェアユース4要素テストを参照しつつ、AI訓練という新しい文脈での適用には慎重な検討が必要と指摘。Authors Guild v. Google判決(Google Books事件)との類似性と相違点を分析し、変革的使用の概念が技術の進歩とともに進化する必要性を示唆。
事実認定: 裁判所は、申立て段階では原告の主張を真実と仮定して判断。Googleが大規模なウェブスクレイピングを行い、著作権で保護されたコンテンツを含むデータを収集・使用したという事実について、争いがないものとして扱っている。
技術的理解: 裁判所は、大規模言語モデルの訓練プロセス、トークン化、埋め込み表現、ファインチューニングなどの技術的概念について、両当事者から提出された技術的説明を慎重に検討。AIモデルが元のデータを「記憶」し「再現」する能力について、技術的な理解を示している。
法的意義 (Legal Significance)
先例価値 (Precedential Value)
将来への影響: 本件は、生成AI時代における著作権法の適用に関する重要な先例となる可能性が高い。特に、大規模なデータ収集と使用がフェアユースに該当する条件、AI生成物の著作権上の地位、訓練データの権利者への補償義務などについて、明確な指針を示すことが期待される。
法理論の発展: 変革的使用理論のAI文脈への拡張、機械学習における「複製」概念の再定義、AIシステムの「創作性」に関する新たな法的フレームワークの構築に寄与する可能性がある。また、技術的保護手段の回避に関するDMCAの解釈にも影響を与える。
解釈の明確化: 既存の著作権法をAI技術に適用する際の具体的基準、特に商業的使用と研究目的使用の区別、派生物作成権の範囲、著作権管理情報の技術的処理に関する要件などが明確化される見込み。
規制・実務への影響 (Regulatory and Practical Impact)
AIガバナンス: 本件の結果は、AI開発企業に対して、訓練データの取得と使用に関する明確なガバナンス体制の構築を要求することになる。データソースの文書化、権利処理プロセスの確立、オプトアウト機構の実装などが標準的実務となる可能性がある。
コンプライアンス: 企業は以下の対応が必要となる可能性:
– 訓練データの出所と権利状態の詳細な記録管理
– 著作権者への通知とオプトアウト機会の提供
– 技術的保護手段を尊重したデータ収集方法の採用
– AI生成物における元データの帰属表示システムの構築
– プライバシー影響評価の実施と個人情報の適切な処理
業界への影響: AI開発のコスト増加、ライセンス取得の必要性、オープンソースAIプロジェクトへの影響、新たなビジネスモデル(データライセンシング市場)の創出などが予想される。また、技術開発の地理的シフト(規制の緩い地域への移動)の可能性もある。
リスク管理:
– 法的リスク:訴訟リスクの評価と保険の検討、防御的特許・著作権ポートフォリオの構築
– 技術的リスク:データ汚染の防止、バイアス除去、説明可能性の確保
– レピュテーションリスク:倫理的AI開発の公約、透明性レポートの公開
– 規制リスク:複数管轄での規制動向の監視、ロビー活動への参加
比較法的観点 (Comparative Law Perspective)
日本法との比較:
日本の著作権法における「情報解析のための複製」(第30条の4)は、AI訓練のためのデータ使用により寛容な立場を取っている。非享受目的での著作物利用を広く許容する日本法と異なり、米国法はフェアユースの4要素テストによる個別判断を要求。日本では、令和5年の文化審議会著作権分科会でAI学習用データセットの取扱いが議論され、一定の明確化が図られているが、米国では司法判断に委ねられている部分が大きい。
また、日本の個人情報保護法は、学術研究目的での個人情報利用に一定の例外を設けているが、商業的AI開発への適用は明確でない。プライバシー権の憲法上の位置づけも、日本(憲法13条)と米国(州憲法)では異なり、保護の範囲と救済方法に差異がある。
他国判例との関係:
– EU:欧州では、著作権指令におけるテキスト・データマイニング例外(TDM例外)が適用される可能性があるが、商業目的での使用には権利者のオプトアウト権が認められている
– 英国:英国は現在、AI訓練のための著作権例外規定の導入を検討中であるが、創作者団体からの反対により議論が続いている
– 中国:中国では、AI生成物の著作権に関する判例が蓄積されており、人間の創作的寄与の程度を重視する傾向がある
グローバルな影響: 本件の判決は、国際的なAI開発競争における米国企業の競争力に直接影響する。規制アービトラージ(より寛容な法域での開発)の可能性、国際的な規制調和の必要性、技術標準の分断化リスクなどが懸念される。多国籍企業は、複数法域での異なる規制要件への対応を迫られ、グローバルなAI製品の開発・展開戦略の見直しが必要となる。
重要なポイント (Key Takeaways)
実務家への示唆:
1. データ収集実務の見直し: AI開発を行う企業は、訓練データの収集方法について法的レビューを実施し、必要に応じてライセンス取得やオプトアウト機構の実装を検討すべき
2. 契約条項の更新: 利用規約やプライバシーポリシーにおいて、AI訓練のためのデータ使用について明示的な条項を追加する必要がある
3. リスク評価の実施: 既存のAI製品について、訓練データの出所と権利状態を遡及的に調査し、潜在的な法的リスクを評価すべき
4. 証拠保全: 訴訟リスクに備え、データ収集・処理に関する技術的文書、決定過程の記録を適切に保存する体制を構築する
今後の展望:
本件を含む一連のAI訴訟は、生成AI技術と既存の知的財産権制度との調和点を模索する過程といえる。立法による解決(AI訓練のための著作権例外規定の創設など)の可能性もあるが、当面は司法判断の蓄積により、実務的な指針が形成されていくと予想される。和解による解決も考えられるが、その条件が業界標準となる可能性がある。
注意すべき事項:
– 本件はまだ係属中であり、最終的な判決内容によっては、AI業界の実務に大きな変更が必要となる可能性がある
– 技術的保護手段(robots.txt等)の尊重は、法的義務となる可能性が高い
– 個人情報を含むデータの取扱いについては、著作権とは別個の法的配慮が必要
– AI生成物の商業利用に際しては、訓練データの権利処理状況の確認が重要となる
– 国際的な規制動向を注視し、複数法域での規制要件を満たす体制構築が必要
このレポートに関する注意事項 (Warning/Notes)
– このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。

コメントを残す