Silverman et al v. OpenAI, Inc. et al

Silverman et al v. OpenAI, Inc. et al

Case Metadata

Basic Information

1. Case Name: Silverman et al v. OpenAI, Inc. et al, No. 3:23-cv-03416 (N.D. Cal. 2023), transferred to No. 1:25-cv-03483 (S.D.N.Y. 2025)
2. Court: United States District Court for the Northern District of California (original); United States District Court for the Southern District of New York (after MDL transfer)
3. Filing Date: July 7, 2023
4. Judgment Date: February 12, 2024 (partial dismissal order); case ongoing
5. Case Number: 3:23-cv-03416 (N.D. Cal.); 1:25-cv-03483 (S.D.N.Y.); MDL No. 3143
6. Current Status: Pending in MDL consolidation in S.D.N.Y.; direct copyright infringement and unfair competition claims proceeding

Parties

7. Plaintiff(s):
– Sarah Silverman (Comedian, author, and performer)
– Christopher Golden (Author of horror and fantasy novels)
– Richard Kadrey (Science fiction author)
8. Defendant(s):
– OpenAI, Inc. (Artificial intelligence research and deployment company developing large language models including ChatGPT)
– OpenAI LP and related entities
9. Key Law Firms:
– For Plaintiffs: Joseph Saveri Law Firm, LLP (Joseph Saveri); Matthew Butterick; Christopher K.L. Young; Bryan L. Clobes
– For Defendants: Morrison & Foerster (Joseph Gratz, Tiffany Cheung, Allyson Bennett); Latham & Watkins (Andrew Gass, Sarang Damle, Allison Stillman)
10. Expert Witnesses: Not yet disclosed; technical experts anticipated for trial phase

Legal Framework

11. Case Type: Copyright infringement litigation involving AI training data; class action lawsuit challenging use of copyrighted works in large language model development
12. Primary Legal Claims: Direct copyright infringement under 17 U.S.C. § 501; Unfair competition under California Business and Professions Code § 17200
13. Secondary Claims: Vicarious copyright infringement (dismissed); DMCA violations under 17 U.S.C. § 1202(b) (dismissed); Negligence (dismissed); Unjust enrichment (dismissed)
14. Monetary Relief: Actual damages and profits; statutory damages up to $150,000 per infringed work; injunctive relief sought

Technical Elements

15. AI/Technology Involved: OpenAI’s ChatGPT and GPT language models; large language model training processes; natural language processing systems; text generation algorithms
16. Industry Sectors: Publishing and literary works; entertainment; artificial intelligence development; content creation and media
17. Data Types: Copyrighted literary works including books; training datasets; text corpora; copyright management information

Database Navigation

18. Keywords/Tags: AI copyright infringement, ChatGPT litigation, LLM training data, derivative works, fair use defense, generative AI, copyright class action, DMCA violations, transformative use
19. Related Cases: Authors Guild v. OpenAI (S.D.N.Y.); Kadrey v. Meta Platforms (N.D. Cal.); Tremblay v. OpenAI (N.D. Cal.); New York Times v. OpenAI (S.D.N.Y.); Thomson Reuters v. Ross Intelligence (D. Del.)

詳細分析 (Detailed Analysis)

事件の概要 (Case Overview)

背景と争点 (Background and Issues)

事実関係:
本件は、著名なコメディアン・作家であるサラ・シルバーマン氏を筆頭とする著作者らが、OpenAI社に対して2023年7月に提起した集団訴訟である。原告らは、OpenAI社が同社のChatGPTおよびGPT言語モデルの訓練において、原告らの著作権保護された書籍を無断で複製・使用したと主張している。原告らによれば、これらの書籍は違法な「影の図書館」ウェブサイトから取得された可能性が高く、OpenAI社は著作権者の許諾なく、また対価を支払うことなく、大規模な著作権侵害を行ったとされる。

中心的争点:
1. AI訓練データとしての著作物使用が著作権侵害を構成するか
2. 大規模言語モデル(LLM)自体が著作物の派生的著作物(derivative work)に該当するか
3. AI訓練における著作物使用がフェアユース(公正利用)の抗弁により正当化されるか
4. ChatGPTの出力が訓練データの著作物と実質的類似性を有するか
5. AI開発企業が訓練データの著作権管理情報を保持する義務があるか

原告の主張:
原告らは、OpenAI社が数百万冊の著作権保護された書籍を無断で複製し、それらを使用してChatGPTを訓練したと主張している。特に、ChatGPTが原告らの書籍の詳細な要約を生成できることを証拠として、同社が著作物全文を取得・使用したことは明白であると論じている。さらに、大規模言語モデル自体が「侵害的派生的著作物」であり、訓練データなしには機能し得ないものであるため、その存在自体が著作権侵害を構成すると主張している。

被告の主張:
OpenAI社は、AI訓練における公開情報の使用は変革的(transformative)であり、フェアユースの法理により保護されると主張している。同社は、ChatGPTの出力が原告らの著作物と実質的に類似していないこと、また訓練プロセスは学習目的であり商業的搾取ではないことを強調している。さらに、著作権管理情報の除去については意図的なものではなく、技術的プロセスの一部に過ぎないと反論している。

AI/技術要素:
本件の中核となる技術は、OpenAI社のGPTシリーズ(特にGPT-3.5およびGPT-4)である。これらは、トランスフォーマーアーキテクチャを基盤とする大規模言語モデルで、数千億のパラメータを持ち、インターネット上の膨大なテキストデータで訓練されている。訓練プロセスには、テキストの次の単語を予測する教師なし学習と、人間のフィードバックによる強化学習(RLHF)が含まれる。原告らは、このモデルが著作権保護された作品の「表現的情報」を内部に保持し、それを基に新たなテキストを生成していると主張している。

手続きの経過 (Procedural History)

重要な手続き上の決定:
2023年7月の提訴後、OpenAI社は直接著作権侵害を除く複数の請求について棄却申立てを行った。2023年12月7日、カリフォルニア州北部地区連邦地裁のマルティネス=オルギン判事は口頭弁論を実施した。2024年2月12日、同判事は部分的棄却決定を下し、代位著作権侵害、DMCA違反、過失、不当利得の請求を棄却する一方、直接著作権侵害と不正競争の請求については訴訟継続を認めた。その後、2025年4月27日、本件はニューヨーク州南部地区連邦地裁の広域係属訴訟(MDL)第3143号に移送された。

証拠開示:
現時点では本格的な証拠開示(ディスカバリー)段階には至っていないが、原告らはOpenAI社の訓練データセット、データ取得方法、著作権フィルタリングプロセスに関する情報開示を求めている。特に、違法な「影の図書館」からのデータ取得の有無、著作権管理情報の処理方法、訓練データの保持期間等が重要な争点となることが予想される。

専門家証言:
技術専門家による証言はまだ提出されていないが、今後、AI訓練プロセス、自然言語処理技術、著作権侵害の技術的側面について、双方から専門家証人が召喚されることが予想される。特に、LLMが訓練データをどのように「記憶」し、出力にどの程度反映させるかという技術的メカニズムが重要な論点となる見込みである。

判決の概要 (Judgment Summary)

裁判所の判断 (Court’s Decision)

主要な判決内容:
2024年2月12日の部分的棄却決定において、マルティネス=オルギン判事は以下の判断を示した:

1. 直接著作権侵害請求(継続): 裁判所は、訓練データとしての著作物の無断複製に関する請求については、現段階で棄却する理由がないと判断した。

2. 代位著作権侵害請求(棄却): ChatGPTの出力と原告らの著作物との間に「実質的類似性」が立証されていないため、代位侵害の主張は成立しないと判断した。

3. DMCA違反請求(棄却): OpenAI社が意図的に著作権管理情報を除去したという証拠が不十分であるとして棄却された。

4. 過失請求(棄却): OpenAI社が原告らに対して著作物を保護する法的義務を負っていたことが立証されていないとして棄却された。

5. 不当利得請求(棄却): 詐欺、錯誤、強制によって利益を得たという主張が不十分であるとして棄却された。

6. 不正競争請求(継続・修正機会付与): カリフォルニア州法に基づく不正競争の主張については、修正の機会を与えつつ訴訟継続を認めた。

勝敗の結果:
現段階では部分的な手続き的決定に留まっており、最終的な勝敗は決していない。ただし、原告らの6つの請求のうち4つが棄却され、2つのみが継続している状況は、被告OpenAI社にとって有利な展開と評価できる。

命令された救済措置:
現時点では最終判決が下されていないため、具体的な救済措置は命じられていない。原告らは、実損害賠償、法定損害賠償(侵害著作物1件あたり最大15万ドル)、差止命令を求めている。

重要な法的判断:
裁判所は、AI訓練における「入力」(訓練データ)と「出力」(生成されたコンテンツ)を明確に区別し、派生的著作物の主張には出力における実質的類似性の立証が必要であると判示した。この判断は、AI著作権訴訟における重要な法的枠組みを示すものである。

法的推論の分析 (Analysis of Legal Reasoning)

適用された法理:
裁判所は、著作権侵害の判断において伝統的な「複製」と「派生的著作物」の概念を適用した。特に、Ninth Circuit(第9巡回区)の先例に従い、派生的著作物の認定には「実質的類似性」の立証が必要であることを強調した。また、DMCA違反については「故意性」の要件を厳格に適用し、単なる技術的プロセスによる情報除去では違反を構成しないと判断した。

事実認定:
裁判所は、ChatGPTが原告らの書籍の要約を生成できることは認めつつも、これが必ずしも著作物全体の無断複製を証明するものではないと指摘した。また、LLM自体が派生的著作物であるという原告らの理論については、技術的な仕組みの理解が不十分であるとして現段階では採用しなかった。

技術的理解:
判決文からは、裁判所がAI技術の複雑性を認識しつつも、既存の著作権法の枠組みを慎重に適用しようとしている姿勢が窺える。特に、機械学習における「学習」と「複製」の区別、統計的パターン認識と表現の複製の違いなど、技術的ニュアンスの理解に努めている様子が見られる。

法的意義 (Legal Significance)

先例価値 (Precedential Value)

将来への影響:
本件は、生成AIに対する著作権訴訟の先駆的事例として、今後のAI関連訴訟に大きな影響を与える可能性がある。特に、訓練データの使用に関するフェアユースの適用範囲、派生的著作物の認定基準、技術的プロセスにおける著作権管理情報の取り扱いなど、複数の重要な法的論点について先例を形成することが期待される。

法理論の発展:
本件は、デジタル時代における著作権法の適応と発展に寄与している。特に、大規模な自動化されたデータ処理における著作権の境界、AIの「創造性」と著作権侵害の関係、機械学習における「変革的使用」の概念など、新たな法理論の発展を促している。

解釈の明確化:
裁判所の判断は、AI開発における著作物使用について、「入力段階」と「出力段階」を区別する重要な枠組みを提供した。これにより、AI訓練における著作権侵害の評価基準がより明確になり、今後の訴訟における予測可能性が高まることが期待される。

規制・実務への影響 (Regulatory and Practical Impact)

AIガバナンス:
本件は、AI開発企業に対して、訓練データの取得と使用に関するより厳格なガバナンス体制の構築を促している。特に、データソースの合法性確認、著作権クリアランスプロセスの確立、著作権管理情報の保持など、コンプライアンス体制の強化が求められている。

コンプライアンス:
企業は以下の対応策を検討すべきである:
– 訓練データの出所と権利関係の明確な記録保持
– ライセンス取得またはフェアユース評価の文書化
– オプトアウトメカニズムの実装
– 著作権管理情報の技術的保護措置
– 出力フィルタリングシステムの導入

業界への影響:
本件の結果は、AI業界全体のビジネスモデルに根本的な影響を与える可能性がある。もし原告らが勝訴した場合、AI企業は訓練データのライセンス取得に莫大なコストを負担することになり、オープンソースAI開発や研究活動にも制約が生じる可能性がある。

リスク管理:
AI開発企業は、以下のリスク管理措置を検討すべきである:
– 著作権リスク評価プロセスの確立
– 保険によるリスク移転の検討
– 代替的な訓練データソースの開発
– 権利者との事前のライセンス交渉
– 技術的な著作権保護措置の実装

比較法的観点 (Comparative Law Perspective)

日本法との比較:
日本の著作権法第47条の7(電子計算機による情報解析のための複製等)は、情報解析を目的とする著作物の利用について一定の制限規定を設けている。この規定は、非享受目的での機械学習を明示的に許容しており、米国のフェアユース法理よりも明確な枠組みを提供している。ただし、生成AIの出力段階における著作権問題については、日本でも明確な法的枠組みが確立されていない。

また、日本では2024年3月に文化審議会著作権分科会が「AIと著作権に関する考え方」を公表し、AI学習における著作物利用の適法性判断基準を示している。この点で、日本は米国よりも先行して規制的枠組みの整備を進めている。

他国判例との関係:
EUでは、2024年に施行されたAI規則(AI Act)により、基盤モデル提供者に対して訓練データの著作権遵守が義務付けられた。英国では、AI訓練のための著作権例外規定の導入が検討されたが、クリエイター団体の反対により撤回された。これらの国際的動向は、本件の判断にも影響を与える可能性がある。

グローバルな影響:
本件の結果は、多国籍AI企業のグローバル戦略に大きな影響を与える。特に、訓練データの地域別管理、各国法に応じたモデルの差別化、国際的なライセンシング戦略など、複雑な対応が必要となる可能性がある。また、国際的な著作権条約の改正や、AI特有の国際的枠組みの必要性についての議論も加速することが予想される。

重要なポイント (Key Takeaways)

実務家への示唆:
1. 訓練データの適法性確保: AI開発においては、訓練データの出所と権利関係を明確に記録し、必要に応じてライセンスを取得することが重要である。

2. フェアユース評価の文書化: フェアユースの抗弁を主張する場合、変革的使用の性質、市場への影響等を詳細に分析・文書化しておく必要がある。

3. 技術的保護措置の実装: 著作権管理情報の保持、出力フィルタリング、オプトアウトメカニズムなど、技術的な著作権保護措置を実装することが推奨される。

4. 契約による保護: AI開発・利用に関する契約において、知的財産権の帰属、補償条項、免責条項等を明確に規定することが重要である。

5. 国際的視点の必要性: グローバルにサービスを展開する場合、各国の著作権法制の違いを考慮した戦略が必要である。

今後の展望:
本件は現在MDLに統合され、他の類似訴訟と共に審理されることになった。今後、統一的な証拠開示手続きを経て、AI訓練における著作権問題について包括的な司法判断が示されることが期待される。特に、フェアユースの適用範囲、技術的中立性の原則、創作者の権利保護とイノベーション促進のバランスなど、根本的な政策判断が求められることになるだろう。

また、立法的解決の可能性も検討されており、米国議会では複数のAI規制法案が提出されている。これらの立法動向も、本件の最終的な解決に影響を与える可能性がある。

注意すべき事項:
1. 証拠保全: AI開発企業は、訓練データの取得・使用に関する全ての記録を適切に保存すべきである。

2. リスク評価: 新たなAIモデルの開発・展開前に、著作権リスクの包括的評価を実施すべきである。

3. 業界標準への準拠: Partnership on AIやその他の業界団体が策定する倫理的AIガイドラインへの準拠が推奨される。

4. 継続的モニタリング: 本件および関連訴訟の動向を継続的にモニタリングし、必要に応じて実務を調整する必要がある。

5. ステークホルダーとの対話: 著作権者、AI開発者、利用者等のステークホルダー間の建設的な対話を促進し、持続可能な解決策を模索することが重要である。

このレポートに関する注意事項 (Warning/Notes)

このレポートはサイト運営者がAIエージェントに文献等の調査・調査結果の分析・分析結果の整理・分析結果の翻訳等を行わせたものです。人間による追加的な調査や査読は行っておらず、内容には誤りを含む場合があります。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です