Nvidiaが「Anna's Archive」に書籍アクセスのために連絡を取った
概要
- NVIDIAがAIブームで巨額の利益を得ている現状
- 著作権侵害を巡る作家たちの集団訴訟
- Anna’s Archiveなど“シャドウライブラリ”との関与疑惑
- 訴訟は米国カリフォルニア北部地区連邦地裁で進行中
- 今後の法的・業界的影響に注目
NVIDIAとAI著作権訴訟の概要
- NVIDIAはAIチップとデータセンター事業で急成長
- 独自AIモデル(NeMo, Retro-48B, InstructRetro, Megatron)の開発・学習
- 学習データに大規模テキストライブラリを活用
- 他のIT大手同様、著作権者からの法的反発を受ける状況
作家によるNVIDIAへの著作権侵害訴訟
- 2024年初頭、複数の作家がNVIDIAを著作権侵害で提訴
- 集団訴訟の内容:Books3データセットが“海賊版”サイトBibliotik由来
- 無断利用による損害賠償請求
- **NVIDIA側は“フェアユース”**を主張し、「書籍は統計的相関に過ぎない」と反論
- しかし、訴訟過程で新たな証拠が発見される
Anna’s Archiveとの接触疑惑
- 2024年6月、訴状が拡大され新たなAIモデル・書籍・著者が追加
- 内部メール等から、NVIDIAがAnna’s Archiveに直接接触したと主張
- データストラテジーチームが「高速アクセス」の条件を問い合わせ
- Anna’s Archive側は「違法性」を警告
- 数日後、**NVIDIA経営陣が“ゴーサイン”**を出し、500TB規模のデータアクセス権を取得
- 提供データにはInternet Archiveの電子貸出システム経由の書籍も含む
その他の“シャドウライブラリ”利用疑惑
- LibGen, Sci-Hub, Z-Libraryなど他の“海賊版”ソースも利用疑惑
- Books3以外のデータセットにもアクセスした可能性
二次的・共同侵害の主張
- NVIDIAが自社AI学習だけでなく、顧客向けに自動ダウンロード用ツールやスクリプトを配布
- 例:「The Pile」データセット(Books3含む)の自動取得
- これにより共同・間接侵害による収益化も指摘
- 損害賠償請求は原告作家だけでなく、将来参加する可能性のある多数の著者にも及ぶ
今後の展望と業界への影響
- Anna’s Archiveとのやり取りが米大手IT企業で初めて公になった事例
- “シャドウライブラリ”の存在感が一層拡大
- 訴訟の行方次第でAI開発と著作権問題の業界基準・規制強化の可能性
- 訴状は米国カリフォルニア北部地区連邦地裁に提出済み
- 代表的な原告作家:Abdi Nazemian, Brian Keene, Stewart O’Nan, Andre Dubus III, Susan Orlean
まとめ
- NVIDIAはAI時代のリーダーである一方、著作権侵害疑惑で厳しい法的局面に直面
- “シャドウライブラリ”との関与問題がAI業界全体のリスクとして浮上
- 今後の訴訟動向と判決がAI開発と著作権の新たなルールを形作る可能性