ハクソク

世界を動かす技術を、日本語で。

メタ、海賊版書籍のBitTorrentによるアップロードはフェアユースに該当すると主張

概要

  • Metaが著作権侵害で集団訴訟を受けた事例
  • LLMの訓練データに無断で書籍を使用
  • BitTorrentによる書籍共有が争点
  • Metaは「技術的必然性によるフェアユース」を主張
  • 裁判所の判断が今後のAI訴訟に影響

Metaの書籍データ利用を巡る著作権訴訟の経緯

  • Meta(FacebookとInstagramの親会社)が著名作家から集団訴訟を提起された事例
  • Richard Kadrey, Sarah Silverman, Christopher Goldenなどが2023年に訴訟を提起
  • Llama LLMの訓練データとして無許可の書籍を利用
  • Anna’s ArchiveなどのシャドウライブラリからBitTorrent経由で書籍データを取得
  • BitTorrent利用により他者へのアップロードも同時発生

フェアユースの主張と裁判所の判断

  • 2023年夏、Metaは訓練目的の利用はフェアユースとの主張で一部勝訴
  • ただし、BitTorrentによる配布行為は争点として残る
  • Metaは「BitTorrentによるアップロードもフェアユース」と新たに主張
    • BitTorrentは技術的に必然的にアップロードが発生
    • 大量データ取得には唯一の現実的手段であったと説明

著者側とMetaの主張の対立

  • 著者側は新たなフェアユース主張を期限後の提出として問題視
    • Metaは2024年11月からアップロード問題を認識していたと指摘
    • 裁判所への提出が発見手続き期限後である点を非難
  • Metaは以前から主張していたと反論
    • 2025年12月の共同声明や法廷で既に言及済みと主張

証拠と市場への影響

  • Metaは著者自身の証言を引用
    • どの著者も「自分の本の内容がMetaの出力として再現された例を知らない」と証言
    • Sarah Silvermanは「出力されなくても問題ない」と発言
  • Metaはこれを市場被害の否定として利用
    • 訓練自体のフェアユース性が認められた過去判決を強調

AIと米国の国際競争力

  • MetaはAI投資が米国のグローバルリーダーシップに貢献と主張
    • AI分野の発展が国家的価値であると間接的に示唆

今後の展開と影響

  • 裁判所は「技術的必然性によるフェアユース」の可否を判断予定
  • この判断は他のAI訴訟やシャドウライブラリ利用にも波及
  • BitTorrentによる配布の主張が2023年提訴の訴訟の最後の争点
  • Judge Vince ChhabriaがMetaの新たな防御を認めるかは未定

関連資料

  • Metaの補足回答書(pdf)
  • 著者側の裁判所宛書簡(pdf)
  • Metaの反論書簡(pdf)

Hackerたちの意見

世界がめっちゃ変わったよね。俺の海賊時代には、こんな風に大企業が裁判で争うなんて思いもしなかったし、基本的に海賊行為を支持してるなんて。今や活動家たちがそれに反対してるのも、結局大手がやってるからだよね。
大企業は自分たちを豊かにするために盗んでるけど、小規模な海賊たちは自分たちの楽しみのために海賊行為をしてた。後者の中には刑務所に入った奴もいるのに、前者は金をガッポリ稼いでる。
大企業が一枚岩じゃないってことを理解する必要があるよ。みんなそれぞれの目標や利益の出し方があるから。消費者や国家を搾取する以外にね。
> 「活動家たちがそれに反対してるのは、大手が俺たち小さい奴らを搾取してるからだ。」メタが任天堂のIPをトレントして、OpenAIがNetflixのIPをトレントしても、弁護士たち以外は誰も気にしないよね。
原則に変化があったわけでもないし、何かを鋭くするためのナイフがあるわけでもない。「2005年の個人海賊」はアートをアクセスしやすくすることだった。「2025年の企業海賊」はアートを潰すことだ。
誰かが海賊版を作ることに対しては全然問題ないよ。俺の国では、イタリアでもすぐにそうなるけど、すべてのストレージメディアの販売には小額の課金(Artisjus)が含まれてて、海賊版による損失を著作権者に補償するためのものなんだ。メディアをコピーするために使ってないなら不公平だって言えるかもしれないけど、強制的に払わされる以上、払いたくないコンテンツを海賊版で見ることに道徳的な葛藤はないよ。同じことを言えば、AI企業も自分たちのモデルがスクレイピングされて精製されてることに文句を言う立場じゃないよね。
何も変わってないよ。お金の流れは以前と同じ方向に流れている、それが常に変わらないこと。裁判所は整流器のダイオードみたいなもんだ。
活動家たちは、軽蔑に目がくらんで、もしそれが通ったら前例の価値を考えることすらできないみたいだね。
活動家たちはAIのトレーニングには反対だけど、ビットトレントには反対してないよ。
2015年にTwitterが、ペリスコープが前夜にペイパービューのボクシングマッチを海賊版として広く使われたって自慢してたのを思い出す。なんか変だなと思った。https://www.nytimes.com/2015/05/05/sports/periscope-a-stream...
> そして、活動家たちは今それに反対している。なぜなら、大手企業がそれをやっているから。活動家にもいろいろいるよ。「情報は自由であるべきだ」と主張する活動家は、「正直に生計を立てようとするアーティスト」を支援する活動家とは違うし、大手企業もそれぞれ違う。大手AI企業は、大手出版社とは違うことを望んでいるんだ。
90年代や2000年代のことを思い出すと、FBIが路上で違法なVHSやDVDを売ってるホームレスを追いかけてたのが笑える。
アメリカができて以来、本当に人が犯せる罪は貧乏であることだけだった。
ICEは、長いサプライチェーンのケースで重要な役割を果たしてたよね。今考えるとちょっと古臭いけど、子供の虐待リングに参加してない犯罪者は認めるべきだと思う。あの偽造DVDは違法コンテンツじゃなくて、ただの違法な店舗だった。もし今のICEやFBIがそんなリングを見つけたら、最初に誰に連絡するんだろう?
> 「BitTorrentを使ってファイルを転送する人は、自動的に他の人にコンテンツをアップロードすることになる。これはプロトコルに内在するものだから。つまり、アップロードは選択肢じゃなくて、技術の仕組みなんだ。裁判でこんな主張をするなんて、すごいよね。原告側が数分で反証できるのに。」
こんな主張、今まで誰も試したことがないなんて信じられない…じゃあ、これからはビットトレントで音楽をダウンロードした過去の著作権訴訟を全部巻き戻すの?
これ。アップロード速度をゼロに設定すれば、何もアップロードせずにデータセット全体をダウンロードできるよ。遅いけど、できる。
引き金を引いて弾が他の人を殺すのは、技術の仕組みだよね。使うかどうか選んだとして、なんで俺が責任を負わなきゃいけないの?
そうだね、昔は「リーチャー」って呼ばれてたもんね。ちょっと関連するxkcd https://xkcd.com/553/
自動的にってわけじゃないよ。シーディングはオプトアウトで、オプトインじゃないからね…でも、通常は手動で設定を変更しないといけないデフォルトになってる。ほとんどのユーザーはその設定に触れないし、平均的な海賊はトレントをダウンロードしてる時点で、知らず知らずのうちにシーディングしてるんだ。プロトコル自体はシーディングを強制しないし、クライアントはトラッカーに嘘をついてアップロードを0kに制限することもできる。ビットトレントには共有を強制する仕組みはないんだ。ファイルをリークして、ダウンロードしても前方パケットを共有しないことも可能だし、「シーディングの社会契約」は完全にプライベートトラッカーとコミュニティの恥によって強制されるノルムに過ぎない。プロトコル自体ではないんだよ。
弁護士は自分の立場を守るために報酬をもらってるんだよね。知的な売春婦みたいなもんだ。
「法律は公平なもの」と「法律は権力の気まぐれに屈するもの」の矛盾は、いつか解決しなきゃいけないよね。
悪いニュースだけど、もう解決済みだよ。
完全に同意。ディズニーやその仲間たちが法律を利用して自分たちの懐を肥やしているのは、ほんとにひどいことだよね。: https://en.wikipedia.org/wiki/Copyright_Term_Extension_Act
権力にはすべてが従うってのが定義だからね。法律はハードサイエンスに基づいてないから、公平じゃないんだ。「殺人」「暴行」「窃盗」とかの言葉は曖昧で解釈が分かれるし(例えば、詐欺は窃盗なのか?そうなら、詐欺の定義は?「嘘をつく」ってことは「誤解を招く」と何が違うのか、違わないなら「誤解を招く」の定義は?)俺の考える解決策は、もっと教育を受けることだと思う。そうすれば、みんな悪い法律を作って、それを悪く執行することがなくなる。
「法律」ってのは、常に権力者の気まぐれで、従わないと無力な者に対する暴力の脅威なんだよ。
一方で、子供が曲をダウンロードしたらリンチにあったりするんだよね。
私たちの中には、RIAAが子供たちを訴えてメタリカのアルバムをファイル共有ネットワークでダウンロードさせたことを覚えている人もいるよ。1曲あたり10万ドルの訴訟を起こして、物理的なアルバムを盗むのと比べたら、1曲あたり1ドルくらいしか価値がないのに、ほんとに馬鹿げてるよね。おかしいのは、裁判所がその金額を真剣に受け止めていたこと。通常は約3,000ドルで和解するのに、それでも実際の損害の約30倍だし。法的な最大額は1件につき15万ドルだったから、ウルヴァリンの映画の早期カットが漏れたとき、スタジオはその金額しか訴えられなかったんだ。
子供だって犯罪を犯すことがあるよね。面白いのは、今のAIの時代に、海賊版を支持していた人たちが、同じことをAI企業にやらせないようにしようとしていることだよ。
じゃあ、ビットトレントでメディアをダウンロードして起訴された場合、ローカルモデルのトレーニングに使ったらフェアユースだと主張できるってこと?
コンテキストを完全に無視してるね!ダウンロードだけで訴えていたわけじゃないから。彼らはダウンロードしながら共有して、さらにシーディングしていたから、"早期シーダー"として何千人もの人にコピーを提供していたんだ。正しいか間違っているかは別として、単にダウンロードすることだけが問題じゃなかった。彼らの目には、コピーを取って、何万ものコピーを無料で配ることが問題だったんだ。繰り返すけど、正しいとは言ってないよ。ただ、結論を導くために偏った要約をしないでほしい。
メタリカのメンバーが、自分たちの未成年ファンに対して訴訟を起こすのに積極的に関わってたことを忘れないで。RIAAやレコード会社だけが冷酷だったわけじゃなくて、メタリカ自身もそうだったんだ。メタリカ、マジでクソだな。
でも、そのおかげでMetallicopsみたいな楽しいフラッシュアニメが生まれたから、まあ良かったかな。https://www.youtube.com/watch?v=mb_jLAisPzk
数字がちょっと違うよ。まず、RIAAの訴訟はダウンロードのためじゃなくて、配布のためのものだったんだ。彼らの執行活動は大体こんな感じだった。1. 最初に、共有されている曲ごとに約3ドルを請求する手紙を送って、支払わなければ訴えるぞって脅してた。これで合計は大体2,000〜3,000ドルくらいになった。中には、意図的に大量に配布してるって言われた人のように、最初の請求がもっと高額なケースもあったけど、ほとんどの人は音楽を自分のために得るためにファイル共有アプリを使ってたから、平均的にはその2,000〜3,000ドルの範囲だった。2. もし合意に至らず、実際に訴訟を起こすと、共有していた曲のリストから10〜25曲を選んで訴えることになる(通常は約1,000曲)。その訴訟での損害賠償の範囲は、侵害された作品ごとに750ドルから30,000ドルで、裁判所(裁判官と陪審)が金額を決めるんだ。[1] 注意:これは「侵害された作品ごと」であって、侵害ごとじゃないよ。侵害の回数は、裁判所がその750ドルから30,000ドルの範囲でどの金額にするかを決める際の要素の一つになる。3. 訴訟が実際に裁判に進む前に、もっと和解の提案があったりする。これらはほとんどいつも曲ごとに200〜300ドルの範囲で、訴訟は共有していた1,000曲のうちの十数曲にしか関わっていなかったから、通常は訴訟前の和解提案と同じくらいの金額になる。ほとんどの人はその時点で和解したよ。なぜなら、(1) 勝つ見込みがほとんどないこと、(2) 自分が「無知な侵害者」だと証明する見込みがないこと、(3) 最低限の法定損害賠償750ドル/曲×10〜15曲が和解提案よりも多いこと、(4) さらに弁護士費用だけでなく、著作権訴訟では負けた方が勝った方の弁護士費用を払わなきゃいけないことを理解したから。4. 実際に裁判に進んだのは10件にも満たなくて、そのほとんどは裁判中に和解した。理由は上の段落と同じで、ほとんどの人が裁判前に和解したから。これらは3,000〜15,000ドルの範囲で、ほとんどが約5,000ドルだった。[1] 被告が「無知な侵害者」であることを証明できれば、最低額は200ドルに下がる。原告が侵害が「故意」であることを証明できれば、最高額は150,000ドルに上がる。
君の記憶が曖昧になってるかもね。君が言ってる「最大値」はまだ存在してるけど、ただの法定損害賠償の規定に過ぎないんだ。つまり、原告は実際の損失を証明しなくてもそういった損害を得られる、いわゆる厳格責任ってこと。もし原告がこのレベルを超える実際の損害を証明できれば、彼らはそれを得ることができる。
これが超富裕層がメディア会社を買ってる本当の理由だよ。彼らは既存の著作権法が裁判で通用することを期待していて、トレーニング用のIPライセンスでかなりの収益を上げるか、AI企業に大きな出資をすることを狙ってるんだ。データだけが防壁で、アルゴリズムや計算能力じゃない。
これは悪い賭けに見えるな。著者たちがこの訴訟に負けて、トレーニングデータのライセンスを取得する必要がないっていう前例を作ることになるみたい。
もしこれが起こったら、無料でオープンなコンテンツ(Wikipediaモデルみたいな)が、大手AIやテクノロジー企業にとって大きな影響力を持つ「補完物のコモディティ化」のプレイになるね。良いオープンコンテンツは、AI企業が独占的なサプライヤーからライセンスを取得する必要がないものだから。完全にオープンなコンテンツで訓練されたモデルが新しいものの「初稿」を書けるなら、それはすごい加速になる。
今、すごく複雑な気持ちだ。片方では、もし彼らがこの主張で成功したら、めちゃくちゃ面白いと思う。VPN業者はそれを面白いとは思わないだろうけどね。もう一方では、その偽善には驚かされる。弁護士があらゆる角度から攻めるのは仕方ないけど、これはかなりクリエイティブだよね。でも、本当に知りたいのは、お金が正義を買い続けるのかってこと。心からFacebookが負けて、訴訟のすべての本の著作権を故意に侵害してたと認定されることを願ってる。1回の違反で15万ドルだから、可哀想な株主にはちょっと同情しちゃうかも。ザッカーバーグは全責任を取って、何万人も解雇するんだろうな。
これはウィンウィンの状況だね。海賊が勝つか、Metaが負けるか。
「彼らの財布を取るのがフェアユースだと思って撃ったんだ。これがプロトコルのやり方だよ。」こんなことを弁護として言うために、裁判官にいくら賄賂を渡さなきゃいけないんだ?
みんな明らかな偽善を指摘してるけど、メタがこの主張を成功させたらもっと面白いと思う。じゃあ、好きな本を盗んで誰にでもシェアしていいの?音楽や映画、テレビ番組、ゲームにも同じことが当てはまるのかな?