ハクソク

世界を動かす技術を、日本語で。

二人の頭は一つより優れているか?

概要

  • 複数の嘘つき友人がコイントスの結果を伝えても、偶数人数では正解率が向上しない現象の解説
  • Aliceひとりでは正解率80%、Bobが加わっても変化なし
  • 奇数人数(Charlie追加)で正解率向上、偶数人数(David追加)で再び頭打ち
  • Condorcetの陪審定理との関連性
  • 投票理論や確率、シミュレーションの面白さを紹介

三人寄れば文殊の知恵?嘘つき友人とコイントス

  • ゲーム設定:Bobがコインを投げ、Aliceが結果を見てあなたに伝える
  • Aliceの嘘率:20%、つまり8割は真実を伝える
  • Aliceだけを信頼:Aliceの発言をそのまま信じる戦略で、正解率は常に80%
  • Bob追加:Bobも独立して20%の確率で嘘をつき、Aliceと同じく情報提供
  • 最適戦略:AliceとBobの発言パターンごとに最も確率の高い結果を選ぶ
    • 両者一致時は高確率で正解
    • 不一致時はどちらも同じ信頼度なので、ランダムと同じ
  • シミュレーション結果:Aliceのみでも、Alice+Bobでも正解率は80%で変化なし

シミュレーションと数式で理解

  • ケース分け(コイン表の場合)
    • 両者真実(64%):常に正解
    • 両者嘘(4%):常に不正解
    • 片方だけ嘘(16%ずつ):ランダムなので正解率50%
  • 合計正解率:64% + 8% + 8% = 80%
  • 直感的理由:一致時の高信頼度と、不一致時の無力さが打ち消し合う現象

Charlie(3人目)が加わると…

  • Charlieも嘘率20%で参加
  • パターン増加:3人のうち2人以上が同じ結果を言えば、その多数派を信じる
  • 正解率向上:シミュレーションで正解率90%に上昇
  • 理由:不一致時でも多数決が可能になり、情報量が増える

David(4人目)登場で再び頭打ち

  • 4人になると:2対2の引き分けが発生
  • 引き分け時:結局ランダムでしか判断できない
  • 正解率:Charlieまでと同じく90%で頭打ち
  • 以降も同様:奇数人数で正解率向上、偶数人数で頭打ち現象

この現象の名前は?

  • Condorcetの陪審定理:投票者が独立して正しい判断をする確率が50%超なら、人数が増えるほど正解率は100%に近づく(ただし多数決時のみ)
  • 偶数人数問題:理論上も証明の際にこの“引き分け”ケースは回避されている
  • 投票理論との関連:投票や意思決定の限界を示す好例

まとめと感想

  • 偶数人数の限界:複数人の独立した証言も、偶数人数では“引き分け”が生じ、正解率は向上しない
  • 奇数人数の効果:多数決が可能になり、正解率が大きくアップ
  • 投票・確率論の面白さ:日常の意思決定や投票に潜む意外な数学的現象
  • シミュレーションの重要性:直感に反する結果も、実際に計算・プログラムで確かめることの大切さ
  • The Recurse Centerや数学好きへのおすすめ情報

Hackerたちの意見

ボブは具体的な情報を提供してくれないよね。アリスとボブが同意していれば、前より自信がつくけど、結局アリスを信じることになる。もし意見が食い違ったら、自信は50%に下がるけど、それでもアリスを信じるのがいいかも。
50%よりも信頼できるよ。彼らは20%の確率で嘘をつくから、意見が食い違っても、まだ64%の確率で表が出るんだ(0.8 x 0.8)。
一旦止まって、確率を全部書き出してみたけど、80%以上に改善する方法が見つからなかった。間違ってることを証明してほしくてスクロールしたよ!
(私が作者です)「ねえ、これ面白い問題なんだけど、答えは何?」って言うことで、実際に答えを得る可能性が高くなっちゃったのがちょっと面倒だなと思ってる!本当にやりたかったのは、関連する問題のシミュレーションを書く経験を伝えることだったんだ。結果を観察して、コードにバグがあると思い込んで、計算したときに喜ぶっていうね。でも残念ながら、その経験をインターネット越しに伝える方法がわからないんだ :( (はっきり言うと、確率を書き出して正解したのは本当に嬉しいよ!ただ、このブログを書いたときに考えてたことを表現したかっただけなんだ)
その予想をどう使うかによるね。もし正しいか間違ってるかの頻度だけの問題なら、二人目はあまり役に立たない。でも、例えばその予想に賭けるなら、二人目がいることで勝つ確率がかなり上がるよ。彼らが同意したときは、反対のときよりも高い賭けができるからね。
この投稿は、最後の方でまさにその点について話してるよ。
こんな感じで想像したんだ:F T(アリス)F xx ???????? xx ???????? T ?? vvvvvvvv ?? vvvvvvvv ^ ?? vvvvvvvv B ?? vvvvvvvv o ?? vvvvvvvv b ?? vvvvvvvv v ?? vvvvvvvv ?? vvvvvvvv (ここで「F」は指定された人が嘘をつくケースを、「T」はその人が真実を言うケースを表してる)チェックマーク(v)の領域では、どちらも真実を言ってるから正しい答えが得られるし、同意したらもちろん彼らを信じるよね。同様に、xの領域ではどちらにしても間違った答えになる。?の領域では、戦略に関係なくコインを投げるのと同じくらいの確率になる。アリスを無条件に信じるなら、右側で勝てるけど、左側では負ける。ボブが言うことは関係ない。ボブを無条件に信じる場合も状況は対称的だよ(もちろんそうだよね;二人とも同じルールで、同じ情報に基づいて行動してるから)。他の戦略を選んでも、アリスとボブが意見を異にするから、どちらかを選ぶ理由がない限り、50-50の確率になる。確率空間のどの領域でも戦略によって確率が変わらないから、全体としても変わらないんだ。
投票ではパリティが重要だよ。場合によっては、効果が面白いこともある。例えば、マフィアや人狼ゲームでは、市民や村人を追加すると勝率が√(π/2)だけ下がることがある。詳しくは https://arxiv.org/abs/1009.1031 を見てね。群衆の知恵については、https://egtheory.wordpress.com/2014/01/30/two-heads-are-bett... を参照して。
アリスが100%真実を言うと仮定して、ボブは20%のままだとしよう。ボブの貢献はノイズに過ぎないって直感的にわかりやすいよね。アリスの正確さを99%に下げても、やっぱりアリスを信じないならボブを信じるのも変わらない。面白いことに、これは彼らが独立していることの特徴でもある。もしボブがアリスが嘘をついたときに20%の確率で真実を言うか、ボブがアリスの返答を20%の確率でコピーして、あとは真実を言うなら、数学は変わってくるよ。
昔の船乗りたちにも似たような格言があったんだ。「二つの時計を持って海に出るな。一つか三つ持て。」彼らは正確な時計を使って経度を計算してたんだよね。
でも連続の場合は違うと思う。二つの(かなり正確な)時計を平均すれば、より良い測定ができるからね。でも、真実と偽を平均することはできない、少なくともこの問題の定義の文脈ではね。ただ、時計は別々に保管しなければ同期するから、相関のあるノイズが生じて、平均では解決できないんだ。
今の僕は船乗りだけど、これと同じルールでボートにはデジタルマルチメーターを3つ持ってるよ。
ポイントをはっきりさせるために言うと、時計の誤差率が1%なら、二つを平均すると2%の誤差率になるんだ。
一つよりも三つの方が絶対いいよ…一つを踏んじゃって壊しちゃうかもしれないし。
船乗りには、いろいろと有害な言い回しがあるよね。実際、経度を測れなくても航海はできるんだ。例えば、島を探してるなら、まず正しい緯度に向かって、その緯度に沿って航海すれば島にたどり着ける。ルートは明らかに長くなるけど、もし時計が合わなかったら、そうするべきなんだ。
ちゃんとした航海士なら、いろんな理由で、むしろ少ないより多い時計を持っていたいと思うはず。これは明らかに、陸にいる人の言い回しから来てるんだろうね…
順列を取り除いて、組み合わせと表と裏の対称性だけを表示する方が簡単だと思う。分析的に解決するのもいいね。例えば、pがNPCが正しい確率だとしたら、P(A|AAAA) = p^4、P(A|BBBB) = (1-p)^4。とにかく、引き分けのケースの奇妙さは、二項PMFがn(参加者の数)とn-kに関して対称であることから来てる。PMF = (n choose k) * p^k * (1-p)^(n-k)。だからk = n/2の時、対称性のおかげでpと1-pの下での可能性は同じになるから、情報は得られないんだ。これ、すごくいい例だね。面白い投稿!(追記:フォーマットが下手くそみたい)
3人以上の観察者による三角測量効果は面白いけど、もっと奇妙な拡張があるかも。「第三の観察者」が別の人ではなく、二人の間の関係の一貫性だったらどうなる?三つの独立した信号の代わりに、アリスとボブが普段どうやってやり取りしているかを考慮して、彼らの合意/不合意のパターンが何かを教えてくれるのかを評価するんだ。(例えば、彼らが常に反対意見を持つ人なら、合意が信号で、不合意はそうじゃない。)さらに進めて、人間とLLMのコラボレーションを測定して、会話のダイナミクス—トーンの変化、生産的な対立と循環的な対立、何がスルーされるか、矛盾がどう扱われるかを測るんだ。コラボレーションのプロセス自体の質があなたの真実の信号になる。もう独立した観察を集めているだけじゃなくて、相互作用の基盤を読み取ってるんだ。会話の構造が診断ツールになる。
この原則は、冗長センサーを使う安全-criticalなシステムにもすごく関係があるよ。単にセンサーをもう一つ追加するだけじゃ、しばしば不十分なんだ。だって、もし二つのセンサーが意見が食い違ったら、どっちを信じるの? 飛行機の例がこれに当たるね。
経験が足りなくてこれには困ってるんだけど、もし二つの当事者の間に合意がなければ、どちらも信じずにもう一度聞くのが妥当だと思う。ここでのスプリットブレインシナリオでは、なんでそうならないの? 即決しなきゃいけないの?