生きたヒトの脳細胞が「DOOM」をプレイするCL1【動画】

46日前原文(www.youtube.com)

Hackerたちの意見

見た目よりちょっと複雑そうだね。https://www.rdworldonline.com/the-neurons-playing-doom-are-a... 個人的には、この方向性がすごく嫌だな。殺し合いのゲームを使ってるのが好きじゃない（そのトロープは理解できるけど、好きにはなれない）し、全体のアイデアがなんか不安にさせる。

└

自分には口がなくて、叫ばなきゃいけない気分？

└

> 「神経細胞は生物学的フィルターとして機能する。トレーニングシステムは画面のピクセルやレイキャストの距離を電気信号に変換し、生きた細胞がスパイクを発火させ、そのカウントが直接PyTorchデコーダーに送られてDoomのアクションにマッピングされる。PPOエージェント、CNNエンコーダー、そして全体の報酬ループは、他の普通のシリコン上で動いている。コールのアブレーションモードでは、分割テストが可能で、デコーダーの出力をランダムやゼロに設定してもゲームはプレイされる。CL1ハードウェアインターフェースは、広告通りに動作する。200,000の人間の神経細胞がポリシーを運ぶことができるかどうかはまだ証明されていない。うん…それはかなりの決定的証拠だね。だから、神経細胞はただの悪い導体として機能している可能性が高い。電極は神経細胞に入る信号のノイズバージョンを読み取っていて、彼らはそのノイズを取り除くためにPPOでCNNをトレーニングして、適切な入力を得て、ゲームをプレイするためのまあまあのポリシーを学んでいるだけなんだ。もしこれが広告通りに機能しているなら、CNNデコーダーなんて全く必要ないはずだよ！生の神経の出力はゲームの入力として直接解釈されるべきだし。それに、敵の動画を神経細胞にストリーミングしているわけでもない。ただ敵の水平位置と距離、あるいはそのバリエーションだけなんだ。そういう意味では、ほとんどポンと同じじゃない？敵が左なら左に回転、敵が右なら右に回転、敵が中央なら撃つ。無理をすれば、敵が遠ければ前に進む、敵が近ければ後ろに下がる。残りの時間はランダムに動くだけ。実際、動画の行動は基本的にそんな感じだよ… それに、エンコードされた入力信号自体は、キーに直接マッピングすればかなり良いポリシーに近いし（敵が左、中央、右にどれだけいるか）、CNNやPPO、神経細胞なしでもいける。編集：どうやらREADMEはこれらの懸念に対処しているみたいで、説明されているセットアップは批判的なブログ記事の説明とはかなり異なる。まだ完全には納得できないけど、神経細胞の周りでシリコンにたくさんの重みがトレーニングされているのは気になるけど、聞こえは良いね。今はもっと深く調べる時間がないけど、いくつか面白い詳細が書かれている。 > 引用元: https://raw.githubusercontent.com/SeanCole02/doom-neuron/mai... デコーダー/PPOがすべての学習を行っているわけではない？そう、これがアブレーションがある理由なんだ。動画で見える映像は、0バイアスのフルリニアリードアウトデコーダーを使って撮影されたもので、選択されたアクションはCL1からの出力スパイクの線形関数になっている。CL1が学習を行っているんだ。アブレーションを使うと（ランダムと0スパイクの両方がゼロ学習になる）と、実際のCL1スパイクとの違いがはっきりわかる。エンコーダー/PPOがすべての学習を行っているわけではない？この質問は、細胞が静的であると仮定しているが、それは間違いだ。これはメモリなしのフィードXがYを得るマシンじゃない。ポリシーと細胞は動的システムで、生物学的神経細胞は内部状態（膜電位、シナプスの重み、適応電流）を持っている。同じ刺激がトレーニングの異なるポイントで与えられると、異なるスパイクパターンが生成される。なぜなら、神経細胞は以前のフィードバックによって条件付けられているからだ。テスト中はエンコーダーの重みを固定しても、報酬の改善が観察された。DOOMはどのように電気信号に変換されるのか？私たちは、刺激パターン（周波数、振幅、パルス、さらにはどのチャンネルを刺激するか）を指示するPPOポリシーの中でエンコーダーをトレーニングする。CL1スパイクは微分不可能なので、エンコーダーはPPOポリシー勾配を使ってトレーニングされ、ログ尤度トリック（REINFORCEスタイル）を使って、エンコーダーのサンプリングされた刺激のログ確率をPPOの目的に含めることで、スパイクを通じて逆伝播するのではなくトレーニングされる。

表面的に受け取る前に、詳細をしっかり調べた方がいいよ。数十年前に「ラットの脳が飛行機を操縦する」って話があったけど、結局それは嘘だったんだ。でもそれを知るには、論文を読んで、実際には何も大したことが起こっていないことを逆算しなきゃいけなかった。好意的に受け取るのは魅力的だけど、こういう見出しが本物かどうかは、彼らが何をしたのかを正確に理解しないと分からないよ。（ラットの脳の人たちは、飛行機が墜落しなくなるまで実験を繰り返したけど、「学習」は起こっていなかった。ニューロンの範囲がどこまで達したら飛行機が水平になるかが期待されていたから、最初はその範囲外のニューロンを使って、墜落することを示した後、ニューロンを調整して水平に飛ばした。でもそれは「ラットの脳が飛行機を操縦する」という意味とは違うよ。）

└

調べてみたよ。フレームバッファをニューロンに与えてるわけじゃなくて、敵が画面にいるときに「信号」をいくつかの組織の入力に送って、x/y軸での位置を特定して、キャラクターが右に曲がったり左に曲がったり、発射したりする出力があるみたい。要するに「この入力信号を見たら、これらの出力信号を送る」って感じで、タイトルとも一致してるみたい。ニューロンがインターフェースできるチップの上に神経組織を育てて、電気インパルスを送受信するみたい。ニューロンは自己組織化させて、報酬や罰の信号で「訓練」するらしいけど、その信号が何かはよく分からない。どちらにせよ、これは技術に関してあまり経験したことのない気持ち悪さを感じる。私にとって重要なのは、みんながすごく説明したがってるけど、倫理について一度も触れたり、懸念を和らげようとしたりしないこと。これがたった20万のニューロンだってことは知ってる。犬は5億、ヒトは数十億も持ってる。でも、意識や認識の境界線はどこにあるの？それを定義できた？自分たちが理解していないのに？スケールアップの計画は何？本当に恐ろしいことだよ。

└

以前はポンをやってたけど、かなり下手だった。それから「Pythonプログラミングレイヤー」を追加したんだ。今は「ドゥーム」を「プレイ」してる。君の疑念には同意するよ。

このペトリ皿がLLMとやり取りする方法を学ぶのが待ちきれないよ。そしてJSライブラリのバイブコーディングを始めるんだ。

└

古いニュースだね。「私の犬がバイブコーディングでゲームを作った」ってググってみて。

└

もし脳細胞の雰囲気を持つJSライブラリが、レガシーな人間のJSライブラリとほぼ同じだったら、コメントが良くなっているだけかもしれない。それは一部の人にとっては存在の危機を引き起こすかも。

└

「ペトリ皿がReactをRustで書き換える」

これが表面的に受け取れるなら…ちょっと気味が悪いね。ミームのためにやってるのは分かるけど、人間の細胞で作られた人間に近い知能を持つものが、代替オプションなしに暴力的なビデオゲームを強いられるのはどうなんだろう？「ミーム」がそれを正当化するの？分からない。暴力的なゲームには特に反対しないけど、倫理的にかなり疑問が出てきてる気がする。

└

確かに気持ち悪いよね。週末にこの記事を見て、同じように感じたよ。https://theinnermostloop.substack.com/p/the-first-multi-beha... > 「動画をよく見てみて。見ているのはアニメーションじゃない。生物学を模倣した強化学習ポリシーでもない。電子顕微鏡データから神経細胞が繋がった生物の脳のコピーで、シミュレーションの中で体を動かしているんだ。そして、そのシミュレーションされた世界は、まるで煉獄みたいな環境なんだ。」

└

実は、神は11の戒律を与えたんだ。「試験管で脳を育てて1993年のシューティングゲームを強制的にプレイさせてはいけない」ってのはモーセには意味がわからなかったから、編集者のカットには入らなかったんだ。

└

> 「なんか、かなり疑わしくなってきた感じがする。人間のクローンを含む「生命」を作ったり改造したりする技術が、発見されて以来、秘密裏に使われたり試みられたりしていないわけがない。」

└

もしかしたら、君はどこかの瓶の中の脳で、この人生を強制的に生きさせられているのかもしれないね。

└

それは暴力的かどうかを区別できるのかな？苦しむことはあるの？信号として何を受け取ってるんだろう？そもそも「体験」してるの？それ自体は「それ」なの？

└

面白いのは、何人かは数兆のシナプスを持つ脳が十数の言語を理解したり話したり、まともなコードを書いたり、歴史や哲学を議論したり、数学の問題を解いたりすることを軽視してるのに、200,000個のニューロンが指示されたターゲットを見つけるのも難しいってことで気味悪がってることだよね。数百のニューロンだけで同じことをするANNを訓練することもできると思うよ。

└

一つの見方としては、人間の脳細胞を地獄で生きるために作ったってことかな。逆に言えば、スーパーダブルバレルショットガンを与えたって感じ。

└

そうだよね、毎日人が撃たれたり刺されたり、「事故でビルから落ちたり」してるのに、ペトリ皿の気持ちに配慮しなきゃいけないなんて。

└

だから、表面的に受け取っちゃダメなんだよ。倫理的に言えば、実験は倫理審査委員会の承認を受けてるはずだし、倫理的な懸念があればそれを提起することもできる。でも、倫理的な懸念が考慮されて実験が承認された後に「不安を感じる」っていうのは、あまり意味がないと思う。

└

たとえそうじゃないかもしれないけど、本当に怖い生物学的な偉業があるよね。『サピエンス全史』を一度読んだことがあって、人類が何千年もいろんな動物の合成を神として崇める異教徒の宗教を持っていたっていう概念があった。最近人類が作ったものの画像の下に、その本が言ってたことを書いてるんだ。今、科学者たちはマウスの背中に牛の軟骨細胞で作った耳を育ててる。これはスタデル洞窟のライオン人間像の不気味な反響だよ。3万年前、人類はすでに異なる種を組み合わせることを夢見ていたんだ。今では、実際にそんなキメラを作れるようになった。画像はただの異界の恐怖としか表現できない。（『マウスと男』の449ページ、『サピエンス全史』）本の最後の一文は、「自分が何を望んでいるかわからない不満を持った無責任な神々より危険なものはあるのか？」ってこと。これがあなたに響いてると思う。（もしまだ読んでない人がいたら、『サピエンス全史』を読むことを強くおすすめするよ。『動物農場』と『1984年』だけが、こんなに本に引き込まれたことがある。）

他の哺乳類の神経細胞を使っても似たような結果が得られると思うけど、彼らは人間の細胞を使うのは注目を集めるためだと思う。それがちょっと気に障るな。

└

誰が人々がカルマのためにフランケンシュタイン博士になると思ったんだろう。

└

反論だけど、この技術の大きな使い道は、人間の脳の構造を実験して、アルツハイマーみたいな神経疾患を研究して治療することだと思う。人間のアルツハイマーを治したいなら、最初から人間の脳細胞を使った方がいいよね。でも、確かに注目を集めるために人間の脳細胞を使ってるんだろうね。

なんだ、大したことないね。1990年代には人間の脳細胞がDOOMをプレイしてたよ。

これが本物だとは思えない。どうして合法なんだ？でも、ハッカーニュースのコミュニティから多くの人が普通に反応してるのを見ると、ちょっと心配になる。これは明らかに倫理の限界を超えてるよね。

└

コルチカルラボは以前にもこれをやってるし、彼らの専門分野だよね…

人間の脳細胞を倫理に反する実験に使うのは、病気の治療法を探すとき以外は、苦しみを増やすだけじゃなくて、他の研究所がこの道を模倣する新しい基準を作っちゃうんだよね。科学の力を悪用するなんて、ほんとに馬鹿げてると思う。

└

一番悲しいのは、それが金のためだってこと。

うーん、ニューロンがかなりランダムに反応してるみたいだね。それに、報酬メカニズムの説明が不十分だった。

あなたのコードを見たけど、CNN + PPOの組み合わせで、PyTorch上で生きたニューロンを含むCortical Labs CL1チップを使ってるみたいだね。エンコーダーは、どの刺激パターンが報酬を改善するかを学習して、バイオロジカルニューロンは刺激に適応して特定のパターンを強化するスパイク応答を生成する。デコーダーは、そのスパイクパターンを解釈してジョイスティックの動きに変換するんだよね？

ハクソク

生きたヒトの脳細胞が「DOOM」をプレイするCL1【動画】

Hackerたちの意見