ハクソク

世界を動かす技術を、日本語で。

インフルエンティストたち: 証拠のないAIの誇大広告

概要

  • Jaana Dogan (Rakyll) のツイートが開発者コミュニティで大きな話題に
  • Claude Code により、従来チームで数ヶ月かけて構築したものが1時間で生成されたという主張
  • 実際はRakyllの専門知識と事前の設計が大きく影響
  • 誇張された「魔法のようなAI」デモが業界全体で増加傾向
  • 技術コミュニティには再現性と実証重視の姿勢が必要

Rakyllのツイートが示したAI開発の現状

  • 2026年1月2日、Jaana Dogan (Rakyll) がAIによる分散エージェントオーケストレーターの自動生成体験をツイート
  • 問題の説明だけで、Claude Codeが1時間でプロトタイプを生成したという内容
  • 多くの開発者が「ソフトウェア開発の終焉」や「エンジニア不要論」など、過剰な悲観論をSNSで展開
  • 直後、Rakyll本人がスレッドで補足説明を投稿
    • 実際は過去に自分たちで設計・構築した複数案の知見をAIに与えた上での結果
    • 生成されたものはあくまでプロトタイプであり、実運用可能な製品レベルには程遠い
    • 成功の鍵はRakyll自身の専門性と暗黙知によるガイド
  • 「AIがすべて自動生成した」ような印象操作が行われていた点に注意

Influentist現象と誇張されたAIデモ

  • 「ハイプ優先、後から文脈説明」というパターンが業界トレンド
  • こうした現象に加担する人々を「Influentist」と定義
    • 科学・技術コミュニティの中で、大規模フォロワーを活用し、根拠の薄い主張を拡散
  • Influentistの特徴
    • 「trust-me-bro」文化:個人的体験を普遍的真実として語る
    • 再現性の欠如:コードやデータ、手法を公開しない
    • 戦略的曖昧さ:曖昧な表現で批判を受けた際に軌道修正できる余地を残す
  • Andrej KarpathyやGalen Hunt (Microsoft)、AnthropicやOpenAIのエンジニアにも同様の傾向
    • 例:MicrosoftのC/C++コードをAIでRustに書き換えるという非現実的な目標発言
    • AGI達成をほのめかすが、後で「研究プロジェクト」や「誤解だった」と釈明

ハイプによる影響とコミュニティへの提言

  • 大手研究所のリーダーが誇張投稿を繰り返すことで、技術的期待値の負債が蓄積
  • 初学者や若手エンジニアが「自分には無理」と感じる心理的障壁
  • 実際は「魔法のようなAI」ではなく、専門家の知見とプロトタイプに過ぎないケースが大半
  • 証拠や再現性よりも「雰囲気」や「バズ」に依存した権威付けをやめる必要性
  • 真に革新的なツールや手法は、再現可能な実績で評価されるべき
  • 技術コミュニティは、「trust-me-bro」文化から脱却し、実証と検証を重視すべき

Hackerたちの意見

同意だね。もしそのメリットがそんなに大きいなら、もっと明確な証拠が必要だよね(「信じて、使ってみて」じゃなくて)。とはいえ、俺はAntigravityを使って自己ホストのソフトウェアで大成功を収めてる。これを公開すべきだと思ってるけど、なんでまだやってないんだろう? * ソフトウェアが俺の要件にかなり特化してるから。 * Antigravityが大部分の作業をやってくれたから、なんか申し訳なくて。 * プロジェクトを持ちたくないけど、それが公開リポジトリに進むのを妨げる理由にはならないよね。 * 自分をさらけ出すのがちょっとためらわれる? それでも、俺がその人じゃないにしても、もっと証拠が出てこないのが意外だね。
「* ソフトウェアが俺の要件にかなり特化してる。」ってのが、俺にとっては一番のポイントだと思う。俺は休暇中にAntigravityを使って、自分用に何かを作ったんだけど、それが俺のユースケースを解決してくれた。これが他の人にも役立つか考えて、ホスティングできるバージョンに少し進めてみたけど、あんまり意味がないかも。熱橋のための計算集約的な数値ソルバーで、無料ホスティングプラットフォームではすごく遅いから。でも、このプロジェクトは数晩でできたもので、そうでなければ完成までに半年かかってたと思う(だから、そもそもやってなかったかも)。 https://github.com/schoenenbach/thermal-bridge https://thermal-bridge.streamlit.app/
> アンチグラビティが膨大な作業をしたので、自分がやったことが無価値に感じる。 これ、僕にも当てはまると思う。僕は小さなプロジェクトを二つやってて、一つは自分が書いたコードとAIを混ぜたもの。これにはかなりの時間をかけてAIをガイドしたり、出力を整理したりしたから、他の人が学べる価値があると思って投稿したんだ。でも、ほぼ100%雰囲気でコーディングしたものもある。これらは公開可能にするために整理したりドキュメントを書いたりするのにすごく時間がかかるし、なんか「無価値」な感じがするんだよね。役に立つと思うけど、オープンソースのバージョンを探してたんだ。でも、数回のプロンプトで雰囲気コーディングできたものが、どれだけ価値があるのか疑問だよね。次に探してる人も、たぶん僕と同じように数分で自分のバージョンを雰囲気コーディングするだろうし。
AIに置いていかれる不安が、これらのツイートが大げさだと気づいてから一気に減った。俺は毎日AIを使ってるけど、みんなどうやってそんなにすごい結果を出してるの? 実際は、彼らは誇張してるだけだった。いくつかの実際の話を掘り下げてみたよ: 「俺の実店舗ビジネスはAIなしでは存在しなかった」→ 地元の弁護士を探すのにClaudeを使ったり、必要な許可をまとめたりしただけ。 「今は10人のプロダクトマネージャーの仕事をしてる」→ 実際にはドラフトのPRDを作ってるだけ。10人のPMを解雇したとは言ってないし。 「今週末に全製品ラインを立ち上げた」→ サインアップ用のウェブサイトを作っただけで、表示されるのは単一のJavaScriptページ、顧客はいない。 「今朝コーヒーを淹れながら小説を書いた」→ ChatGPTエージェントを使って、雑な中途半端なPDFを作っただけ。
Xでバイラルになるのが、今の{デイトレ、アマゾンFBA、クリプト}のコース販売の代わりになってる。ツイートの内容自体が重要じゃなくて、バルポスティングやカニンガムの法則を引き合いに出すことが重要なんだ。Xはフォーミュラ投稿の行き先で、青いチェックマークの中には「リーチ」や収益シェアのキックバックを得てる人もいる。
フォロワーを増やしたいとき、人はとんでもないことを言うよね。
「AIを使って超利益の出る株取引ボットを作った」———歴史データを使った偽のお金で。「AIを使って午後のうちにNESエミュレーターを作った!」———何百回もやられて、GitHubにたくさんの参考が載ってるプロジェクトだよね。
「AIを使ってGPU専用のMoEのフォワードとバックワードパスを書いて、特定のGPUしかサポートしていないPyTorchの手動実装を補完した」 -> https://github.com/lostmsu/grouped_mm_bf16 100% vibe coded.
> 「今朝コーヒーを淹れながら小説を書いた」→ チャットGPTエージェントを使って、雑な中途半端なPDFを作った。数年前、アマゾンで何百もの小説を作った人の話があったけど、合計でそこそこ稼いでたみたい。今は誰かがChatGPTを使って同じことをしてるのかな。
実際に誰かがプロンプトと生成された出力を投稿する稀なケースでは、ログやコードを読み込んでるよ。技術に対して過度にシニカルになってるなら、知りたい。最後に見たのは「[LLM]を使って高度なデジタルフォレンジックをやった!」って大絶賛されてたやつ。いや、LLMは君が与えたキーワードを一つ探して、jsonに何度も入れようとしてから捨てて、代わりにマークダウンを生成しただけだよ。結果が悪いって言ったら、二つ目の単語を探して同じプロセスを繰り返した。jsonファイルやbashスクリプトが飛び交ってるのは見栄えがいいけど、実際にやったのは単語のgrepをブログ投稿のマークダウンに変えただけで、結局手伝わなきゃいけなかった。君たちの中には、企業向けソフトウェアの営業コールに参加したことがない人もいるみたいで、それがよく分かる。
結局、最初のプロンプトで70%まで進んでも、あまり得られないってことだよね(たぶんそれについては結構時間をかけて議論したり、考えたり、要件を明確にしたりしただろうし)。有料で納品可能な仕事は、検証、責任、セキュリティ、信頼性などが求められる。70%の解決策を取って、これらの要素を追加するのは、人間が70%まで導いてくれた場合よりも難しい。なぜなら、LLMが犯す間違いは正しく見えるように設計されているけど、実際には常識的な人間が絶対にしないような間違いを犯すから。そのせいで、彼らの間違いは見逃しやすくなっていて、報酬を得るために人々がいる領域では、より慎重に行を確認する必要がある。さらに、コードを重複させたり、すごく冗長になったりするから、技術的負債がたくさん生まれて、将来のエージェントのコンテキストを詰まらせるトークンが増える。使うのは好きだけど、正しく使えば本当に価値があると思う。でも、リスクや技術的負債を考えると、今後数年でこの価値が大きなビジネス価値に変わるとは懐疑的だね。
最近のRedditは最悪だね。技術的な話題にはほとんど行かなかったけど、面白いミームとかは見てた。でも最近、クレイジーなAIのハイプストーリーが投稿されるのを見始めて、悲しいことに一度クリックしちゃったら、もうそればっかり。r/agiやr/singularityみたいなサブからの無限の投稿、ClaudeやOpenAIのような特定の製品に関するサブも。これらは外部の記事へのリンクじゃなくて、最新のモデルやツールのすごさに驚いた人の個人的なアカウントなんだ。どの投稿も「ソフトウェアエンジニアにはもう終わりだ」みたいなイライラするハイプの祭りになってて、時にはAI生成のテキストや誇張された主張を指摘するコメントもあるけど、たいていは無視されちゃう。ハイプされてるものの欠点を指摘すると、「その欠点は昔は本当だったかもしれないけど、最新のバージョンにはそんな欠点はない、マジで奇跡的だ」って感じで流されることが多い。いつも同じパターンだし、明らかにアストロターフィングが行われてるよ。
ドットコムバブル崩壊の時の好きな話の一つは、崩壊後に人々が「Pets.comを見てみろ。誰がネットで40ポンドのドッグフードを買うんだ?どんなビジネスがそんなことをするんだ?経済的に全く意味がない!だから潰れたんだろう」って言ってたこと。だけど、今は20年後に、家具をネットで注文して「無料」で届けられる時代になった。要するに、AIに関するハイプは確かに多いけど、実際に役立つプロジェクトもあるってことだよ。
エージェントコーディングの影響について証拠を示さない理由は大きく分けて2つある。1) プロンプトやパイプラインが独自の知的財産に関わっていて、公開できるかどうかわからない。2) プロンプトやパイプラインがつまらないか恥ずかしいもので、それを見せるとエージェントコーディングが神秘的なプロセスだという神話が崩れるから。例えば、#2のケースでは、最近透明性のためにターミナルMIDIミキサーを作るのに使ったプロンプトを公開したけど(https://github.com/minimaxir/miditui/blob/main/agent_notes/P...)、そのプロンプトはMIDIミキシングがどう機能するかほとんど理解していないことを示していて、振り返るとそれで嫌がらせを受けなかったのが意外だった。こういう状況では、今後どれくらいプロンプトをオープンソースにするかは不透明だね。
君がそれで嫌がらせを受けなかったのは、(1) それが面白かったから、(2) AIの関与を隠さずに自分のものとして扱わなかったからだよ。結果は(俺にとっては)かなり当たり外れがあって、まだ信頼できるツールとは思ってない。時には本当に効果があるけど、時間を無駄にする可能性も高い。君のような例が、実際にそのツールを他の選択肢の中で正しく位置づけるのに役立つんだ。
いや、主な理由は2つあって、1) AIが生成するコードには問題が多くて、それを見せると人に笑われるか、2) 実際にそのコードをサービスとして運用すると、すぐに人にハッキングされて、コードに問題があることを証明されるから。
それか、成功を胸に秘めておくのが俺の競争優位なんだよね。
最後の段落、もうちょっと詳しく説明してもらえる?「論争のある気候」って何を指してるのか分からないんだけど。AIのアンチハイプ? 何かを共有することで嫌がらせを受けないって、むしろいいことじゃないの?それが将来プロンプトを共有するかどうかの不安に繋がるの?
ゲーム内のコスメアイテムを得るための報酬ポイントを稼ぐために。
> プロンプトやパイプラインは退屈で恥ずかしいもので、これを見せるとエージェントコーディングが神秘的なプロセスだという神話が崩れる。 その通りだね。プロンプトを考えるのは単調で明白だよ。リクエストを作成するためには基本的なスキルが必要だけど、科学でもエンジニアリングとも関係ない。
ChatGPTみたいな消費者向け製品が存在するってことは、LLMは人間レベルの仕事ができないってことじゃない?もしOpenAIが本当に10万人のプログラマーや科学者、ライター、弁護士、医者などの能力を持つデジタル労働力を持ってたら、その「労働者」を直接利用するのが一番利益が出る方法じゃないの?スキルをバラバラに借りるんじゃなくて。
それは本当の価値が何かによるよね。金鉱掘りにピッケルを売って金持ちになるのが確実な方法。でも、もし本当に金がどこにあるのかを見つけて、その正確な場所で掘れば、もっと金持ちになれるよね。もちろん、詐欺を売って金持ちになることもできるけど。
もしこの技術が本当に機能するなら、Microsoftが大きなシェアを持ってることを考えると、Microsoftの製品は良くなるべきじゃない?少なくとも、良くなっていくべきだよね。僕はほぼ毎日Bingを使ってるけど、いつも絶対にジョークみたいなもんだよ。
LLMは人間レベルの仕事ができるよね。今やそれは疑いようがないと思う。全ての人間レベルの仕事ができるわけじゃないけど、全ての人間が全ての人間レベルの仕事をできるわけでもないし、多くの批判はそれを全ての仕事と比べている。LLMは部屋の中で一番賢い存在でありながら、一番バカな存在でもあるという驚くべき能力を持ってる。収益性の点では、そうとも言えるし、そうでもないとも言えるかな。ChatGPTはAIレース(または初期のAIレース)で最も影響力のあるものとして記録されるだろう。なぜなら、一般の人々にとって可能性のアートを最も直接的に示したから。技術者たちは私を訂正したり、そうじゃない理由を議論するかもしれないけど、彼らは間違ってると思う。なぜなら、ChatGPTは消費者の注意を引き、その結果、財政的な注目を集めたから。以降の出来事はそれに起因している。純粋なマーケティングか未来予測かは別として、金の世界はそれに乗っかっていて、最終的にはこれが最悪の状態だと見なされている。最終的な利益目標は、間違いなく人間の労働を置き換えること(コストを抑えて)だけど、それが不可能なら、可能だと信じているなら、その目標を達成できると信じてもらうこともかなりの利益になるし、実際にそうなっている人もいるし、そのおかげで彼らは最終目標を追求するための余裕を得ている。
これは不思議な現象で、他の誰かが何かに興奮しているという事実だけで人々が興奮するってことなんだよね。観客には直接見えないものだけど、ホラー映画とかAIのハイプにはうまく働くみたい。
俺はこれを(心の中で)「おべっかの時代」って呼ぶことにした。政治、企業、技術、ソーシャルメディアの中で、多くの人が他の人が聞きたいことを言うことで公の生活を築いていて、真実や信頼性とは全く関係がないんだよね。
確かに、面白い人類学的なケーススタディになるね。人間は常に自分の社会的なサークルの外にいる人たちに対してパフォーマンスをする生き物だから。政治は実質的にパフォーマンスの技術で、それを使って影響力や権力を得るものだし。昔のメディアでは一般の人々は受け身だったけど、今のテクノロジーやSNSのおかげで、誰でもオーディエンスを作る能力を持つようになった。だから、今やパフォーマンス行動がどこにでもあふれてる。みんな自分の声を聞いてもらいたくて、崇拝や名声、権力、富を求めて競い合ってるんだ。デジタルの世界でこれが行われているのは変な状態で、イメージを作るのが簡単になったけど、それが現実世界に何らかの影響を与えてしまう。私たちのリーダーはこのゲームが得意なセレブたちで、必ずしもその地位にふさわしい人たちではないと思う。正直、これを変えるのは難しいんじゃないかって思ってる。良くなる前にもっと悪化するだろうし、良くならないかもしれない。
大企業の中で尊敬されることは、SNSでのエンゲージメントとはあまり関係ないよ。ほとんどの優秀なエンジニアは黙々と働いてるし、ネットでのシットポスティングはGoogleの中での技術力と逆相関があるかもしれない。Appleが従業員が会社の一員として無許可で発言することに対して厳しいアプローチを取っているのは、正しいと思うことがある。
LLMはすごいよね。自分の人生のうちにシンギュラリティが起こるかもって真剣に考えちゃうけど、今の能力を過剰に持ち上げてる人もいるよね。もし今のモデルが完全に人間レベルのAGIで、チューリングテストもクリアしてたら、経済やソフトウェアエコシステムに与える影響は、彗星の衝突みたいにすぐにわかるはずだと思う。RakyllやAndrejがそんなことを主張してるわけじゃないと思うけど、彼らは読者がもっとコンテキストを共有してる前提で話してるんじゃないかな。AIが予想以上に進化してることに驚いてる投稿をするたびに、毎回その話を繰り返す必要はないって感じなんだろうね。彼らのような人たちの投稿を読んで、うんうんって頷いてから、その同じ投稿を引用して「AGIが今ここにある!」って興奮してるツイートを読むと、なんか違和感を感じることが多いよ。
誰か、どうしてこんなに短い時間でDSLを作れたのか教えてくれない? https://github.com/williamcotton/webpipe https://github.com/williamcotton/webpipe-lsp フル機能のLSP(リポジトリのGIFを見てみて)、ステップデバッガー、言語とランタイム自体に組み込まれたBDDテストフレームワーク(新しい!)、パイプライン内の非同期/結合(新しい!)、Postgres、jq、JavaScript、Lua、GraphQL(データローダー付き)用のミドルウェアなど、かなりのことができる。これを作るのにどれくらいの時間がかかったかは、私のGitHubのタイムラインを見ればわかるよ。これは100%言語とフレームワークデザインの実験なんだ。じゃなきゃ、実現した時に自分の突飛なアイデアがどうなるかを見たいだけで、何年も手作りするわけないじゃん。言語そのものについて話したいけど、こういう状況だからね。自分のDSLでブログも書いたし、これがただの楽しいことじゃないって言わせて。
> じゃなきゃ、実現した時に自分の突飛なアイデアがどうなるかを見たいだけで、何年も手作りするわけないじゃん。もしそれが本当にあなたが望んでいたことなら、もっと道と目的のプロジェクトだったら、プログラミング言語のデザインや実装について深い洞察を得られたかもしれないよ。効率的なルートでは得られないような。
いろんな競争するプロパガンダの戦いがあるよね。1) 人々や企業が、自分たちのAIプロジェクトを買わせるために、AIを持ち上げたりしてお金を稼ごうとしてる。2) 競合や他国のAI努力を潰そうとしている企業や国家があって、国民をその方向に向けさせて、レースでの優位性を得ようとしている。3) 逆に、他国に勝つために自国のAI産業を盛り上げようとしている国家もある(AGIのような「勝利」があると仮定して)。4) 一般市民がイデオロギーに洗脳されて、オンラインで自分の信念や「側」を主張する文化戦争を繰り広げている。5) クリックやお金を得るために、AIに関するクレイジーな意見を投稿する人たちもいる。全体的にこの話題は深刻なプロパガンダであふれてる。進むべき唯一の道は、自分が確実に知っていることを信じることだと思う。