世界を動かす技術を、日本語で。

AlphaEvolve: ジェミニ搭載のコーディングエージェントが各分野での影響を拡大

概要

AlphaEvolve は、Gemini搭載の高度なアルゴリズム設計エージェントとして、科学・産業・インフラ分野で革新的な進展を実現。 社会貢献やサステナビリティ、基礎研究、AIインフラ最適化、商用応用など、多岐にわたる成果を達成。 Google のDNA解析や電力網、地球科学分野での実用例が多数。 数学・物理学 の最先端研究や大規模AIモデルの最適化にも貢献。 今後もさらに多様な課題への適用と進化が期待される。

AlphaEvolveの一年間の進化とインパクト

  • AlphaEvolve は、Geminiを基盤とした高度なコーディングエージェント

    • 数学・計算機科学の未解決問題への新発見支援
    • Googleインフラの重要部分でのアルゴリズム最適化実績
  • アルゴリズムの適用範囲 の拡大

    • 物理現象の説明、電力網・計算インフラの最適化
    • 科学・ビジネス分野での進歩加速

社会貢献とサステナビリティ推進

  • ゲノミクス分野 での活用

    • DeepConsensusモデルのDNA配列エラー補正をAlphaEvolveで最適化
    • バリアント検出エラー30%削減、PacBioでの精度向上・コスト削減
    • 「これまで見つからなかった病因変異の発見に貢献」— PacBio Aaron Wenger氏
  • 電力網最適化

    • AC Optimal Power Flow問題に適用
    • Graph Neural Networkモデルの解探索率14%→88%以上に向上
    • 高コストな後処理の大幅削減
  • 地球科学分野

    • 複雑な地理空間データの自動最適化
    • 20種類の自然災害リスク予測精度を5%向上

研究最前線の加速

  • 量子物理学

    • Google Willow量子プロセッサでの分子シミュレーション最適化
    • 量子回路のエラー率を従来比10分の1に低減
    • 量子計算の実験的デモに即時貢献、古典計算超えの可能性を示唆
  • 数学分野

    • Terence Taoら著名数学者と協働、Erdős問題の解決支援
    • 「最適化問題の直感的理解・厳密証明の容易化」— Terence Tao氏
    • Traveling Salesman ProblemやRamsey Numbersなどで記録更新
  • 公開ギャラリー

    • Tammes問題など、多様な問題への最適解生成例を公開

AIインフラ最適化

  • Googleインフラの中核ツールとして運用開始

    • 次世代TPU設計の最適化
    • キャッシュ置換ポリシーの効率化、従来数ヶ月の作業を2日で達成
    • 「直感に反する効率的な回路設計を提案、次世代TPUに直接採用」— Jeff Dean氏
  • Google Spannerの効率化

    • Log-Structured Merge-tree圧縮ヒューリスティクスの改良
    • '書き込み増幅'を20%削減、ソフトウェアのストレージフットプリントを9%削減

商用応用の拡大

  • Google Cloudと連携し、産業界へ展開
    • 金融:Klarnaが大規模トランスフォーマーモデルの学習速度2倍・品質向上
    • 半導体:Substrateが計算リソグラフィフレームワークの実行速度を大幅向上
    • 物流:FM Logisticが巡回セールスマン問題のルート効率を10.4%改善、年間15,000km削減
    • 広告・マーケティング:WPPがAIモデル精度10%向上
    • 計算材料・生命科学:SchrödingerがMLFF学習・推論を4倍高速化
      • 「分子候補のスクリーニング期間を数ヶ月から数日に短縮」— Schrödinger Gabriel Marques氏

AlphaEvolveの未来

  • 多用途・汎用システムとしての進化
    • 自律的に学習・進化・最適化するアルゴリズムによる新たなブレイクスルーの予感
    • 今後もより広範な課題への応用拡大を計画

開発・貢献者への謝辞

  • 開発コアチーム :Matej Balog、Alexander Novikov、Ngân Vũ、Marvin Eisenberger、Emilien Dupont、Po-Sen Huang、Adam Zsolt Wagner、他
  • UI・API開発、Google Cloud顧客連携 :Alexey Cherepanov、Becky Evangelakos、Jamie Smith、他多数
  • 応用分野の協力者・利用者 :Aaron Wenger、Terence Tao、他多数の研究者・実務家
  • リーダーシップ・パートナーチーム :Amin Vahdat、Demis Hassabis、Jeff Dean、Sundar Pichai、他

まとめ

  • AlphaEvolve は、研究・産業・社会の幅広い領域で進化と成果を実証
  • 今後も AIによる自律的アルゴリズム設計 の最前線として、さらなる発展が期待される

Hackerたちの意見

AIが自分自身を改善している(あるいは、動いているアーキテクチャをね)。シンギュラリティが近づいてるって言われてるけど、他にAIがLLMを改善するために使われている例ってある?合成データの作成やモデルのテスト以外で。

最近一番バズってるのは、これかな。https://github.com/karpathy/autoresearch

AIがLLMを改善するために使われている他の例はある? うん、去年AlphaEvolveを発表したとき、以前のGeminiモデルを使って、今のモデルのトレーニングに使うカーネルを改善したんだ。トレーニングが1%早くなったけど、大したことないよね。

恥ずかしがらずに宣伝: https://huggingface.co/spaces/smolagents/ml-intern これはOpusの周りにシンプルなハーネスを作ったもので、Hugging Faceのインフラと密接に統合されてるから、エージェントが論文を読んだり、コードをテストしたり、実験を始めたりできるんだ。

AIが自分自身を改善していく これが2027年に注目すべきポイントだと思う。大手AIラボは、リサーチエージェントの大きなプロジェクトを進めていて、AIを改善することにも特化してる(当たり前だけど)。今年中に実験段階から多くの成果が出ると期待してる。来年は実際にたくさんの作業ができるようになるし、AIが共に発明した最初の大きな効果的なアーキテクチャの変化を見ることができると思う。

これの難しいところは、数回の「WOW」に対して「お前バカだな」の系譜があることだよね。もしこの二つをフィルタリングするための認識を作れるなら、確かに特異点に向かうだろうけど、誰がそれを実現するのかは本当に見えにくい。

自己改善って、必ずしもシンギュラリティを意味するわけじゃないよね?シンギュラリティを実現するには、まだ厳しい制約があったり、実用的じゃないくらい長い時間がかかるかもしれないし。

AIが自分を改善すること(より能力を高めること)と、AIトレーニングや推論に使われるソフトウェアを最適化することには、全然違うんだよね。もっと効率的なトランスフォーマーは、単に運用コストが安くなるだけ。 "AIがAIを改善する"っていうのは、ある世代のAIが次世代のAIを設計すること、つまり根本的により能力が高い(ただ速いとか安いだけじゃなくて)AIを作ることだと思う。爬虫類の脳が、自律的に哺乳類の脳を設計できるような感じ。AlphaEvolveみたいなスマートハーネスに繋いでも、LLMにはこれをするための創造性がないと思う。次世代のアーキテクチャが、LLMが予測できるパーツの集合体として目の前に隠れているなら別だけど。おそらく、自律的な革新ができるAIが出てくるまでには、AGIに向けた人間の革新がもう少し必要だと思う。

Googleの人たちは、Claude CodeやCodexの代わりにGeminiコーディングエージェントを使って満足してるのかな?(皮肉じゃなくて、本当に聞いてる)

先月、スティーブ・イェッゲがそうじゃないって言ってたよね。https://xcancel.com/Steve_Yegge/status/2043747998740689171

Codex?

ドッグフーディングのポイントはまさにそれだよね。もし不満があれば、自分たちが改善するってこと。

コーディングがジェミニや他のモデルの唯一の使い道じゃないってことを知っておいてね。この話はこの記事の内容でもないし。ジェミニはコーディングに関しては最良のエージェントじゃないかもしれないけど、他のことではすごく優れてるよ。

私はコーディングに関してはClaudeとGeminiの違いがわからないな。内部エージェントのツールは、私の経験ではClaude Codeよりも何倍も速いよ。

もし具体的にGeminiのVS Code拡張について言ってるなら、Claude CodeやCodexと比べるとひどいよ。どうしてこれが許されるのか分からない。常にタイムアウトするし、変な失敗モードがあるし、モードを切り替えるために新しいチャットを始めなきゃいけない...でも、これがジェミニモデル特有の問題とは思えない。拡張機能の問題のように感じる。実際の問題解決については、VS Code拡張を無視すれば、私の目的にはどの三つのプレミアモデルも優れたコーディングエージェントだと思うよ。

ディープマインドではClaude Codeを使ってるよ。

アンチグラビティが思い浮かぶな。

エージェントが具体的にどのように役立ったのか、興味あるな。どう使われたのか、どの改善につながったのか、同じ解決策に人間がたどり着くのにどれくらい時間がかかったのか、知りたい。

このブログ記事には、この具体的な質問について議論している論文やプレプリントへのリンクがたくさんあるよ。

まるでkarpathy/autoresearchのステロイド版みたいだね。

これ、Antirezの「反AIのハイプにハマるな」を思い出すな。要するに、これらの基盤モデルは非常に高レベルで明確に定義された問題空間(例えば、行列を早く掛け算する)を最適化するのが得意なんだ。Antirezの場合は「Redisを速くする」ってことね。反応は二つあって、「自分には絶対無理だ」っていうのと、「自分の人生の数ヶ月分が1時間で達成できた」っていうの。両方とも正しいと思う。Antirezには期待したいし(最近すごい活躍してるし)、私たちも安心して、LLMが人間の知識が詰まった、システム中心で曖昧に定義された問題を解決するのは無理だってことを理解すべきだと思う。

私たちの他の人たちは、LLMができないことを知って安心すべきだと思う。もし(いつ?)AI支援の研究がLLMを超えることになったらどうなる?そんなことは起こらないと思う?

私たちの他の人たちは、LLMができないことを知って安心すべきだと思う(そして、多分最初からそういう目的ではなかった)。人間中心で暗黙の知識が詰まった、あいまいに定義された問題空間の仕事を、ほとんどの人間がやってるけど、正直言ってもうそんなことは信じてない。モデルはあいまいさに対してうまくなり始めてる。Claude Codeは今、何かがあいまいなときに私に聞いてくる。もうすぐ、すべての会議が録音されて、文字起こしされ、エージェントがあいまいさに直面したときに検索できるように、よくインデックスされた場所に保存されることになるよ(ここに無料のスタートアップアイデア!)。今、彼らがあなたに聞けるなら、そうなったら自分で答えを探せるようになるよ。実際、もしあなたがしっかりと文書化されたNotionやConfluenceを持っていれば、彼らはもうそれをやってる。ただ、誰も持ってないだけ。あいまいさを特定するための強化学習は、パフォーマンスアルゴリズムのための強化学習よりも難しいかもしれないけど、無理ではないし、進行中だよ。今はただ時間の問題だね。

これはこういうことだと思う:1. すごい、たった1%の効率を調整しただけ 2. バカだな、幻のAPIをトラブルシューティングするのに1時間も使ったのか。平均的には、どれが勝つかを見極めるのは本当に難しい。

私たちの他の人たちは、LLMができないことを知って安心すべきだと思う(そして、多分最初からそういう目的ではなかった)。2030年には、これは非常に短絡的に見えることが保証された発言だね。

Claudeたちは、僕が考えてるアルゴリズムを効果的に素早く実装するのが得意だよ。たくさんのコントロール質問をしてコードをチェックすればね。ただ、非主流のアルゴリズムを発明するのは苦手で、短期的なショートカットを使うことが多いんだ。まだツールの域を出てないし、道具を効果的に使う職人にはなってないよ。でも、これは徐々に変わっていくし、マイナーなアルゴリズムが勝つ場所もさらに減っていくと思う。

エルデシュ問題について何度聞かされるんだろう? :) 最初は人類にとって素晴らしい成果に思えるけど、しばらくするとまた戻ってくるんだよね!

AlphaEvolveは、マップエリートをLLMと組み合わせてる。これは機械学習における重要なステップで、強化学習のDQNの流れに沿ったものだ。AEは、遺伝的アルゴリズムのコミュニティからの多様性を大規模な最適化された深層学習とRLモデルに持ち込む。これは前進するための必須ステップだよ。アプローチはクリーンでシンプルだけど、一般的だ。唯一の注意点は、マップエリートの次元の最適化問題の定義だ。でも、これは次の数年で何とかされるだろう。マップエリートについて知らないなら、ジャン=バティスト・ムレの研究や講演を調べてみて。すごく面白くて普遍的だから。

GoogleがGemini 3.xモデルをGAに持ってきて、429エラーに悩まされないくらいのキャパシティを提供してくれたらいいのに。なんか、彼らがVertex APIを使って企業向けのアプリを開発するのを嫌がってる気がする。彼らのモデルはドキュメント分析とかにすごく良かったのに、ほんと残念だよ。

無料プランでやってるの?無料プランだと429エラーがめっちゃ多い気がするんだよね。

アルゴリズム改善のための素晴らしくシンプルな解決策だね。これを数年前にアクティベーションエンジニアリングで知ってたらよかったのに。どうやってAlphaEvolveにアクセスするの?

これはただの自慢投稿だね。10億ドルの企業になれなきゃ、出て行けって感じ。