ハクソク

世界を動かす技術を、日本語で。

2025年:LLMの年

概要

2025年のLLM分野を総括し、推論モデルエージェントの進化、コーディングエージェントの台頭を解説。
CLI利用の普及やYOLOモードのリスク、高額サブスクリプションの出現も注目点。
中国のオープンウェイトモデルの躍進や、ローカル・クラウドモデルの進化も取り上げ。
各種ツールやサービスの実例を交え、2025年のAIトレンドを網羅的に振り返る内容。
個人の体験や業界の空気感も交えた、現場感覚に基づく総括


2025年 LLM業界総括:主なトレンドと進化

  • 推論(Reasoning)モデルの本格普及

    • OpenAIがo1シリーズで推論強化を先導
    • **RLVR(Reinforcement Learning from Verifiable Rewards)**による性能向上
    • 各社が推論モード搭載モデルをリリース
    • APIで推論レベル調整可能なダイヤル機能普及
    • ツール連携による複雑なタスク処理能力の向上
  • エージェントの現実化

    • エージェント=ツールを使いながら目標達成を目指すLLMシステム
    • コーディングや検索など、実用的な分野で定着
    • Deep ResearchパターンやGPT-5 Thinkingによる詳細レポート生成
    • “魔法のコンピュータ助手”像は未実現だが、実作業支援ツールとして普及
  • コーディングエージェントとClaude Code

    • 2025年2月、AnthropicのClaude Codeが静かに登場
    • LLMがコード生成・実行・結果検証・反復まで自動化
    • OpenAI、Google Gemini、Qwen、Mistralなど各社がCLI型コーディングエージェントを展開
    • GitHub Copilot CLIやAmpなど、ベンダーニュートラルなCLIツールも登場
    • Zed、VS Code、CursorなどIDEとの連携強化
    • 非同期型コーディングエージェント(Claude Code for web等)によるPull Request自動作成
    • セキュリティ面ではローカルPCを汚さない設計が評価
  • コマンドライン(CLI)でのLLM活用の一般化

    • 2024年からCLIツール開発が進む
    • sedやffmpeg等の複雑なコマンドもLLMが自動生成
    • Claude Codeは年間10億ドル規模の収益に到達
    • CLI経由でのLLM利用が開発者に広く浸透
  • YOLOモードとリスクの常態化

    • 安全確認なしの自動実行(YOLOモード)が普及
    • “Normalization of Deviance”現象によるリスク感覚の麻痺
    • セキュリティ研究者Johann Rehbergerによる警鐘
    • Challenger事故の教訓に学ぶべき点
  • 高額サブスクリプションモデルの出現

    • Claude Pro Max 20x($200/月)、ChatGPT Pro($200/月)、Google AI Ultra($249/月)など
    • トークン大量消費する高度なタスクでのコストメリット
    • ヘビーユーザー層に受け入れられる価格帯
    • APIクレジット消費量の増加が背景

中国オープンウェイトモデルの台頭

  • 2024年から中国発の高性能オープンウェイトモデルが世界ランク上位に進出
  • Baichuan、Qwen、DeepSeekなどの台頭
  • 国際的な評価指標での存在感増加
  • オープンソース化による研究・実装コミュニティの活性化

ローカルモデルとクラウドモデルの進化

  • ローカルモデルの精度・速度が大幅向上
  • しかしクラウドモデルも同時に進化し、依然としてトップ性能
  • 用途や予算に応じた選択肢の多様化

新しいAI利用スタイルとツール群の拡大

  • プロンプト駆動型画像編集学術大会での金賞獲得など応用範囲の拡大
  • 110以上のツール開発スマホでのプログラミングなど個人利用の深化
  • AI搭載ブラウザの普及と新たなリスク(“lethal trifecta”など)
  • コーディングエージェントの非同期・並列活用による生産性向上

2025年の総括と今後の展望

  • 推論とエージェント化によるLLMの実用性向上
  • CLI・非同期処理・高額プランなど、新しい利用パターンの定着
  • セキュリティリスク利便性のバランスが今後の課題
  • 中国勢の台頭ローカル・クラウドの進化などグローバルな競争激化
  • 個人・組織のAI活用スタイルが多様化しつつある現状

Hackerたちの意見

毎年素晴らしいですね!素晴らしい仕事をしてくれてありがとう。
同じく。サイモンは、AIの進展について(なんとか)ついていける理由の一つなんだ。これからも彼のブログやHNのコメントから学ぶのが楽しみだよ。
昔のことを思い出してみて。進歩の年って、例えば「Javaにちょっとした文法的な工夫を追加することに投票した」みたいな感じだったよね…
> 「Javaにちょっとした文法的な工夫を追加することに投票した」…あの頃は、全部Rustで書き直したいって思ってたよね。あの頃はもっとシンプルだった。クリプト系の人たちが、ベンチャーキャピタリズムの最悪の部分みたいに見えた時代だった。
> 私が好きだと思うMCPの(唯一の?)年だけど、MCPはすぐに企業向けのものになりそうだから、これからも残ると思う。
残ると思うけど、1月から5月の間のように再び熱い話題になることはないと思うな。
LLMの年の素晴らしいまとめだね。2026年の予測に関するブログ記事もある?
2025年の予測があまりにもひどくなったから、今回はパスしようかな! https://simonwillison.net/2025/Jan/10/ai-predictions/
もし進歩が本当にプロのソフトウェアエンジニアの大量失業(でも根絶ではない)につながったら、どう見られるのか気になるな。
それについてセクションを追加しようと思ったんだけど、時間がなくてうまくまとめられなかったからやめたんだ。多くの企業がジュニアエンジニアの採用を減らしているのに対して、CloudflareやShopifyが1,000人以上のインターンを雇っていることを対比させたかったんだよね。
僕の予想だけど、もしほとんどのソフトウェアエンジニアを排除できれば、大半の知識労働もなくせると思う。ロボティクスの現状を考えると、肉体労働の方が知的労働よりも長生きする可能性が高いね。
確かに。Hacker NewsがLLMの登場をそんなに軽視している理由がわからない。HNの読者は今、5段階の悲しみを経験しているのかな?でもLLMは確実にゲームチェンジャーだと思う。インターネットそのもの以上の影響を与える可能性があるよね。どちらも多くの投資が必要だけど。
多くの人がLLMの急速な進展に脅威を感じて、自分のスキルが陳腐化することを恐れて、非合理的な行動をとってしまう。こうした変化をうまく乗り越えるためには、オープンマインドを持ち、柔軟に対応し、継続的な学びを受け入れることが大切だね。
インターネットやスマホは、ほぼすべての人にとってすぐに役立つものでしたが、AIはそのレベルには全然達していない。プログラミングのような分野では多少役立つけど、普通の人はAIを使わずに日常生活を送ることができると思う。一番広く受け入れられる可能性があるのは、AIが生成したインスタグラムのリールみたいな100% AIのエンターテイメントかもしれない。もしかしたら、僕が普通の人たちとズレているだけかもしれないけど、これが流行るとは思えないな。リングカメラの動画みたいな新しさとしては楽しいけど、AI生成のメディアを一日中見るなんてことは絶対にしないよ。
HNが影響力のある技術を軽視するっていうアイデアは、HNが始まった頃からあるよね。実際、みんな過去を振り返ってばかりで、時代に取り残されてる感じがする。ただ、HNの議論は一様じゃないし、Karpathyが最近のブログ記事「10年前のHacker Newsを自動採点する」で示したように、少なくとも一部のコメント者はすごい先見の明を持ってるよね。https://karpathy.bearblog.dev/auto-grade-hn/
> 「なぜHacker NewsはLLMの登場を軽視しているのか理解できない。LLMは信じられないほど役立つと思うけど、ここ数年の進展を見ていると、”指数関数的な進歩”と、世界を破壊するような超知能の予告があった。客観的に見て、私たちはその道を歩んでいない。LLMの登場はない。少しの改善はあるかもしれないけど、明らかにシグモイド的な進歩を見ている。みんなの代わりには言えないけど、正当化されない誇張した rant にうんざりしてる(指数関数的な進歩については議論する必要がないのがいいところだよね)」
LLMには本当に役立つ部分がある。でも、その実際の有用性は、偽の盛り上がりや過剰な約束の山の下に埋もれている。LLMには本当の限界があって、すぐには解消されない。新しい技術が出てこない限り、ほとんど共通点がないものに移行するまでね。人々が「進歩の洗浄」を行っていて、これらの短所が十分なデータと計算を投げれば魔法のように消えると主張しているけど、明らかにそうはならない。
自分の意見を言うと、もし盛り上がりが本当なら、MongoDBがあるのにリレーショナルデータベースは必要ないし、暗号通貨があるのにドルは必要ないし、すべてのバーチャル商品はNFTとして独占的に販売されているはずだし、今頃は自動運転車だけを運転しているはずだよね。LLMは主に、現金が尽きる前に独占を達成しようとしている詐欺師たちによって推進されている。そういう条件下では、彼らの約束を信じるのは難しい。彼らが破産するか、左右にお金を失うのをやめるまで待つつもりだし、残ったものはおそらく本当に役立つものだと思う。
LLMに対する感情の幅には驚かされる。HNは「蛇油」に傾いていて、Xは「もう終わりだ」と言っている——両方ともあり得るのかな?他の人たちはこれをどう理解しているの?どちらかの側に立つことを求めているわけじゃなくて、その幅を理解したいんだ。範囲がYよりXを信じることにつながるの?
僕の意見(他の人と同じくらいの知識しかないけど)は、範囲が示しているのは、これはまだ人々が理解しようとしている複雑な現象だってこと。僕の疑いは、次のようなことが起こっていると思う:1. LLMは自然言語の指示を受けて、コンパイル可能な機能的なコードを出力するなど、本当に印象的なことができる。これが一部の人を応援団に変えてしまう。2. 他のエンジニアは、実際のプロダクションシステムでは、LLMが効果的に反復するための十分な背景知識やドメイン知識を欠いていることに気づく。出力は出るけど、冗長で、求められている変更のポイントを外してしまう。3. LLMは知識がない人にも「ごまかす」ために使われて、大量の出力を生み出すけど、それは基本的に的外れなもの。これが、同じシニアの人たちを非常に不満にさせる。彼らの時間を無駄にするからね。これはツールのせいではないけど、一般的にそういう使われ方をされるから、ツール自体が悪く見られがち。4. これらのツールやワークフローには、疑わしい価値のものも含めて、信じられないほどの複雑さがある。だから、ツール自体だけでなく、この分野でリーダーになろうとしている人たちや、彼らが考え出すような奇抜なハックに対しても懐疑的なんだ。5. これらのツールが経済的に価値を正当化できるかどうか、そして社会に与える影響についての本当のマクロな疑問がある。6. 最後に、これらのツールは「知性」の境界を突いている。私たちの種の宝物であり、多くのエンジニアコミュニティの人々にとって大きなステータスの源でもある。だから、何かがこの概念を価値を下げたり、民主化したりする可能性については、ちょっと敏感になってしまうのも自然だよね。これが僕の意見だけど、これは複雑な現象で、いろんな糸に触れているから、いろんな意見が出てくるのは当然だし、同じ人がある側面については楽観的で、別の側面については悲観的に感じることもあるんだ。
自分の意見として言うと、AI自体がスパイキーだから、反応のスパイキーさがあると思う。特定のタスクにはすごく優れていて、他のタスクには驚くほど劣っている。スパイクの部分で使っている人は、その良さに本当に驚いているけど、トラフの部分で使っている人は、みんなができないことに対して狂ったように盛り上がっているのがイライラするだけなんだ。
これは過去1年の良いツール調査だね。再び就職市場に入る開発者として見ているよ。求人の説明は、投稿で使われているタイムラインと密接に関連している。これが奇妙だと思うのは、こうしたアプローチがこんなに早く変わっているから。例えば、「生産レベルの0→1経験を持つスキルとLangchainの専門家。元創業者優遇」とかの求人があるんだ。これは数ヶ月前に生まれた専門知識で、スタートアップはそれを使って一晩でチームを作ろうとしている。1月や2月には、その週にリリースされるものに対する求人が出るだろうね。まるで砂の城みたいだ。
ありがとう!この話、すごく楽しめたよ。AIのスロップ動画は2026年にはもっと長くて「リアル」になるだろうね。ソーシャルメディア企業が「おそらく/AIによって作成された」って大きなバナーを貼って、これらの動画を自動的にミュートするオプションを提供してくれることを本当に願ってる。そうするのが責任ある行動だと思うけど、AlphabetがYouTubeで、xAIがXで、MetaがFacebookやInstagramでそれをやるとは思えないな。みんな動画生成のゲームに関わってるからね。