2025年:LLMの年
概要
2025年のLLM分野を総括し、推論モデルやエージェントの進化、コーディングエージェントの台頭を解説。
CLI利用の普及やYOLOモードのリスク、高額サブスクリプションの出現も注目点。
中国のオープンウェイトモデルの躍進や、ローカル・クラウドモデルの進化も取り上げ。
各種ツールやサービスの実例を交え、2025年のAIトレンドを網羅的に振り返る内容。
個人の体験や業界の空気感も交えた、現場感覚に基づく総括。
2025年 LLM業界総括:主なトレンドと進化
-
推論(Reasoning)モデルの本格普及
- OpenAIがo1シリーズで推論強化を先導
- **RLVR(Reinforcement Learning from Verifiable Rewards)**による性能向上
- 各社が推論モード搭載モデルをリリース
- APIで推論レベル調整可能なダイヤル機能普及
- ツール連携による複雑なタスク処理能力の向上
-
エージェントの現実化
- エージェント=ツールを使いながら目標達成を目指すLLMシステム
- コーディングや検索など、実用的な分野で定着
- Deep ResearchパターンやGPT-5 Thinkingによる詳細レポート生成
- “魔法のコンピュータ助手”像は未実現だが、実作業支援ツールとして普及
-
コーディングエージェントとClaude Code
- 2025年2月、AnthropicのClaude Codeが静かに登場
- LLMがコード生成・実行・結果検証・反復まで自動化
- OpenAI、Google Gemini、Qwen、Mistralなど各社がCLI型コーディングエージェントを展開
- GitHub Copilot CLIやAmpなど、ベンダーニュートラルなCLIツールも登場
- Zed、VS Code、CursorなどIDEとの連携強化
- 非同期型コーディングエージェント(Claude Code for web等)によるPull Request自動作成
- セキュリティ面ではローカルPCを汚さない設計が評価
-
コマンドライン(CLI)でのLLM活用の一般化
- 2024年からCLIツール開発が進む
- sedやffmpeg等の複雑なコマンドもLLMが自動生成
- Claude Codeは年間10億ドル規模の収益に到達
- CLI経由でのLLM利用が開発者に広く浸透
-
YOLOモードとリスクの常態化
- 安全確認なしの自動実行(YOLOモード)が普及
- “Normalization of Deviance”現象によるリスク感覚の麻痺
- セキュリティ研究者Johann Rehbergerによる警鐘
- Challenger事故の教訓に学ぶべき点
-
高額サブスクリプションモデルの出現
- Claude Pro Max 20x($200/月)、ChatGPT Pro($200/月)、Google AI Ultra($249/月)など
- トークン大量消費する高度なタスクでのコストメリット
- ヘビーユーザー層に受け入れられる価格帯
- APIクレジット消費量の増加が背景
中国オープンウェイトモデルの台頭
- 2024年から中国発の高性能オープンウェイトモデルが世界ランク上位に進出
- Baichuan、Qwen、DeepSeekなどの台頭
- 国際的な評価指標での存在感増加
- オープンソース化による研究・実装コミュニティの活性化
ローカルモデルとクラウドモデルの進化
- ローカルモデルの精度・速度が大幅向上
- しかしクラウドモデルも同時に進化し、依然としてトップ性能
- 用途や予算に応じた選択肢の多様化
新しいAI利用スタイルとツール群の拡大
- プロンプト駆動型画像編集や学術大会での金賞獲得など応用範囲の拡大
- 110以上のツール開発やスマホでのプログラミングなど個人利用の深化
- AI搭載ブラウザの普及と新たなリスク(“lethal trifecta”など)
- コーディングエージェントの非同期・並列活用による生産性向上
2025年の総括と今後の展望
- 推論とエージェント化によるLLMの実用性向上
- CLI・非同期処理・高額プランなど、新しい利用パターンの定着
- セキュリティリスクと利便性のバランスが今後の課題
- 中国勢の台頭やローカル・クラウドの進化などグローバルな競争激化
- 個人・組織のAI活用スタイルが多様化しつつある現状