エージェンティックエンジニアリングのレベル
概要
- AIによるコーディング能力は急速に進化し、人間の活用力が追いついていない現状
- エンジニアリングチームの生産性向上には、AIの能力と実践力のギャップを埋める必要性
- Agentic Engineeringの8段階による進化プロセスの解説
- チーム全体のレベルアップが個々の生産性にも大きく影響
- 各レベルの特徴と実践ポイントを具体的に紹介
AIコーディング能力と実践ギャップ
- AIのコーディング能力は急速に向上し続けている現状
- SWE-benchスコアの向上と実際の生産性指標の乖離が発生
- AnthropicのCoworkチームのように10日で製品を出すチームと、POC止まりのチームの差は「能力と実践のギャップ」を埋められるかどうか
- このギャップは一夜で埋まらず、8段階のレベルアップによって徐々に縮まる構造
- チーム全体のレベルが個人のアウトプットにも影響し、協力的な成長が重要
Agentic Engineeringの8段階
-
Level 1 & 2: Tab CompleteとAgent IDE
- Tab CompletionはGitHub Copilotから始まり、コード自動補完の時代
- Agent IDE(例: Cursor)はチャットをコードベースに接続し、複数ファイル編集を容易に
- コンテキスト制限が常に課題で、モデルが参照できる範囲が限られる
- Planモードで、粗いアイデアを構造化しLLMに指示する運用が主流
-
Level 3: コンテキストエンジニアリング
- 2025年のバズワードとなる「コンテキストエンジニアリング」
- 情報密度の最適化が重要で、「各トークンが存在意義を持つ」ことが求められる
- .cursorrulesやCLAUDE.mdなどのルールファイル管理
- ツール説明や会話履歴管理、適切なツール選択など幅広い範囲に影響
- 最近は大規模モデルで許容度が増すも、適切なコンテキスト設計は依然重要
-
Level 4: コンパウンディングエンジニアリング
- Kieran Klaassenにより普及した「Compounding Engineering」
- 計画→委任→評価→コーディファイのループで、継続的な改善を実現
- LLMのステートレス性を補うため、学びをルールファイルやドキュメントに反映
- ルール過多による逆効果に注意し、必要な情報を自動発見できる設計が理想
-
Level 5: MCPとスキル
- MCP(Multi-Component Plugin)やカスタムスキルでLLMの能力を拡張
- データベース・API・CIパイプライン・デザインシステムなどとの連携
- PRレビュー自動化スキルの共有や、DeepWiki MCPによるドキュメントアクセス
- スキルの社内マーケットプレイス構築、Pull Requestやバージョン管理の導入
- CLIツール利用によるトークン効率化、必要な出力のみをコンテキストに投入
-
Level 6: ハーネスエンジニアリングと自動フィードバックループ
- ハーネスエンジニアリングは、エージェントが自律的に作業できる環境・ツール・フィードバックループの構築
- OpenAI Codex Harnessのような、観測・検証・自己修正機能の統合
- 自動化されたバックプレッシャー(型システム、テスト、リンター等)による品質担保
- セキュリティ境界の設計で、エージェントの暴走や情報漏洩を防止
- スループット重視・制約設計が現代的なエージェント運用の鍵
チームレベルの重要性とマルチプレイヤー効果
- 個人のレベルが高くても、チーム全体のレベルが低いとアウトプットが制限
- 例:Level 7の開発者が夜間にエージェントでPRを上げても、Level 2の同僚が手動レビューでボトルネック
- チーム全体の底上げが個々の生産性に直結
- AI支援コーディングを実践する複数チームからの知見を元に、レベルアップの道筋を共有
まとめ:次のレベルを目指す意義
- 各レベルの進化は生産性の飛躍的向上をもたらす
- モデルの能力向上が、既存の運用レベルの価値をさらに増幅
- 自分だけでなく、チーム全体でのレベルアップが最重要課題
- Agentic Engineeringの段階的進化が、AI時代のエンジニアリング組織に不可欠