GPT-5.4 ミニとナノ
45日前原文(openai.com)
概要
OpenAIがGPT-5.4 miniとGPT-5.4 nanoを発表。
小型モデルでありながら高い性能と高速処理を実現。
コーディングやマルチモーダル理解、ツール利用で従来モデルを大幅に上回る。
コストパフォーマンスと低レイテンシが求められる用途に最適。
APIやCodex、ChatGPTで利用可能。
GPT-5.4 mini & nano:最先端小型AIモデルの登場
- GPT-5.4 miniとGPT-5.4 nano、OpenAIによる最新小型AIモデル
- GPT-5.4の強みを受け継ぎつつ、高速・高効率な処理能力
- GPT-5.4 mini
- GPT-5 mini比で2倍以上の速度と大幅な性能向上
- コーディング、推論、マルチモーダル理解、ツール利用で優秀なパフォーマンス
- SWE-Bench ProやOSWorld-Verified等のベンチマークでGPT-5.4に迫る成績
- GPT-5.4 nano
- GPT-5.4シリーズ最小・最安モデル
- 速度・コスト重視のタスク(分類、データ抽出、ランク付け、単純なコーディングサブエージェント)に最適
- GPT-5 nanoからの大幅なアップグレード
- 低レイテンシがプロダクト体験を左右するワークロード向け
- 即応性が求められるコーディングアシスタントやサブエージェント、マルチモーダルアプリケーション等に有用
- 大きなモデルよりも応答速度・ツール利用の信頼性が重要な場面で活躍
ベンチマーク・性能比較
- 主要ベンチマークにおける各モデルのスコア(xhigh設定時)
- SWE-Bench Pro:GPT-5.4 57.7%、GPT-5.4 mini 54.4%、GPT-5.4 nano 52.4%、GPT-5 mini 45.7%
- Terminal-Bench 2.0:GPT-5.4 75.1%、GPT-5.4 mini 60.0%、GPT-5.4 nano 46.3%、GPT-5 mini 38.2%
- Toolathlon:GPT-5.4 54.6%、GPT-5.4 mini 42.9%、GPT-5.4 nano 35.5%、GPT-5 mini 26.9%
- GPQA Diamond:GPT-5.4 93.0%、GPT-5.4 mini 88.0%、GPT-5.4 nano 82.8%、GPT-5 mini 81.6%
- OSWorld-Verified:GPT-5.4 75.0%、GPT-5.4 mini 72.1%、GPT-5.4 nano 39.0%、GPT-5 mini 42.0%
- コーディング・ツール利用・知能・マルチモーダル・長文対応といった各分野で高評価
利用シーン・ユーザー評価
- コーディングワークフローで特に有効
- 迅速な反復作業、ターゲット編集、コードベース検索、フロントエンド生成、デバッグループ等で低レイテンシを実現
- コスト・速度・パス率のバランスが非常に良好
- 複数モデル連携による効率化
- Codex等でGPT-5.4が全体計画や最終判断、GPT-5.4 miniがサブタスクを並列処理
- 大型モデルと小型モデルの役割分担による最適化
- マルチモーダルタスクやコンピュータ利用にも強み
- 複雑なUIのスクリーンショット解釈や画像を含むリアルタイム推論にも対応
- OSWorld-VerifiedでGPT-5.4 miniがGPT-5.4に近い成績を達成
提供形態・価格
- API、Codex、ChatGPTで提供
- GPT-5.4 mini:テキスト・画像入力、ツール利用、関数呼び出し、Web/ファイル検索、コンピュータ利用、スキル対応
- コンテキストウィンドウ40万トークン
- 価格:入力100万トークンあたり$0.75、出力100万トークンあたり$4.50
- CodexではGPT-5.4の30%クォータで利用可能、コスト約1/3
- ChatGPTではFree/Goユーザー向け「Thinking」機能、他ユーザーはGPT-5.4のフォールバック
- GPT-5.4 nano:API限定、入力100万トークンあたり$0.20、出力100万トークンあたり$1.25
- GPT-5.4 mini:テキスト・画像入力、ツール利用、関数呼び出し、Web/ファイル検索、コンピュータ利用、スキル対応
今後の展望と開発者へのメリット
- 小型モデルの高速化・高性能化で新たなシステム構成が可能
- 大型モデルが判断、小型モデルが高速実行という分散型AIワークフローの普及
- 開発者は用途・コスト・速度に応じて最適なモデル選択が可能
- リアルタイム性・コスト効率を重視する現場での導入促進
ご要望に応じて、各モデルの詳細やベンチマーク結果のさらなる分析もご提供可能です。