DeepSeek V4 - ほぼ最前線、価格はごくわずか
概要
- 2026年4月、DeepSeekがV4シリーズのAIモデルを発表
- DeepSeek-V4-Proはオープンウェイト最大規模のモデル
- FlashとProの2種類、いずれも高効率・低コスト
- 価格は競合他社を大きく下回る水準
- 長文コンテキストや効率性に特化した設計
DeepSeek V4シリーズ新モデル発表
- DeepSeekは2026年4月にV4シリーズをリリース
- 今回発表されたのはDeepSeek-V4-ProとDeepSeek-V4-Flashの2モデル
- 両モデルとも1Mトークンのコンテキスト長を持つMixture of Expertsアーキテクチャ採用
- Proモデルは総パラメータ1.6兆、アクティブ49B
Flashモデルは総パラメータ284B、アクティブ13B - MITライセンスで公開、商用利用も可能
モデル規模・比較
- DeepSeek-V4-Proは現時点で最大規模のオープンウェイトモデル
- これまでの**Kimi K2.6(1.1T)やGLM-5.1(754B)**を上回る規模
- 前世代の**DeepSeek V3.2(685B)**の2倍以上
- Hugging Faceで配布:Proは865GB、Flashは160GB
ローカル実行・互換性
- Flashモデルは128GBメモリのMacBook Proでも量子化すれば動作可能性
- Proモデルは必要なエキスパートのみディスクからストリーミングすれば実行可能性
- OpenRouter経由でモデルを試用可能
- コマンド例:
llm install llm-openrouter llm openrouter refresh llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle'
- コマンド例:
価格・コスト比較
-
DeepSeek V4 Flash
入力$0.14/100万トークン、出力$0.28/100万トークン -
DeepSeek V4 Pro
入力$1.74/100万トークン、出力$3.48/100万トークン -
競合モデルとの比較表
| モデル | 入力($/M) | 出力($/M) | |-------------------------|-----------|-----------| | DeepSeek V4 Flash | 0.14 | 0.28 | | GPT-5.4 Nano | 0.20 | 1.25 | | Gemini 3.1 Flash-Lite | 0.25 | 1.50 | | Gemini 3 Flash Preview | 0.50 | 3.00 | | GPT-5.4 Mini | 0.75 | 4.50 | | Claude Haiku 4.5 | 1.00 | 5.00 | | DeepSeek V4 Pro | 1.74 | 3.48 | | Gemini 3.1 Pro | 2.00 | 12.00 | | GPT-5.4 | 2.50 | 15.00 | | Claude Sonnet 4.6 | 3.00 | 15.00 | | Claude Opus 4.7 | 5.00 | 25.00 | | GPT-5.5 | 5.00 | 30.00 |
- Flashは小型モデルで最安、Proも大規模モデルで最安
効率性とアーキテクチャの特徴
- 1Mトークンコンテキストにおいても高効率
- Proモデル:DeepSeek V3.2比でFLOPs27%・KVキャッシュ10%
- Flashモデル:同じくFLOPs10%・KVキャッシュ7%
- 効率化設計により低コストを実現
性能・ベンチマーク
- DeepSeek論文内ベンチマークでProモデルはフロンティアモデルと競合
- GPT-5.2やGemini-3.0-Proよりも高性能
- GPT-5.4やGemini-3.1-Proにはやや劣る(約3~6ヶ月の開発差)
今後の展望・量子化モデル
- Unslothチームによる量子化版モデルの公開が期待
- Flashモデルがローカルマシンでどこまで動作するかに注目