中国DeepSeekの「V4」モデルが3月初旬にリリースされました。当初3月初週の公開を予定していましたが若干の延期を経ての登場となります。コーディングと長文コンテキストを活用したソフトウェアエンジニアリングタスクに最適化されており、内部テストではClaudeやChatGPTを上回る性能を示したと報道されています。
NxCodeによると、DeepSeek V4は約1兆パラメータのMixture-of-Experts(MoE)アーキテクチャを採用し、推論時には約320億パラメータのみをアクティベートする効率的な設計となっています。100万トークンのコンテキストウィンドウを備え、ネイティブマルチモーダル機能を搭載。Huawei Ascendチップでの動作に最適化されている点も注目されています。
特筆すべきは、DeepSeekが新たに開発した「Engram」メモリアーキテクチャの導入です。これにより、超長文コンテキストからの効率的な情報検索が可能となり、大規模なコードベースを扱うソフトウェア開発タスクで威力を発揮します。内部ベンチマークでは、マルチファイルリファクタリングでSonnet 3.5を、競技プログラミング(Codeforces)で現行GPT-4oを上回るスコアを記録したとされています。
Redditのr/LocalLLaMAでは「R1以来最も期待されているドロップ」との熱気が高まっており、Hacker Newsでは「延期が続いていたが、コーディング能力への期待は高い」との慎重ながらも前向きな反応が見られます。ただし、3月5日時点では独立した第三者ベンチマークは公開されておらず、自己申告のスコアについては検証待ちの状態です。
DeepSeekは昨年のR1モデルで業界を驚かせた実績があり、V4がその期待に応えられるかどうか、開発者コミュニティの関心が集まっています。
| - [DeepSeek V4: Everything We Know | NxCode](https://www.nxcode.io/resources/news/deepseek-v4-release-specs-benchmarks-2026) |
|---|---|
| - [DeepSeek plans V4 multimodal model release | TechNode](https://technode.com/2026/03/02/deepseek-plans-v4-multimodal-model-release-this-week-sources-say/) |
| - [DeepSeek's Next Move: What V4 Will Look Like | Recode China AI](https://recodechinaai.substack.com/p/deepseeks-next-move-what-v4-will) |