中国のAIスタートアップDeepSeekが、旧正月に合わせてV4のリリースを準備中。1兆パラメータ、100万トークンのコンテキストウィンドウを搭載し、西側競合他社の10〜40分の1の推論コストで80%以上のSWE-bench性能を目指す。
DeepSeek V4は、2026年2月中旬のリリースを目標としており、The Informationの報道によると2月17日頃の旧正月祝賀に合わせた公開が予定されている。このモデルは、高度なコーディング能力と長文コンテキスト処理に特化して設計されている。
技術的な革新として、3つの新しいアーキテクチャ要素が導入される。Manifold-Constrained Hyper-Connections(mHC)、Engram条件付きメモリ、そしてSparse Attentionだ。これらの革新により、AI経済学を再定義する可能性があると期待されている。
注目すべきは、すでに2月11日にユーザーがDeepSeekのサイレントアップグレードを発見していることだ。コンテキストウィンドウが128Kから100万トークンに拡張され、知識のカットオフ日も2025年5月に更新されている。これがV4のプレビューである可能性が高い。
内部ベンチマークでは、SWE-benchで80%以上の性能を、西側競合他社の10〜40分の1という驚異的に低い推論コストで達成すると報告されている。前回のDeepSeekモデルリリースが株式市場に大きな影響を与えたことから、V4の発表もNASDAQ株に影響を与える可能性があると警戒されている。
2026年2月は、GPT-4登場以来最も激しいAIモデル競争の月となっており、米中間のAI覇権争いがさらに加速している。