DeepSeekは4月24日、V4-Pro(1.6兆パラメータ、アクティブパラメータ49B)とV4-Flash(284Bパラメータ)をMITライセンスでオープンソース公開しました。Hugging Faceで重みを直接配布し、100万トークンのコンテキストウィンドウにも対応しています。V4-Proの推論価格はClaude Opus 4.7やGPT-5.5の約1/6という破格の水準で、中国発のオープンウェイトモデルが再びAI業界の価格設定を揺さぶる形となりました。
r/LocalLLaMAでは、V4のアーキテクチャ分析が大きな反響を呼んでいます。Mixture-of-Experts(MoE)アーキテクチャとCSA(Chunked State Attention)・HCA(Hybrid Chunk Attention)を組み合わせた混合アテンション機構により、長文コンテキスト処理時の推論FLOPが前世代のV3比で約27%に削減されたという技術的分析が注目を集めています。つまり、コンテキスト長が増えるほど計算コストが跳ね上がる従来の課題を大幅に緩和した設計となっており、長文文書処理や大規模コードベースの解析で特に優位性を発揮する見込みです。
Hacker Newsの「DeepSeek V4」スレッドは公開直後から数百コメントを獲得し、「またDeepSeekが業界の価格設定を破壊した」と歓迎する声と、中国発モデルの地政学的リスクを懸念する声が激しく対立しています。X上では「DeepSeek V4がAIエコノミー全体を混乱させるかもしれない」という見出しが拡散し、Nasdaq上場のAI銘柄が再び売り圧力にさらされるとの観測も出ています。オープンウェイト・MIT ライセンス・フロンティア級性能・破格の価格という組み合わせは、商業モデル一辺倒だった業界の勢力図を塗り替える可能性を秘めており、今後のAIエコシステムへの影響が注目されます。