Model Releases Community 2026-03-06 Source →

DeepSeek V4、1兆パラメータのマルチモーダルモデルを今週リリース予定―Huaweiチップで訓練、GPT-5の1/50コストを実現か

中国のAIスタートアップDeepSeekが、1兆パラメータ規模のマルチモーダルモデル「V4」を今週中にオープンソースでリリースする見込みです。100万トークンのコンテキストウィンドウを備え、テキスト・画像・動画を統一的に処理できる能力を持つとされています。訓練にはHuaweiのAscendチップが使用され、GPT-5の約1/50のコストで同等以上の性能を実現したと報じられています。

技術的な特徴として、V4はスパースMoE（Mixture of Experts）アーキテクチャを採用し、1兆パラメータのうち約320億のみを各トークン処理時にアクティブ化することで、計算コストを大幅に削減しています。また、100万トークンのコンテキストから効率的に情報を取得する「Engram Conditional Memory」や、新しい「Lightning Indexer」を備えた強化版アテンション機構など、3つの新しいアーキテクチャ改良が導入されています。リリースのタイミングは、3月4日から始まる中国の「両会」（全国人民代表大会・全国政治協商会議）に合わせた戦略的なものとみられます。

一方で、DeepSeekを巡っては激しい論争が起きています。AnthropicとOpenAIは、DeepSeekを含む中国のAI企業が「産業規模の蒸留攻撃」を行ったと非難しています。Anthropicによれば、DeepSeek、Moonshot AI、MiniMaxの3社が2万4000の偽アカウントを使用してClaudeから1600万件以上のやり取りを抽出したとのことです。Hacker Newsでは、DeepSeekがV4のリリース前アクセスをNVIDIAやAMDに提供しなかったことも議論されており、グローバルAIインフラの分断を示す動きとして注目されています。

DeepSeekはV4をオープンソースライセンスで公開予定であり、世界中の開発者がライセンス料なしで利用・カスタマイズできるようになります。米中AI競争が激化する中、その性能と地政学的影響の両面から大きな関心が寄せられています。

- [DeepSeek plans V4 multimodal model release this week	TechNode](https://technode.com/2026/03/02/deepseek-plans-v4-multimodal-model-release-this-week-sources-say/)
- [DeepSeek V4: Trillion-Parameter Open-Source AI	Digital Applied](https://www.digitalapplied.com/blog/deepseek-v4-trillion-parameter-open-source-multimodal)
- [Anthropic accuses DeepSeek of distillation attacks on Claude	CNBC](https://www.cnbc.com/2026/02/24/anthropic-openai-china-firms-distillation-deepseek.html)

DeepSeek V4、1兆パラメータのマルチモーダルモデルを今週リリース予定―Huaweiチップで訓練、GPT-5の1/50コストを実現か

関連リンク