DeepSeekは4月24日、大規模言語モデルの新シリーズ「V4」のプレビューを公開しました。フラッグシップの「V4-Pro」は総パラメータ数1.6兆という超大規模MoE(Mixture of Experts:混合エキスパート)アーキテクチャを採用し、SWE-bench Verifiedで80.6%を達成——Claude Opus 4.6とわずか0.2ポイント差に迫りました。一方で価格は出力トークン100万あたり3.48ドルと、Claude Proの約25ドルと比べて約86%安という破格の水準です。南華早報(SCMP)によれば、同価格帯の比較ではGPT-5.5比97%安となっています。
V4-Proに並行して公開された「V4-Flash」は総パラメータ284億・アクティブパラメータ130億のより軽量なモデルで、入力100万トークンあたり0.14ドルという業界最安水準の価格設定です。両モデルとも標準コンテキストウィンドウは100万トークンで、数学・STEM・コーディングの各ベンチマークでは現行の主要オープンウェイトモデルを上回る結果が報告されています。DataCampのレビューでは、V4-Proはオープンソースのフロンティアモデルとして最大級の存在感を示していると評価されています。
さらにThe Next Webによると、5月5日までの期間限定でV4-Proを通常価格の75%引きで提供するキャンペーンも実施されました。X上では「R1ショックほどの衝撃はないが、中国AIが本物の競争力を持つことが再確認された」「1/6の価格でフロンティア級はコスト破壊的」という反応が多数見られました。r/LocalLLaMAではHugging Faceからのダウンロードが急増し、ローカル環境での動作検証を試みる報告が続きました。Hacker Newsでは「DeepSeek V4 Proがローカルで動けばCloud API全体の価値が変わる」というスレッドがフロントページを賑わせました。
DeepSeek V4は商用利用可能なオープンウェイトモデルとして公開されており、個人・企業がモデルをダウンロードして自前のインフラで動かすことができます。フロンティア水準の性能をローカルで実現できる可能性は、API従量課金モデルに依存する既存の商用LLMビジネスへの圧力を一段と高めそうです。今後の正式リリースと、より詳細な独立ベンチマーク結果が注目されます。