Open Source Community 2026-05-13 Source →

DeepSeek V4 ProがMITライセンスでSWE-bench 80.6%達成、クローズドモデルとの差がついに1ポイント以内に

中国のAIラボDeepSeekが公開した「DeepSeek V4-Pro」が、コーディング性能ベンチマーク「SWE-bench Verified」で80.6%を達成し、MITライセンスのオープンソースとして公開されています。Claude Opus 4.6との差はわずか0.2ポイントであり、商用クローズドモデルとオープンソースモデルの性能差が事実上消滅したと言える状況です。同時期にZhipu AIが公開した「GLM-5.1」（744Bパラメータ・MoEアーキテクチャ、SWE-Bench Pro 58.4%）も幻覚率（ハルシネーション率）1.2%という最低値を記録しており、中国系オープンソースLLMの台頭がいよいよ無視できない段階に達しています。

Coderseraの調査によると、DeepSeek V4-ProはMITライセンスのため商用利用・改変・再配布が自由であり、企業が自社インフラ上にデプロイして使うことができます。クローズドモデルと同等の性能を自社サーバーで運用できるとなれば、API利用料やデータ送信のリスクなしに高品質なAIコーディング支援が実現します。GLM-5.1についてはHuaweiのAscendシリコンで訓練されているという点も注目されており、NVIDIAのGPUに依存しない開発体制が中国側のサプライチェーンリスク回避の観点からも意義を持っています。

X（旧Twitter）では「オープンソースとクローズドの差がほぼ消えた」というツイートが広く拡散し、中国AIラボの台頭への警戒感と期待感が交錯しています。r/MachineLearningでは「MITライセンスでこの性能は本物のゲームチェンジャー」というスレッドが上位に上がり、GLM-5.1の幻覚率最低値も話題になりました。Hacker Newsでは「Huawei Ascendシリコンで訓練されたモデルが幻覚率最低値」という点から、NVIDIA依存の地政学リスクへの議論が活発化しています。

オープンソースLLMがフロンティアモデルと実質的に並ぶ時代が来たことで、AIのアクセスの民主化は大きく前進しています。同時に、商用モデルの差別化要素がますます「性能」以外のところ——サポート・セキュリティ・カスタマイズ性・コンプライアンス対応——に移っていくことも意味しています。

DeepSeek V4 ProがMITライセンスでSWE-bench 80.6%達成、クローズドモデルとの差がついに1ポイント以内に

関連リンク