Open Source Community 2026-03-02 Source →

DeepSeek V3.2がAIME数学ベンチマークでGPT-5を上回る96%を達成、オープンソースがプロプライエタリを超える転換点に

中国のDeepSeekがリリースしたオープンソースモデル「DeepSeek-V3.2-Speciale」が、高難度の数学推論ベンチマークAIMEでGPT-5を上回る成績を収め、オープンソースAIがプロプライエタリモデルと肩を並べる時代の到来を示しました。オープンソースコミュニティにとって歴史的な転換点となる可能性があります。

InfoQによると、DeepSeek-V3.2-SpecialeはAIME（American Invitational Mathematics Examination）で96.0%の正答率を達成しました。これはGPT-5-Highの94.6%、Gemini-3.0-Proの95.0%を上回る数字です。AIME（アメリカ招待数学試験）は75分間で15問を解く試験で、計算力よりも数学的洞察力を測定するAIにとって最も困難なベンチマークの一つとされています。96%というスコアは、世界トップ50の数学オリンピック選手レベルに相当します。

技術的には、DeepSeek-V3.2は新しいDSA（DeepSeek Attention）メカニズムを採用しています。これにより計算複雑性がO(L²)からO(Lk)に削減され、長いコンテキストでの大幅な高速化を実現しています。DeepSeek-V3.1のチェックポイントから出発し、コンテキスト長を128Kに拡張した上で追加学習を行ったとのことです。

X上では「AIにはより多くの資金と電力が必要という業界ナラティブを吹き飛ばした」と称賛の声が上がっています。一方でRedditの開発者コミュニティからは「シンプルなCRUDタスクでの過剰な推論はリソースの無駄になる」との技術的懸念も示されています。Hacker Newsでの感情分析では肯定的反応が47%を占める一方、驚きと恐れが混在した反応も見られ、この急速な進歩に対する複雑な心境が伺えます。

DeepSeekの躍進は、AIの民主化という観点で重要な意味を持ちます。巨額の資金を持つ企業だけがフロンティアAIを開発できるという従来の常識が覆されつつあり、オープンソースコミュニティの力が改めて証明されました。今後、両者の競争がさらに激化することで、AI技術全体の発展が加速することが期待されます。

DeepSeek V3.2がAIME数学ベンチマークでGPT-5を上回る96%を達成、オープンソースがプロプライエタリを超える転換点に

関連リンク