Open Source Community 2026-02-26 Source →

DeepSeek-V3.2-Speciale、GPT-5を超える推論性能を達成 - 数学・論理タスクで首位に

概要

中国のDeepSeekがリリースしたDeepSeek-V3.2-Specialeが、AIME 2025やHMMT 2025などの数学・推論ベンチマークでGPT-5を上回る性能を達成しました。IMO、CMO、IOI、ICPC世界大会で金メダルレベルの性能を示した初のAIモデルとして、フロンティアAI競争に新たな衝撃を与えています。

詳細

DeepSeek-V3.2-Specialeは、DeepSeek-V3.2の「高計算量版」として位置づけられるモデルです。特に数学的厳密性と多段階の論理的推論を要求するタスクにおいて、GPT-5 HighやGemini 3.0 Proと同等以上の性能を一貫して発揮しています。

具体的なベンチマーク結果として、AIME 2025（アメリカ招待数学試験）で96.0%を達成し、GPT-5 Highの94.6%を上回りました。HMMT 2025（ハーバード-MIT数学トーナメント）でも99.2%を達成し、Gemini 3 Proの97.5%を凌駕しています。

さらに注目すべきは、IMO 2025（国際数学オリンピック）、CMO 2025（中国数学オリンピック）、IOI 2025（国際情報オリンピック）、ICPC世界大会のすべてで金メダルレベルの性能を達成した初のモデルであるという点です。これはOpenAIやGoogleのモデルでさえ成し遂げていなかった快挙です。

VentureBeatは「GPT-5に匹敵する2つの強力なAIモデルを無料で提供」と報じており、DeepSeekの「コスト効率」も大きな強みとなっています。Introlの分析によると、DeepSeek-V3.2はGPT-5と同等の性能を90%低いトレーニングコストで実現しており、AI開発の経済性に革命をもたらしています。

モデルの重みはHugging Faceで公開されており、APIはDeepSeekの開発者プラットフォームから利用可能です。

ポイント

AIME 2025で96.0%達成（GPT-5 High: 94.6%を上回る）
HMMT 2025で99.2%達成（Gemini 3 Pro: 97.5%を上回る）
IMO、CMO、IOI、ICPC世界大会で金メダルレベル達成（史上初）
GPT-5の90%低いトレーニングコストで同等性能
長文コンテキストを低コストで処理可能
Hugging Faceでオープンソース公開

DeepSeek-V3.2-Speciale、GPT-5を超える推論性能を達成 - 数学・論理タスクで首位に

概要

詳細

ポイント

関連リンク