Open Source Community 2026-03-05 Source →

DeepSeek-V3.2がGPT-5を推論タスクで上回る、AIME 96.0%・国際数学オリンピック金メダルでオープンソースの壁を突破

中国のAIスタートアップDeepSeekがリリースした「DeepSeek-V3.2-Speciale」が、複数の推論ベンチマークでGPT-5を上回る性能を達成しました。アメリカ数学招待試験（AIME）では96.0%を記録し、GPT-5 Highの94.6%を超えています。ハーバード・MIT数学トーナメント（HMMT）では99.2%と、Gemini 3 Proの97.5%をも凌駕しました。

さらに注目すべきは国際的な数学・情報科学大会での実績です。2025年の国際数学オリンピック（IMO）では42点中35点で金メダルを獲得、国際情報オリンピック（IOI）では600点中492点で同じく金メダル相当の10位に入っています。ICPC世界大会では12問中10問を解いて2位という驚異的な結果を残しました。これらはすべてオープンウェイトモデルとして公開されています。

Hacker Newsでは「テキスト・コードタスクでコスパ最強」「オープンウェイトモデルがついにクローズドモデルの堀を突破した」と評価され、X上では「AI業界の『より多くの資金と計算力が必要』という物語を覆した」との声も上がっています。Redditでは自律的にGitHubへPRを送るエージェントデモが話題となり、Agent-Firstアーキテクチャへの期待が高まっています。

DeepSeek-V3.2がGPT-5を推論タスクで上回る、AIME 96.0%・国際数学オリンピック金メダルでオープンソースの壁を突破

関連リンク