中国のAIスタートアップDeepSeekがリリースした「DeepSeek-V3.2-Speciale」が、複数の推論ベンチマークでGPT-5を上回る性能を達成しました。アメリカ数学招待試験(AIME)では96.0%を記録し、GPT-5 Highの94.6%を超えています。ハーバード・MIT数学トーナメント(HMMT)では99.2%と、Gemini 3 Proの97.5%をも凌駕しました。
さらに注目すべきは国際的な数学・情報科学大会での実績です。2025年の国際数学オリンピック(IMO)では42点中35点で金メダルを獲得、国際情報オリンピック(IOI)では600点中492点で同じく金メダル相当の10位に入っています。ICPC世界大会では12問中10問を解いて2位という驚異的な結果を残しました。これらはすべてオープンウェイトモデルとして公開されています。
Hacker Newsでは「テキスト・コードタスクでコスパ最強」「オープンウェイトモデルがついにクローズドモデルの堀を突破した」と評価され、X上では「AI業界の『より多くの資金と計算力が必要』という物語を覆した」との声も上がっています。Redditでは自律的にGitHubへPRを送るエージェントデモが話題となり、Agent-Firstアーキテクチャへの期待が高まっています。