Model Releases Community 2026-04-16 Source →

Google DeepMindがGemini 3.1 Proをリリース、GPQA Diamondで94.3%達成しGPT-5.4を複数指標で上回る

Google DeepMindは最新フラッグシップモデル「Gemini 3.1 Pro」を正式リリースしました。科学・数学の難問集として知られるGPQA Diamond（Graduate-Level Google-Proof Q&A）で94.3%というスコアを達成し、ソフトウェアエンジニアリングの実力評価指標SWE-bench Verifiedでも78.80%を記録して、複数のベンチマークでGPT-5.4を上回る結果を示しました。

特筆すべきは価格戦略です。入力100万トークンあたり2ドル、出力12ドルという料金は前世代からの据え置きで、これだけの性能向上を追加コストなしに提供するという姿勢が業界の注目を集めています。科学知識領域でのリードは特に顕著で、医療・研究分野での活用に対する期待が高まっています。コーディング能力についてはAnthropicの最新モデルとほぼ同水準との独立検証も報告されており、総合的な実力の高さが裏付けられています。

「価格据え置きで世代的アップグレード」という点にHacker Newsユーザーから高評価が集まっており、実際の開発者ユースケースでの評価レポートを求める声も多数寄せられています。X上ではベンチマーク首位奪還を称賛する声と「実際の使用感はどうか」を問う実用論者に二分され、価格据え置き戦略をGoogleの自信の表れと評価するツイートも目立ちます。r/MachineLearningでは科学知識分野でのリードを詳細に分析するスレッドが活発に展開されました。

Gemini 3.1 Proのリリースは、2026年のAIモデル市場が単純なスペック競争から「コストパフォーマンス込みの総合評価」へと移行していることを示しています。AnthropicやOpenAIとの三者鼎立が続く中、Googleがベンチマークと価格の両面で攻勢をかけることで、開発者やエンタープライズ向け市場での獲得競争はさらに熾烈になりそうです。

Google DeepMindがGemini 3.1 Proをリリース、GPQA Diamondで94.3%達成しGPT-5.4を複数指標で上回る

関連リンク