Model Releases Community 2026-04-23 Source →

Google「Gemini 3.1 Ultra」正式公開 — GPQA Diamond 94.3%・ARC-AGI-2 77.1%で主要ベンチマークほぼ全制覇、GPT-5.4と並びトップに

Googleがネイティブマルチモーダル推論AIモデル「Gemini 3.1 Ultra」を正式リリースしました。GPQA Diamond（博士レベル科学問題ベンチマーク）で94.3%、ARC-AGI-2（汎用推論ベンチマーク）で77.1%を達成し、Artificial Analysis Intelligence Indexでは57点を記録。GPT-5.4 Proと並んで公開モデルの最高スコアを共有するとともに、ほぼ全ての主要ベンチマークでOpenAIを上回ると報告されています。

Redditのr/GoogleAIでは、ネイティブマルチモーダル推論の実用性を検証するレポートが多数投稿されています。「科学・コーディング両分野でのパフォーマンス向上を確認できた」という肯定的な評価が大勢を占めており、特に画像・テキスト・コードを一つのモデルで扱えるネイティブ統合の優位性が評価されています。

X上では「ほぼ全ての主要ベンチマークでGPT-5.4を上回る」という分析が拡散し、「GoogleがAI競争の最前線に本格復帰した」との声が相次ぎました。Hacker Newsでは、今回公開を拒否されたAnthropicのClaude Mythosとの比較を試みる考察スレッドが人気となっています。「公開されているモデルの頂点に立ったGemini」という評価が技術系ユーザーに広く受け入れられており、ChatGPTやClaudeへの対抗軸として改めてGoogleの存在感が示されました。

Gemini 3.1 Ultraの登場により、OpenAI・Google・Anthropicの三つ巴の競争は新たな局面を迎えています。特にGPQA Diamond 94%台という水準はClaude Mythosと肩を並べるものであり、一般公開されたモデルとしてはほぼ限界に近い性能といえます。今後は純粋な性能競争から、推論コスト・速度・マルチモーダル対応の実用性といった差別化軸への移行が加速するとみられます。

Google「Gemini 3.1 Ultra」正式公開 — GPQA Diamond 94.3%・ARC-AGI-2 77.1%で主要ベンチマークほぼ全制覇、GPT-5.4と並びトップに

関連リンク