Model Releases Community 2026-03-12 Source →

Google、Gemini 3.1 Proをリリースー ARC-AGI-2で77.1%達成、前モデルの2倍以上の推論性能

Google DeepMindは2026年2月19日、最新AIモデル「Gemini 3.1 Pro」をリリースしました。ARC-AGI-2ベンチマークで77.1%という驚異的なスコアを達成し、Gemini 3 Proの2倍以上の推論性能を実現しています。

ARC-AGI-2は人間レベルの抽象的推論能力を測定する難関ベンチマークとして知られていますが、Gemini 3.1 Proは全フロンティアモデルの中で最高スコアを記録しました。比較として、Claude Opus 4.6は68.8%、GPT-5.2は52.9%にとどまっており、Gemini 3.1 Proが大差をつけてトップに立っています。さらに、大学院レベルの科学テストであるGPQA Diamondでは94.3%を達成。PCMagによると、このベンチマークで過去最高のスコアとなっています。

JetBrainsのTankov氏は15%の品質向上を報告しており、DatabricksのCTOもOfficeQAで最高クラスの結果と評価しています。Hacker Newsでは「GPT-4以来のブレイクスルー」との見出しが飛び交い、コスト面でもOpus 4.6の半額以下という点で高い評価を得ています。100万トークンのコンテキストウィンドウを備えながら、AIエージェント向けの推論能力で他モデルを圧倒する性能は、Google DeepMindの研究開発力を示すものとなりました。

GPT-5.4、Claude Sonnet 4.6とともにAI Intelligence Indexでトップに並ぶGemini 3.1 Proは、2026年のAIモデル競争を一層激化させています。

- [Gemini 3.1 Pro	Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/)
- [Gemini 3.1 Pro Model Card	Google DeepMind](https://deepmind.google/models/model-cards/gemini-3-1-pro/)
- [Google AI Releases Gemini 3.1 Pro	MarkTechPost](https://www.marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro-with-1-million-token-context-and-77-1-percent-arc-agi-2-reasoning-for-ai-agents/)

Google、Gemini 3.1 Proをリリース ー ARC-AGI-2で77.1%達成、前モデルの2倍以上の推論性能

関連リンク

Google、Gemini 3.1 Proをリリースー ARC-AGI-2で77.1%達成、前モデルの2倍以上の推論性能