Googleは2026年2月19日、Gemini 3.1 Proをプレビュー版としてリリースしました。このモデルは、純粋な論理パターン認識と新規問題解決能力を測定するベンチマーク「ARC-AGI-2」で77.1%のスコアを達成し、前世代Gemini 3 Proの31.1%から2倍以上の性能向上を記録しています。
MarkTechPostによると、Gemini 3.1 Proは100万トークンのコンテキストウィンドウを備え、16のベンチマーク中13でトップスコアを獲得。特にARC-AGI-2は、事前学習データからの暗記では解けない完全に新しい論理パターンを解く能力をテストするもので、フロンティアモデルの中でも拡張思考モードを使用せずに達成した最高スコアとなります。
Google DeepMindのモデルカードによると、Gemini 3.1 Proは複雑な問題解決やエージェント的なワークフロー処理に最適化されており、抽象的思考とパターン認識において大きな進歩を見せています。9to5Googleは「複雑な問題解決のためのよりスマートなベースライン」と評しています。
X上では「AGI-2ベンチマークでの圧勝は印象的」との声が上がり、Hacker Newsでは「暗記では突破できないテストでの高スコアは本物の進歩」との分析が多く見られます。従来のベンチマークでは高スコアを出しながら実際の応用で期待外れとなるケースが指摘されてきましたが、ARC-AGI-2のような「真の汎化能力」を測るテストでの好成績は、AIの推論能力が着実に進化していることを示唆しています。
Gemini 3.1 Proの登場により、エージェント型AI開発やコード生成、複雑な分析タスクにおいて、Googleの競争力がさらに強化されることが期待されます。
| - [Gemini 3.1 Pro: A smarter model for your most complex tasks | Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/) |
|---|---|
| - [Google AI Releases Gemini 3.1 Pro | MarkTechPost](https://www.marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro-with-1-million-token-context-and-77-1-percent-arc-agi-2-reasoning-for-ai-agents/) |
| - [Gemini 3.1 Pro Model Card | Google DeepMind](https://deepmind.google/models/model-cards/gemini-3-1-pro/) |