Googleは2月19日、最新モデル「Gemini 3.1 Pro」をプレビュー版としてリリースしました。主要ベンチマーク16項目中13項目でトップスコアを記録し、価格はGemini 3 Proと同等を維持しています。
Gemini 3.1 Proの最も注目すべき成果は、ARC-AGI-2ベンチマークでの77.1%という検証済みスコアです。これはGemini 3 Proの2倍以上の推論性能向上を示しています。ARC-AGI-2は、訓練データ分布外の新規の視覚ロジックパズルを解く能力を評価するベンチマークで、多段階の抽象化と演繹を必要とします。Claude Opus 4.6の68.8%、GPT-5.3-Codexの52.9%を大きく上回っています。大学院レベルの科学知識をテストするGPQA Diamond評価でも94.3%を記録し、外部ツールなしでのHumanity's Last Exam評価では44.4%という新記録を樹立しました。コンテキストウィンドウは100万トークンに対応しています。
Hacker Newsでは元Googlerから「開発時のフラストレーション」を指摘する声もあり評価は分かれています。Redditでは「法律RAGタスクでは前モデルより若干精度低下」との報告もあります。とはいえ、ベンチマーク上ではGoogleがAI競争でトップの座を奪還したことは明らかです。
Gemini 3.1 Proの登場により、OpenAI、Anthropic、Googleの三つ巴の競争はさらに激化しています。価格を据え置きながら性能を大幅に向上させたGoogleの戦略は、エンタープライズ市場でのシェア拡大を狙ったものと見られます。
| - [Gemini 3.1 Pro: A smarter model for your most complex tasks | Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/) |
|---|---|
| - [Google AI Releases Gemini 3.1 Pro with 1 Million Token Context and 77.1 Percent ARC-AGI-2 Reasoning | MarkTechPost](https://www.marktechpost.com/2026/02/19/google-ai-releases-gemini-3-1-pro-with-1-million-token-context-and-77-1-percent-arc-agi-2-reasoning-for-ai-agents/) |
| - [Google launches Gemini 3.1 Pro, retaking AI crown with 2X+ reasoning performance boost | VentureBeat](https://venturebeat.com/technology/google-launches-gemini-3-1-pro-retaking-ai-crown-with-2x-reasoning) |