Google DeepMindは2026年2月19日、最新AIモデル「Gemini 3.1 Pro」をプレビュー版としてリリースしました。第三者評価機関Artificial Analysisのインテリジェンスインデックスで57点を獲得し、Opus 4.6(53点)、Sonnet 4.6(51点)を抑えて世界最高スコアを記録しています。
Gemini 3.1 Proの推論能力は劇的に向上しました。新しい論理パターンの解決能力を測るARC-AGI-2ベンチマークでは77.1%を達成し、Gemini 3 Proの2倍以上のスコアを記録。GPQA Diamondでは94.3%、ライブコーディングベンチマークLiveCodeBench Proでは2887のEloレーティング、SWE-Bench Verifiedでは80.6%という結果を残しています。VentureBeatによると、エージェントワークフロー向けのさらなる改善を行ってから一般提供される予定です。
JetBrainsのディレクターは「品質が15%向上し、より高速で効率的になった」と評価する一方、Hacker Newsでは「503エラーや最大104秒のレイテンシ」への不満が報告されています。また、Gemini 3 Proの廃止スケジュールが予定通り進んでいないという批判も見られます。
AIモデルの性能競争は激化の一途をたどっており、Gemini 3.1 Proの登場でGoogleがベンチマーク首位を奪還した形です。ただし、実運用での安定性については引き続き注視が必要でしょう。
| - [Gemini 3.1 Pro: A smarter model for your most complex tasks | Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/) |
|---|---|
| - [Gemini 3.1 Pro Preview - Intelligence, Performance & Price Analysis | Artificial Analysis](https://artificialanalysis.ai/models/gemini-3-1-pro-preview) |