Model Releases Community 2026-03-09 Source →

Google Gemini 3.1 Proが第三者評価で世界最高性能を達成、推論能力は2倍以上に向上

Google DeepMindは2026年2月19日、最新AIモデル「Gemini 3.1 Pro」をプレビュー版としてリリースしました。第三者評価機関Artificial Analysisのインテリジェンスインデックスで57点を獲得し、Opus 4.6（53点）、Sonnet 4.6（51点）を抑えて世界最高スコアを記録しています。

Gemini 3.1 Proの推論能力は劇的に向上しました。新しい論理パターンの解決能力を測るARC-AGI-2ベンチマークでは77.1%を達成し、Gemini 3 Proの2倍以上のスコアを記録。GPQA Diamondでは94.3%、ライブコーディングベンチマークLiveCodeBench Proでは2887のEloレーティング、SWE-Bench Verifiedでは80.6%という結果を残しています。VentureBeatによると、エージェントワークフロー向けのさらなる改善を行ってから一般提供される予定です。

JetBrainsのディレクターは「品質が15%向上し、より高速で効率的になった」と評価する一方、Hacker Newsでは「503エラーや最大104秒のレイテンシ」への不満が報告されています。また、Gemini 3 Proの廃止スケジュールが予定通り進んでいないという批判も見られます。

AIモデルの性能競争は激化の一途をたどっており、Gemini 3.1 Proの登場でGoogleがベンチマーク首位を奪還した形です。ただし、実運用での安定性については引き続き注視が必要でしょう。

Google Gemini 3.1 Proが第三者評価で世界最高性能を達成、推論能力は2倍以上に向上

関連リンク