Model Releases Community 2026-03-26 Source →

Google Gemini 3.1 Pro発表、16ベンチマーク中13で首位獲得しOpusの半額で同等以上の性能を実現

Googleは2月19日、「Gemini 3.1 Pro Preview」をリリースしました。入力100万トークンあたり2ドル、出力12ドルという価格設定で、フロンティアレベルの性能をコモディティ価格で提供しています。これはClaude Opus 4.6の約半額に相当します。

ベンチマーク性能は目覚ましく、ARC-AGI-2で77.1%（前モデル31.1%から大幅向上）、GPQA Diamondで94.3%、LiveCodeBench Proで2887 Eloを記録し、追跡している18のベンチマークのうち12で首位を獲得しました。多言語質問応答のMMMUでは92.6%を達成し、Gemini 3 Pro（91.8%）、Claude Opus 4.6（91.1%）、GPT-5.2（89.6%）を上回っています。Artificial Analysis Intelligence Indexでは57点を獲得し、同価格帯の推論モデルの中央値31点を大きく上回りました。

テキスト、画像、音声、動画の入力に対応し、100万トークンのコンテキストウィンドウを備えています。前モデルGemini 3 Proと比較して推論性能は2倍以上に向上しながら、価格は据え置きという「価格据え置きで大幅性能向上」を実現しました。JetBrainsのVladislav Tankov氏も前モデル比15%向上を報告しています。

ただし、Hacker Newsでは「Opusの半額で性能は同等以上」と高評価される一方、X上では「高負荷時に104秒のレイテンシ」「長時間コーディングセッションでの状態劣化」への懸念も指摘されています。Redditでは、コーディングタスクについてはClaudeを好む開発者も存在するとの声があり、用途に応じた使い分けが推奨されています。

コスト効率を重視する開発者やチームにとって、Gemini 3.1 Proは有力な選択肢となりそうです。

Google Gemini 3.1 Pro発表、16ベンチマーク中13で首位獲得しOpusの半額で同等以上の性能を実現

関連リンク