Googleは2月19日、「Gemini 3.1 Pro Preview」をリリースしました。入力100万トークンあたり2ドル、出力12ドルという価格設定で、フロンティアレベルの性能をコモディティ価格で提供しています。これはClaude Opus 4.6の約半額に相当します。
ベンチマーク性能は目覚ましく、ARC-AGI-2で77.1%(前モデル31.1%から大幅向上)、GPQA Diamondで94.3%、LiveCodeBench Proで2887 Eloを記録し、追跡している18のベンチマークのうち12で首位を獲得しました。多言語質問応答のMMMUでは92.6%を達成し、Gemini 3 Pro(91.8%)、Claude Opus 4.6(91.1%)、GPT-5.2(89.6%)を上回っています。Artificial Analysis Intelligence Indexでは57点を獲得し、同価格帯の推論モデルの中央値31点を大きく上回りました。
テキスト、画像、音声、動画の入力に対応し、100万トークンのコンテキストウィンドウを備えています。前モデルGemini 3 Proと比較して推論性能は2倍以上に向上しながら、価格は据え置きという「価格据え置きで大幅性能向上」を実現しました。JetBrainsのVladislav Tankov氏も前モデル比15%向上を報告しています。
ただし、Hacker Newsでは「Opusの半額で性能は同等以上」と高評価される一方、X上では「高負荷時に104秒のレイテンシ」「長時間コーディングセッションでの状態劣化」への懸念も指摘されています。Redditでは、コーディングタスクについてはClaudeを好む開発者も存在するとの声があり、用途に応じた使い分けが推奨されています。
コスト効率を重視する開発者やチームにとって、Gemini 3.1 Proは有力な選択肢となりそうです。
| - [Gemini 3.1 Pro - Model Card | Google DeepMind](https://deepmind.google/models/model-cards/gemini-3-1-pro/) |
|---|