Model Releases Community 2026-04-03 Source →

Google、Gemini 3.1 Proを開発者向けプレビュー公開 — ARC-AGI-2で77.1%、100万トークンコンテキストを実現

Googleは2026年4月、最新AIモデル「Gemini 3.1 Pro」の開発者・エンタープライズ向けプレビューを公開しました。100万トークン（約75万〜100万英単語相当）のコンテキストウィンドウを持ち、汎用知能の指標として注目されるARC-AGI-2ベンチマークで77.1%のスコアを達成。テキスト・画像・音声・動画・コードのマルチモーダル推論に対応するフラッグシップモデルとして、AIモデル競争に新たな局面をもたらしています。

ARC-AGI-2スコア77.1%の意味

ARC-AGI（Abstraction and Reasoning Corpus）は、人間の汎用知能に近いパターン認識能力を測る難易度の高いベンチマークです。Googleの公式ブログによると、Gemini 3.1 ProはARC-AGI-2において77.1%を記録しており、これは前世代モデルや競合他社製品を大幅に上回る数値とされています。X上では「AGIへの一歩」という表現が飛び交い、このスコアへの驚きが広がりました。ただし、ベンチマークに最適化された結果を実際の知的作業能力と直結させることへの慎重論も少なくありません。

100万トークンのコンテキストウィンドウという仕様も、実用面で大きな意味を持ちます。書籍数冊分のテキストを丸ごと入力して分析したり、巨大なコードベースを一度に読み込んでデバッグしたりといった用途が現実的になります。Hacker Newsでは「100万トークンコンテキストの実用性」に関する議論が活発に行われ、特にNotebookLMへの統合が高く評価されているコメントが上位を占めました。Googleが長文処理を前提としたプロダクト戦略を取っていることが改めて浮き彫りになっています。

Redditでは、ClaudeやGPT-5.4との比較ベンチマーク議論が活発に展開されており、「実タスクでの差は僅差」との報告が多く見られます。ベンチマーク上の数字が大きく離れていても、実際の生産性向上という観点では各モデルが似通ったパフォーマンスを示しているという現実が浮かび上がってきます。

現時点ではプレビュー段階であり、一般向けの正式リリース時期や料金体系は未公表です。開発者向けAPIのアクセス申請が始まっており、今後数週間で本格展開が進む見込みです。NotebookLMやGoogle Workspaceへの統合が進めば、企業ユーザーへの恩恵は一段と大きくなるでしょう。

Google、Gemini 3.1 Proを開発者向けプレビュー公開 — ARC-AGI-2で77.1%、100万トークンコンテキストを実現

ARC-AGI-2スコア77.1%の意味

関連リンク