Model Releases Community 2026-05-04 Source →

Google Gemini 3.1 Ultra公開——200万トークンコンテキストとネイティブマルチモーダル推論で全コードベース一括処理が現実に

Googleは最新フラッグシップモデル「Gemini 3.1 Ultra」を公開しました。最大の特徴は200万（2M）トークンというコンテキストウィンドウで、これは現在公開されているAIモデルの中で最大級です。動画・音声・画像・テキストを同時に処理するネイティブマルチモーダル推論に対応しており、Google AI Studio、Gemini API、Gemini.google.com（Advancedプラン）で利用可能となっています。

2Mトークンがもたらす実務インパクト

Google DeepMindの発表によると、Gemini 3.1 Ultraの2Mトークンコンテキストウィンドウは書籍全冊・大規模コードベース・Webサイト全体を1つのプロンプトで処理できる規模に相当します。マルチモーダル面では、グラフや図表の読み取り・動画フレーム解析・ライブ動画分析といった機能が大幅に強化されました。コード実行においては、サンドボックス環境でPythonコードを直接書いて実行し、出力を観察しながら修正するCode Executionツールが組み込まれており、サードパーティのプラグインは不要です。ベンチマーク比較ではHumanEval（コード生成）とMMLU Proでそれぞれ GPT-5を上回っており、100万トークンにおける長文コンテキスト再現精度でもGPT-5とClaude 3.7を超えているとされています。

X（旧Twitter）では「2Mコンテキストで全コードベースを一括処理できる——実務での活用シーンが一気に広がる」という高い評価が目立ちます。一方Hacker Newsでは「以前のGeminiと比べて大幅な改善は認めるが、Claude Opusとの比較では創造性や多段階推論でまだ差がある」という冷静な指摘もあり、実際の業務投入には詳細な評価が必要だという声も上がっています。

2Mトークンコンテキストの実用化は、長文法律文書の一括審査・大規模ソフトウェアの全コード解析・長時間の会議録トランスクリプト処理など、これまで分割処理が必要だった業務を一気通貫で扱えるようにするという点で業界に大きなインパクトを与えます。今後はAnthropicやOpenAIも同水準以上のコンテキスト長を競ってリリースする流れが加速するものと見られます。

Google Gemini 3.1 Ultra公開——200万トークンコンテキストとネイティブマルチモーダル推論で全コードベース一括処理が現実に

2Mトークンがもたらす実務インパクト

関連リンク