Model Releases Community 2026-05-16 Source →

Google、Gemini 3.1 UltraとProを正式リリース——200万トークンのネイティブコンテキストでテキスト・画像・音声・動画をフルカバー

Googleは次世代マルチモーダルAIモデル「Gemini 3.1 Ultra」と「Gemini 3.1 Pro」を正式にリリースしました。Ultarは200万トークンのネイティブコンテキストウィンドウを備え、テキスト・画像・音声・動画のすべてのモダリティ（入出力形式）にネイティブで対応。Proはロジカル推論とコーディング性能が大幅に向上しています。

200万トークンというコンテキストウィンドウは、現在公開されている主要モデルのなかでも最大クラスです。技術文書・学術論文・長尺動画を丸ごと入力した上で推論や要約が行える規模で、企業向け用途における競争優位を明確に意識した設計です。さらに、テキスト・画像・音声・動画のすべてに対してネイティブ処理（外部変換ツールを介さない直接処理）ができる点も、マルチモーダル対応としては一歩踏み込んだものとなっています。Gemini 3.1 Proについては、数学的推論や複雑なコーディングタスクにおける精度の大幅な向上が報告されており、コードベースの解析や論理パズルへの適応力が向上しているとのことです。

コミュニティの反応は慎重なものが多く、X上では「ARC-AGI（汎用知能ベンチマーク）スコアの向上は印象的だが、実際のエージェントタスクでの性能はまだ未確認」という指摘が相次いでいます。r/GeminiAIでは「ベンチマーク重視の設計に見えるが、感情的な深さや創造性が低下しているのでは」との懸念も上がっており、Hacker Newsでも「アーキテクチャの最適化は評価できるが、独立した第三者による検証が必要」との声が多数を占めています。

長大なコンテキストとマルチモーダル対応を両立したGemini 3.1 Ultraは、企業ユーザーにとって魅力的な選択肢となる可能性を持っています。ただし、ベンチマークと実運用の乖離という課題はAI業界全体に共通するものであり、実際のユースケースでどこまで威力を発揮するかは、今後の独立評価の蓄積を待つ必要がありそうです。

Google、Gemini 3.1 UltraとProを正式リリース——200万トークンのネイティブコンテキストでテキスト・画像・音声・動画をフルカバー

関連リンク