2026年5月19日のGoogle I/O 2026で予告されたGemini 3.5 Proが、200万トークンのコンテキスト窓と「Deep Think」推論モードを搭載して6月中に一般公開(GA)される見込みだ。6月7日時点ではGoogle Cloud Vertexの限定プレビュー段階にあり、Sundar Pichai CEOがI/Oの場で「あと1カ月待って」と述べてから間もなく正式リリースが実現しそうだ。
TechTimesの報道によると、Gemini 3.5 Proの200万トークンというコンテキスト窓は、大規模なコードベース全体・長編ドキュメント・長時間の会話をすべてワーキングメモリに保持できる規模で、前世代からの大きな飛躍となる。「Deep Think」モードは複雑な問題に対してより深く推論することに重点を置いた機能であり、Googleが推論能力の向上に注力していることを示している。価格については、過去世代の比率(FlashのProに対する比率)から試算すると、入力が100万トークンあたり15ドル、出力が60ドル程度になると予測されている。現時点では限定Vertexプレビューの段階であり、APIおよびGeminiアプリへの一般提供タイムラインは「6月内」とされているが、正確な日程は明らかにされていない。Gemini APIのリリースノートでは、Gemini 3.5 FlashがすでにGA済みであり、Proバージョンが待機中の状態となっている。
I/Oでの「来月まで待って」という発言は早速X上で波紋を呼び、「Googleはまたやらかした」との揶揄ツイートが多数投稿された。r/MachineLearningでは200万トークンコンテキストをRAGシステムと組み合わせた実用ユースケースへの期待が高まり、技術的な議論が活発化している。一方、HackerNewsでは予測価格の出力60ドル/100万トークンという数字に対して「コスト対効果の見極めが必要」との指摘が多く、OpenAIやAnthropicとの価格競争力が焦点となっている。
Gemini 3.5 ProのGAが実現すれば、200万トークンという業界最大クラスのコンテキスト窓を持つ商用モデルとして、長文処理・エンタープライズ向けRAGアプリケーション・複雑な推論タスクなどで強力な選択肢となり得る。Anthropic・OpenAIとの三つどもえの競争がさらに激化しそうだ。