Googleは2026年2月、推論特化モデル「Gemini 3 Deep Think」の大規模アップグレードをGoogle AI Ultraサブスクライバー向けに正式公開しました。同時に科学者・エンジニア・企業向けのAPIを早期アクセスプログラムとして解放しており、難解な研究課題へのAI活用が本格的に始まっています。
Google DeepMindによると、今回のアップグレードはARC-AGI-2(AIの汎用推論を測定するベンチマーク)で84.6%という前例のないスコアを達成し、ARC Prize財団によって検証されています。また、フロンティアモデルの限界を測定する「Humanity's Last Exam」では48.4%を記録しました。科学分野での実用性も実証されており、ラトガース大学の数学者がDeep Thinkを使って人間の査読を通過してしまっていた論文の論理的欠陥を発見したほか、デューク大学のWangラボでは半導体材料の結晶成長製造プロセスの最適化に活用されています。
X(旧Twitter)では「科学・エンジニアリング用途ではGPT-5を上回るとの声。Googleがついに本気出した」という評価が広がっています。r/MachineLearningではベンチマーク解析スレッドが立ち上がり、数学・コーディング分野での好成績が次々と報告されています。Hacker Newsでは「専門推論モデルの差別化戦略として興味深い」と概ねポジティブな評価が寄せられています。
Gemini 3 Deep ThinkはGoogle AI Ultraサブスクリプション(月額20ドル)に追加料金なしで含まれており、一般向けの敷居は低く設定されています。Gemini 3.1 Deep Thinkも近くリリース予定とされており、Googleは汎用AIから専門推論AIへの展開を着実に加速させています。