GoogleがGemini 3.5 Flashを正式一般提供(GA: General Availability)しました。100万トークンのコンテキストウィンドウを持ち、コーディングおよびエージェントタスクのベンチマークでGemini 3.1 Proを上回る性能を発揮するとしています。価格は入力1Mトークンあたり1.50ドル、出力1Mトークンあたり9.00ドルで、コスト効率の高さも特徴です。
注目すべきはFlashモデルがProモデルを性能面で超えるという逆転現象です。Gemini 3.5 Flashは出力トークンスループットが前世代の4倍に向上しており、複数ステップのタスクを自律的に実行するエージェントワークフローにおいて応答速度が重要な場面で大きなアドバンテージをもたらします。コーディングベンチマークではAnthropicのClaudeシリーズに迫る性能を示しており、コスト対性能比で見れば現時点でトップクラスとなる可能性があります。Googleによると、Gemini 3.5 Proは7月頃のリリースが示唆されており、Flashを超える性能が期待されます。
X(旧Twitter)では「FlashがProより優秀というのは皮肉だが嬉しい誤算」という感想が広まり、Google I/OでGemini 3.5 Proの発表を期待していた観客がため息をついた場面が話題になりました。r/MachineLearningでは「コーディングベンチマークでClaudeに迫る性能ながらコスト効率が高い」と好評を博しつつも、難解な推論タスクでの回帰(性能後退)が懸念材料として挙げられています。Hacker Newsでは「4倍の出力トークンスループットは実際のエージェントワークフローで大きなアドバンテージ」と実務的な評価が集まっています。
AIモデル市場では「Flashクラス」の高速・低コストモデルが実用面でフロンティアモデルに追いつきつつあり、価格競争はさらに激化しそうです。7月予定のGemini 3.5 Pro次第では、AnthropicのClaudeシリーズとの競争構図が大きく変わる可能性もあります。