← 2026-06-16
Model Releases Community 2026-06-16 Source →

Google Gemini 3.5 Flash正式リリース——毎秒284トークン・入力$1.5/百万トークンで速度と低価格を両立

GoogleがGemini 3.5 Flashを正式リリースしました。毎秒284トークンという高速推論と、入力$1.5・出力$9(百万トークンあたり)という低価格を組み合わせており、リアルタイム応答が求められるアプリケーションや大量処理が必要なバックエンド用途で注目を集めています。インテリジェンス指数は55を記録しています。

開発者が注目する「速さとコスト」の両立

毎秒284トークンという推論速度は、現行の主要モデルの中でもトップクラスです。X(旧Twitter)では「284トークン/秒はリアルタイムアプリに革命的——HaikuやFlashより速い」という開発者の絶賛コメントが多く見られました。チャットボットや音声アシスタント、ライブ字幕生成など、レイテンシ(応答遅延)が直接UXに影響するユースケースでの採用が進む見込みです。

価格面では、入力$1.5/出力$9(百万トークン)という設定がAnthropicのClaude Haiku 4.5と競合する位置づけです。Redditのr/LocalLLaMAではGemini 3.5 FlashとClaude Haiku 4.5のコスト比較が活発に行われており、タスク種別によってどちらが有利かを実測する投稿が増えています。ただし、Hacker NewsではGoogle APIの安定性やレート制限への懸念も指摘されており、価格の安さが即座に移行の理由になるかどうかは用途次第という冷静な見方もあります。

「Flash」の位置づけと今後

Googleの「Flash」シリーズはProなどの上位モデルと異なり、精度よりも速度・コスト効率を優先したラインナップです。Gemini 3.5 Flashのリリースにより、開発者はProクラスの知性を必要としない処理をFlashに任せ、コストを抑える「ハイブリッド設計」がしやすくなります。生成AIの普及に伴いAPIコストの最適化が重要課題となる中、Gemini 3.5 FlashはGoogle Cloud上のコスト管理における有力な選択肢として定着しそうです。

関連リンク