Googleが2026年3月3日、コストパフォーマンスを追求した新モデル「Gemini 3.1 Flash-Lite」をプレビュー版として公開しました。入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルという低価格設定ながら、従来のGemini 2.5 Flashと比較して初回応答までの時間が2.5倍高速化、出力速度も45%向上しています。
同モデルは最大100万トークンのコンテキストウィンドウをサポートしており、同価格帯の競合モデルを大きく上回る処理能力を備えています。Arena.aiリーダーボードでは1432のEloスコアを獲得し、同クラスのモデルの中で推論能力とマルチモーダル理解の両ベンチマークでトップクラスの性能を示しています。VentureBeatによると、Pro版の約8分の1のコストで利用可能です。
X(旧Twitter)ではコスト効率の良さに注目が集まっており、「高頻度のAPIコールが必要な用途に最適」との評価が見られます。Hacker Newsでは「Flash系モデルの進化が継続しており、レイテンシ重視のユースケースでの選択肢が増えている」との声が上がっています。翻訳、コンテンツモデレーション、UIの自動生成、シミュレーション作成など、大量のリクエストを低コストで処理する必要があるエンタープライズ向けユースケースでの活用が期待されています。