
Googleは、既存のGemini 2.5 Proよりも軽量かつ高速なモデル「Gemini 2.5 Flash」を発表しました。現在、Google AI StudioおよびVertex AIのGemini APIを通じて利用可能です。
このモデルは、速度とコスト効率を向上させつつ、段階的な思考を促すハイブリッド推論機能を採用し、応答品質、コスト、速度のバランスを柔軟に調整できるよう設計されています。推論機能をオフにした状態でも高速な応答を維持し、全体的な性能も向上しています。実際、LMArenaの「Hard Prompts(難易度の高い質問)」部門では、Gemini 2.5 Proに次いで2位を獲得しました。