2026年3月20日時点で先に結論を言うなら、coding・agentic・multimodal の品質を優先するなら Gemini 3 Flash、低コスト・Stable・無料 grounding を優先するなら Gemini 2.5 Flash です。 このキーワードの本当の論点は「新しい方が強いか」ではなく、「いま使っている 2.5 Flash をどこまで 3 Flash に置き換えるべきか」です。
混乱しやすいのは、Google の公式情報が両方の方向を示しているからです。公式の deprecations page では gemini-2.5-flash の shutdown date が 2026年6月17日 とされ、推奨置き換え先は gemini-3-flash-preview です。一方で公式の pricing page を見ると、Gemini 3 Flash は 2.5 Flash より高く、rate-limits page では Preview モデルの方が制約が厳しくなりやすいと明記されています。
つまり、これは単純な「最新版に更新するだけ」の話ではありません。能力は 3 Flash の方が上ですが、2.5 Flash にもまだ残る価値があります。
要点まとめ
- Gemini 3 Flash を優先すべき場面: coding agents、tool-heavy assistants、multimodal reasoning、品質上限が重要なプロダクト
- Gemini 2.5 Flash を残すべき場面: high-volume の軽量テキスト処理、保守的な本番 default、無料 grounding を使う低コストな検証
- 移行準備は後回しにしない: Google はすでに Gemini 3 Flash を 2.5 Flash の replacement path として示しています
公式情報を実務目線で圧縮すると次のとおりです。
| 項目 | Gemini 3 Flash | Gemini 2.5 Flash | 実務での意味 |
|---|---|---|---|
| 現在の状態 | Preview | Stable / GA | 3 Flash は次の主力候補、2.5 Flash は今の安定 default |
| Model ID | gemini-3-flash-preview | gemini-2.5-flash | pinned model を使うなら移行は明示的に行うべき |
| リリース日 | 2025年12月17日 | 2025年6月17日 | 3 Flash は新世代 |
| ライフサイクル | shutdown date 未発表 | 2026年6月17日終了予定 | 2.5 を使い続ける判断には期限がある |
| 推奨置き換え先 | N/A | gemini-3-flash-preview | Google 自身が移行先を指定している |
| Standard price | $0.50 input / $3.00 output | $0.30 input / $2.50 output | 3 Flash はより高価 |
| Batch price | $0.25 / $1.50 | $0.15 / $1.25 | batch でも 2.5 の方が安い |
| Context / output | 1,048,576 / 65,536 | 1,048,576 / 65,536 | token limit は決定的な差ではない |
| Grounding | paid monthly allowances | free Search 500 RPD、free Maps 500 RPD | 2.5 は grounded prototype に向く |
| Thinking control | thinking_level | thinking_budget | 移行時に設定の考え方も変わる |
| Computer Use | 対応 | Gemini API page では未記載 | 3 Flash は agentic workflow 向き |
実務では、この表を「どちらが勝ちか」ではなく「どの経路にどちらを置くか」の表として読むのが重要です。code generation、tool orchestration、multimodal analysis のように失敗コストが高い経路では、Gemini 3 Flash の追加コストは十分に回収しやすくなります。逆に大量の summarization、extraction、routing のように unit economics が支配的な経路では、Gemini 2.5 Flash の単価差がそのまま月次コスト差になります。
つまり、2026年3月20日時点での最適解は単純な置き換えではなく、split-routing に近い発想です。品質上限が必要な経路から 3 Flash に寄せ、コストと安定性が重要な経路は 2.5 Flash を残す。この整理を先にしておくと、6月17日の shutdown date が近づいても慌てずに移行を進められます。
なぜ launch の印象だけで決めると危ないのか
公式の launch post や DeepMind page が示す通り、Gemini 3 Flash は単なるマイナー更新ではありません。DeepMind の表では Gemini 2.5 Flash に対して次のような優位があります。
- GPQA: 90.4 vs 82.8
- MMMU-Pro: 81.2 vs 66.7
- SWE-bench Verified: 78.0% vs 60.4%
- FACTS: 61.9% vs 50.4%
- MCP Atlas: 57.4% vs 8.8%
この差を見る限り、coding、tool use、multimodal、factuality を重視するなら Gemini 3 Flash は確かに魅力的です。実際、release notes では 2026年1月21日 に gemini-flash-latest が gemini-3-flash-preview へ切り替えられています。
ただし API の判断では、それだけでは足りません。Gemini 3 Flash はより強い代わりに、
- 価格が高い
- まだ Preview
- thinking controls の扱いが変わる
というコストがあります。Gemini 2.5 Flash は能力では見劣りしても、安くて Stable、grounding も使いやすい。この差が本番の default 選択を難しくします。
2026年3月20日時点の料金、grounding、終了日

公式 pricing page にある現在の standard pricing は次の通りです。
- Gemini 3 Flash Preview:
\$0.50input、\$3.00output - Gemini 2.5 Flash:
\$0.30input、\$2.50output
batch でも同じ傾向です。
- Gemini 3 Flash batch:
\$0.25input、\$1.50output - Gemini 2.5 Flash batch:
\$0.15input、\$1.25output
つまり 3 Flash は「同じ値段でより強い」わけではありません。2.5 Flash より高価です。大量の要約や抽出、分類パイプラインではこの差がそのままコストに効きます。
Grounding の差も見逃せません。現在の pricing page では:
- Gemini 2.5 Flash: free Search grounding 最大 500 RPD、free Maps grounding 最大 500 RPD
- Gemini 3 Flash Preview: 同じ free-tier grounding の見せ方ではなく、paid-tier 側の monthly allowance ベース
grounded assistant や検索補助型プロダクトでは、この違いはとても大きいです。
そして lifecycle。公式 deprecations page には:
gemini-2.5-flashrelease date: 2025年6月17日- shutdown date: 2026年6月17日
- recommended replacement:
gemini-3-flash-preview
とあり、gemini-3-flash-preview には shutdown date がまだ出ていません。
つまり 2.5 Flash を今すぐ全廃する必要はありませんが、「長期 default のままでいい」と考えるのも危険です。
特に production 側で見落としやすいのは、コスト差とライフサイクル差が別方向に効くことです。短期的には 2.5 Flash の方が安くて導入しやすいのに、中長期では 3 Flash へ寄せる準備を進めないと deadline が近づいた時に一気に負債として返ってきます。だからこそ、今のうちに route ごとの採算と移行優先度を分けて考えるべきです。
grounding 依存のユースケースでも同じです。無料 Search / Maps grounding を活かして 2.5 Flash を残す判断は合理的ですが、その場合でも「どこまでを low-cost lane として残すのか」「どの経路は quality lane として 3 Flash に上げるのか」を明文化しておかないと、後で routing が曖昧なまま広がります。
Gemini 3 Flash が 2.5 Flash に対して本当に増やしてくれるもの

Gemini 3 Flash を単に「少し賢い 2.5 Flash」と考えると、移行価値を見誤ります。
現在の Gemini 3 Flash API page と Vertex AI page では、次の差分が前面に出ています。
- Computer Use
- multimodal function responses
- streaming function call arguments
- media resolution control
- thinking_level
これは coding agents、tool orchestration、search-heavy assistants、multimodal products のような本当に複雑な workflow で効いてきます。
さらに重要なのは、単なる benchmark 勝利ではなく、設定の考え方そのものが変わることです。Vertex AI では、以前 Gemini 2.5 Flash で thinking_budget: 0 を使っていた場合、Gemini 3 Flash では thinking_level: MINIMAL から始めるよう案内しています。つまり prompt が同じでも、latency や cost の挙動を自動的に同一視してはいけません。
ここは migration で特に事故が起きやすい部分です。多くのチームは prompt 互換性だけを見がちですが、実際には tool call の出方、応答の長さ、reasoning の深さ、latency のばらつき、成功タスクあたりの実効コストまで含めて比較しないと意味がありません。Gemini 3 Flash の価値は、単に benchmark が高いことではなく、複雑な workflow で failure rate を下げられる可能性にあります。
だからこそ、3 Flash を採用するなら「高いが強い」で終わらせない方がいいです。どの経路で retry が減るのか、どのケースで human escalation を減らせるのか、どの multimodal task で品質差が顧客体験に直結するのかまで見て初めて、追加コストを払う意味が明確になります。
それでも Gemini 2.5 Flash を残す意味があるケース
Gemini 2.5 Flash は、今でも少なくとも次のケースで合理的です。
1. コスト感度が非常に高い workload
分類、要約、抽出、routing など high-volume の軽量処理では、単価の安さがまだ重要です。
2. Stable default を維持しながら段階的に評価したい場合
2.5 Flash は Stable / GA、3 Flash は Preview です。この違いは本番運用ではまだ意味があります。
3. 無料 grounding が重要な場合
free Search / Maps grounding を使った検証や初期運用では 2.5 Flash の方が扱いやすいです。
要するに、2.5 Flash を支持する一番強い理由は「能力が高いから」ではなく、安く、安定していて、grounded workload の入り口として便利だからです。
さらに 2.5 Flash は比較用の baseline としても有用です。3 Flash を route 単位で評価する時、Stable な既存経路が残っていると latency、cost、incident rate を相対比較しやすくなります。移行対象を増やしながらも rollback しやすい構成を作れるので、運用上の安心感がかなり違います。
ワークロード別の選び方
| ワークロード | まず選ぶべきモデル | 理由 |
|---|---|---|
| coding agents / developer tools | Gemini 3 Flash | benchmark と feature 差分が明確 |
| tool-heavy assistants | Gemini 3 Flash | reasoning、tool use、Computer Use の差が大きい |
| 品質重視の search-heavy product | Gemini 3 Flash | 上位能力が活きやすい |
| budget-first summarization / extraction | Gemini 2.5 Flash | cost が勝つ |
| 安価な grounded prototype | Gemini 2.5 Flash | free grounding が便利 |
| 低リスク本番 default | Gemini 2.5 Flash を当面維持 | Stable の価値がある |
| greenfield で capability first | Gemini 3 Flash | Google が押している Flash 新路線 |
現時点の実務的な推奨は次の通りです。
- 新しい能力重視プロダクト: Gemini 3 Flash から始める
- 既存の低コスト大規模フロー: Gemini 2.5 Flash を残しつつ部分移行する
- 分流できるなら分流する
既存システムでは、これを policy として明文化しておくと運用が楽になります。たとえば coding、agentic automation、multimodal support は Gemini 3 Flash。bulk summarization、cheap extraction、grounded FAQ は Gemini 2.5 Flash。境界が曖昧な route だけを A/B eval に送り、success rate、latency、cost per completed task で判定する。この形なら、モデル選択が感覚論ではなく観測可能なルールになります。
どう移行すれば失敗しにくいか

最悪なのは model name を置き換えるだけの blind swap です。
良いのは staged rollout です。
1. alias を使っていないか確認する
release notes では gemini-flash-latest が gemini-3-flash-preview に切り替わっています。alias を使っているなら、すでに一部が移行済みかもしれません。
2. workload ごとに eval を分ける
- coding / agentic
- chat / support
- grounded search
- extraction / summarization
- multimodal
3. thinking controls を再調整する
thinking_budget と thinking_level は同じではありません。latency / cost / quality の再検証が必要です。
4. quality / latency / cost を同時に見る
どれか一つだけを見ると、移行判断を誤ります。
5. fallback を持ったまま cutover する
2.5 Flash は今日消えるわけではありません。shutdown date が見えている今こそ、急がずに、でも先延ばししすぎずに移行するべきです。
シンプルなカレンダー感覚で言えば:
- 今から4月: alias audit と workload-based eval
- 4月から5月: 価値が大きい route を先に移す
- 6月17日まで: 残りの
gemini-2.5-flash固定経路を閉じる
rate limits の背景は、現時点では英語 fallback の方が詳しいため、必要なら Gemini API rate limits per tier を参照してください。
加えて、cutover 前に rollback 条件を決めておくべきです。たとえば P95 latency の悪化、tool-heavy task の success rate 低下、manual escalation の増加、completed task あたりの実効コスト上昇などです。これらを先に決めておけば、移行後の判断が「なんとなく不安」ではなく、明確な運用基準になります。
最後に重要なのは、移行を global な model ID 置換だけで済ませないことです。どの prompt がどの route に結びつくのか、どの tools を使うのか、どの eval dataset を pass したら rollout を広げるのかまで整理しておくと、deadline 直前に慌てて repo 全体を洗う必要がなくなります。
FAQ
Gemini 3 Flash は Gemini 2.5 Flash より良いですか。
総合的な capability ceiling では yes です。reasoning、coding、multimodal、agentic、factuality の多くで 3 Flash が優勢です。ただし、それが即「すべての production default を今日から 3 Flash にすべき」という意味ではありません。
今すぐ移行するべきですか。
今すぐ evaluation と staged rollout を始めるべきです。blind full migration は不要でも、準備を先延ばしにする理由はもうありません。
Gemini 2.5 Flash はまだ使う価値がありますか。
あります。安く、Stable で、grounding の入り口としても便利です。短中期の default route として合理的です。
見落とされやすい移行の落とし穴は何ですか。
thinking_budget から thinking_level への移行です。設定の考え方が変わるので、latency と cost は再評価が必要です。
