AIFreeAPI Logo

Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite: 今すぐ切り替えるべき?

A
13 min readAIモデル比較

2026年3月20日時点では、最小コストと安定性を優先するなら Gemini 2.5 Flash-Lite がまだ有力です。Gemini 3.1 Flash-Lite は、より高い品質が必要で、将来の移行先を今から試したいときに向いています。

Gemini 3.1 Flash-Lite と Gemini 2.5 Flash-Lite の比較カバー画像

2026年3月20日時点で、最小コストと安定運用を優先するなら Gemini 2.5 Flash-Lite がまだ無難なデフォルトです。Gemini 3.1 Flash-Lite は、2.5 Flash-Lite の品質上限に当たり始めていて、より高い料金を払ってでも後継レーンを先に学びたい場合に選ぶ価値があります。 これがこの比較の実用的な答えです。

なぜこの比較が重要なのかというと、Google が同時に二つのメッセージを出しているからです。公式の deprecations ページ では gemini-3.1-flash-lite-previewgemini-2.5-flash-lite の推奨置き換え先になっており、安定版 2.5 Flash-Lite には 2026年7月22日 という最短シャットダウン日も付いています。ところが、公式 pricing ページ では 2.5 Flash-Lite のほうが今もかなり安い。つまり本当の問いは「どちらが新しいか」ではなく、「今すぐ移行するか、待つか、ワークロードごとに分けるか」です。

短く言えば、安いバックグラウンド処理は 2.5 Flash-Lite に残し、品質の差が効く軽量ワークロードだけ 3.1 Flash-Lite へ移し、2026年7月22日までに段階的な移行を終える のが一番現実的です。

要点まとめ

  • Gemini 2.5 Flash-Lite は、今も「安くて安定した lite レーン」です。
  • Gemini 3.1 Flash-Lite は、料金は上がるが品質が大きく伸びる後継レーンです。
  • もし gemini-2.5-flash-lite-preview-09-2025 をまだ使っているなら、移行は先延ばしにしないほうがいいです。
項目Gemini 3.1 Flash-LiteGemini 2.5 Flash-Lite実際の意味
現在の状態PreviewStable3.1 は新しいが、2.5 のほうが運用リスクは低い
Model IDgemini-3.1-flash-lite-previewgemini-2.5-flash-lite置き換えではなく明示的ルーティングが必要
リリース時期2026-03-032025-07-223.1 は新ライン、2.5 は成熟ライン
置き換え / シャットダウンシャットダウン日未発表最短 2026-07-22 に停止、推奨置き換え先は 3.1 Flash-Lite今すぐではないが移行判断は必要
入力価格$0.25 / 1M$0.10 / 1M3.1 は入力が 2.5 倍高い
出力価格$1.50 / 1M$0.40 / 1M3.1 は出力が 3.75 倍高い
標準無料枠現行価格表では表示なしあり安く試すなら 2.5 が有利
Search groundingfree tier 500 RPD、paid tier 1,500 RPD同じgrounding は差分になりにくい
公開 Batch 上限2.5 と同等3.1 と同等公開表では 3.1 に明確な優位はない

この比較は Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash とは性格が違います。2.5 Flash と比べると 3.1 Flash-Lite がコスト面でも魅力的に見える場面がありますが、2.5 Flash-Lite と比べると「強いが高い」が中心テーマになります。

これはスペック比較ではなく移行判断

このキーワードの SERP はまだ薄く、価格表、モデルページ、ベンチマーク、デプリケーション表が別々に出てきます。どれも事実は教えてくれますが、「結局どう動くべきか」までは整理してくれません。

公式ページで今いちばん重要なのは次の事実です。

  • gemini-3.1-flash-lite-preview2026年3月3日 に公開
  • gemini-2.5-flash-lite2025年7月22日 に公開
  • 安定版 gemini-2.5-flash-lite の最短停止日は 2026年7月22日
  • Google の推奨置き換え先は gemini-3.1-flash-lite-preview

ここで特に注意すべきなのが、安定版 2.5 Flash-Lite と古い preview ID は締切が違う ことです。gemini-2.5-flash-lite-preview-09-2025 の最短停止日は 2026年3月31日。この ID をまだ使っている人は、安定版ユーザーよりもずっと急いで移行する必要があります。

価格と無料枠: 3.1 Flash-Lite は強いが、安くはない

Gemini 3.1 Flash-Lite の方が高価で、Gemini 2.5 Flash-Lite が低コストの安定レーンであることを示す比較ボード。
Gemini 3.1 Flash-Lite の方が高価で、Gemini 2.5 Flash-Lite が低コストの安定レーンであることを示す比較ボード。

Google の発表文では 3.1 Flash-Lite は「非常に cost-effective」と表現されています。ただし、それは「2.5 Flash-Lite より安い」という意味ではありません。2026年3月20日時点の価格表では次の通りです。

  • Gemini 3.1 Flash-Lite Preview: input \$0.25、output \$1.50
  • Gemini 2.5 Flash-Lite: input \$0.10、output \$0.40

つまり 3.1 Flash-Lite は:

  • input が 2.5 倍
  • output が 3.75 倍

この差は小さくありません。だからこそ、2.5 Flash-Lite は今でも「安い要約・圧縮・低リスク分類」のレーンとして意味があります。Lite モデルの役割が「十分よく、しかも安いこと」であるなら、3.1 へ全量移行する根拠は弱くなります。

しかも現行の pricing ページでは、2.5 Flash-Lite には標準無料枠があり、3.1 Flash-Lite Preview にはそれが見えません。安価な試用や個人利用では 2.5 がまだ扱いやすいです。

grounding も、今回の比較では大きな差になりません。両方とも現在は:

  • free tier で 500 RPD
  • paid tier で 1,500 RPD

が表示されています。つまり、今の本質的な差はかなり単純です。

  • 2.5 Flash-Lite は安い安定レーン
  • 3.1 Flash-Lite は強いが高い後継レーン

無料枠まわりを詳しく確認したいなら、Gemini API free quota 2026 も合わせて見ておく価値があります。

3.1 Flash-Lite が実際に強くなる点

もっとも説得力のある公式比較は、DeepMind の Gemini 3.1 Flash-Lite ページ です。ここでは 3.1 Flash-Lite と 2.5 Flash-Lite が同じ表に入っています。

主要な行だけ抜き出すとこうです。

指標Gemini 3.1 Flash-LiteGemini 2.5 Flash-Lite優位
Input price$0.25 / 1M$0.10 / 1MGemini 2.5 Flash-Lite
Output price$1.50 / 1M$0.40 / 1MGemini 2.5 Flash-Lite
Output speed363 tokens/s366 tokens/sほぼ同等
GPQA Diamond86.9%66.7%Gemini 3.1 Flash-Lite
MMMU-Pro76.8%51.0%Gemini 3.1 Flash-Lite
SimpleQA Verified43.3%11.5%Gemini 3.1 Flash-Lite
LiveCodeBench72.0%34.3%Gemini 3.1 Flash-Lite
MRCR v2 128k60.1%30.6%Gemini 3.1 Flash-Lite

この差はかなり大きいです。だから 3.1 Flash-Lite は次のようなケースで魅力があります。

  • 後処理を減らしたい翻訳
  • JSON や抽出精度が重要なパイプライン
  • 最初の判断ミスが高くつく routing / triage 層
  • 2.5 Flash-Lite では脆いと感じる軽量コード支援

ただし、これは「すべての lite 仕事を 3.1 に移すべき」という意味ではありません。その品質向上が、増えたコストを回収できるか をワークロード単位で見ないといけません。

Preview リスク、公開上限、移行タイムライン

旧 preview の締切と安定版 2.5 Flash-Lite の移行期限を分けて示すタイムライン。
旧 preview の締切と安定版 2.5 Flash-Lite の移行期限を分けて示すタイムライン。

公式の rate limits ページ には、preview モデルはより厳しい制限になる可能性があり、実際の容量は変わりうると書かれています。これは 3.1 Flash-Lite が必ず不安定という意味ではありませんが、preview を安定版と同じ感覚で全量デフォルトにするのは危険だ、という意味ではあります。

さらに、同じページの公開 Batch API 表では、3.1 Flash-Lite Preview と 2.5 Flash-Lite の上限は同等です。つまり、今の公式公開情報だけでは「3.1 は Batch でも明確に有利」とは言えません。

したがって判断の軸は次の三つです。

  1. 古い preview ID を使っているなら先に移行する
  2. 安定版 2.5 を使っているなら、7月22日までに評価と準備を済ませる
  3. 将来の置き換えが確実なら、今から段階的に学ぶ

どのワークロードを残し、移し、併用するべきか

どのタスクを Gemini 2.5 Flash-Lite に残し、どのタスクを Gemini 3.1 Flash-Lite に移し、いつ両方を併用するべきかを示すルーティング図。
どのタスクを Gemini 2.5 Flash-Lite に残し、どのタスクを Gemini 3.1 Flash-Lite に移し、いつ両方を併用するべきかを示すルーティング図。

いちばん実用的なのは、結論を routing ルールにすることです。

2.5 Flash-Lite に残す:

  • memory compaction
  • bulk summarization
  • low-stakes classification
  • とにかく安く終わればよいバックグラウンド処理

3.1 Flash-Lite へ移す:

  • translation
  • extraction
  • routing
  • 品質差がそのまま価値差になる lite タスク

両方を併用する:

  • mixed traffic
  • phased migration
  • 安い仕事と重要な lite 仕事が混在しているチーム

多くのチームにとって、今の最適解はこの「併用」です。2.5 のコスト優位を残しつつ、3.1 という公式後継レーンを学べます。

後悔しない移行手順

  1. 今の 2.5 Flash-Lite の用途を分解する
  2. 品質差が効くタスクだけ 3.1 を試す
  3. ベンチマークの点数ではなく、総コストと総効果で比べる
  4. 古い preview ユーザーを先に移行する
  5. 実トラフィックで十分確認できるまで 2.5 を fallback として残す

部分移行後に見るべき指標

この比較でいちばん危ないのは、料金表だけを見て「3.1 は高いから損」と決めること、あるいはベンチマークだけを見て「3.1 は強いから全部移すべき」と決めることです。Flash-Lite の移行では、その二つの見方だけでは判断を誤りやすくなります。見るべきなのは、実トラフィックの中でどの仕事が本当に改善され、その改善がどれだけコスト差を打ち返すかです。

たとえば翻訳なら、完成文の見栄えだけでなく、初回出力のあとに何回手直しが必要だったかを見るべきです。抽出や JSON 生成なら、一発で正しい構造が返る率を追うほうが実務に近いです。routing や triage のような入口タスクでは、最初の誤判定が後続コストを増やすので、単純な品質点よりも「最初の判断を外した割合」のほうが重要になることがあります。

実際には、次のような指標を並べて比べると判断しやすくなります。

  • 手修正なしで通った割合
  • リトライ回数と再生成回数
  • 後段のより高価なモデルに送る必要があった割合
  • 1 回の API 呼び出し単価ではなく、1 件の有効結果あたりの総コスト
  • 3.1 から 2.5 に戻した fallback 率

こうして見ると、3.1 Flash-Lite は「いつも高すぎるモデル」でも「常に置き換えるべきモデル」でもないことがはっきりします。安い要約や圧縮では 2.5 が残る場面が多い一方で、抽出、翻訳、routing のように最初の質がそのまま手戻り率に効く仕事では 3.1 のほうが総合的に得になることがあります。移行の正解はモデル名ではなく、仕事単位で決まります。

FAQ

Gemini 3.1 Flash-Lite は Gemini 2.5 Flash-Lite より安いですか?

いいえ。2026年3月20日時点の公式価格表では、3.1 Flash-Lite は \$0.25 / \$1.50、2.5 Flash-Lite は \$0.10 / \$0.40 です。

では、なぜ 3.1 Flash-Lite へ移る価値があるのですか?

DeepMind の公式比較表で、複数の品質指標に大きな差があるからです。品質差がリトライや後処理の削減につながるなら、高い料金でも元が取れます。

両方とも grounding はありますか?

あります。現行価格表では、両方とも free tier 500 RPD、paid tier 1,500 RPD の Search grounding が表示されています。

gemini-2.5-flash-lite-preview-09-2025 を使っているなら今すぐ移行すべきですか?

はい。公式 deprecations ページでは 2026年3月31日が最短停止日になっています。

安定版 2.5 Flash-Lite も今すぐ全部 3.1 に置き換えるべきですか?

普通はそこまで急ぐ必要はありません。まずは 2.5 を安い仕事に残し、価値の高い lite ワークロードだけ 3.1 を試しながら、7月22日までに段階的移行を進めるほうが安全です。

Nano Banana Pro

4K画像80%OFF

Google Gemini 3 Pro Image · AI画像生成

10万+の開発者にサービス提供
$0.24/枚
$0.05/枚
期間限定·企業レベル安定性·Alipay/WeChat
Gemini 3
ネイティブモデル
ダイレクト接続
20ms遅延
4K超高解像度
2048px
30秒生成
超高速
|@laozhang_cn|$0.05獲得

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+