如果你说的是 gemini-2.5-flash-lite-preview-09-2025,答案是:它已经被 Google 列入 2026 年 3 月 31 日下线倒计时,而稳定版 gemini-2.5-flash-lite 是独立模型线。官方文档把两者分开列出,稳定版当前下线日期是 2026 年 7 月 22 日。这篇文章只解决一个决策问题:你现在是否需要立刻迁移,以及该迁移到哪里。
之所以会混乱,是因为 Google 公开文档里同时出现了三层 Flash-Lite 生命周期:已经退役的 06-17 预览版、即将下线的 09-2025 预览版,以及仍在运行的稳定版 gemini-2.5-flash-lite。再叠加 Vertex AI 公共页面仍显示 09-2025 预览版本,很多人会误判下线公告是不是“只下了一部分”。真实问题不是家族名,而是你代码或提示词到底绑的是哪个端点,以及你跑在 Gemini API / Google AI Studio 还是其他产品表面。
要点速览
gemini-2.5-flash-lite-preview-09-2025才是 2026 年 3 月 31 日下线倒计时里的那个端点。- stable
gemini-2.5-flash-lite是另一条线,Google 当前文档给出的下线日期是 2026 年 7 月 22 日。 - 官方继任模型是
gemini-3.1-flash-lite-preview,但价格明显更高,不能当“免费改名”。
如果你只要可执行答案,先看这张表,再跳到对应小节。
| 你当前在用什么 | 公开文档里的当前状态 | 你该关注的日期 | 现在最优动作 |
|---|---|---|---|
gemini-2.5-flash-lite-preview-09-2025 | 已弃用预览版 | 2026 年 3 月 31 日 | 立即安排迁移;Google 推荐替代为 gemini-3.1-flash-lite-preview |
gemini-2.5-flash-lite | 稳定版 | 2026 年 7 月 22 日 | 今天不用紧急改名;先做基准测试和成本评估 |
gemini-3.1-flash-lite-preview | 当前预览继任线 | Gemini API 文档暂未给下线日 | 想走官方继任路线就先测这条 |
| Vertex AI 页面仍显示预览版本 | 表面差异导致歧义 | 先看你真实调用的产品表面和端点行为 | 批量替换前先确认,但不要忽视 Gemini API 的弃用信号 |
gemini-flash-lite-latest 或封装别名 | 别名解析风险 | 取决于别名当前实际指向 | 先解析成真实模型字符串,再判断是否安全 |
关键点是:这次“下线”说的是端点,不是家族名。你的代码、提示词工具或配置里如果只写了 “Flash-Lite”,其实还没回答“是否紧急”的核心问题。
Gemini 2.5 Flash-Lite Preview 真的在下线吗?

对 Gemini API 而言,最干净的官方结论是:gemini-2.5-flash-lite-preview-09-2025 计划在 2026 年 3 月 31 日下线。 Google 在公开 Gemini deprecations 页面 里直接写了这一点,同一张表也把 gemini-3.1-flash-lite-preview 标为推荐替代。
很多人仍然不放心,是因为 Google 的公开文档并不是一条线叙述。看 changelog 会发现生命周期是分段出现的:
gemini-2.5-flash-lite-preview-06-17在 2025 年 6 月先出现- stable
gemini-2.5-flash-lite在 2025 年 7 月上线 gemini-2.5-flash-lite-preview-09-2025在 2025 年 9 月后续上线- 到 2026 年 3 月,Google 宣布 09-2025 预览版将在 3 月 31 日下线
这意味着“Gemini 2.5 Flash-Lite Preview”这个短语在历史上可以指多个模型 ID。有人记住的是旧别名、AI Studio 选择器,或某个月份的社区帖子,即使家族名记对了,也可能把端点记错。这就是为什么很多人明明看过官方文档,还是不确定。
另一个混淆源在产品表面。Gemini API 的公开文档明确给了 2026 年 3 月 31 日的下线日期;但公开的 Vertex AI Flash-Lite 页面 仍把 gemini-2.5-flash-lite-preview-09-2025 作为预览版本展示在 GA gemini-2.5-flash-lite 旁边。所以稳妥说法不是“Google 全面关停 Flash-Lite Preview”,而是:
Google 的 Gemini API 生命周期文档已将 gemini-2.5-flash-lite-preview-09-2025 列为 2026 年 3 月 31 日下线;稳定版 gemini-2.5-flash-lite 是独立线路。由于公开 Vertex 文档仍显示该预览版本,你在改生产路由前应先确认自己所在的产品表面。
这比一句“是/否”更麻烦,但这是公开来源能支持的准确表述。
最容易混淆的地方:预览端点、稳定模型、旧预览 ID 是三件事

这个关键词下很多页面的问题,是只回答家族名,不回答端点。结果看起来很“紧急”,但对排障没有执行价值。你至少要分清三件事。
第一,stable gemini-2.5-flash-lite。Google 的模型页面把它标为当前 2.5 家族的低成本多模态稳定模型,同时把 gemini-2.5-flash-lite-preview-09-2025 标成 Deprecated。仅这一个版本区块就足以反驳“Preview 下线 = Flash-Lite 已死”这种常见误读。
第二,09-2025 已弃用预览端点。这才是 2026 年 3 月 31 日截止日对应的模型字符串。如果你的代码、配置、保存的提示词界面或封装默认值里出现这个完整 ID,就应按紧急迁移处理。
第三,更早的 06-17 预览端点。那条线已经是旧事件。Google changelog 在 2025 年 11 月 4 日的弃用公告里写过,它在 2025 年 11 月 18 日就下线了。这个历史细节有价值,因为它解释了为什么不少社区帖子、复制代码或老截图也在说“Flash-Lite Preview”,但说的可能是另一轮下线。
所以仅仅在仓库里搜 “Flash-Lite” 不够。要搜完整模型字符串:
bashrg "gemini-2.5-flash-lite-preview-09-2025|gemini-2.5-flash-lite|gemini-flash-lite-latest"
如果只看到 gemini-2.5-flash-lite,你不属于 3 月 31 日紧急桶。看到 gemini-2.5-flash-lite-preview-09-2025,就属于。看到 gemini-flash-lite-latest 这类别名,则要先搞清它当前解析到哪条线,不能想当然。
这一点比想象中更关键。团队通常会改主应用代码,但容易漏掉:
.env文件- 内部管理工具
- 保存的提示词模板
- notebooks
- 评测脚本
- batch 作业
- 包装层默认值
下线事故很少只出在主路径,通常是某个被遗忘的配置面残留了旧 ID。
现在应该切换到什么
gemini-2.5-flash-lite-preview-09-2025 的官方替代是 gemini-3.1-flash-lite-preview。这来自 deprecations 页面;如果你的目标是跟随官方继任路线,这就是第一优先测试 ID。
但这不等于所有团队都该把迁移当成“无脑改名”。你需要先回答两个实际问题:
- 你当前是否真的跑在已弃用预览端点上?
- 你要的是官方继任路线,还是更看重 2.5 Flash-Lite 的最低成本经济性?
如果你在 Gemini API 或 Google AI Studio 里确实用的是 gemini-2.5-flash-lite-preview-09-2025,最直接官方迁移路径是:
textgemini-2.5-flash-lite-preview-09-2025 -> gemini-3.1-flash-lite-preview
如果你的核心业务目标是“尽量维持最便宜的 Flash-Lite 线路”,那 stable gemini-2.5-flash-lite 仍是实际可用线路,官方模型页也仍可见,且公开价格与已弃用预览版同档。它不是 Google 在该弃用公告里明确给出的“官方继任”,所以不该写成标准答案;但对于更重视价格纪律和稳定状态的团队,它依然是合理的运营选项。
这一点也和我们已发布的 Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite 对比解读 一致。简化成一句话:
- 想走官方继任路径:用
gemini-3.1-flash-lite-preview - 想把最低成本稳定线维持更久:先留在
gemini-2.5-flash-lite
最不该做的是盲目切到 3.1,然后对账单上涨感到意外。官方替代并不是同价替换。
价格、限额与迁移风险到底变了什么
这是迁移真正会“疼”的部分。
在官方 pricing 页面 上,stable gemini-2.5-flash-lite 与 deprecated gemini-2.5-flash-lite-preview-09-2025 目前公开价格一致;官方继任模型并不一致。
| 模型 | 状态 | 标准输入价格 | 标准输出价格 | 实操结论 |
|---|---|---|---|---|
gemini-2.5-flash-lite-preview-09-2025 | 已弃用预览版 | $0.10 / 1M | $0.40 / 1M | 便宜,但已进入 3 月 31 日下线倒计时 |
gemini-2.5-flash-lite | 稳定版 | $0.10 / 1M | $0.40 / 1M | 公开经济性相同,下线日期更晚(7 月 22 日) |
gemini-3.1-flash-lite-preview | 当前预览继任线 | $0.25 / 1M | $1.50 / 1M | 官方替代,但价格显著更高 |
也就是说,推荐替代模型目前是:
- 输入 贵 2.5 倍
- 输出 贵 3.75 倍
这是很多页面埋得很深的信息。用户不只想知道“会不会下线”,还想知道迁移会不会悄悄把本来选低成本线路的账单打穿。
限额问题更微妙。官方 rate-limits 页面 说明预览模型可能更受限,并建议在 AI Studio 查看你的实际限制。与此同时,公开 Batch API 表格目前又显示 Gemini 2.5 Flash-Lite 与 Gemini 2.5 Flash-Lite Preview 的批处理排队 token 上限一致。所以稳妥结论不是“3.1 吞吐一定更好”,而是:
- 公开文档暂时没有给出一个可以单凭吞吐就证明迁移必要性的明确优势
- 预览模型的限额行为仍可能比稳定版更不可预测
- 迁移核心理由主要是生命周期与模型能力,不是公开批处理容量优势
因此正确问题不是“新名字是什么”,而是“在被强制离开旧预览线之前,3.1 这条线能不能创造足够价值,抵消更高 token 成本”。
如果你还要看更完整的配额与账单背景,下一步建议看我们的 Gemini API 分层速率限制指南(英文) 和 Google Gemini API 定价 2026。
改名后仍报错怎么排查:Gemini API、Google AI Studio、Vertex AI

这部分是当前搜索结果最常跳过的。很多用户确实改了模型名,却仍觉得迁移失败。通常不是下线公告有误,而是旧引用藏在另一个产品表面。
Gemini API
如果你的应用通过 Gemini Developer API 明确调用 gemini-2.5-flash-lite-preview-09-2025,请把它当成正在进行中的迁移项。Gemini API 生命周期文档已经足够明确,没必要等到 3 月底才改。先有意识地替换模型字符串,再用最小请求做回归,之后再排查其他问题。
Google AI Studio
如果旧 prompt、模板或工作区还引用已弃用预览 ID,本质和 API 代码中的旧引用是同一个问题,只是位置不同。AI Studio 场景里最常见的漏改点是:
- 保存的提示词工作区
- 内部截图
- onboarding 文档
- 复制出来的 notebooks
所以当 AI Studio 用户说“上周还可用”,不要马上推断官方公告不准。先核对他是不是在用旧保存模板、另一个项目,或没人审计过的别名路径。
Vertex AI
这是最难一次性讲清的表面,因为公共文档本身存在歧义。Vertex AI 的 Flash-Lite 页面仍显示 stable gemini-2.5-flash-lite 为 GA,同时也保留 gemini-2.5-flash-lite-preview-09-2025 预览版本区块。你不该在内部发“一刀切”公告说“Flash-Lite Preview 全部消失了”;但也不该因为 Vertex 页面仍可见预览行,就忽视 Gemini API 生命周期信号。
更稳妥的运营规则是:
- 你在 Gemini Developer API 或 Google AI Studio:迁移时间以 Gemini API 生命周期页面为准
- 你在 Vertex AI:先在自己项目里确认真实端点行为再批量替换,但不要假设预览线会无限期保留
这不是最“爽快”的答案,但比假装公开资料完全一致更安全。
安全迁移检查清单
如果这个关键词来自真实生产流量,建议按这个顺序执行:
- 搜完整的已弃用模型 ID,而不是只搜家族名。
- 在所有引用位置把预览
gemini-2.5-flash-lite-preview-09-2025和稳定gemini-2.5-flash-lite明确分开。 - 明确你的主目标是官方继任
gemini-3.1-flash-lite-preview还是更便宜的稳定 2.5 线。 - 先用一个最小请求回归,再排查复杂 prompt 或流水线。
- 审计保存的 prompts、wrapper、notebook、部署配置里是否残留旧模型字符串。
- 如果你在 Vertex AI,先确认当前表面真实行为,再做批量替换。
- 把 3.1 Flash-Lite Preview 上线前后的成本模型重算一遍,尤其是高流量任务。
如果你只想要一个可落地默认策略,就是这三条:
- 现在就迁移:当你明确绑定在
gemini-2.5-flash-lite-preview-09-2025 - 不用恐慌:当你已经在 stable
gemini-2.5-flash-lite - 不要把 3.1 当免费改名:因为定价并非同档
如果你改名后又遇到 400、403 或 429 这类连锁问题,下一步应看我们的 Gemini API 错误排查指南,而不是继续猜生命周期公告。
FAQ
stable gemini-2.5-flash-lite 已经下线了吗?
没有。以 2026 年 3 月 21 日为准,Google 公开 Gemini API 文档仍把 stable gemini-2.5-flash-lite 与已弃用预览行分开列出。当前显示的 stable 线下线日期是 2026 年 7 月 22 日,不是 2026 年 3 月 31 日。
2026 年 3 月 31 日到底下线的是哪一个?
官方 Gemini API deprecations 页面写的是 gemini-2.5-flash-lite-preview-09-2025 将在 2026 年 3 月 31 日 下线。大多数人搜索这个关键词时指的就是它。同一页面给出的替代模型是 gemini-3.1-flash-lite-preview。
Vertex AI 也会同步受影响吗?
公开 Vertex AI 文档仍展示该预览版本,所以不要假设所有 Google 表面处于同一状态。更稳妥的理解是:Gemini API 生命周期文档已经明确给出预览下线信号,而 Vertex 侧行为需要在你实际使用的表面里验证。这也是“明明有官方文档,大家仍然困惑”的核心原因。
