По состоянию на 20 марта 2026 года Gemini 2.5 Flash-Lite остается лучшим вариантом по умолчанию, если вам важны минимальная стоимость и стабильная линия. Gemini 3.1 Flash-Lite имеет смысл выбирать тогда, когда вы уже упираетесь в потолок качества 2.5 Flash-Lite и готовы платить заметно больше за более сильную preview-модель, которую Google уже называет официальной заменой. В этом и состоит практический смысл этого сравнения.
Ситуация запутывает тем, что Google одновременно говорит две вещи. На официальной странице deprecations gemini-3.1-flash-lite-preview уже указан как рекомендованная замена для gemini-2.5-flash-lite, а у стабильной линии 2.5 Flash-Lite теперь есть самая ранняя дата отключения: 22 июля 2026 года. Но на официальной странице pricing 2.5 Flash-Lite по-прежнему заметно дешевле. Поэтому правильный вопрос здесь не "какая модель новее", а "мигрировать сейчас, подождать или развести нагрузки по разным маршрутам".
Если нужен короткий вывод, то он такой: оставьте 2.5 Flash-Lite для дешевой фоновой работы, переводите на 3.1 Flash-Lite только те lite-нагрузки, где рост качества действительно окупается, и завершите миграцию до 22 июля 2026 года без паники в последний момент.
Краткое содержание
- Оставайтесь на Gemini 2.5 Flash-Lite, если вам нужен самый дешевый стабильный lite-маршрут.
- Переходите частично на Gemini 3.1 Flash-Lite, если качество уже важнее минимальной цены.
- Если вы все еще сидите на
gemini-2.5-flash-lite-preview-09-2025, тянуть дальше не стоит.
| Параметр | Gemini 3.1 Flash-Lite | Gemini 2.5 Flash-Lite | Что это значит |
|---|---|---|---|
| Текущий статус | Preview | Stable | 3.1 новее, 2.5 менее рискован |
| Model ID | gemini-3.1-flash-lite-preview | gemini-2.5-flash-lite | Нужна явная маршрутизация, а не молчаливая замена |
| Дата запуска | 2026-03-03 | 2025-07-22 | 3.1 это новая линия, 2.5 зрелая |
| Замена / отключение | Дата отключения не объявлена | Самая ранняя дата отключения 2026-07-22, рекомендованная замена 3.1 Flash-Lite | Вопрос миграции уже реальный |
| Цена input | $0.25 / 1M | $0.10 / 1M | 3.1 дороже в 2.5 раза |
| Цена output | $1.50 / 1M | $0.40 / 1M | 3.1 дороже в 3.75 раза |
| Стандартный free tier | На текущей таблице не показан | Показан | Для дешевых экспериментов 2.5 удобнее |
| Search grounding | free tier 500 RPD, paid tier 1,500 RPD | То же самое | grounding больше не главный фактор различия |
| Публичные Batch-лимиты | Совпадают с 2.5 | Совпадают с 3.1 | По открытым таблицам у 3.1 нет преимущества |
Это сравнение не похоже на Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash. В паре с обычным 2.5 Flash модель 3.1 Flash-Lite может выглядеть выигрышно и по цене. В паре с 2.5 Flash-Lite история уже другая: 3.1 лучше, но дороже.
Это не спор о спецификациях, а решение о миграции
SERP по точному запросу пока слабый. В выдаче доминируют официальные таблицы, страницы моделей и benchmark-страницы, но почти никто не собирает эти факты в рабочую рекомендацию.
Ключевые официальные факты сейчас такие:
gemini-3.1-flash-lite-previewвыпущен 3 марта 2026 годаgemini-2.5-flash-liteвыпущен 22 июля 2025 года- у стабильного
gemini-2.5-flash-liteсамая ранняя дата отключения 22 июля 2026 года - Google рекомендует замену на
gemini-3.1-flash-lite-preview
Особенно важно не путать стабильную линию 2.5 Flash-Lite со старым preview-ID. У gemini-2.5-flash-lite-preview-09-2025 самая ранняя дата отключения уже 31 марта 2026 года. Если вы все еще на этом ID, для вас сроки гораздо жестче, чем для тех, кто уже перешел на стабильный gemini-2.5-flash-lite.
Цена и бесплатный уровень: 3.1 Flash-Lite сильнее, но не дешевле

Здесь многие короткие обзоры ошибаются.
Google называет 3.1 Flash-Lite очень cost-effective моделью, но это не значит, что она дешевле 2.5 Flash-Lite в текущей таблице цен. На 20 марта 2026 года официальный pricing показывает:
- Gemini 3.1 Flash-Lite Preview:
\$0.25input и\$1.50output - Gemini 2.5 Flash-Lite:
\$0.10input и\$0.40output
То есть 3.1 Flash-Lite:
- дороже по input в 2.5 раза
- дороже по output в 3.75 раза
Это серьезная разница. Поэтому 2.5 Flash-Lite по-прежнему отлично подходит для дешевого сжатия контекста, массовых summary, простой классификации и другой фоновой работы, где ключевое требование это цена.
Кроме того, в текущей таблице у 2.5 Flash-Lite остается стандартный бесплатный уровень, а у 3.1 Flash-Lite Preview он не показан. Для дешевых экспериментов и небольших внутренних инструментов это все еще важный аргумент в пользу 2.5.
Grounding в этой паре тоже уже не является главным отличием. На текущей pricing-странице обе модели показывают:
- 500 RPD бесплатно на free tier
- 1,500 RPD бесплатно на paid tier
Поэтому текущий вывод очень простой:
- 2.5 Flash-Lite это дешевая стабильная линия
- 3.1 Flash-Lite это более сильная, но более дорогая линия-наследник
Если нужен более широкий контекст по бесплатным квотам, посмотрите также Gemini API free quota 2026.
Что реально улучшает 3.1 Flash-Lite
Самый полезный официальный аргумент в пользу перехода дает страница DeepMind про Gemini 3.1 Flash-Lite, потому что там 3.1 Flash-Lite сравнивается напрямую с 2.5 Flash-Lite.
Ключевые строки этой таблицы такие:
| Метрика | Gemini 3.1 Flash-Lite | Gemini 2.5 Flash-Lite | Преимущество |
|---|---|---|---|
| Input price | $0.25 / 1M | $0.10 / 1M | Gemini 2.5 Flash-Lite |
| Output price | $1.50 / 1M | $0.40 / 1M | Gemini 2.5 Flash-Lite |
| Output speed | 363 tokens/s | 366 tokens/s | Почти паритет |
| GPQA Diamond | 86.9% | 66.7% | Gemini 3.1 Flash-Lite |
| MMMU-Pro | 76.8% | 51.0% | Gemini 3.1 Flash-Lite |
| SimpleQA Verified | 43.3% | 11.5% | Gemini 3.1 Flash-Lite |
| LiveCodeBench | 72.0% | 34.3% | Gemini 3.1 Flash-Lite |
| MRCR v2 at 128k | 60.1% | 30.6% | Gemini 3.1 Flash-Lite |
Разница заметная. Поэтому 3.1 Flash-Lite особенно интересен там, где рост качества действительно экономит деньги или время:
- перевод
- структурированное извлечение
- routing / triage
- легкая кодогенерация или UI-подсказки, где 2.5 Flash-Lite слишком хрупок
Но это не означает, что 3.1 Flash-Lite должен автоматически стать дефолтом для всего. Вопрос остается экономическим: окупает ли рост качества более высокий счет за токены именно на вашей задаче?
Preview-риск, публичные лимиты и часы миграции

Официальная страница rate limits отдельно предупреждает: у preview-моделей лимиты могут быть более жесткими, а реальная емкость может меняться. Это не доказывает, что 3.1 Flash-Lite нестабилен, но и не позволяет относиться к нему как к полностью устоявшейся базе без собственных тестов.
При этом та же страница не дает 3.1 публичного преимущества по Batch API. В открытых таблицах лимиты для 3.1 Flash-Lite Preview и 2.5 Flash-Lite совпадают.
Значит, практическая логика такая:
- Если вы еще на старом preview-ID, мигрируйте в первую очередь
- Если вы уже на стабильном 2.5, используйте время до 22 июля для оценки
- Если миграция неизбежна, начинайте учить новую линию заранее
Какие нагрузки оставить, перенести или развести по двум маршрутам

Самый полезный способ закончить это сравнение это превратить вывод в routing-правило.
Оставляйте на 2.5 Flash-Lite:
- memory compaction
- bulk summarization
- low-stakes classification
- любую фоновую работу, где цена важнее качества
Переводите на 3.1 Flash-Lite:
- translation
- extraction
- routing
- lite-задачи, где более хороший результат реально уменьшает ручную доработку
Используйте обе линии, если:
- у вас mixed traffic
- вам нужен phased migration
- у вас одновременно есть очень дешевые задачи и более ценные lite-нагрузки
Для многих команд это и есть лучший текущий ответ: сохранить ценовое преимущество 2.5 и параллельно освоить официальную линию-наследник 3.1.
Как мигрировать без сожалений
- Разделите текущие задачи 2.5 Flash-Lite по типам
- Тестируйте 3.1 только там, где качество может окупить цену
- Смотрите не только на benchmark, но и на итоговую стоимость и пользу
- Сначала переводите пользователей старого preview-ID
- Держите 2.5 как fallback, пока не убедитесь в новой линии на реальном трафике
Что измерять после частичного перехода
Самая частая ошибка при такой миграции в том, что команда смотрит только на цену за токен или только на benchmark-таблицу. Для Flash-Lite этого почти никогда недостаточно. Если вы переносите часть нагрузки на 3.1 Flash-Lite, вам нужно измерять не "модель стала умнее" в абстрактном смысле, а то, изменилась ли экономика конкретного контура.
Лучший способ это сделать: взять один и тот же набор реальных задач и прогнать его по двум маршрутам. Для перевода стоит сравнивать не только итоговое качество текста, но и долю ручных исправлений после первой генерации. Для extraction и JSON-пайплайнов нужно смотреть на процент валидных структур с первой попытки. Для routing и triage важнее оценивать количество неправильных первых решений, потому что именно они потом раздувают downstream-стоимость.
Если смотреть только на цену input и output, 3.1 почти всегда будет выглядеть хуже. Но если новая модель заметно сокращает число ретраев, ручной постобработки, повторных прогонов или вызовов следующей модели в цепочке, итоговая стоимость процесса может оказаться ближе, чем кажется по прайс-листу. В некоторых задачах она все равно окажется слишком дорогой. В других рост качества будет окупаться почти полностью. Это и есть причина, почему универсального ответа "всем переключаться" здесь нет.
На практике после частичного перехода полезно собирать хотя бы такие показатели:
- доля ответов, которые проходят без ручной правки
- частота ретраев и число повторных вызовов на один успешный результат
- процент задач, которые пришлось отправить на более дорогую модель дальше по цепочке
- средняя стоимость одного полезного результата, а не только стоимость одного вызова
- доля трафика, которую пришлось откатить обратно на 2.5 Flash-Lite
Отдельно стоит наблюдать за тем, на каких задачах 3.1 Flash-Lite действительно меняет исход, а на каких просто дает "чуть лучшее" качество без реальной бизнес-пользы. Для дешевой фоновой summarization-раздачи этого часто недостаточно. Для extraction, translation и routing-слоя разница может быть уже существенной. Если вы явно отделите эти два класса задач, решение о миграции станет намного проще и точнее.
Еще один полезный прием это держать короткий недельный срез по каждому типу нагрузки, а не смотреть только на общий средний показатель по всей lite-линии. Когда translation, extraction и дешевые summary смешиваются в одну метрику, команда почти всегда получает ложную картину. В среднем все может выглядеть "примерно одинаково", хотя на самом деле 3.1 Flash-Lite уже выигрывает в задачах, где ошибка дорого стоит, и одновременно проигрывает в потоках, где нужен просто самый дешевый достаточно хороший результат.
Поэтому зрелая миграция выглядит не как один флаг в конфиге, а как набор порогов. Например: если 3.1 снижает долю ручных исправлений не меньше чем на определенный процент, маршрут расширяется; если рост счета не окупается, задача возвращается на 2.5; если старая preview-линия подходит к дедлайну, переводится весь связанный трафик, даже если часть задач пока остается на стабильном 2.5. Такой подход требует чуть больше дисциплины, зато избавляет от двух крайностей: от слепого увлечения новой моделью и от столь же слепого отказа от официальной линии-замены.
Именно поэтому для этой пары моделей полезно заранее договориться о практическом критерии успеха. Например, команда может считать миграцию удачной только в том случае, если на выбранном наборе задач 3.1 Flash-Lite одновременно снижает долю невалидных ответов, уменьшает ручную доработку и не увеличивает итоговую стоимость полезного результата сверх заранее заданного порога. Когда такой критерий есть, спор "новее против дешевле" быстро превращается в инженерное решение с понятными цифрами, а не в обсуждение вкусов.
И чем раньше такие правила появятся, тем легче будет пройти окно до 22 июля 2026 года без аврального переключения и без лишних переплат на тех маршрутах, где 2.5 Flash-Lite по-прежнему делает работу достаточно хорошо.
Это важно.
FAQ
Gemini 3.1 Flash-Lite дешевле Gemini 2.5 Flash-Lite?
Нет. На 20 марта 2026 года официальный pricing показывает \$0.25 / \$1.50 против \$0.10 / \$0.40.
Тогда зачем вообще переходить на 3.1 Flash-Lite?
Потому что официальная таблица DeepMind показывает заметный прирост качества. Если он уменьшает число ошибок, ретраев и ручной доработки, более высокая цена может окупаться.
У обеих моделей есть grounding?
Да. На текущей pricing-странице у обеих моделей показаны 500 RPD на free tier и 1,500 RPD на paid tier.
Если я еще на gemini-2.5-flash-lite-preview-09-2025, переходить нужно прямо сейчас?
Да. Для этой линии самая ранняя дата отключения указана как 31 марта 2026 года.
Нужно ли уже сегодня полностью заменить стабильный 2.5 Flash-Lite на 3.1?
Обычно нет. Гораздо разумнее оставить 2.5 для дешевой фоновой работы, протестировать 3.1 на более ценных lite-нагрузках и завершить миграцию постепенно до 22 июля 2026 года.
