Gemini image-to-video: бесплатный, платный и API-гид

AI Free API Team

•Mar 18, 2026•23 min read•AI-видео

Практический гид по Gemini image-to-video, который объясняет пользовательский сценарий, реальные бесплатные кредиты и момент, когда действительно стоит переходить к Veo API.

Руководство по Gemini image-to-video: бесплатный и API-пути

Короткий ответ: да, Google уже умеет превращать изображение в видео, но правильный путь зависит от того, что именно вы называете словом Gemini. По состоянию на 18 марта 2026 года обычные пользователи чаще всего получают эту возможность через Gemini, Flow, Whisk или потребительские функции Google Photos, а разработчики работают не с каким-то отдельным "Gemini image-to-video API", а с Veo через Gemini API.

Именно на этом месте большинство публикаций и начинают путать читателя. Одно дело - бесплатные или условно-бесплатные AI credits внутри Flow и Whisk. Другое дело - Veo в Gemini API, где видео сейчас не имеет бесплатного тарифа. Поэтому лучший способ сэкономить время и деньги - сначала понять пользовательские поверхности и логику кредитов, а уже потом решать, нужен ли вам API.

Это руководство специально построено в такой последовательности. Сначала мы разберем, что означает запрос "Gemini image to video" в реальной продуктовой структуре Google, затем пройдем самый простой сценарий для новичка, и только после этого разберем, что действительно бесплатно, а что относится уже к платной разработческой модели.

Краткое содержание

Если вы искали "gemini image to video", то самый полезный ответ сегодня - не просто "да, можно", а разделение Google-стека на три практических маршрута.

Что вы хотите	Лучший путь	Что это стоит сейчас	Для кого это лучше
Быстро оживить одну картинку	Потребительский Gemini	Обычно зависит от тарифа Google AI и региона	Обычные пользователи
Проверить идею почти бесплатно	Flow или Whisk	Подходящие личные аккаунты без подписки сейчас получают 50 AI credits в день	Создатели, тестирующие идеи
Строить автоматизацию и приложения	Veo через Gemini API	Бесплатного Veo video tier нет, действует поминутная / посекундная оплата	Разработчики
Получить больше квоты	Google AI Plus / Pro / Ultra	200 / 1 000 / 25 000 credits в месяц	Частые пользователи

Google сам пишет на странице Google AI plans, что видео можно генерировать в Flow, Gemini и Whisk. Но на странице Gemini API pricing та же компания отдельно показывает разработческое ценообразование Veo. Это значит, что Gemini - это в первую очередь пользовательская поверхность, а Veo - сам видеомодельный движок.

Если вы просто хотите превратить одну фотографию в короткий ролик, API вам, скорее всего, не нужен. Он становится важен только тогда, когда вы уже уверены, что хотите код, интеграцию, пакетную генерацию и управляемый биллинг.

Что на самом деле означает "Gemini image-to-video" в 2026 году

Фраза "Gemini image-to-video" выглядит так, будто речь идет об одном конкретном продукте. Но у Google это не один продукт, а несколько слоев, из-за чего поисковая выдача переполнена материалами, где названия смешиваются и создают лишнюю путаницу.

Запомнить архитектуру проще всего так:

Слой	Что это такое	Что пользователь обычно делает
Gemini	Потребительское приложение и интерфейс	Загружает изображение, пишет промпт, запускает генерацию
Veo	Семейство видеомоделей Google	Непосредственно создает видео
Flow	Креативная поверхность с AI credits	Делает генерацию и правки видео
Whisk	Еще одна креативная поверхность	Подходит для дешевых тестов и визуальных экспериментов
Gemini API / Vertex AI	Разработческий слой	Вызывает генерацию программно

Это различие критично, потому что за одним и тем же запросом стоят две очень разные аудитории. Один человек хочет понять, где в интерфейсе Gemini нажать кнопку, чтобы анимировать фото. Другой человек хочет узнать, какой endpoint вызывать из JavaScript или Python. Если статья не разделяет эти сценарии в самом начале, она начинает походить на справку по брендам, а не на руководство.

Официальный потребительский материал Google, Turn your photos into videos in Gemini, говорит об этом предельно прямо: Gemini с помощью Veo 3 может превращать фото в 8-секундные ролики со звуком. Для обычного пользователя это и есть правильный старт.

Но разработческая документация живет уже в другой плоскости. На странице Generate videos with Veo 3.1 in Gemini API Google объясняет параметры, разрешения 720p, 1080p и 4k, правила для reference images и асинхронные операции. То есть, как только вы переходите от интерфейса к интеграции, фактическим предметом разговора становится Veo.

Именно поэтому статья должна объединять пользовательский и API-пути. В текущей выдаче Google хватает разрозненных страниц, но мало материалов, которые помогают быстро принять решение, а не просто перечисляют функции.

Самый простой tutorial для новичка

Для большинства читателей лучший маршрут - это потребительский интерфейс. Там не нужно сразу думать про polling, model IDs и посекундную оплату. Вам нужен рабочий Google-аккаунт, подходящая поверхность и достаточно понятная исходная картинка.

Если следовать тому, как Google описывает это в официальной статье, базовый процесс выглядит так:

Откройте поддерживаемую поверхность Gemini и войдите в личный Google-аккаунт.
Найдите инструмент Videos.
Загрузите статичное изображение.
Опишите движение, изменение сцены и звук.
Сгенерируйте результат, просмотрите его и решите, нужно ли повторить.

Официальный пользовательский материал сейчас строится вокруг роликов длиной 8 секунд. На практике это значит, что промпт должен задавать один компактный и легко считываемый тип движения. Небольшой поворот головы, легкий ветер в волосах, облака, которые плывут по небу, или едва заметное движение камеры работают обычно лучше, чем попытка упаковать в 8 секунд целую сюжетную сцену.

Качество исходного изображения влияет на результат сильнее, чем кажется после чтения рекламных обзоров. Фото с одним главным объектом, чистым освещением и меньшим количеством визуального шума обычно анимируется стабильнее, чем картинка, где много лиц, текстур, бликов и предметов на разных планах. Чем яснее стартовый кадр, тем легче модели придумать убедительное движение.

Промпт тоже лучше писать не как пересказ картинки, а как описание того, как эта картинка должна начать двигаться. Вот несколько устойчивых шаблонов:

Тип входной картинки	Удачный паттерн промпта	Почему это помогает
Портрет	Модель медленно поворачивает голову, волосы слегка движутся, тихий комнатный фон	Фиксирует главное движение
Пейзаж	Облака медленно уходят вправо, вода слегка рябит, камера плавно приближается	Дает ясную направленность движению
Продукт	Камера слегка обходит предмет, блики проходят по поверхности, фон остается чистым	Сохраняет товар читаемым
Иллюстрация	Слои сцены слегка расходятся по глубине, появляются мягкие частицы	Помогает плоскому изображению стать объемнее

Google также прямо пишет, что готовые ролики получают видимый watermark и невидимый SynthID watermark. Для части пользователей это не проблема, но если вы рассчитываете на клиентскую работу, брендовый контент или обучение, лучше знать об этом заранее.

Бесплатно ли это?

Бесплатные и платные пути Gemini image-to-video

Это главный денежный вопрос, и отвечать на него нужно максимально аккуратно. Потому что в экосистеме Google слово "free" в зависимости от страницы может означать либо реальные ежедневные кредиты, либо маркетинговую пробную программу, либо вообще отдельный Cloud trial.

Самый сильный текущий источник - статья Google Manage your AI credits with Google One. По состоянию на 18 марта 2026 года там сказано, что любой подходящий личный Google-аккаунт без Google AI membership plan получает 50 AI credits в день для видео в Whisk и Flow. Это и есть основной официальный аргумент в пользу слова "бесплатно" в пользовательском поиске.

Но это совершенно не равняется фразе "Gemini API для видео бесплатен". На странице Gemini API pricing Veo 3.1 video generation не имеет бесплатного tier. То есть бесплатный или условно-бесплатный опыт существует на кредитных пользовательских поверхностях, а не в разработческой модели оплаты.

Текущая кредитная лестница у Google выглядит так:

План	Включенные AI credits	Практическое значение
Нет Google AI плана	50 credits в день	Немного ежедневных тестов
Google AI Plus	200 credits в месяц	Легкое потребительское использование
Google AI Pro	1 000 credits в месяц	Регулярная творческая работа
Google AI Ultra	25 000 credits в месяц	Высокая нагрузка и большой запас

На той же странице Google показывает и типичную стоимость генерации в Flow:

Режим Flow	Кредитов за генерацию	Как это читать
Veo 3.1 Fast	20 credits	Для черновиков и тестов
Veo 3.1 Quality	100 credits	Для более дорогой и качественной генерации
Video edits	20 credits	Когда нужно поправить, а не начинать заново

Математика отсюда очень простая. Если у вас есть 50 credits в день, этого обычно хватает примерно на 2 Fast-генерации, но не на полноценную Quality-генерацию. Если у вас есть 1 000 credits в месяц по Google AI Pro, это примерно 50 Fast-роликов или 10 Quality-роликов. Это не маркетинговая оценка, а прямое следствие цифр на официальной странице.

Разработческий путь выглядит иначе. На 18 марта 2026 года Google публикует такие ставки для Veo 3.1: Fast в 720p / 1080p стоит $0.15 за секунду, Standard - $0.40 за секунду; Fast в 4k стоит $0.35, Standard в 4k - $0.60. Значит, 8-секундный ролик Fast в 720p или 1080p стоит около $1.20, а Standard - около $3.20.

Режим API	Цена за 8 секунд в 720p / 1080p	Цена за 8 секунд в 4k
Veo 3.1 Fast	$1.20	$2.80
Veo 3.1 Standard	$3.20	$4.80

Поэтому честный ответ такой: частично бесплатно. Бесплатный опыт есть на стороне Flow и Whisk для подходящих личных аккаунтов. На стороне Gemini API - нет.

Отдельно стоит помнить про Google Cloud trial. Да, Google для новых подходящих пользователей дает примерно $300 trial credits на ограниченный период. Это полезно для тестирования облачных продуктов. Но это отдельная billing-программа, а не встроенный бесплатный слой Veo. Если вам нужен более подробный разбор разработческой стоимости, посмотрите наш гайд по ценам Veo и гайд по бесплатному tier Gemini API.

Практический смысл этого различия простой: бесплатные кредиты хороши для проверки идеи, но как только вы переходите к регулярной генерации, вопрос стоимости становится уже не маркетинговым, а операционным. Именно в этот момент важно перестать смешивать consumer-льготы и разработческое ценообразование.

Если говорить еще проще, то бесплатный слой отвечает на вопрос "стоит ли мне вообще продолжать", а API-слой отвечает на вопрос "как мне масштабировать это без ручной работы". Пока вы не дошли до второго вопроса, спешить в API обычно не нужно. Но если дошли, игнорировать реальные ставки за секунду уже опасно для бюджета.

Tutorial для Gemini API с Veo

Процесс image-to-video через Gemini API и Veo

API нужен не тогда, когда вы впервые пробуете оживить одну картинку, а тогда, когда у вас появляется настоящая потребность в автоматизации, интеграции, повторяемости и собственном логировании. Иными словами, когда время оператора начинает стоить дороже, чем сама модель.

Главный официальный источник для разработчика - страница Generate videos with Veo 3.1 in Gemini API. Она прямо подтверждает, что вы можете передавать входное изображение как reference image для image-to-video generation.

На практике разработческий workflow выглядит так: сначала вы создаете проект с включенным billing, затем получаете API credentials, отправляете промпт и картинку в Veo, дальше ждете завершения асинхронной операции, а затем скачиваете итоговый ролик. В отличие от потребительского пути, здесь вам уже приходится самому управлять параметрами, ошибками и бюджетом.

Самое важное правило для начинающего разработчика - помнить, что Google сейчас требует 8-секундную длительность для reference image jobs, а также для 1080p и 4k сценариев. Это одно ограничение объясняет массу ситуаций, когда пользователь думает, что проблема в аккаунте или правах доступа, хотя на самом деле запрос просто не соответствует текущим условиям модели.

Поэтому безопасная стратегия почти всегда такая: стартовать с 720p, 8 секунд и максимально простой reference image, проверить логику движения, и только потом поднимать разрешение и сложность сцены. Так вы быстрее найдете правильный промпт и сэкономите на неудачных прогонах.

Вот как выглядит типичная экономика тестов:

Сценарий	Примерная стоимость сейчас
1 Fast-тест на 8 секунд	около $1.20
5 Fast-тестов на 8 секунд	около $6.00
10 Standard-тестов на 8 секунд	около $32.00
20 Fast-тестов в 4k на 8 секунд	около $56.00

По этой причине многие команды делают ideation сначала в Flow или Whisk, а уже потом переносят победивший промпт в API. То есть кредиты работают как дешевый творческий слой, а API - как слой автоматизированного исполнения.

Если ваш реальный вопрос уже не про интерфейс, а про различие между бесплатными consumer credits и платным video API, то вы фактически смотрите на задачу глазами разработчика. И здесь полезно дополнительно открыть наш гайд по бесплатному Gemini API, чтобы не смешивать бесплатные text / image-возможности с платной Veo-видеогенерацией.

Troubleshooting

Большинство проблем в Gemini image-to-video не означают, что функция сломана. Обычно причина лежит в одной из пяти зон: доступ еще не открыт, кредиты закончились, сработал safety filter, запрос собран в неподдерживаемой конфигурации или вообще выбран неверный путь под текущую задачу.

Проблема	Самая вероятная причина	Что попробовать дальше
Функции нет в интерфейсе Gemini	Разница в регионе, плане или rollout	Проверить тариф, страну и тип аккаунта
Flow или Whisk пишут, что credits закончились	Суточный или месячный лимит исчерпан	Дождаться сброса или перейти на более крупный план
API ломается на reference image	Неподдерживаемые параметры	Вернуться к 8 секундам, 720p и простому соотношению сторон
Видео блокируется при нормальной картинке	Safety или региональные ограничения	Упростить изображение и убрать рискованные cues
API кажется слишком дорогим	Вы используете API слишком рано	Сначала тестируйте идеи через credits

Ограничения по регионам и планам - одна из самых недооцененных причин. Google в справке и на страницах планов многократно подчеркивает, что доступ зависит от страны, возраста, аккаунта и конкретного продукта. Поэтому первое действие при загадочном отсутствии функции - не переписывать промпт, а проверить, должна ли функция вообще быть доступна в этой конфигурации.

С credits похожая история. На странице AI credits Google пишет, что неудачные генерации могут быть возвращены в баланс. Значит, если после ошибки у вас временно не сходится цифра кредитов, это не обязательно означает потерю средств. Часто нужно просто дождаться обновления и перепроверить историю.

Со стороны API самые неприятные кейсы обычно связаны с границами документации и edge-case-поведением. В обсуждениях сообщества уже встречались случаи, когда reference images, aspect ratio или human-like features вели себя непредсказуемо. Такие ветки не заменяют официальный policy, но помогают понять практический принцип: если сложный запрос постоянно падает, сначала сведите его к простому 16:9, 720p, 8-second reference image pipeline, и лишь потом наращивайте сложность.

Если вы не уверены, какой путь сейчас лучше - UI или API, примените простой вопрос: что для вас уже стало дороже, модель или ручные действия? Пока вы в основном ищете работающий промпт, потребительские credits обычно выгоднее. Когда главным узким местом становятся повторяющиеся ручные операции, API начинает выигрывать.

FAQ

Gemini действительно умеет превращать фото в видео?

Да. В официальной потребительской статье Google прямо написано, что Gemini с помощью Veo превращает фото в 8-секундное видео со звуком.

Gemini image-to-video бесплатен?

Частично. Подходящие личные аккаунты без Google AI membership plan сейчас получают 50 AI credits в день в Flow и Whisk. Но Veo через Gemini API бесплатного видеотарифа не имеет.

Gemini API для image-to-video бесплатен?

Нет. Для Veo 3.1 video generation действует платная модель по секундам.

Зачем мне знать про Veo, если я просто пользуюсь Gemini?

Для пользователя это не всегда важно, но как только речь заходит о цене, параметрах, ограничениях и интеграции, именно Veo оказывается настоящим объектом разговора.

Почему в интернете так много путаницы между Gemini, Flow, Whisk и API?

Потому что многие SEO-страницы смешивают названия продуктов, не разделяя пользовательский и разработческий сценарии.

Что лучше для новичка?

Новичку обычно лучше начинать с Gemini или другой потребительской поверхности Google. API нужен тогда, когда вы уже понимаете рабочий шаблон и хотите автоматизацию.

Что делать, если функция отсутствует в аккаунте?

Сначала проверить доступность по плану, региону, типу аккаунта и rollout, а уже потом подозревать баг.

Когда имеет смысл переходить с credits на API?

Когда вы уже нашли рабочий промпт и исходный материал, а повторение ручных шагов стало важнее, чем цена одного теста.

Nano Banana Pro

4K Изображение-80%

Google Gemini 3 Pro Image · AI Генерация

Обслужено 100K+ разработчиков

$0.24/изобр.

$0.05/изобр.

Спецпредложение·Стабильный·Alipay/WeChat

Gemini 3

Нативная модель

Прямой доступ

20мс задержка

4K Ultra HD

2048px

30сек генерация

Сверхбыстро

|@laozhang_cn|$0.05 бонус

200+ AI Models API

Jan 2026

GPT-5.2Claude 4.5Gemini 3Grok 4+195

Image

80% OFF

gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video

80% OFF

Veo3 · Sora2$0.15/gen

16% OFF⚡ 5-Min📊 99.9% SLA👥 100K+

Get $0.1 Free Docs

#Gemini #Veo #image-to-video #AI-видео #Google AI #Flow #Whisk