AIFreeAPI Logo

Guía de Gemini imagen a video: gratis, pago y API

A
23 min readTutoriales de video con IA

Guía práctica de Gemini imagen a video que explica el flujo para usuarios comunes, los créditos realmente gratuitos y el momento en que sí conviene pasar a Veo API.

Tutorial de imagen a video en Gemini con rutas gratis y API

Respuesta corta: sí, Google ya puede convertir una imagen en video, pero la ruta correcta depende de qué entiendas por Gemini. A 18 de marzo de 2026, la mayoría de los usuarios comunes accede a esta función desde Gemini, Flow, Whisk o algunas superficies de Google Photos, mientras que los desarrolladores trabajan con Veo a través de Gemini API, no con una supuesta API separada llamada “Gemini image-to-video”.

La mayor confusión en la SERP no está en si la función existe o no, sino en qué parte del sistema es realmente gratis. La ayuda oficial de Google dice que determinadas cuentas personales sin plan Google AI reciben 50 AI credits diarios en Flow y Whisk. Al mismo tiempo, la página de precios de Gemini API muestra que Veo para video no tiene free tier. Por eso, antes de gastar dinero o tiempo en integración, conviene entender primero las superficies para consumidores y la lógica de créditos.

Esta guía sigue ese orden. Primero aclara qué significa hoy “Gemini imagen a video”, luego muestra el tutorial más simple para principiantes, y después separa con claridad la capa gratis, la capa de suscripción y la capa API.

Resumen rápido

Si buscaste “gemini image to video”, la respuesta útil no es solo “sí se puede”, sino entender que hoy Google ofrece tres rutas reales.

Si quieres...Mejor rutaQué cuesta hoyMejor para
Animar una sola imagen lo más rápido posibleGemini en su superficie de consumoSuele depender del plan Google AI y del paísUsuarios casuales
Probar ideas casi gratisFlow o WhiskLas cuentas personales elegibles sin plan reciben hoy 50 AI credits al díaCreadores que están experimentando
Automatizar o integrarlo en una appVeo vía Gemini APINo hay free tier de video para Veo; se cobra por usoDesarrolladores
Tener mucha más capacidadGoogle AI Plus / Pro / Ultra200 / 1.000 / 25.000 credits al mesUsuarios frecuentes

Google dice en Google AI plans que los usuarios pueden generar videos con IA en Flow, Gemini y Whisk, pero en Gemini API pricing separa el precio de Veo para desarrolladores. En otras palabras, Gemini es la superficie; Veo es el modelo de video.

Si solo quieres convertir una foto en un clip corto, casi seguro no necesitas la API. La API empieza a tener sentido cuando necesitas automatización, repetibilidad, lotes o integración real con tu flujo de trabajo.

Qué significa realmente “Gemini imagen a video” en 2026

Mapa de relación entre Gemini, Veo, Flow y Whisk
Mapa de relación entre Gemini, Veo, Flow y Whisk

La frase “Gemini imagen a video” parece nombrar una sola función, pero en realidad Google la reparte entre varias capas. Por eso tantos resultados mezclan nombres de producto y terminan generando más ruido que ayuda.

La forma más simple de entenderlo es esta:

CapaQué esQué haces ahí
GeminiApp y superficie para usuariosSubes una imagen, escribes el prompt y generas
VeoFamilia de modelos de video de GoogleGenera el video de verdad
FlowSuperficie creativa con AI creditsGeneración y edición con créditos
WhiskOtra superficie creativaPruebas baratas y experimentación visual
Gemini API / Vertex AICapa para desarrolladoresLlamadas programáticas y automatización

Esta distinción importa porque detrás de la misma keyword hay dos usuarios distintos. Uno solo quiere saber dónde hacer clic en Gemini para animar una foto. El otro quiere saber qué endpoint llamar desde JavaScript o Python. Si un artículo no separa esas dos intenciones al principio, termina pareciendo una guía cuando en realidad solo repite nombres de producto.

El artículo oficial para consumidores Turn your photos into videos in Gemini lo deja claro: Gemini puede transformar fotos en clips de 8 segundos con sonido usando Veo 3. Para un usuario común, ese es el punto de partida correcto.

En cambio, la documentación para desarrolladores vive en Generate videos with Veo 3.1 in Gemini API, donde la conversación ya gira alrededor de 720p, 1080p, 4k, reference images y operaciones asíncronas. Ya no se trata de “cómo entrar al menú”, sino de “cómo llamar a Veo”. Por eso esta guía integra ambas rutas en una sola estructura de decisión.

El tutorial más fácil para principiantes

Para la mayoría de lectores, la mejor ruta inicial es la de consumo. No necesitas empezar entendiendo polling, model IDs ni facturación por segundo. Necesitas una cuenta de Google válida, una superficie que tenga la función y una imagen razonable para usar como punto de partida.

Si sigues la explicación oficial de Google, el flujo básico es:

  1. Abre la superficie compatible de Gemini e inicia sesión con tu cuenta personal.
  2. Busca la herramienta Videos.
  3. Sube una imagen estática.
  4. Describe el movimiento, la escena y el sonido que quieres.
  5. Genera, revisa el resultado y repite si hace falta.

Hoy la comunicación oficial para usuarios gira alrededor de clips de 8 segundos. Eso no es un detalle menor: cambia la forma en que debes escribir el prompt. En 8 segundos funciona mejor pedir un movimiento claro y compacto que intentar contar una historia completa. Un giro suave de cabeza, nubes moviéndose, agua ondulando o una ligera aproximación de cámara suelen funcionar mejor que una secuencia demasiado ambiciosa.

La calidad de la imagen de entrada importa más de lo que admiten muchos artículos de marketing. Una imagen con un solo sujeto claro, buena luz y menos ruido visual suele animarse mejor que una imagen recargada, con varios rostros, texto, reflejos o demasiados objetos. Cuanto más fácil sea leerla como “primer fotograma”, más estable tiende a ser el resultado.

El prompt también funciona mejor cuando describe cómo debe moverse la imagen, no cuando vuelve a describir todo lo que ya se ve. Estos patrones suelen ser más útiles:

Tipo de imagenPatrón de prompt más establePor qué ayuda
RetratoEl sujeto gira lentamente hacia cámara, el cabello se mueve un poco, ambiente interior suaveFija el movimiento principal
PaisajeLas nubes se desplazan, el agua ondula suavemente, la cámara avanza despacioMarca dirección y ritmo
ProductoLa cámara rodea ligeramente el objeto, las luces recorren la superficie, el fondo se mantiene limpioMantiene legible el producto
IlustraciónSe separan levemente las capas, aparece profundidad y suben partículas suavesConvierte mejor una imagen plana en escena

Google también indica que los videos generados llevan un watermark visible y un SynthID invisible. Si piensas usar el resultado en entregables, marca o educación, conviene saberlo desde el principio.

¿Gemini imagen a video es gratis?

Rutas gratis y de pago para imagen a video en Gemini
Rutas gratis y de pago para imagen a video en Gemini

Esta es la parte donde conviene ser muy preciso, porque “gratis” significa cosas distintas según la página de Google que estés leyendo.

A fecha de 18 de marzo de 2026, la ayuda oficial Manage your AI credits with Google One dice que cualquier cuenta personal elegible sin Google AI membership plan recibe 50 AI credits diarios para crear video en Whisk y Flow. Ese es el mejor respaldo oficial actual para la palabra “gratis” dentro de la intención del usuario común.

Pero eso no significa que Gemini API sea gratis. En Gemini API pricing, Veo 3.1 para video no aparece con free tier. La experiencia gratis o semigratis existe en las superficies de consumo con credits, no en la ruta API para desarrolladores.

La escalera actual de créditos que publica Google es esta:

PlanAI credits incluidosLectura práctica
Sin plan Google AI50 credits diariosPruebas pequeñas cada día
Google AI Plus200 credits mensualesUso ligero
Google AI Pro1.000 credits mensualesTrabajo creativo regular
Google AI Ultra25.000 credits mensualesUso intensivo

La misma ayuda muestra además el coste típico dentro de Flow:

Modo en FlowCredits por generaciónQué significa
Veo 3.1 Fast20 creditsBorradores y test rápidos
Veo 3.1 Quality100 creditsMás calidad, mucho más gasto
Ediciones de video20 creditsÚtil para corregir sin reiniciar

La matemática es directa. Con 50 credits diarios normalmente puedes hacer unas 2 generaciones Fast, pero no te alcanza de forma cómoda para una Quality. Con 1.000 credits al mes en Google AI Pro, eso equivale aproximadamente a 50 generaciones Fast o 10 Quality. No es una estimación de terceros; es la lectura directa de la tabla oficial.

En la ruta API la historia cambia. Hoy Google publica estos precios para Veo 3.1: en 720p y 1080p, Fast cuesta $0.15 por segundo y Standard $0.40 por segundo; en 4k, Fast cuesta $0.35 y Standard $0.60 por segundo. Así, un clip de 8 segundos en Fast 720p o 1080p cuesta alrededor de $1.20, mientras que Standard ronda los $3.20.

Modo APICoste de 8 segundos en 720p / 1080pCoste de 8 segundos en 4k
Veo 3.1 Fast$1.20$2.80
Veo 3.1 Standard$3.20$4.80

Por eso, la respuesta más honesta a “¿Gemini imagen a video es gratis?” es: parcialmente. Hay ruta gratis en Flow y Whisk para ciertas cuentas personales. No hay ruta gratis de video en Veo vía API.

También conviene no mezclar esto con los trial credits de Google Cloud. Es cierto que Google ofrece alrededor de $300 de credits temporales para nuevos usuarios elegibles, pero eso es un programa de facturación en la nube, no un free tier nativo de Veo. Si quieres profundizar en el coste para desarrolladores, revisa nuestra guía de precios de Veo y nuestra guía del free tier de Gemini API.

Tutorial de Gemini API con Veo

Flujo de trabajo de imagen a video con Gemini API y Veo
Flujo de trabajo de imagen a video con Gemini API y Veo

La API no es la mejor primera parada para quien solo quiere animar una imagen. Tiene sentido cuando empiezas a necesitar automatización, integración, repetibilidad y control del proceso. En ese punto, el coste real ya no es solo el modelo, sino el trabajo manual repetido.

La fuente oficial clave para desarrolladores es Generate videos with Veo 3.1 in Gemini API. Esa página confirma de forma explícita que puedes usar una imagen de entrada como reference image para generar video.

En la práctica, el flujo para desarrolladores consiste en crear un proyecto con billing activo, obtener las credenciales, enviar prompt e imagen a Veo, esperar la operación asíncrona y descargar el resultado. A diferencia de la ruta de consumo, aquí tú controlas parámetros, errores y coste.

La regla más importante para un principiante es recordar que, cuando usas reference image o quieres 1080p / 4k, la documentación actual exige 8 segundos de duración. Muchas llamadas que “parecen rotas” no lo están; simplemente están fuera de las restricciones actuales del modelo.

Por eso, la estrategia más segura suele ser empezar con 720p, 8 segundos y una reference image simple. Primero validas el tipo de movimiento. Después, si ya funciona, escalas a 1080p o 4k.

Una estimación rápida de coste se ve así:

EscenarioCoste aproximado hoy
1 prueba Fast de 8 segundosalrededor de $1.20
5 pruebas Fast de 8 segundosalrededor de $6.00
10 pruebas Standard de 8 segundosalrededor de $32.00
20 pruebas Fast de 8 segundos en 4kalrededor de $56.00

Por esa razón, muchos equipos hacen la ideación primero en Flow o Whisk y solo pasan a la API cuando ya tienen claro qué prompt funciona. Así, los credits sirven para descubrir el enfoque correcto y la API se convierte en la capa de ejecución automatizada.

Si tu duda ya es más bien “por qué hay credits gratis en consumo pero no en video API”, entonces ya estás mirando el problema con ojos de desarrollador. En ese caso también te conviene revisar la guía del free tier de Gemini API, porque la política gratis para texto, imagen y video no es idéntica.

Troubleshooting

La mayoría de fallos en Gemini image-to-video no significa que la función esté caída. Con la ayuda oficial, la página de precios y las señales de comunidad, los problemas suelen concentrarse en cinco grupos: función no disponible, créditos agotados, filtros de seguridad, configuración no soportada o elección de ruta incorrecta.

ProblemaCausa más probableQué probar después
No ves la función en GeminiDiferencias por región, plan o rolloutVerifica país, plan y tipo de cuenta
Flow o Whisk dicen que no tienes creditsLlegaste al límite diario o mensualEspera al reinicio o sube de plan
La API falla con reference imageConfiguración fuera de soporteVuelve a 8 segundos, 720p y proporción simple
La generación se bloquea con una imagen normalFiltros de seguridad o límites regionalesUsa una imagen de menor riesgo y simplifica el prompt
La API parece demasiado caraEstás usando la ruta equivocada para esta faseIdea y prueba con credits; automatiza después

Las restricciones de región y plan son de las más subestimadas. Google repite en sus páginas que la disponibilidad depende del país, la edad, el tipo de cuenta y el producto concreto. Por eso, cuando una función no aparece, lo primero no es reescribir el prompt, sino confirmar si esa cuenta debería tener acceso.

Con los credits ocurre algo parecido. Google también indica que algunas generaciones fallidas vuelven a acreditarse. Si los números no cuadran justo después de un error, eso no significa automáticamente que hayas perdido el saldo. A veces basta con esperar y revisar el historial de actividad.

En la API, los casos más incómodos suelen venir de los límites documentales y los edge cases. Ya hay discusiones de comunidad sobre reference images, aspect ratio y human-like features. No son autoridad de policy, pero sí dejan una lección práctica: si un request complejo falla una y otra vez, primero redúcelo a un caso base de 16:9, 720p y 8 segundos, y solo después vuelve a añadir complejidad.

Si no tienes claro si debes usar UI o API, aplica una regla sencilla. Mientras todavía estás descubriendo qué movimiento y qué prompt funcionan, los credits de consumo suelen ser la mejor ruta. Cuando lo que más cuesta ya no es la calidad, sino repetir pasos manuales, entonces la API empieza a tener sentido.

FAQ

¿Gemini de verdad puede convertir una imagen en video?

Sí. La documentación oficial para consumidores explica que Gemini puede transformar fotos en clips de 8 segundos con sonido usando Veo.

¿Gemini imagen a video es gratis?

Solo en parte. Las cuentas personales elegibles sin plan Google AI pueden tener 50 AI credits diarios en Flow y Whisk, pero la ruta API para Veo video no tiene free tier.

¿La API de Gemini para image-to-video es gratis?

No. Veo 3.1 para video se cobra por uso.

Si uso Gemini, por qué me importa Veo?

Porque Veo es el modelo real de video. Para un usuario casual no siempre importa el nombre, pero en cuanto hablas de precios, límites y desarrollo, Veo es la capa que de verdad necesitas entender.

¿Por qué hay tanta confusión entre Gemini, Flow, Whisk y la API?

Porque muchas páginas SEO mezclan marcas y superficies sin separar el camino del usuario común del camino del desarrollador.

¿Cuál es la mejor ruta para principiantes?

Gemini o cualquier superficie de consumo equivalente. La API tiene más sentido cuando ya sabes exactamente qué quieres automatizar.

¿Qué hago si la función no aparece en mi cuenta?

Revisa primero plan, país, tipo de cuenta y rollout antes de asumir un bug.

¿Cuándo debo pasar de credits a API?

Cuando ya encontraste la combinación correcta de imagen y prompt, y el verdadero coste pasa a ser repetir tareas manuales.

Nano Banana Pro

Imagen 4K80% DESC.

Google Gemini 3 Pro Image · Generación de imágenes AI

Más de 100K desarrolladores atendidos
$0.24/img
$0.05/img
Oferta limitada·Estable empresarial·Alipay/WeChat
Gemini 3
Modelo nativo
Acceso directo
20ms latencia
4K Ultra HD
2048px
30s generación
Ultra rápido
|@laozhang_cn|Obtén $0.05

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+