Respuesta corta al 18 de marzo de 2026: sí, Gemini Developer API todavía tiene cuota gratis. Google sigue diciendo en la guía oficial de Gemini API quickstart que puedes crear una API key gratis para empezar. Además, en la página oficial de pricing, Gemini 2.5 Pro, Gemini 2.5 Flash y Gemini 2.5 Flash-Lite siguen apareciendo como free of charge para el uso estándar. Lo que cambió no es la existencia del acceso gratuito, sino el hecho de que la documentación pública ya no actúa como una tabla completa y garantizada de la cuota gratis actual.
La forma más segura de entenderlo hoy es en dos capas. La primera capa es lo que Google todavía confirma públicamente: cómo se cuentan los límites, cuándo se reinicia la cuota diaria, cómo funcionan los tiers de pago, qué modelos siguen marcados como gratuitos y qué condiciones legales aplican al uso unpaid. La segunda capa es lo que ya no conviene deducir a partir de blogs viejos o capturas de pantalla: el límite exacto que tiene activo tu proyecto para una combinación concreta de modelo, estado y cuenta. Por eso la página oficial de rate limits ahora te envía a AI Studio para ver los active limits.
Resumen rápido
La cuota gratis de Gemini API sigue siendo real en marzo de 2026, pero ya no conviene tratarla como si fuera una tabla fija y pública que siempre describe tu situación exacta. La documentación pública sigue siendo fiable para varias cosas: la cuota se aplica por proyecto y no por API key, el RPD se reinicia a medianoche hora del Pacífico, la ruta de subida de tier está documentada y los modelos 2.5 principales siguen apareciendo como uso gratuito estándar. Lo que ya no está tan claro en una sola página pública es el techo exacto y actual que tiene tu proyecto en ese momento.
Por eso muchos artículos de búsqueda siguen siendo útiles para contexto, pero no para operar con seguridad. Todavía verás cifras como 5 RPM, 10 RPM, 15 RPM, 100 RPD, 500 RPD o 1000 RPD circulando por blogs y foros. Algunas fueron correctas en otros momentos, otras siguen acercándose a lo que ciertos proyectos ven en la práctica, pero la página pública actual de rate limits ya no las presenta como una matriz universal garantizada. Hoy la lectura correcta es: usa la documentación pública para entender las reglas y AI Studio para ver el límite real.
| Pregunta | Respuesta segura el 18/03/2026 |
|---|---|
| ¿Gemini API todavía tiene cuota gratis? | Sí. Google mantiene el acceso gratuito inicial y todavía muestra uso estándar gratis para modelos clave 2.5. |
| ¿Dónde veo mis límites exactos? | En AI Studio, no solo en tablas viejas de blogs. |
| ¿Qué sigue confirmado públicamente? | Reglas de RPM/TPM/RPD, límites por proyecto, reset a medianoche PT, criterios de tier, estado gratis o pagado y términos del uso unpaid. |
| ¿Se puede tratar la cuota gratis como capacidad de producción? | No. Sirve muy bien para prototipos, pero no equivale a una capacidad estable contratada. |
| ¿Con qué modelo conviene empezar? | Normalmente con Gemini 2.5 Flash; si priorizas iteración barata y alta frecuencia, Flash-Lite. |
| ¿Cuándo conviene activar billing? | Cuando la estabilidad, la privacidad, la región o la velocidad del equipo pasan a ser más importantes que ahorrar unos dólares. |
Si después de esta guía quieres comparar costes reales entre proveedores, puedes seguir con nuestro análisis Gemini vs OpenAI vs Claude 2026. Para OpenAI todavía no hay equivalente en español en este repo, así que el texto útil sigue siendo English reference: OpenAI API free trial guide.
Qué significa realmente “cuota gratis de Gemini API” en marzo de 2026
Hoy ya no basta con repetir “Gemini API es gratis”. Esa frase es técnicamente cierta como punto de entrada, pero incompleta como guía operativa. Lo que Google sigue sosteniendo con claridad es que puedes empezar sin tarjeta, crear una key gratis y usar ciertos modelos 2.5 sin coste estándar. Lo que ya no está presentado de la misma forma es una tabla pública, cerrada y plenamente suficiente para saber el límite exacto de tu proyecto en este instante.
Ese cambio importa mucho porque la intención de búsqueda ya no es solo “¿puedo probarlo sin pagar?”. En realidad, la mayoría de usuarios quiere decidir algo más profundo: si la cuota gratis les alcanza para su prototipo, si los números viejos que ven en artículos siguen siendo fiables, si un 429 se resuelve con backoff o con billing, y si ese camino gratuito es compatible con su contexto legal o de privacidad.
La documentación oficial actual deja una pista clara. La página de rate limits sigue describiendo la mecánica, pero te manda a AI Studio para ver los límites activos y además recuerda que la capacidad real puede variar. Esa combinación significa que free tier sigue existiendo, pero no debes modelarlo como una garantía rígida de producción.
En la práctica, eso cambia la manera correcta de planificar. Si hoy estás decidiendo entre seguir en pruebas o poner una función delante de usuarios reales, la pregunta ya no es solo "¿hay cuota gratis?", sino "¿qué parte de mi arquitectura depende de un límite vivo que Google puede ajustar y que solo veo en AI Studio?". Ese matiz parece pequeño, pero es exactamente lo que separa un prototipo razonable de una expectativa operativa equivocada.
Lo que Google todavía confirma de forma pública

La siguiente tabla solo incluye datos que todavía se pueden verificar directamente en páginas públicas de Google a fecha de 18 de marzo de 2026.
| Tema | Hecho público verificable hoy | Por qué importa |
|---|---|---|
| Inicio gratis | El quickstart sigue diciendo que puedes crear una API key gratis | Confirma que la puerta de entrada gratuita sigue activa |
| Nivel del límite | Los límites se aplican por proyecto, no por API key | Varias keys no multiplican la cuota gratis |
| Reinicio diario | El RPD se reinicia a medianoche hora del Pacífico | Explica cuándo vuelve la cuota diaria |
| Dimensiones de límite | Google sigue describiendo RPM, TPM y RPD | Necesitas esta base para entender un 429 |
| Fuente del límite vivo | Google te pide ver active limits en AI Studio | El valor exacto actual depende del estado del proyecto |
| Tier 1 | Se activa al habilitar billing | Es el primer paso cuando free tier ya no alcanza |
| Tier 2 | Requiere 100 USD pagados y al menos 3 días desde el primer pago exitoso | Útil para planificar crecimiento |
| Tier 3 | Requiere 1000 USD pagados y 30 días desde el primer pago exitoso | Importante para cargas mayores |
| Estado gratis | 2.5 Pro, 2.5 Flash y 2.5 Flash-Lite siguen como free of charge para standard usage | El estado gratuito no desapareció |
| Search grounding | Flash y Flash-Lite aún muestran un límite gratis compartido de 500 RPD | Es uno de los pocos valores numéricos gratuitos visibles en público |
| Long context | Gemini 2.5 Pro sigue publicando 1,048,576 tokens de entrada y 65,536 de salida | Relevante para documentos y repositorios grandes |
| Uso de datos unpaid | Google puede usar inputs y outputs de servicios unpaid para mejorar sus productos | Free tier no es ideal para datos sensibles |
| Restricción EEA / CH / UK | Las apps para usuarios finales en esas regiones deben usar paid services | La cuota gratis no sirve como vía de lanzamiento allí |
Este marco es más útil que una tabla vieja porque se apoya en lo que Google todavía firma públicamente hoy. Los blogs pueden ayudarte a entender el contexto, pero si no separas los hechos estables de los números volátiles, acabarás diseñando alrededor de una ilusión.
Cómo ver el límite real de tu proyecto en AI Studio
El consejo operativo más importante de toda esta guía es simple: crea la key, vuelve a AI Studio y revisa los límites del proyecto que realmente vas a usar. No de otro proyecto del mismo correo, no del proyecto de pruebas de hace meses, sino del proyecto exacto que usará tu aplicación.
La secuencia segura es esta:
- Crear la API key en AI Studio.
- Confirmar a qué proyecto pertenece.
- Abrir la vista de rate limits en AI Studio.
- Revisar el model name exacto que vas a invocar.
- Anotar RPM, TPM, RPD y si el modelo es stable, preview o experimental.
Este paso evita dos errores frecuentes. El primero: pensar que varias API key significan varias cuotas gratis independientes. No es así si comparten proyecto. El segundo: asumir que preview y stable se comportan igual. La propia documentación pública dice que los modelos preview y experimental suelen ser más restrictivos.
También conviene guardar una captura antes y después de activar billing. Eso te da una referencia real y evita que el equipo discuta a partir de recuerdos vagos o artículos antiguos.
Qué modelo conviene usar en free tier: Flash, Flash-Lite o Pro

En la fase gratuita no siempre gana el modelo más potente. Muchas veces gana el modelo que te deja iterar más y llegar más rápido a una decisión útil.
| Modelo | Cuándo encaja mejor | Ventaja principal | Coste oculto |
|---|---|---|---|
| Gemini 2.5 Flash-Lite | Extracción, clasificación, routing, tareas simples de alto volumen | Muy barato y rápido | Menor profundidad para reasoning complejo |
| Gemini 2.5 Flash | Prototipos, chat, demos, uso general | Mejor equilibrio entre calidad y practicidad | Los límites activos siguen dependiendo de AI Studio |
| Gemini 2.5 Pro | Documentos largos, razonamiento difícil, código complejo | Mejor capacidad de reasoning y contexto largo | En free tier es el más fácil de volver impráctico por iteración |
Por eso Flash suele ser la recomendación inicial más sensata. Flash-Lite es mejor si tu cuello de botella es la frecuencia de pruebas y no la dificultad intelectual de cada tarea. Pro vale la pena cuando el problema de verdad requiere contexto largo o razonamiento de mayor calidad, no solo porque “suena mejor”.
Por qué sigues viendo errores 429 en free tier

La mayoría de la frustración con Gemini free tier aparece en forma de 429, pero 429 no es la causa. Es solo la señal. Lo importante es identificar qué límite tocaste y si la solución es esperar, recortar contexto, separar proyectos o activar billing.
| Síntoma | Causa más probable | Acción correcta |
|---|---|---|
| Varias llamadas fallan tras un burst | RPM agotado | Cola, backoff con jitter y menos concurrencia |
| El problema aparece con prompts grandes | TPM agotado | Reducir contexto, trocear y cachear |
| Funciona al principio del día y luego deja de funcionar | RPD agotado | Esperar al reset PT o pasar a paid tier |
| Distintos servicios fallan a la vez | Mismo bucket por proyecto | Separar cargas por proyecto |
| Preview falla más de lo esperado | Restricción más dura del modelo preview | Priorizar stable si existe |
| Billing activado pero sensación de límite bajo | Proyecto equivocado, tier mal interpretado o capacidad variable | Revisar otra vez AI Studio |
La idea clave es esta: no todo 429 se arregla con más retry. El backoff sirve cuando el problema es RPM o cierta contención temporal. No sirve cuando la cuota diaria ya se consumió. Si la causa es RPD, no estás ante un problema de algoritmo de retry, sino de capacidad.
Una envoltura mínima de reintento puede verse así:
pythonimport asyncio import random from google import genai client = genai.Client(api_key="YOUR_GEMINI_API_KEY") async def generate_with_retry(prompt: str, retries: int = 5): for attempt in range(retries): try: return client.models.generate_content( model="gemini-2.5-flash", contents=prompt, ) except Exception as exc: if "429" not in str(exc) or attempt == retries - 1: raise delay = min(2 ** attempt + random.random(), 30) await asyncio.sleep(delay)
Úsalo como herramienta táctica, no como excusa para evitar una decisión de capacidad. Si necesitas un análisis más profundo de la mecánica, todavía no hay versión equivalente en español en este repo, así que la referencia sigue siendo English reference: Gemini API rate limit explained.
Cuándo deja de tener sentido seguir en la capa gratuita
La capa gratuita es valiosa cuando el coste del fallo es bajo. En cuanto el coste del fallo supera el ahorro, insistir en free tier empieza a ser una falsa economía.
| Escenario | ¿Seguir en free tier? | Motivo |
|---|---|---|
| Aprendizaje, PoC, hackathon | Sí | Es justo el mejor caso de uso |
| Herramienta interna pequeña | A veces | Si toleras pausas y variación |
| Producto público para usuarios | No | Necesitas capacidad predecible |
| Datos sensibles o confidenciales | No | El tratamiento unpaid ya no encaja |
| App para usuarios finales en EEA / CH / UK | No | Se requieren paid services |
| Ya escribiste demasiada lógica de evasión | Casi nunca | El tiempo de ingeniería empieza a costar más que billing |
La regla práctica es sencilla: si lo importante para ti ya es estabilidad, privacidad, compatibilidad regional o velocidad sostenida del equipo, la etapa gratuita debe dejar de ser la base de tu arquitectura.
Cómo crear la key gratis y hacer la primera llamada
La parte de onboarding sigue siendo simple. Entras en Google AI Studio, creas la key, la guardas en GEMINI_API_KEY, haces una primera llamada con Flash y luego vuelves a AI Studio para mirar tu límite real.
Python:
pythonfrom google import genai import os client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) response = client.models.generate_content( model="gemini-2.5-flash", contents="Explica de forma sencilla qué es una base de datos vectorial.", ) print(response.text)
Node.js:
tsimport { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const response = await ai.models.generateContent({ model: "gemini-2.5-flash", contents: "Explica de forma sencilla qué es una base de datos vectorial.", }); console.log(response.text);
El hábito más importante aquí no es técnico sino operativo: no incrustes la key en frontend y no diseñes sobre límites viejos cuando AI Studio te puede mostrar el estado real del proyecto.
FAQ
¿Necesito tarjeta para crear una Gemini API key?
No. El quickstart oficial sigue permitiendo empezar gratis.
¿Google puede usar mis prompts y respuestas gratis para mejorar sus productos?
Sí, en la capa unpaid. Por eso free tier no es una buena opción para datos sensibles.
¿Puedo lanzar una app para usuarios de la EEA, Suiza o Reino Unido usando free tier?
No. Para esas regiones Google exige paid services en apps para usuarios finales.
¿Las viejas tablas de 5 RPM, 10 RPM o 15 RPM siguen valiendo?
Solo como contexto histórico. El valor operativo actual se confirma en AI Studio.
¿Con qué modelo debería empezar?
Normalmente con Flash. Si buscas muchas iteraciones simples y baratas, Flash-Lite. Si tu problema exige reasoning más fuerte o contexto largo, Pro.
¿Activar billing resuelve todo al instante?
Resuelve el problema estructural principal, pero no elimina la necesidad de comprobar el proyecto y el tier correctos dentro de AI Studio.
