Cuota gratis de Gemini API en 2026: qué sigue funcionando y dónde ver los límites reales

AI Free API Team

•Mar 18, 2026•17 min read•Guías de API

En marzo de 2026 Gemini Developer API todavía ofrece cuota gratis, pero la página pública de rate limits ya no funciona como una tabla completa y garantizada para todos los proyectos. Esta guía separa los hechos públicos estables de los límites activos que debes revisar dentro de AI Studio.

Guía 2026 sobre la cuota gratis de Gemini API con hechos públicos, límites de AI Studio y solución de errores 429

Respuesta corta al 18 de marzo de 2026: sí, Gemini Developer API todavía tiene cuota gratis. Google sigue diciendo en la guía oficial de Gemini API quickstart que puedes crear una API key gratis para empezar. Además, en la página oficial de pricing, Gemini 2.5 Pro, Gemini 2.5 Flash y Gemini 2.5 Flash-Lite siguen apareciendo como free of charge para el uso estándar. Lo que cambió no es la existencia del acceso gratuito, sino el hecho de que la documentación pública ya no actúa como una tabla completa y garantizada de la cuota gratis actual.

La forma más segura de entenderlo hoy es en dos capas. La primera capa es lo que Google todavía confirma públicamente: cómo se cuentan los límites, cuándo se reinicia la cuota diaria, cómo funcionan los tiers de pago, qué modelos siguen marcados como gratuitos y qué condiciones legales aplican al uso unpaid. La segunda capa es lo que ya no conviene deducir a partir de blogs viejos o capturas de pantalla: el límite exacto que tiene activo tu proyecto para una combinación concreta de modelo, estado y cuenta. Por eso la página oficial de rate limits ahora te envía a AI Studio para ver los active limits.

Resumen rápido

La cuota gratis de Gemini API sigue siendo real en marzo de 2026, pero ya no conviene tratarla como si fuera una tabla fija y pública que siempre describe tu situación exacta. La documentación pública sigue siendo fiable para varias cosas: la cuota se aplica por proyecto y no por API key, el RPD se reinicia a medianoche hora del Pacífico, la ruta de subida de tier está documentada y los modelos 2.5 principales siguen apareciendo como uso gratuito estándar. Lo que ya no está tan claro en una sola página pública es el techo exacto y actual que tiene tu proyecto en ese momento.

Por eso muchos artículos de búsqueda siguen siendo útiles para contexto, pero no para operar con seguridad. Todavía verás cifras como 5 RPM, 10 RPM, 15 RPM, 100 RPD, 500 RPD o 1000 RPD circulando por blogs y foros. Algunas fueron correctas en otros momentos, otras siguen acercándose a lo que ciertos proyectos ven en la práctica, pero la página pública actual de rate limits ya no las presenta como una matriz universal garantizada. Hoy la lectura correcta es: usa la documentación pública para entender las reglas y AI Studio para ver el límite real.

Pregunta	Respuesta segura el 18/03/2026
¿Gemini API todavía tiene cuota gratis?	Sí. Google mantiene el acceso gratuito inicial y todavía muestra uso estándar gratis para modelos clave 2.5.
¿Dónde veo mis límites exactos?	En AI Studio, no solo en tablas viejas de blogs.
¿Qué sigue confirmado públicamente?	Reglas de RPM/TPM/RPD, límites por proyecto, reset a medianoche PT, criterios de tier, estado gratis o pagado y términos del uso unpaid.
¿Se puede tratar la cuota gratis como capacidad de producción?	No. Sirve muy bien para prototipos, pero no equivale a una capacidad estable contratada.
¿Con qué modelo conviene empezar?	Normalmente con Gemini 2.5 Flash; si priorizas iteración barata y alta frecuencia, Flash-Lite.
¿Cuándo conviene activar billing?	Cuando la estabilidad, la privacidad, la región o la velocidad del equipo pasan a ser más importantes que ahorrar unos dólares.

Si después de esta guía quieres comparar costes reales entre proveedores, puedes seguir con nuestro análisis Gemini vs OpenAI vs Claude 2026. Para OpenAI todavía no hay equivalente en español en este repo, así que el texto útil sigue siendo English reference: OpenAI API free trial guide.

Qué significa realmente “cuota gratis de Gemini API” en marzo de 2026

Hoy ya no basta con repetir “Gemini API es gratis”. Esa frase es técnicamente cierta como punto de entrada, pero incompleta como guía operativa. Lo que Google sigue sosteniendo con claridad es que puedes empezar sin tarjeta, crear una key gratis y usar ciertos modelos 2.5 sin coste estándar. Lo que ya no está presentado de la misma forma es una tabla pública, cerrada y plenamente suficiente para saber el límite exacto de tu proyecto en este instante.

Ese cambio importa mucho porque la intención de búsqueda ya no es solo “¿puedo probarlo sin pagar?”. En realidad, la mayoría de usuarios quiere decidir algo más profundo: si la cuota gratis les alcanza para su prototipo, si los números viejos que ven en artículos siguen siendo fiables, si un 429 se resuelve con backoff o con billing, y si ese camino gratuito es compatible con su contexto legal o de privacidad.

La documentación oficial actual deja una pista clara. La página de rate limits sigue describiendo la mecánica, pero te manda a AI Studio para ver los límites activos y además recuerda que la capacidad real puede variar. Esa combinación significa que free tier sigue existiendo, pero no debes modelarlo como una garantía rígida de producción.

En la práctica, eso cambia la manera correcta de planificar. Si hoy estás decidiendo entre seguir en pruebas o poner una función delante de usuarios reales, la pregunta ya no es solo "¿hay cuota gratis?", sino "¿qué parte de mi arquitectura depende de un límite vivo que Google puede ajustar y que solo veo en AI Studio?". Ese matiz parece pequeño, pero es exactamente lo que separa un prototipo razonable de una expectativa operativa equivocada.

Lo que Google todavía confirma de forma pública

Infografía que separa los hechos públicos estables de Gemini API y los límites vivos que ahora debes revisar en AI Studio

La siguiente tabla solo incluye datos que todavía se pueden verificar directamente en páginas públicas de Google a fecha de 18 de marzo de 2026.

Tema	Hecho público verificable hoy	Por qué importa
Inicio gratis	El quickstart sigue diciendo que puedes crear una API key gratis	Confirma que la puerta de entrada gratuita sigue activa
Nivel del límite	Los límites se aplican por proyecto, no por API key	Varias keys no multiplican la cuota gratis
Reinicio diario	El RPD se reinicia a medianoche hora del Pacífico	Explica cuándo vuelve la cuota diaria
Dimensiones de límite	Google sigue describiendo RPM, TPM y RPD	Necesitas esta base para entender un 429
Fuente del límite vivo	Google te pide ver active limits en AI Studio	El valor exacto actual depende del estado del proyecto
Tier 1	Se activa al habilitar billing	Es el primer paso cuando free tier ya no alcanza
Tier 2	Requiere 100 USD pagados y al menos 3 días desde el primer pago exitoso	Útil para planificar crecimiento
Tier 3	Requiere 1000 USD pagados y 30 días desde el primer pago exitoso	Importante para cargas mayores
Estado gratis	2.5 Pro, 2.5 Flash y 2.5 Flash-Lite siguen como free of charge para standard usage	El estado gratuito no desapareció
Search grounding	Flash y Flash-Lite aún muestran un límite gratis compartido de 500 RPD	Es uno de los pocos valores numéricos gratuitos visibles en público
Long context	Gemini 2.5 Pro sigue publicando 1,048,576 tokens de entrada y 65,536 de salida	Relevante para documentos y repositorios grandes
Uso de datos unpaid	Google puede usar inputs y outputs de servicios unpaid para mejorar sus productos	Free tier no es ideal para datos sensibles
Restricción EEA / CH / UK	Las apps para usuarios finales en esas regiones deben usar paid services	La cuota gratis no sirve como vía de lanzamiento allí

Este marco es más útil que una tabla vieja porque se apoya en lo que Google todavía firma públicamente hoy. Los blogs pueden ayudarte a entender el contexto, pero si no separas los hechos estables de los números volátiles, acabarás diseñando alrededor de una ilusión.

Cómo ver el límite real de tu proyecto en AI Studio

El consejo operativo más importante de toda esta guía es simple: crea la key, vuelve a AI Studio y revisa los límites del proyecto que realmente vas a usar. No de otro proyecto del mismo correo, no del proyecto de pruebas de hace meses, sino del proyecto exacto que usará tu aplicación.

La secuencia segura es esta:

Crear la API key en AI Studio.
Confirmar a qué proyecto pertenece.
Abrir la vista de rate limits en AI Studio.
Revisar el model name exacto que vas a invocar.
Anotar RPM, TPM, RPD y si el modelo es stable, preview o experimental.

Este paso evita dos errores frecuentes. El primero: pensar que varias API key significan varias cuotas gratis independientes. No es así si comparten proyecto. El segundo: asumir que preview y stable se comportan igual. La propia documentación pública dice que los modelos preview y experimental suelen ser más restrictivos.

También conviene guardar una captura antes y después de activar billing. Eso te da una referencia real y evita que el equipo discuta a partir de recuerdos vagos o artículos antiguos.

Qué modelo conviene usar en free tier: Flash, Flash-Lite o Pro

Comparación en tres tarjetas que muestra cuándo usar Flash-Lite, Flash o Pro en la cuota gratis

En la fase gratuita no siempre gana el modelo más potente. Muchas veces gana el modelo que te deja iterar más y llegar más rápido a una decisión útil.

Modelo	Cuándo encaja mejor	Ventaja principal	Coste oculto
Gemini 2.5 Flash-Lite	Extracción, clasificación, routing, tareas simples de alto volumen	Muy barato y rápido	Menor profundidad para reasoning complejo
Gemini 2.5 Flash	Prototipos, chat, demos, uso general	Mejor equilibrio entre calidad y practicidad	Los límites activos siguen dependiendo de AI Studio
Gemini 2.5 Pro	Documentos largos, razonamiento difícil, código complejo	Mejor capacidad de reasoning y contexto largo	En free tier es el más fácil de volver impráctico por iteración

Por eso Flash suele ser la recomendación inicial más sensata. Flash-Lite es mejor si tu cuello de botella es la frecuencia de pruebas y no la dificultad intelectual de cada tarea. Pro vale la pena cuando el problema de verdad requiere contexto largo o razonamiento de mayor calidad, no solo porque “suena mejor”.

Por qué sigues viendo errores 429 en free tier

Diagrama de decisión que separa un error 429 de Gemini en RPM, TPM y RPD

La mayoría de la frustración con Gemini free tier aparece en forma de 429, pero 429 no es la causa. Es solo la señal. Lo importante es identificar qué límite tocaste y si la solución es esperar, recortar contexto, separar proyectos o activar billing.

Síntoma	Causa más probable	Acción correcta
Varias llamadas fallan tras un burst	RPM agotado	Cola, backoff con jitter y menos concurrencia
El problema aparece con prompts grandes	TPM agotado	Reducir contexto, trocear y cachear
Funciona al principio del día y luego deja de funcionar	RPD agotado	Esperar al reset PT o pasar a paid tier
Distintos servicios fallan a la vez	Mismo bucket por proyecto	Separar cargas por proyecto
Preview falla más de lo esperado	Restricción más dura del modelo preview	Priorizar stable si existe
Billing activado pero sensación de límite bajo	Proyecto equivocado, tier mal interpretado o capacidad variable	Revisar otra vez AI Studio

La idea clave es esta: no todo 429 se arregla con más retry. El backoff sirve cuando el problema es RPM o cierta contención temporal. No sirve cuando la cuota diaria ya se consumió. Si la causa es RPD, no estás ante un problema de algoritmo de retry, sino de capacidad.

Una envoltura mínima de reintento puede verse así:

python
import asyncio
import random
from google import genai

client = genai.Client(api_key="YOUR_GEMINI_API_KEY")

async def generate_with_retry(prompt: str, retries: int = 5):
    for attempt in range(retries):
        try:
            return client.models.generate_content(
                model="gemini-2.5-flash",
                contents=prompt,
            )
        except Exception as exc:
            if "429" not in str(exc) or attempt == retries - 1:
                raise
            delay = min(2 ** attempt + random.random(), 30)
            await asyncio.sleep(delay)

Úsalo como herramienta táctica, no como excusa para evitar una decisión de capacidad. Si necesitas un análisis más profundo de la mecánica, todavía no hay versión equivalente en español en este repo, así que la referencia sigue siendo English reference: Gemini API rate limit explained.

Cuándo deja de tener sentido seguir en la capa gratuita

La capa gratuita es valiosa cuando el coste del fallo es bajo. En cuanto el coste del fallo supera el ahorro, insistir en free tier empieza a ser una falsa economía.

Escenario	¿Seguir en free tier?	Motivo
Aprendizaje, PoC, hackathon	Sí	Es justo el mejor caso de uso
Herramienta interna pequeña	A veces	Si toleras pausas y variación
Producto público para usuarios	No	Necesitas capacidad predecible
Datos sensibles o confidenciales	No	El tratamiento unpaid ya no encaja
App para usuarios finales en EEA / CH / UK	No	Se requieren paid services
Ya escribiste demasiada lógica de evasión	Casi nunca	El tiempo de ingeniería empieza a costar más que billing

La regla práctica es sencilla: si lo importante para ti ya es estabilidad, privacidad, compatibilidad regional o velocidad sostenida del equipo, la etapa gratuita debe dejar de ser la base de tu arquitectura.

Cómo crear la key gratis y hacer la primera llamada

La parte de onboarding sigue siendo simple. Entras en Google AI Studio, creas la key, la guardas en GEMINI_API_KEY, haces una primera llamada con Flash y luego vuelves a AI Studio para mirar tu límite real.

Python:

python
from google import genai
import os

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Explica de forma sencilla qué es una base de datos vectorial.",
)

print(response.text)

Node.js:

ts
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

const response = await ai.models.generateContent({
  model: "gemini-2.5-flash",
  contents: "Explica de forma sencilla qué es una base de datos vectorial.",
});

console.log(response.text);

El hábito más importante aquí no es técnico sino operativo: no incrustes la key en frontend y no diseñes sobre límites viejos cuando AI Studio te puede mostrar el estado real del proyecto.

FAQ

¿Necesito tarjeta para crear una Gemini API key?

No. El quickstart oficial sigue permitiendo empezar gratis.

¿Google puede usar mis prompts y respuestas gratis para mejorar sus productos?

Sí, en la capa unpaid. Por eso free tier no es una buena opción para datos sensibles.

¿Puedo lanzar una app para usuarios de la EEA, Suiza o Reino Unido usando free tier?

No. Para esas regiones Google exige paid services en apps para usuarios finales.

¿Las viejas tablas de 5 RPM, 10 RPM o 15 RPM siguen valiendo?

Solo como contexto histórico. El valor operativo actual se confirma en AI Studio.

¿Con qué modelo debería empezar?

Normalmente con Flash. Si buscas muchas iteraciones simples y baratas, Flash-Lite. Si tu problema exige reasoning más fuerte o contexto largo, Pro.

¿Activar billing resuelve todo al instante?

Resuelve el problema estructural principal, pero no elimina la necesidad de comprobar el proyecto y el tier correctos dentro de AI Studio.

Nano Banana Pro

Imagen 4K80% DESC.

Google Gemini 3 Pro Image · Generación de imágenes AI

Más de 100K desarrolladores atendidos

$0.24/img

$0.05/img

Oferta limitada·Estable empresarial·Alipay/WeChat

Gemini 3

Modelo nativo

Acceso directo

20ms latencia

4K Ultra HD

2048px

30s generación

Ultra rápido

|@laozhang_cn|Obtén $0.05

200+ AI Models API

Jan 2026

GPT-5.2Claude 4.5Gemini 3Grok 4+195

Image

80% OFF

gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video

80% OFF

Veo3 · Sora2$0.15/gen

16% OFF⚡ 5-Min📊 99.9% SLA👥 100K+

Get $0.1 Free Docs

#Gemini API #cuota gratis #límites #Google AI #error 429 #precios API