AIFreeAPI Logo

Cuota gratis de Gemini API en 2026: qué sigue funcionando y dónde ver los límites reales

A
17 min readGuías de API

En marzo de 2026 Gemini Developer API todavía ofrece cuota gratis, pero la página pública de rate limits ya no funciona como una tabla completa y garantizada para todos los proyectos. Esta guía separa los hechos públicos estables de los límites activos que debes revisar dentro de AI Studio.

Guía 2026 sobre la cuota gratis de Gemini API con hechos públicos, límites de AI Studio y solución de errores 429

Respuesta corta al 18 de marzo de 2026: sí, Gemini Developer API todavía tiene cuota gratis. Google sigue diciendo en la guía oficial de Gemini API quickstart que puedes crear una API key gratis para empezar. Además, en la página oficial de pricing, Gemini 2.5 Pro, Gemini 2.5 Flash y Gemini 2.5 Flash-Lite siguen apareciendo como free of charge para el uso estándar. Lo que cambió no es la existencia del acceso gratuito, sino el hecho de que la documentación pública ya no actúa como una tabla completa y garantizada de la cuota gratis actual.

La forma más segura de entenderlo hoy es en dos capas. La primera capa es lo que Google todavía confirma públicamente: cómo se cuentan los límites, cuándo se reinicia la cuota diaria, cómo funcionan los tiers de pago, qué modelos siguen marcados como gratuitos y qué condiciones legales aplican al uso unpaid. La segunda capa es lo que ya no conviene deducir a partir de blogs viejos o capturas de pantalla: el límite exacto que tiene activo tu proyecto para una combinación concreta de modelo, estado y cuenta. Por eso la página oficial de rate limits ahora te envía a AI Studio para ver los active limits.

Resumen rápido

La cuota gratis de Gemini API sigue siendo real en marzo de 2026, pero ya no conviene tratarla como si fuera una tabla fija y pública que siempre describe tu situación exacta. La documentación pública sigue siendo fiable para varias cosas: la cuota se aplica por proyecto y no por API key, el RPD se reinicia a medianoche hora del Pacífico, la ruta de subida de tier está documentada y los modelos 2.5 principales siguen apareciendo como uso gratuito estándar. Lo que ya no está tan claro en una sola página pública es el techo exacto y actual que tiene tu proyecto en ese momento.

Por eso muchos artículos de búsqueda siguen siendo útiles para contexto, pero no para operar con seguridad. Todavía verás cifras como 5 RPM, 10 RPM, 15 RPM, 100 RPD, 500 RPD o 1000 RPD circulando por blogs y foros. Algunas fueron correctas en otros momentos, otras siguen acercándose a lo que ciertos proyectos ven en la práctica, pero la página pública actual de rate limits ya no las presenta como una matriz universal garantizada. Hoy la lectura correcta es: usa la documentación pública para entender las reglas y AI Studio para ver el límite real.

PreguntaRespuesta segura el 18/03/2026
¿Gemini API todavía tiene cuota gratis?Sí. Google mantiene el acceso gratuito inicial y todavía muestra uso estándar gratis para modelos clave 2.5.
¿Dónde veo mis límites exactos?En AI Studio, no solo en tablas viejas de blogs.
¿Qué sigue confirmado públicamente?Reglas de RPM/TPM/RPD, límites por proyecto, reset a medianoche PT, criterios de tier, estado gratis o pagado y términos del uso unpaid.
¿Se puede tratar la cuota gratis como capacidad de producción?No. Sirve muy bien para prototipos, pero no equivale a una capacidad estable contratada.
¿Con qué modelo conviene empezar?Normalmente con Gemini 2.5 Flash; si priorizas iteración barata y alta frecuencia, Flash-Lite.
¿Cuándo conviene activar billing?Cuando la estabilidad, la privacidad, la región o la velocidad del equipo pasan a ser más importantes que ahorrar unos dólares.

Si después de esta guía quieres comparar costes reales entre proveedores, puedes seguir con nuestro análisis Gemini vs OpenAI vs Claude 2026. Para OpenAI todavía no hay equivalente en español en este repo, así que el texto útil sigue siendo English reference: OpenAI API free trial guide.

Qué significa realmente “cuota gratis de Gemini API” en marzo de 2026

Hoy ya no basta con repetir “Gemini API es gratis”. Esa frase es técnicamente cierta como punto de entrada, pero incompleta como guía operativa. Lo que Google sigue sosteniendo con claridad es que puedes empezar sin tarjeta, crear una key gratis y usar ciertos modelos 2.5 sin coste estándar. Lo que ya no está presentado de la misma forma es una tabla pública, cerrada y plenamente suficiente para saber el límite exacto de tu proyecto en este instante.

Ese cambio importa mucho porque la intención de búsqueda ya no es solo “¿puedo probarlo sin pagar?”. En realidad, la mayoría de usuarios quiere decidir algo más profundo: si la cuota gratis les alcanza para su prototipo, si los números viejos que ven en artículos siguen siendo fiables, si un 429 se resuelve con backoff o con billing, y si ese camino gratuito es compatible con su contexto legal o de privacidad.

La documentación oficial actual deja una pista clara. La página de rate limits sigue describiendo la mecánica, pero te manda a AI Studio para ver los límites activos y además recuerda que la capacidad real puede variar. Esa combinación significa que free tier sigue existiendo, pero no debes modelarlo como una garantía rígida de producción.

En la práctica, eso cambia la manera correcta de planificar. Si hoy estás decidiendo entre seguir en pruebas o poner una función delante de usuarios reales, la pregunta ya no es solo "¿hay cuota gratis?", sino "¿qué parte de mi arquitectura depende de un límite vivo que Google puede ajustar y que solo veo en AI Studio?". Ese matiz parece pequeño, pero es exactamente lo que separa un prototipo razonable de una expectativa operativa equivocada.

Lo que Google todavía confirma de forma pública

Infografía que separa los hechos públicos estables de Gemini API y los límites vivos que ahora debes revisar en AI Studio
Infografía que separa los hechos públicos estables de Gemini API y los límites vivos que ahora debes revisar en AI Studio

La siguiente tabla solo incluye datos que todavía se pueden verificar directamente en páginas públicas de Google a fecha de 18 de marzo de 2026.

TemaHecho público verificable hoyPor qué importa
Inicio gratisEl quickstart sigue diciendo que puedes crear una API key gratisConfirma que la puerta de entrada gratuita sigue activa
Nivel del límiteLos límites se aplican por proyecto, no por API keyVarias keys no multiplican la cuota gratis
Reinicio diarioEl RPD se reinicia a medianoche hora del PacíficoExplica cuándo vuelve la cuota diaria
Dimensiones de límiteGoogle sigue describiendo RPM, TPM y RPDNecesitas esta base para entender un 429
Fuente del límite vivoGoogle te pide ver active limits en AI StudioEl valor exacto actual depende del estado del proyecto
Tier 1Se activa al habilitar billingEs el primer paso cuando free tier ya no alcanza
Tier 2Requiere 100 USD pagados y al menos 3 días desde el primer pago exitosoÚtil para planificar crecimiento
Tier 3Requiere 1000 USD pagados y 30 días desde el primer pago exitosoImportante para cargas mayores
Estado gratis2.5 Pro, 2.5 Flash y 2.5 Flash-Lite siguen como free of charge para standard usageEl estado gratuito no desapareció
Search groundingFlash y Flash-Lite aún muestran un límite gratis compartido de 500 RPDEs uno de los pocos valores numéricos gratuitos visibles en público
Long contextGemini 2.5 Pro sigue publicando 1,048,576 tokens de entrada y 65,536 de salidaRelevante para documentos y repositorios grandes
Uso de datos unpaidGoogle puede usar inputs y outputs de servicios unpaid para mejorar sus productosFree tier no es ideal para datos sensibles
Restricción EEA / CH / UKLas apps para usuarios finales en esas regiones deben usar paid servicesLa cuota gratis no sirve como vía de lanzamiento allí

Este marco es más útil que una tabla vieja porque se apoya en lo que Google todavía firma públicamente hoy. Los blogs pueden ayudarte a entender el contexto, pero si no separas los hechos estables de los números volátiles, acabarás diseñando alrededor de una ilusión.

Cómo ver el límite real de tu proyecto en AI Studio

El consejo operativo más importante de toda esta guía es simple: crea la key, vuelve a AI Studio y revisa los límites del proyecto que realmente vas a usar. No de otro proyecto del mismo correo, no del proyecto de pruebas de hace meses, sino del proyecto exacto que usará tu aplicación.

La secuencia segura es esta:

  1. Crear la API key en AI Studio.
  2. Confirmar a qué proyecto pertenece.
  3. Abrir la vista de rate limits en AI Studio.
  4. Revisar el model name exacto que vas a invocar.
  5. Anotar RPM, TPM, RPD y si el modelo es stable, preview o experimental.

Este paso evita dos errores frecuentes. El primero: pensar que varias API key significan varias cuotas gratis independientes. No es así si comparten proyecto. El segundo: asumir que preview y stable se comportan igual. La propia documentación pública dice que los modelos preview y experimental suelen ser más restrictivos.

También conviene guardar una captura antes y después de activar billing. Eso te da una referencia real y evita que el equipo discuta a partir de recuerdos vagos o artículos antiguos.

Qué modelo conviene usar en free tier: Flash, Flash-Lite o Pro

Comparación en tres tarjetas que muestra cuándo usar Flash-Lite, Flash o Pro en la cuota gratis
Comparación en tres tarjetas que muestra cuándo usar Flash-Lite, Flash o Pro en la cuota gratis

En la fase gratuita no siempre gana el modelo más potente. Muchas veces gana el modelo que te deja iterar más y llegar más rápido a una decisión útil.

ModeloCuándo encaja mejorVentaja principalCoste oculto
Gemini 2.5 Flash-LiteExtracción, clasificación, routing, tareas simples de alto volumenMuy barato y rápidoMenor profundidad para reasoning complejo
Gemini 2.5 FlashPrototipos, chat, demos, uso generalMejor equilibrio entre calidad y practicidadLos límites activos siguen dependiendo de AI Studio
Gemini 2.5 ProDocumentos largos, razonamiento difícil, código complejoMejor capacidad de reasoning y contexto largoEn free tier es el más fácil de volver impráctico por iteración

Por eso Flash suele ser la recomendación inicial más sensata. Flash-Lite es mejor si tu cuello de botella es la frecuencia de pruebas y no la dificultad intelectual de cada tarea. Pro vale la pena cuando el problema de verdad requiere contexto largo o razonamiento de mayor calidad, no solo porque “suena mejor”.

Por qué sigues viendo errores 429 en free tier

Diagrama de decisión que separa un error 429 de Gemini en RPM, TPM y RPD
Diagrama de decisión que separa un error 429 de Gemini en RPM, TPM y RPD

La mayoría de la frustración con Gemini free tier aparece en forma de 429, pero 429 no es la causa. Es solo la señal. Lo importante es identificar qué límite tocaste y si la solución es esperar, recortar contexto, separar proyectos o activar billing.

SíntomaCausa más probableAcción correcta
Varias llamadas fallan tras un burstRPM agotadoCola, backoff con jitter y menos concurrencia
El problema aparece con prompts grandesTPM agotadoReducir contexto, trocear y cachear
Funciona al principio del día y luego deja de funcionarRPD agotadoEsperar al reset PT o pasar a paid tier
Distintos servicios fallan a la vezMismo bucket por proyectoSeparar cargas por proyecto
Preview falla más de lo esperadoRestricción más dura del modelo previewPriorizar stable si existe
Billing activado pero sensación de límite bajoProyecto equivocado, tier mal interpretado o capacidad variableRevisar otra vez AI Studio

La idea clave es esta: no todo 429 se arregla con más retry. El backoff sirve cuando el problema es RPM o cierta contención temporal. No sirve cuando la cuota diaria ya se consumió. Si la causa es RPD, no estás ante un problema de algoritmo de retry, sino de capacidad.

Una envoltura mínima de reintento puede verse así:

python
import asyncio import random from google import genai client = genai.Client(api_key="YOUR_GEMINI_API_KEY") async def generate_with_retry(prompt: str, retries: int = 5): for attempt in range(retries): try: return client.models.generate_content( model="gemini-2.5-flash", contents=prompt, ) except Exception as exc: if "429" not in str(exc) or attempt == retries - 1: raise delay = min(2 ** attempt + random.random(), 30) await asyncio.sleep(delay)

Úsalo como herramienta táctica, no como excusa para evitar una decisión de capacidad. Si necesitas un análisis más profundo de la mecánica, todavía no hay versión equivalente en español en este repo, así que la referencia sigue siendo English reference: Gemini API rate limit explained.

Cuándo deja de tener sentido seguir en la capa gratuita

La capa gratuita es valiosa cuando el coste del fallo es bajo. En cuanto el coste del fallo supera el ahorro, insistir en free tier empieza a ser una falsa economía.

Escenario¿Seguir en free tier?Motivo
Aprendizaje, PoC, hackathonEs justo el mejor caso de uso
Herramienta interna pequeñaA vecesSi toleras pausas y variación
Producto público para usuariosNoNecesitas capacidad predecible
Datos sensibles o confidencialesNoEl tratamiento unpaid ya no encaja
App para usuarios finales en EEA / CH / UKNoSe requieren paid services
Ya escribiste demasiada lógica de evasiónCasi nuncaEl tiempo de ingeniería empieza a costar más que billing

La regla práctica es sencilla: si lo importante para ti ya es estabilidad, privacidad, compatibilidad regional o velocidad sostenida del equipo, la etapa gratuita debe dejar de ser la base de tu arquitectura.

Cómo crear la key gratis y hacer la primera llamada

La parte de onboarding sigue siendo simple. Entras en Google AI Studio, creas la key, la guardas en GEMINI_API_KEY, haces una primera llamada con Flash y luego vuelves a AI Studio para mirar tu límite real.

Python:

python
from google import genai import os client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) response = client.models.generate_content( model="gemini-2.5-flash", contents="Explica de forma sencilla qué es una base de datos vectorial.", ) print(response.text)

Node.js:

ts
import { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const response = await ai.models.generateContent({ model: "gemini-2.5-flash", contents: "Explica de forma sencilla qué es una base de datos vectorial.", }); console.log(response.text);

El hábito más importante aquí no es técnico sino operativo: no incrustes la key en frontend y no diseñes sobre límites viejos cuando AI Studio te puede mostrar el estado real del proyecto.

FAQ

¿Necesito tarjeta para crear una Gemini API key?

No. El quickstart oficial sigue permitiendo empezar gratis.

¿Google puede usar mis prompts y respuestas gratis para mejorar sus productos?

Sí, en la capa unpaid. Por eso free tier no es una buena opción para datos sensibles.

¿Puedo lanzar una app para usuarios de la EEA, Suiza o Reino Unido usando free tier?

No. Para esas regiones Google exige paid services en apps para usuarios finales.

¿Las viejas tablas de 5 RPM, 10 RPM o 15 RPM siguen valiendo?

Solo como contexto histórico. El valor operativo actual se confirma en AI Studio.

¿Con qué modelo debería empezar?

Normalmente con Flash. Si buscas muchas iteraciones simples y baratas, Flash-Lite. Si tu problema exige reasoning más fuerte o contexto largo, Pro.

¿Activar billing resuelve todo al instante?

Resuelve el problema estructural principal, pero no elimina la necesidad de comprobar el proyecto y el tier correctos dentro de AI Studio.

Nano Banana Pro

Imagen 4K80% DESC.

Google Gemini 3 Pro Image · Generación de imágenes AI

Más de 100K desarrolladores atendidos
$0.24/img
$0.05/img
Oferta limitada·Estable empresarial·Alipay/WeChat
Gemini 3
Modelo nativo
Acceso directo
20ms latencia
4K Ultra HD
2048px
30s generación
Ultra rápido
|@laozhang_cn|Obtén $0.05

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+