결론부터 말하면, 2026년 3월 18일 기준으로 Gemini Developer API에는 무료 할당량이 여전히 있습니다. Google은 공식 Gemini API quickstart 에서 지금도 무료로 API key를 만들 수 있다고 안내하고, 공식 pricing 페이지 에서는 Gemini 2.5 Pro, 2.5 Flash, 2.5 Flash-Lite의 표준 사용이 free of charge 상태로 남아 있습니다. 바뀐 것은 “무료가 있느냐”가 아니라, 예전처럼 공개 페이지 한 장만 보고 현재의 완전한 무료 한도 표를 읽어낼 수 있느냐 입니다.
지금은 두 층으로 이해하는 것이 안전합니다. 첫째, 공개 문서에서 지금도 확인 가능한 안정적인 사실을 파악합니다. 둘째, AI Studio에서 내 project에 현재 실제로 적용되는 active limits를 확인합니다. 검색 결과 상위에는 아직도 예전 RPM, TPM, RPD 숫자를 그대로 현재 값처럼 말하는 글이 많습니다. 하지만 현재 공개 rate limits 페이지 는 active limits를 AI Studio에서 보라고 안내하고, actual capacity may vary 라고도 적어 두고 있습니다. 이 글은 그래서 공개 문서가 확정해 주는 사실 과 AI Studio를 봐야만 안전하게 말할 수 있는 실제 한도 를 분리해서 설명합니다.
핵심 요약
2026년 3월의 Gemini API 무료 할당량은 여전히 “있다”고 답할 수 있습니다. 다만 그 의미를 예전과 똑같이 받아들이면 안 됩니다. 공개 문서가 지금도 분명하게 보여 주는 것은 무료 API key 생성, project 단위 제한, PT 자정 기준 RPD 리셋, tier 승급 조건, 그리고 2.5 계열 주요 모델의 무료 표준 사용 상태입니다. 반면 내 프로젝트에 지금 이 순간 정확히 적용되는 상한선 은 공개 문서만으로 완전히 확정되지 않으며, AI Studio에서 직접 봐야 합니다.
그래서 가장 안전한 해석은 이렇습니다. 공개 문서로 규칙과 정책을 확인하고, AI Studio로 실제 ceiling을 확인한다. 2025년 말과 2026년 초에 많이 보였던 5 RPM, 10 RPM, 15 RPM, 100 RPD, 500 RPD 같은 숫자는 어떤 시점에서는 맞았거나, 어떤 커뮤니티 문맥에서는 유용했을 수 있습니다. 하지만 현재 Google 공개 페이지는 그것을 누구에게나 보장되는 완전한 현재 무료표로 다루지 않습니다.
| 질문 | 2026-03-18 기준 안전한 답변 |
|---|---|
| Gemini API에 무료 할당량이 아직 있나 | 있다. 무료 key 생성도, 2.5 주요 모델의 무료 표준 사용 표시도 남아 있다. |
| 정확한 현재 한도는 어디서 보나 | AI Studio. 공개 페이지만으로는 충분하지 않다. |
| 공개 문서로 지금도 확정 가능한 것은 무엇인가 | project 단위 제한, RPM/TPM/RPD 구조, PT 자정 리셋, tier 조건, 무료/유료 요금 상태, 미결제 서비스 약관. |
| 무료 할당량을 본격 운영 용량으로 봐도 되나 | 안 된다. 프로토타입과 초기 실험용 진입점으로 보는 것이 맞다. |
| 먼저 어떤 모델부터 시작해야 하나 | 대부분은 Gemini 2.5 Flash. 단순 반복 작업 비중이 크면 Flash-Lite. |
| 언제 유료 전환이 필요하나 | 안정성, 개인정보, 유럽 서비스, 팀 개발 속도가 중요해질 때. |
비용 비교를 더 넓게 보고 싶다면 Gemini vs OpenAI vs Claude 비용 가이드 를 참고하세요. OpenAI 쪽 무료 API 진입 경로의 현재 상태를 비교하려면 아직 한국어판이 없어서 English reference: OpenAI API free trial guide 를 함께 보는 편이 좋습니다.
2026년 3월에 “Gemini API 무료 할당량이 있다”는 말의 실제 의미
지금의 Gemini 무료 할당량은 “무료로 시작할 수 있다”는 사실과, “공개 문서만으로 현재 운영 한도까지 정확히 안다”는 기대를 분리해서 봐야 합니다. 전자는 여전히 사실입니다. quickstart는 무료 key 생성을 안내하고, pricing 페이지는 2.5 Pro, 2.5 Flash, 2.5 Flash-Lite를 무료 표준 사용 상태로 보여 줍니다. 따라서 “무료가 완전히 사라졌다”고 말하면 틀립니다.
하지만 후자, 즉 “예전의 공개 표를 지금도 그대로 운영 기준으로 써도 되느냐”는 별개의 문제입니다. 현재 rate limits 페이지 는 RPM, TPM, RPD 구조와 tier 조건은 설명하지만, 실제 active limits는 AI Studio에서 확인하라고 안내합니다. 동시에 specified rate limits are not guaranteed and actual capacity may vary 라고도 적고 있습니다. 이 표현은 무료 할당량이 남아 있다는 사실과, 그 할당량을 공개 문서만으로 강한 약속처럼 해석하면 안 된다 는 사실을 함께 보여 줍니다.
이 차이를 이해하면 2025년 12월 이후 왜 많은 개발자가 혼란을 겪었는지도 쉽게 설명됩니다. 이전에는 무료 한도를 비교적 고정된 공개 숫자로 받아들였고, 거기에 맞춰 프로토타입이나 작은 서비스를 설계했습니다. 그런데 정책 표현과 실제 제공 방식이 바뀐 뒤에도 검색 결과는 옛 숫자를 오래 유지했습니다. 그래서 “문서나 블로그에는 된다는데 실제로는 429만 뜬다”는 불만이 커졌습니다.
지금의 무료 할당량은 다음 용도에는 매우 좋습니다.
- 학습과 실험
- 주말 프로젝트
- 저빈도 내부 도구
반대로, 사용자-facing 제품의 기반 용량으로 생각하기에는 적합하지 않습니다. 무료로 시작할 수 있다는 점과, 운영에 적합하다는 점은 다른 문제입니다.
Google이 지금도 공개적으로 확인해 주는 사실

아래 표는 2026년 3월 18일 현재 Google의 공개 문서에서 직접 확인 가능한 사실만 모았습니다. 오래된 숫자 표보다 이 층을 먼저 믿는 것이 안전합니다.
| 항목 | 지금도 공개 문서로 확인 가능한 내용 | 의미 |
|---|---|---|
| 무료 시작 | quickstart에서 무료 API key 생성 안내 | 무료 진입 경로가 여전히 존재 |
| 제한 단위 | 제한은 API key 단위가 아니라 project 단위 | key를 늘려도 무료 한도는 늘지 않음 |
| 일일 리셋 | RPD는 PT 자정에 리셋 | 하루 기준이 미국 서부 시간 |
| 제한 종류 | RPM, TPM, RPD가 주요 지표 | 429 원인 구분의 기본 |
| 실한도 확인처 | active limits는 AI Studio에서 보라고 안내 | 현재값은 UI 확인이 중요 |
| Tier 1 | billing을 켜면 Tier 1 진입 | 무료 단계를 벗어나는 첫 단계 |
| Tier 2 | 100달러 지출 + 첫 성공 결제 후 3일 | 확장 시점 판단 기준 |
| Tier 3 | 1000달러 지출 + 첫 성공 결제 후 30일 | 더 큰 운영 단계 기준 |
| 무료 요금 상태 | 2.5 Pro, 2.5 Flash, 2.5 Flash-Lite가 무료 표준 사용으로 표시 | 무료 상태 자체는 유지 |
| Search grounding | Flash / Flash-Lite에 공유 500 RPD 무료 표시 | 공개 페이지에 남아 있는 드문 정밀 수치 |
| 긴 컨텍스트 | 2.5 Pro는 1,048,576 입력 / 65,536 출력 token | 긴 문서나 코드 분석에 중요 |
| 미결제 데이터 사용 | 미결제 서비스의 입출력이 Google 제품 개선에 사용될 수 있음 | 민감 데이터에는 부적합 |
| 유럽 지역 조건 | EEA, 스위스, 영국의 엔드유저 앱은 paid services 필요 | 무료 상태로 현지 서비스 배포 불가 |
결국 공개 문서가 지금도 강하게 떠받치는 것은 규칙과 약관 이지, 누구에게나 동일한 완전한 현재 무료표가 아닙니다. 그래서 검색 결과의 “완전 가이드”보다 공개 문서의 안정 정보가 더 중요합니다.
AI Studio에서 내 project의 실제 한도를 확인하는 방법
실무적으로 가장 중요한 조언은 단순합니다. key를 만든 뒤 AI Studio로 돌아가서, 실제로 사용할 project의 limits를 직접 확인하세요. Google이 공개 페이지에서 AI Studio로 연결해 두는 이유가 바로 그것입니다.
추천 순서는 다음과 같습니다.
- AI Studio에서 API key를 만든다.
- key가 연결된 project를 확인한다.
- 해당 project의 rate limit 화면을 연다.
- 실제로 호출할 model name을 본다.
- RPM, TPM, RPD, stable / preview 여부를 기록한다.
이 과정을 건너뛰면 흔한 오해 두 가지에 빠집니다. 첫째, “key가 여러 개면 무료 한도도 나뉘어 있을 것”이라는 오해입니다. 공식 문서는 project 단위라고 명확히 말합니다. 둘째, “stable과 preview가 비슷한 제한일 것”이라는 오해입니다. 공개 문서는 preview와 experimental이 더 제한적일 수 있다고 분명히 적고 있습니다.
운영상으로는 스크린샷을 남겨 두는 것도 좋습니다. 무료 상태에서 한 번, billing 활성화 후 한 번. 그러면 팀 내부에서 “어디선가 본 숫자”가 아니라 실제 project 기준으로 대화를 할 수 있습니다.
무료 단계에서 어떤 모델을 골라야 하나: Flash, Flash-Lite, Pro

무료 단계에서 가장 강한 모델이 항상 정답은 아닙니다. 많은 개발자에게 더 중요한 것은 최고 품질 한 번이 아니라, 충분한 횟수로 실험하고 프로토타입을 앞으로 밀어낼 수 있는가입니다.
| 모델 | 무료 단계에 잘 맞는 용도 | 장점 | 주의점 |
|---|---|---|---|
| Gemini 2.5 Flash-Lite | 추출, 분류, 라우팅, 고빈도 테스트 | 저렴하고 빠르며 반복 작업에 유리 | 깊은 추론과 어려운 코딩은 약할 수 있음 |
| Gemini 2.5 Flash | 일반 챗, 제품 프로토타입, 데모 | 품질과 실용성의 균형이 가장 좋음 | 정확한 현재 한도는 AI Studio 확인 필요 |
| Gemini 2.5 Pro | 긴 문맥 추론, 복잡한 문서/코드 분석 | 추론력과 긴 컨텍스트가 강함 | 무료 단계에서는 반복 속도가 부족해지기 쉬움 |
따라서 무료 단계에서는 내 병목이 무엇인지 먼저 봐야 합니다. 문제가 너무 어려워서 답의 질이 부족한가, 아니면 실험 횟수가 부족한가. 전자라면 Pro, 후자라면 Flash 또는 Flash-Lite가 더 잘 맞습니다. 대부분의 사람은 Flash에서 시작하는 것이 가장 안전합니다.
무료 할당량에서도 429가 뜨는 이유

Gemini 무료 할당량에서 가장 많이 만나는 문제는 429지만, 429는 원인이 아니라 결과입니다. 먼저 해야 할 일은 “어떤 제한을 맞았는지”를 구분하는 것입니다.
| 증상 | 흔한 원인 | 대응 |
|---|---|---|
| 짧은 시간에 몰아서 호출하면 실패 | RPM 소진 | 큐, 동시성 제한, 랜덤 백오프 |
| 긴 프롬프트에서 자주 실패 | TPM 소진 | 입력 축소, 분할, 캐싱 |
| 하루 후반부에 계속 실패 | RPD 소진 | PT 자정까지 대기 또는 billing 활성화 |
| 여러 서비스가 동시에 실패 | 같은 project 공유 | project 분리 또는 백그라운드 정리 |
| preview에서만 더 불안정 | preview 제한 | stable로 이동 검토 |
| billing 후에도 기대보다 낮음 | project 상태 오해, tier 오해, 실용량 변동 | AI Studio에서 현재 상태 재확인 |
핵심은 모든 429를 재시도로 해결하려고 하면 안 된다 는 점입니다. RPM 충돌에는 백오프가 효과적이지만, RPD가 다 떨어졌다면 기다리거나 유료로 가는 수밖에 없습니다. 이 구분을 못 하면, 사실은 과금 판단 문제인 것을 계속 구현 문제로 붙잡고 있게 됩니다.
간단한 재시도 로직은 아래 정도면 충분합니다.
pythonimport asyncio import random from google import genai client = genai.Client(api_key="YOUR_GEMINI_API_KEY") async def generate_with_retry(prompt: str, retries: int = 5): for attempt in range(retries): try: return client.models.generate_content( model="gemini-2.5-flash", contents=prompt, ) except Exception as exc: if "429" not in str(exc) or attempt == retries - 1: raise delay = min(2 ** attempt + random.random(), 30) await asyncio.sleep(delay)
다만 이 코드는 “기다리면 회복되는 429”에만 유효합니다. 더 긴 설명이 필요하면 아직 한국어판이 없는 English reference: Gemini API rate limit explained 를 참고하면 됩니다.
언제 무료 단계를 끝내야 하나
무료 할당량은 실패 비용이 낮을 때 가장 큰 가치를 냅니다. 반대로 실패 비용이 높아지면, 무료에 집착할수록 더 비싸질 수 있습니다.
| 상황 | 무료 유지 가능성 | 이유 |
|---|---|---|
| 학습, 실험, 해커톤 | 높음 | 가장 잘 맞는 사용처 |
| 소규모 내부 도구 | 조건부 가능 | 변동과 일일 중단을 감수할 수 있으면 가능 |
| 사용자 대상 본서비스 | 낮음 | 예측 가능한 용량이 필요 |
| 민감한 프롬프트 / 문서 처리 | 낮음 | 미결제 서비스 약관과 맞지 않음 |
| EEA, 스위스, 영국 대상 서비스 | 낮음 | paid services 필요 |
| 이미 회피 코드가 많음 | 대체로 낮음 | 개발 공수가 과금보다 비싸지기 시작 |
한 문장 기준으로 정리하면 이렇습니다. 안정성, 기밀성, 지역 요건, 팀 개발 속도 중 하나라도 중요해졌다면 paid tier를 검토할 때입니다. 무료 할당량은 예산을 영구히 대신하는 수단이 아니라, 예산을 들일 가치가 있는지 검증하는 도구에 가깝습니다.
무료로 API key를 만들고 첫 요청 보내기
입문 자체는 여전히 쉽습니다. Google AI Studio에서 key를 만들고, GEMINI_API_KEY 에 넣고, 우선 Flash로 첫 요청을 보내고, 그 다음에 AI Studio에서 현재 limits를 확인하는 순서가 가장 안전합니다.
Python:
pythonfrom google import genai import os client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) response = client.models.generate_content( model="gemini-2.5-flash", contents="벡터 데이터베이스를 쉽게 설명해 주세요.", ) print(response.text)
Node.js:
tsimport { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const response = await ai.models.generateContent({ model: "gemini-2.5-flash", contents: "벡터 데이터베이스를 쉽게 설명해 주세요.", }); console.log(response.text);
정말 중요한 것은 코드보다 습관입니다. key를 프런트엔드에 직접 넣지 말 것, Pro나 preview를 쓰려면 먼저 AI Studio에서 현재 한도를 확인할 것. 이 두 가지만 지켜도 많은 시행착오를 줄일 수 있습니다.
FAQ
Gemini API key를 만들 때 신용카드가 필요한가요?
아니요. quickstart는 지금도 무료 key 생성으로 시작할 수 있다고 안내합니다.
무료 할당량의 프롬프트와 응답은 Google 제품 개선에 쓰이나요?
그럴 수 있습니다. Additional Terms에는 미결제 서비스의 입력과 출력이 Google 제품과 서비스 개선, 개발에 사용될 수 있다고 적혀 있습니다.
EEA, 스위스, 영국 사용자를 대상으로 무료 상태로 서비스할 수 있나요?
아니요. 해당 지역의 엔드유저 앱에는 paid services가 필요합니다.
예전의 5 RPM, 10 RPM, 15 RPM 표를 지금도 믿어도 되나요?
역사적 참고로는 쓸 수 있지만, 현재 project의 보장값으로 쓰면 위험합니다. 지금은 AI Studio의 active limits가 더 중요합니다.
무료 단계에서 가장 무난한 시작 모델은 무엇인가요?
대부분은 Flash입니다. 단순 반복 작업 중심이면 Flash-Lite, 난도 높은 추론이면 Pro를 고려하면 됩니다.
billing을 켜면 바로 모든 문제가 해결되나요?
핵심 용량 문제는 크게 완화되지만, project 상태와 tier를 AI Studio에서 직접 확인해야 합니다. 잘못된 project를 보고 있으면 여전히 혼란이 생깁니다.
