まず結論です。2026年3月18日時点で、Gemini Developer API には無料枠があります。 Google は公式の Gemini API quickstart で、無料で API key を作成して始められると今も案内しています。さらに公式の pricing ページ では、Gemini 2.5 Pro、2.5 Flash、2.5 Flash-Lite の標準利用が free of charge のまま表示されています。変わったのは「無料枠の存在」ではなく、公開ページだけで完全な無料枠マトリクスを読み切れる時代ではなくなった ことです。
今の理解のしかたは二段階です。第一に、公開ドキュメントで確認できる安定した事実を押さえること。第二に、AI Studio で自分の project に対して現在どの上限が有効かを確認することです。2025年末から 2026年初頭の多くの記事は、旧来の RPM、TPM、RPD の数値をそのまま「現在の真実」として扱っています。しかし現在の公開 rate limits ページ は active limits を AI Studio で確認するよう案内し、actual capacity may vary とも明記しています。このページでは、そのギャップを埋めるために、公開情報でまだ言い切れること、AI Studio を見ないと安全に言えないこと、429 をどう切り分けるべきか を整理します。
要点まとめ
2026年3月の Gemini API 無料枠は、今も「ある」と答えてよい状態です。ただし、その意味を昔と同じように受け取ると危険です。公開ドキュメントが今も明確に示しているのは、無料の API key 作成、project 単位の制限、PT 深夜の RPD リセット、tier の昇格条件、そして 2.5 系主要モデルが無料標準利用として表示されていることです。一方で、自分の project で今まさに適用されている精密な上限 は、もはや公開レート制限ページだけから完全には読み取れません。
そのため、安全な読み方は「公開ドキュメントでルールを確認し、AI Studio で現実の上限を確認する」です。検索結果で今でもよく見かける 5 RPM、10 RPM、15 RPM、100 RPD、500 RPD などの数値は、時期によっては事実に近かったり、コミュニティ投稿の文脈では有用だったりします。しかし、現在の Google の公開ページは、それらを誰にでも一律に保証する固定表としては扱っていません。
| 質問 | 2026年3月18日時点の安全な答え |
|---|---|
| Gemini API に無料枠はまだあるか | ある。無料 key 作成も、2.5 系主要モデルの無料標準利用表示も残っている。 |
| 正確な現在の上限はどこで見るか | AI Studio。公開ページだけでは完全ではない。 |
| 公開ドキュメントでまだ確定できることは何か | project 単位の制限、RPM/TPM/RPD の仕組み、PT 深夜リセット、tier 条件、無料/有料の料金状態、未課金サービスの条項。 |
| 無料枠を本番容量とみなしてよいか | よくない。プロトタイプ向けの入り口としては優秀だが、本番 SLA の代わりではない。 |
| まずどのモデルから始めるべきか | 多くのケースでは Gemini 2.5 Flash。呼び出し回数重視なら Flash-Lite。 |
| いつ課金を有効にすべきか | 安定性、機密性、欧州向け提供、継続的な開発速度が必要になった時点。 |
正式なコスト比較に進むなら、同じテーマの Gemini vs OpenAI vs Claude コスト比較 も役立ちます。OpenAI 側の無料 API パスの現状を比較したい場合は、まだ日本語版がないため English reference: OpenAI API free trial guide を参照してください。
2026年3月時点で「Gemini API 無料枠がある」とはどういう意味か
今の Gemini API 無料枠を理解するには、「無料で始められる」という事実と、「公開ページだけで精密な運用上限まで確定できる」という期待を分けて考える必要があります。前者は今も事実です。Google は quickstart で無料 key 作成を案内し、pricing ページでも 2.5 Pro、2.5 Flash、2.5 Flash-Lite を無料標準利用として表示しています。したがって、「無料枠は完全に消えた」と断言するのは誤りです。
しかし後者、つまり「旧来の無料枠一覧をそのまま現在の契約のように扱えるか」は別問題です。現在の rate limits ページ は、RPM、TPM、RPD の仕組みや tier 条件は説明する一方で、active limits は AI Studio で確認するよう導きます。さらに、specified rate limits are not guaranteed and actual capacity may vary とも書いています。この文言は、無料枠が今もある一方で、公開ドキュメント側では以前ほど強い固定的な約束をしていない ことを意味します。
この変化を理解すると、2025年12月以降に起きた混乱も説明しやすくなります。多くの開発者は無料枠を「一定の公開表」として設計に組み込んでいました。そこに調整や表現変更が入り、検索結果だけを見ると古い前提が残り続けたため、「記事では使えると書いてあるのに、実際は 429 が続く」というズレが起きました。Google AI Developers Forum の議論でも、そのズレが不満の中心でした。
だから今の無料枠は、次の用途には非常に向いています。
- 学習と試作
- 週末プロトタイプ
- 低頻度の内部ツール
逆に、本番サービスの基礎容量として考えるには向いていません。無料で始められることと、本番に耐えることは別です。
Google が今も公開ページで確認させている事実

以下は、2026年3月18日時点で公開ページからまだ確認できる事実だけを並べた表です。ここを土台にすると、古い配額表に振り回されにくくなります。
| 項目 | 今も公開ページで確認できる内容 | 意味 |
|---|---|---|
| 無料開始 | quickstart に無料 API key 作成がある | 無料入口は残っている |
| 制限の単位 | 制限は API key 単位ではなく project 単位 | key を増やしても無料枠は増えない |
| 日次リセット | RPD は PT 深夜にリセット | 復活時刻は米西時間基準 |
| 制限の種類 | RPM、TPM、RPD が主要指標 | 429 の原因を切り分ける前提になる |
| 実上限の確認先 | active limits は AI Studio を見るよう案内される | 現在値は UI 依存が強い |
| Tier 1 | billing を有効にすると Tier 1 に進む | 無料段階から抜ける第一歩 |
| Tier 2 | 100ドル支払い済み、初回成功決済から3日以上 | 拡張タイミングの目安 |
| Tier 3 | 1000ドル支払い済み、初回成功決済から30日以上 | さらに大きい運用向け |
| 無料料金状態 | 2.5 Pro、2.5 Flash、2.5 Flash-Lite は無料標準利用表示 | 無料状態そのものは維持されている |
| Search grounding | Flash と Flash-Lite に共有 500 RPD の無料枠表示が残る | 公開でまだ見える精密数値の一つ |
| 長文脈 | 2.5 Pro は 1,048,576 入力 / 65,536 出力 token | 長文書・大規模コード読解に重要 |
| 未課金データ利用 | 未課金サービスの入出力は Google 製品改善に使われ得る | 機密データには不向き |
| 欧州条件 | EEA、スイス、英国向けの API クライアントは paid services が必要 | 無料のままの欧州展開は不可 |
ここで重要なのは、公開ドキュメントがまだ強く支えているのはルールと条項であって、現在の完全な無料枠表ではない という点です。したがって、検索上位の「完全版無料枠一覧」より、公開ページの安定情報を先に信用したほうが判断を誤りにくくなります。
AI Studio で自分の project の本当の上限を確認する方法
このテーマで最も実務的なアドバイスは単純です。key を作成したら、そのまま AI Studio に戻って自分の project の limits を確認してください。Google が公開ページから AI Studio に誘導している以上、それが最も正しい運用手順です。
確認の流れは次の通りです。
- AI Studio で API key を作る。
- その key が属する project を確認する。
- AI Studio の rate limit 画面を開く。
- 実際に呼ぶ model name を見る。
- RPM、TPM、RPD、stable / preview を控える。
この手順を飛ばすと、二つの典型的な誤解に入ります。一つは「自分は key を複数作ったから無料枠も分かれているはず」という誤解。公開ドキュメントは project 単位だと明記しています。もう一つは「stable と preview で同じ上限のはず」という誤解。公開ドキュメントは preview / experimental のほうが制限が厳しい可能性をはっきり示しています。
実務では、最初のスクリーンショットを残しておくのも有効です。無料状態で一度、billing 有効後にもう一度。これだけで、チーム内の「前に見た記事ではこうだった」という議論のかなりの部分を消せます。
無料段階で選ぶべきモデル:Flash、Flash-Lite、Pro

無料段階では、最強モデルを選ぶことが常に最適ではありません。多くの人にとって重要なのは、一回の上限品質よりも、十分な回数を試してプロトタイプを前に進められることです。
| モデル | 無料段階で向く用途 | 強み | 注意点 |
|---|---|---|---|
| Gemini 2.5 Flash-Lite | 抽出、分類、軽いルーティング、高頻度試作 | 低コスト・高速・反復向き | 深い推論や難しいコーディングには弱め |
| Gemini 2.5 Flash | チャット、プロトタイプ、デモ | 品質と実用性のバランスが良い | 実上限は AI Studio で確認が必要 |
| Gemini 2.5 Pro | 長文脈推論、複雑なドキュメント・コード分析 | 推論力と長文脈が強い | 無料では反復速度が足りなくなりやすい |
要するに、無料段階では自分のボトルネックがどちらかを先に見ます。難しいタスクを解く力が足りないのか。それとも試行回数が足りないのか。前者なら Pro、後者なら Flash や Flash-Lite が向いています。
多くのケースでは、まず Flash から入るのが一番安全です。Google の現行 quickstart も Flash を使っており、開発者向けの標準導線として残っています。Flash-Lite は、抽出や分類のように高頻度でシンプルな仕事をたくさん回す場面で真価を出します。Pro は、長い文書、複雑な reasoning、難しいコードなど、「それでないと難しい」場面で使うのが得策です。
無料枠でも 429 が出る理由

Gemini の無料枠で一番よく見かける失敗は 429 ですが、429 は原因ではなく症状です。まずやるべきなのは、「どの制限に当たったのか」を見分けることです。
| 症状 | ありがちな原因 | 対応 |
|---|---|---|
| 短時間の連続リクエストで失敗 | RPM 枯渇 | キュー、並列制御、ランダム退避 |
| 長い prompt で失敗しやすい | TPM 枯渇 | 文脈縮小、分割、キャッシュ活用 |
| その日の後半ずっと使えない | RPD 枯渇 | PT 深夜まで待つか billing 有効化 |
| 複数サービスが同時に失敗 | 同一 project 共有 | project 分離、バックグラウンド負荷整理 |
| preview だけ不安定 | preview 側の制約 | stable へ移行を検討 |
| billing 済みなのに期待ほど伸びない | project 状態違い、tier 誤認、実容量変動 | AI Studio で現在状態を再確認 |
重要なのは、すべての 429 を retry で片付けようとしてはいけない ということです。RPM の突発超過なら指数バックオフが効きます。しかし RPD が尽きているなら、待つか課金するしかありません。ここを誤ると、「本当は課金判断の問題」を「自分のリトライ実装が甘い問題」として何日も引き延ばすことになります。
最小限のリトライ実装なら、次のような形で十分です。
pythonimport asyncio import random from google import genai client = genai.Client(api_key="YOUR_GEMINI_API_KEY") async def generate_with_retry(prompt: str, retries: int = 5): for attempt in range(retries): try: return client.models.generate_content( model="gemini-2.5-flash", contents=prompt, ) except Exception as exc: if "429" not in str(exc) or attempt == retries - 1: raise delay = min(2 ** attempt + random.random(), 30) await asyncio.sleep(delay)
ただし、このコードは「待てば戻る系の 429」にしか効きません。日次枯渇や運用方針の問題には効きません。さらに詳しいメカニズムが必要なら、まだ日本語版はありませんが English reference: Gemini API rate limit explained を参照してください。
無料枠を卒業すべきタイミング
Gemini 無料枠の価値は、失敗コストが低い段階で最大化します。逆に、失敗コストが高くなったら、無料にこだわるほど損をしやすくなります。
| 状況 | 無料枠継続はありか | 理由 |
|---|---|---|
| 学習、検証、ハッカソン | あり | まさに向いている用途 |
| 小規模な内部ツール | 条件付きであり | 日次停止や揺れを許容できるなら成立する |
| ユーザー向け本番サービス | なし | 予測可能な容量が必要 |
| 機密文書や機密プロンプトを扱う | なし | 未課金サービスのデータ利用条件が合わない |
| EEA、スイス、英国向けに提供する | なし | paid services が必要 |
| すでに大量の回避コードを書いている | 多くの場合なし | 工数コストが課金額を上回り始める |
判断基準を一文で言うなら、「安定性・機密性・地域要件・チーム速度のいずれかが重要になったら paid tier に進む」です。無料枠は予算を不要にするものではなく、予算をかける価値があるかを証明するための入口 と考えるのが一番失敗しにくいです。
無料で API key を作って最初のリクエストを送る方法
Quickstart 自体は今も簡単です。Google AI Studio に入り、API key を作り、GEMINI_API_KEY に入れて、まず Flash で一回呼びます。そのあとに AI Studio で active limits を確認する。順番はこれが一番安全です。
Python:
pythonfrom google import genai import os client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) response = client.models.generate_content( model="gemini-2.5-flash", contents="ベクトルデータベースをやさしく説明してください。", ) print(response.text)
Node.js:
tsimport { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const response = await ai.models.generateContent({ model: "gemini-2.5-flash", contents: "ベクトルデータベースをやさしく説明してください。", }); console.log(response.text);
コード以上に大事なのは二点です。key をフロントエンドに直書きしないこと。そして Pro や preview を試すときは、必ず AI Studio の現在値を見てから設計することです。
FAQ
Gemini API key を作るのにクレジットカードは必要ですか。
不要です。公式 quickstart では、今も無料で key を作成して始められると案内されています。
無料枠の prompt や response は Google の改善に使われますか。
使われ得ます。Gemini API Additional Terms では、未課金サービスの入力と出力が Google 製品やサービスの改善・開発に使われると説明されています。機密データには向きません。
EEA、スイス、英国向けのアプリを無料枠のまま出せますか。
できません。該当地域のエンドユーザー向け API クライアントには paid services が必要です。
昔の 5 RPM や 15 RPM の表は今も信用できますか。
今の project の保証値としては危険です。歴史的な参考にはなっても、現在の active limits の代わりにはなりません。
無料段階で最初に選ぶモデルは何ですか。
迷うなら Flash。高速で単純な反復処理が中心なら Flash-Lite。難しい reasoning が最優先なら Pro です。
billing を有効にするとすぐにすべて解決しますか。
主要な容量問題はかなり改善しやすいですが、すべて自動で解決するわけではありません。まず AI Studio で project と tier の状態を確認してください。
