Gemini Flash 画像生成料金ガイド：1枚$0.045〜$0.151の完全解説【2026年版】

AI Free API Team

•2026年3月2日•22 min read•API料金ガイド

Gemini 3.1 Flash Image Previewは解像度に応じて1枚$0.045〜$0.151で画像を生成します。デフォルトの1024pxでは1枚$0.067です。Googleは出力画像トークンに100万トークンあたり$60を課金し、バッチ割引は50%です。無料枠はありません。本ガイドでは全解像度の料金、AI StudioとAPIドキュメント間の料金不一致、10モデル比較、コストを最大67%削減する5つの戦略を解説します。

Gemini 3.1 Flash Image Preview料金ガイド：4つの解像度で1枚$0.045から$0.151のコスト詳細

Gemini 3.1 Flash Image Previewは、Googleの出力画像トークンレート100万トークンあたり$60に基づき、解像度に応じて1枚あたり$0.045から$0.151で画像を生成します。デフォルトの1024px画像は1枚$0.067で、バッチ処理を利用すると$0.034まで下がります。これは一律50%の割引です。2026年3月時点で、このモデルには無料枠が存在せず、Google AI StudioとAPIドキュメントの間に料金の不一致が残っており、公式な解決はされていません。本ガイドでは、全解像度の詳細コスト、10の競合モデルとの料金比較、そして画像生成コストを最大67%削減するための実践的な戦略を解説します。

要点まとめ

標準料金：1枚$0.045（512px）〜$0.151（4K）、1024pxは$0.067
バッチモード：全料金50%オフ — 1024pxが$0.034に
無料枠なし：他のGeminiモデルと異なり、画像生成は常に課金対象
料金不一致：AI Studioの入力/テキスト出力料金はAPIドキュメントの2倍を表示 — 画像出力料金（$60/100万トークン）は一致
最高コスパ：バッチモード + 1024px解像度 = $0.034/枚、サードパーティでは約$0.030まで可能
代替モデルとの比較：GPT Image 1 High（$0.167）より60%安く、DALL-E 3 Standard（$0.040）と同水準

Gemini 3.1 Flash Image Previewとは（なぜ料金が重要なのか）

Googleの Gemini 3.1 Flash Image Preview は、内部コードネームNano Banana 2（Gemini 3.1 Flash Image Preview）として知られ、GoogleのAI画像生成のアプローチにおける大きな転換点を示しています。Imagen 4のような専用モデルで画像生成を提供するのではなく、このモデルはネイティブな画像生成機能をGeminiの会話アーキテクチャに直接統合しています。モデルIDはgemini-3.1-flash-image-previewで、2026年2月にリリースされました。512ピクセルから4096ピクセルまでの解像度と、1:1から8:1までのアスペクト比をサポートしています。

料金体系の理解が想像以上に重要である理由は、トークンベースの課金モデルが直感的でないコストカーブを生み出すためです。DALL-E 3のような定額制画像生成APIでは解像度に関係なくすべての画像が同じ料金ですが、Geminiは生成時に消費される出力トークン数に基づいて課金されます。4K画像は512px画像の約3.4倍のコストがかかり、ユースケースに合わない解像度を選択すると、大規模運用時に月額請求が数千ドル膨れ上がる可能性があります。このモデルは現在「Preview」ステータスにあり、Googleは一般提供（GA）モデルに適用される通常の非推奨通知期間なしに、料金、機能、可用性を調整する可能性があります。

料金の問題が特に重要なのは、このモデルに無料枠が一切ないためです。テキスト生成用のGemini 2.0 Flashへの無料アクセスを含め、他のGeminiモデルの寛大な無料クォータに慣れている開発者は、画像生成もコストなしで実験できると思いがちです。しかし、それは不可能です。Gemini 3.1 Flash Image Previewエンドポイントを通じて生成されるすべての画像に課金が発生するため、本番パイプラインにこのモデルを採用する前に正確なコスト見積もりが不可欠です。

料金分析が特に興味深いのは、このモデルのコスト構造がその機能とどのように関連しているかという点です。Gemini 3.1 Flash Image Previewは単なる画像生成ツールではなく、テキストの理解、画像の分析、新しいビジュアルの作成を1つの会話スレッド内で行えるフルマルチモーダルモデルです。つまり、1回のAPI呼び出しでテキスト推論と画像生成を組み合わせることができ、別々の2つのモデルに対する2回のAPI呼び出しを置き換えられる可能性があります。テキストモデルと専用画像生成ツールを別々に実行するコストを考慮すると、Geminiの統合アプローチによる1枚あたりの実質プレミアムはかなり縮小します。特に、スタンドアロンのプロンプトではなく、文脈を考慮した画像生成が必要なアプリケーションにおいて顕著です。

完全な料金内訳（隠れた不一致を含む）

Gemini 3.1 Flash Imageの解像度別コスト棒グラフ：標準料金とバッチ料金（$0.045〜$0.151）

Gemini 3.1 Flash Image Previewの料金はGoogleの標準的なトークンベース課金システムで運用されていますが、画像出力トークンのレートはテキスト出力レートと比較して格段に高く設定されています。2026年3月2日に検証したGoogleの公式APIドキュメントによると、このモデルは入力トークン100万あたり$0.25、テキスト出力トークン100万あたり$1.50、画像出力トークン100万あたり$60.00を課金します。画像トークンの$60/100万というレートが1枚あたりのコストを決定づけており、各画像は要求する解像度に応じて747から2,520トークンを消費します。

これらのレートがGoogleのより広い料金体系にどう位置づけられるかについては、テキスト、ビジョン、オーディオエンドポイントを含むすべてのGeminiモデルをカバーするGemini API料金完全ガイドをご参照ください。

標準の1枚あたりコスト

実質的な1枚あたりのコストは解像度に完全に依存します。Googleのドキュメントには各出力サイズの正確なトークン数が記載されており、トークン数に$60/100万レートを掛けることで簡単に計算できます。

解像度	出力トークン数	1枚あたりのコスト	月間コスト（1日1,000枚）
512px	約747	$0.045	$1,350
1024px（デフォルト）	約1,120	$0.067	$2,010
2048px	約1,680	$0.101	$3,030
4096px	約2,520	$0.151	$4,530

これらの数値から、解像度とコストの間にほぼ線形の関係があることがわかります。ピクセル寸法を2倍にすると、価格は約50〜67%上昇します。デフォルトの1024px解像度は、$0.067で視覚品質とコストのバランスが最も優れた選択肢であり、ほとんどのウェブアプリケーションに最適です。

バッチモード：一律50%オフ

Googleは、画像出力トークンを含むすべてのトークンコストに一律50%の割引を適用するバッチ処理APIを提供しています。トレードオフはレイテンシです。バッチリクエストはリアルタイムで結果を返す代わりに、24時間以内に処理されます。即時結果が重要でないアプリケーション、例えばマーケティング素材の生成、カタログ画像の作成、ソーシャルメディアコンテンツパイプラインなどでは、バッチモードは大幅な節約を実現します。

解像度	標準料金	バッチモード	1枚あたりの節約額
512px	$0.045	$0.022	$0.023
1024px	$0.067	$0.034	$0.033
2048px	$0.101	$0.050	$0.051
4096px	$0.151	$0.076	$0.075

大規模に運用すると、バッチモードの節約効果は莫大になります。1024px解像度で1日1,000枚の画像を生成する企業の場合、標準からバッチ処理に切り替えるだけで月約$990の節約になり、出力品質には一切の差がありません。

知っておくべき料金の不一致

2026年3月時点で、Googleの2つの公式ソース間に未解決の料金不一致が文書化されています。Google AI Studioは入力トークン料金を100万あたり$0.50、テキスト出力を100万あたり$3.00と表示していますが、APIドキュメントではそれぞれ$0.25と$1.50を示しており、AI Studio料金のちょうど半額です。画像出力トークンレートの100万あたり$60は両ソースで一致しているため、上記の1枚あたりのコストはこの不一致の影響を受けません。

Google AI Developer Forumのコミュニティメンバーが2026年初頭にこの不一致を報告しましたが、Googleからの公式回答はありません。開発者コミュニティで共有された実際の課金データとの照合分析に基づくと、APIドキュメントの料金（$0.25/$1.50）が実際の課金レートを反映していると思われます。ただし、ビジネスケースのコスト予測を作成する場合は、Googleが不一致を公式に明確にするまで、保守的な見積もりとして高いAI Studio料金を使用することをお勧めします。実際の影響は画像生成に関しては限定的です。支配的なコスト要因である画像出力トークン（$60/100万）は両ソースで同一だからです。

全解像度の1枚あたりコスト（512pxから4Kまで）

特定のユースケースで品質を犠牲にすることなく、Geminiの画像生成コストを最適化する最も手っ取り早い方法は、適切な解像度の選択です。選択する解像度は、最高の品質ではなく、意図された表示コンテキストに合わせるべきです。200ピクセルのサムネイルとして表示される4K画像は、体感品質の改善がゼロにもかかわらず3倍以上のコストを浪費します。

解像度とユースケースの対応表

4つの利用可能な解像度はそれぞれ異なる本番環境に適しています。どの解像度が実際の要件に合致するかを理解することで、出力寸法の過大指定という一般的な間違いを防ぐことができます。これは、Geminiの画像生成機能を大規模にデプロイする開発者の間で、予想外に高い画像生成請求の主な原因となっています。

512px（$0.045/枚） は、サムネイル生成、プレビュー画像、小さなアバター作成、最終表示サイズが500ピクセル以下のあらゆるコンテキストに適しています。この解像度では、ソーシャルメディアのプロフィール画像、ECプラットフォームの商品リストサムネイル、ブログ記事の小さなイラスト要素として十分な品質の画像が生成されます。この価格帯での視覚品質は驚くほど良好で、747トークンの出力はコスト削減だけでなく、より速い生成時間も意味します。

1024px（$0.067/枚） はデフォルト解像度であり、大多数のウェブアプリケーションに最適な選択です。標準的なソーシャルメディア投稿、ブログのヒーロー画像、メールニュースレターのグラフィック、一般的なマーケティングビジュアルのすべてがこの解像度で最適に表示されます。1024pxのコスパは4つのオプションの中で最も優れており、Googleがこれをデフォルトに選んだのもおそらくそのためです。より高い解像度またはより低い解像度に変更する具体的な理由がない限り、この解像度を標準的な選択にすべきです。

2048px（$0.101/枚） は印刷品質の制作領域に入ります。マーケティングパンフレット、ズーム対応ギャラリーの高解像度商品写真、大画面で表示されるプレゼンテーションスライド、Retinaディスプレイ向けのデジタル広告素材は、2K解像度が提供する追加のディテールの恩恵を受けます。1024pxに対する50%の料金プレミアムは、出力がネイティブ解像度またはそれに近い解像度で実際に表示される場合にのみ正当化されます。

4096px（$0.151/枚） は大判出力向けに設計されています。ポスター印刷、看板グラフィック、大型デジタルディスプレイ、アーカイブ品質の画像生成が対象です。1枚$0.151で、この解像度はベースの512pxオプションの3.4倍のコストがかかります。4K出力を本当に必要とするユースケースは比較的限られており、デフォルトとして選択する前に、アプリケーションが本当にこのレベルのディテールを必要としているか慎重に評価すべきです。

解像度・ボリューム別の月間予算

予算計画には、予想されるボリュームと必要な解像度のマッピングが必要です。以下の表は、一般的な本番ボリュームでの月間コスト見積もりを提供し、正確な経費予測に役立ちます。

日次ボリューム	512px	1024px	2048px	4096px
100枚	$135	$201	$303	$453
500枚	$675	$1,005	$1,515	$2,265
1,000枚	$1,350	$2,010	$3,030	$4,530
5,000枚	$6,750	$10,050	$15,150	$22,650
10,000枚	$13,500	$20,100	$30,300	$45,300

これらの数値は標準（非バッチ）料金と30日間の月を想定しています。50%のバッチ割引を適用すると、この表のすべての数値が半分になり、コストに敏感なアプリケーションでの大量生産がかなり実現可能になります。

ボリュームとコストの関係から、重要な閾値効果が明らかになります。1日100枚の少量では、512pxと1024pxの差は月わずか$66であり、ほとんどのプロジェクト予算では気にならない金額です。しかし、1日10,000枚のエンタープライズ規模では、同じ解像度の選択が月$6,600の差を生み、画像生成パイプライン全体の財務的実現可能性を左右する可能性があります。これが、解像度の選択がコスト最適化の後付けではなく、プロジェクトのアーキテクチャ段階で慎重に検討すべき理由です。開発中に最高の利用可能な解像度をデフォルトにし、後からコストを削減しようとするチームは、プロンプト、下流処理、品質期待がすべて高い解像度に合わせて調整されてしまっており、切り替えが最初から正しく設定するよりもコスト高になることに気づくことがよくあります。

Gemini 3.1 Flash Imageと全代替モデルの比較

10モデルの料金比較表：Google、OpenAI、サードパーティプロバイダーのAI画像生成コスト

2026年のAI画像生成市場はかつてないほど多くの選択肢を提供しており、料金は最安の1枚$0.011から最高の$0.167まで幅広く分布しています。この市場におけるGemini 3.1 Flash Image Previewの位置づけを理解するには、単純なコストだけでなく、品質、機能、統合要件も考慮する必要があります。

10モデル完全比較

モデル	プロバイダー	1枚あたりのコスト	月間コスト（1日1,000枚）	品質ティア	主な利点
GPT Image 1 Low	OpenAI	$0.011	$330	低	最安オプション
Imagen 4 Fast	Google	$0.020	$600	良	高速かつ手頃
laozhang.ai（Flash Image）	サードパーティ	$0.030	$900	高	同モデル、より安い
GPT Image 1 Mini High	OpenAI	$0.036	$1,080	高	品質/コスト比が良好
DALL-E 3 Standard	OpenAI	$0.040	$1,200	高	実績ある品質
Imagen 4 Standard	Google	$0.040	$1,200	高	Google最高の専用モデル
Imagen 4 Ultra	Google	$0.060	$1,800	非常に高い	プレミアム品質
Gemini 3.1 Flash Image	Google	$0.067	$2,010	非常に高い	ネイティブマルチモーダル
DALL-E 3 HD	OpenAI	$0.080	$2,400	非常に高い	HD出力
GPT Image 1 High	OpenAI	$0.167	$5,010	最高	最高品質

この包括的な比較からいくつかのパターンが浮かび上がります。Gemini 3.1 Flash Image Previewは料金スペクトラムの中上位に位置し、GPT Image 1 Highより60%安く、同等の視覚品質を提供します。しかし、DALL-E 3 Standardより67%高く、Google自身のポートフォリオのImagen 4 Fastの3倍以上の価格です。

Gemini 3.1 Flash Imageの決定的な差別化要因は生のコストではなく、ネイティブマルチモーダルアーキテクチャです。専用画像生成モデルとは異なり、Gemini 3.1 Flash Imageは会話フローの一部として画像を生成し、前のメッセージからのコンテキストを理解し、自然言語の指示で既存の画像を編集し、1回のAPI呼び出しでテキストと画像の生成をシームレスに混在させることができます。このアーキテクチャ上の優位性により、スタンドアロンのエンドポイントとしてではなく、コンテキストを認識した画像生成が必要なアプリケーションに最適な選択肢となります。

Gemini 3.1 Flash Imageが適切な選択肢となる場合

Gemini 3.1 Flash Imageは、いくつかの特定のシナリオで、よりシンプルな代替モデルに対するプレミアムを正当化します。コンテキストが重要な会話型画像生成、例えば反復的なデザインワークフロー、ビジュアル質問応答、マルチターンクリエイティブセッションなどでは、スタンドアロンの画像生成ツールでは実現できない方法でモデルのネイティブマルチモーダル機能を活用できます。単一のパイプラインでテキスト分析と画像生成の両方が必要なアプリケーションは、2つの別々のAPIをチェーンする代わりに1つのモデルを使用することで複雑さが軽減されます。テキスト理解と画像生成の組み合わせにより、ドキュメント分析に基づく画像生成や、提供されたテキストコンテキストの情報を正確に参照するビジュアルの作成など、独自の機能も実現できます。

ただし、コンテキスト要件のない純粋な画像生成では、$0.040のImagen 4 Standardや$0.040のDALL-E 3 Standardの方がコスト効率に優れています。最終的な判断は、追加の1枚あたりコストを正当化するマルチモーダル機能がアプリケーションに必要かどうかにかかっています。

価格と品質のトレードオフ分析

比較表から、品質と機能レベルに大まかに対応する3つの明確な料金帯が浮かび上がります。1枚$0.040未満の予算帯にはGPT Image 1 Low、Imagen 4 Fast、サードパーティプロバイダーのアクセスが含まれ、コスト節約を優先し、ドラフト生成、内部テスト、1枚あたりの品質よりもスループットが重要な大量アプリケーションに適しています。$0.040〜$0.080の中間帯にはDALL-E 3、Imagen 4 StandardとUltra、Gemini 3.1 Flash Imageが含まれ、本番ウェブコンテンツ向けに品質、機能、コストの最適なバランスを提供します。$0.080超のプレミアム帯はDALL-E 3 HDとGPT Image 1 Highが占め、最高の視覚品質を提供しますが、プレミアムマーケティング素材やプロフェッショナルなクリエイティブ作業など、少量・高価値のアプリケーションに限定されるコストです。

ほとんどの本番アプリケーションは中間帯で最適なモデルを見つけます。その帯域内では、$0.067のGemini 3.1 Flash Imageと$0.040のDALL-E 3 Standardの選択は、Geminiの会話コンテキスト機能が必要かどうかにかかっています。各プロンプトが自己完結型の単純なテキストから画像への生成では、DALL-E 3が40%のコスト優位性を提供します。反復的な改善、会話による画像編集、前のコンテキストを参照する必要がある生成を含むワークフローでは、Geminiのアーキテクチャがプレミアムを正当化する独自の価値を提供します。

コストを実際に削減する5つの最適化戦略

Gemini画像生成のための5つのコスト最適化戦略：バッチモード、解像度、サードパーティでの節約効果

Geminiの画像生成コストを削減するために、品質を犠牲にしたり劣った代替手段に切り替えたりする必要はありません。以下の5つの戦略を組み合わせることで、標準1024pxレートの$0.067から最大67%のコスト削減を達成し、実効コストを約$0.022まで引き下げることが可能です。

戦略1：緊急でないタスクにバッチモードを使用する。 最もインパクトの大きい最適化は、対象ワークロードをGoogleのバッチ処理APIに切り替えることです。すべてのトークンコストに一律50%の割引が適用されます。バッチリクエストは24時間以内に処理されるため、リアルタイムのユーザー向けアプリケーションには不向きですが、バックグラウンド処理、コンテンツパイプライン生成、大量アセット作成には最適です。1024px解像度で1日1,000枚のマーケティング画像を生成するチームは、標準APIの代わりにバッチエンドポイントを経由させるだけで月$990を節約できます。バッチAPIは標準エンドポイントと同じモデルパラメータ、解像度、品質設定をサポートしており、唯一の違いはレイテンシです。

戦略2：解像度を適正化する。 ウェブ表示される画像のほとんどは2048pxや4096pxの解像度を必要としません。実際の表示コンテキストを監査し、要件に合った解像度に合わせることが、2番目に効果的なコストレバーです。ウェブコンテンツで2048pxから1024pxに切り替えると1枚あたり33%の節約（$0.101から$0.067）になり、画像が一般的なウェブ寸法で表示される場合、品質の違いは視認できません。「高い方が良い」という理由で特定の大判ユースケースなしに2Kで画像を生成している場合、1日1,000枚のボリュームで月$1,020を余分に支出しています。

戦略3：サードパーティAPIプロバイダーを検討する。 サードパーティのアグリゲーションプラットフォームは、同じGemini 3.1 Flash Image Previewモデルへのアクセスを大幅に割引された価格で提供しています。laozhang.aiのようなプロバイダーは、OpenAI互換のAPIエンドポイントを通じて同じモデルを1枚約$0.030で提供しており、Googleの公式$0.067レートから55%の割引になります。これらのプラットフォームは、複数のアカウントにまたがるAPIアクセスを集約し、ボリュームディスカウントをユーザーに還元する仕組みです。トレードオフには潜在的なレイテンシの差やサードパーティ仲介者への依存が含まれますが、毎日数千枚の画像を生成するコスト重視のアプリケーションでは、1日1,000枚で月$1,110以上の節約が見込め、真剣に検討する価値があります。Gemini画像生成の無料枠代替手段を探している方にとって、サインアップ時の無料クレジットを提供するサードパーティプロバイダーは、公式モデルに無料枠がないため、最も近い選択肢となります。

戦略4：繰り返しテンプレートにプロンプトキャッシングを実装する。 類似のプロンプト構造で複数の画像を生成する場合、例えば一貫したスタイリングの商品写真、ブランドのソーシャルメディアテンプレート、テーマのバッチバリエーションなど、Googleのプロンプトキャッシング機能で入力トークンコストを30〜60%削減できます。入力トークンは画像生成総コストのわずかな割合ですが（$60/100万の画像出力レートが支配的）、プロンプトキャッシングは大量処理時、特に詳細なシステム指示やリクエスト間で繰り返されるスタイル参照を含むプロンプトがある場合に効果を発揮します。

戦略5：エンタープライズ利用のボリューム割引を交渉する。 月10万枚以上の画像を生成する組織は、カスタムエンタープライズ料金についてGoogle Cloudの営業チームに問い合わせるべきです。Googleは大量ティアでのコミット使用割引とカスタムレート交渉を提供していますが、これらは料金ページに公開されていません。業界レポートによると、エンタープライズ契約ではバッチ割引に加えて1枚あたりのコストをさらに15〜25%削減できますが、具体的な条件はコミットメントレベルと契約期間によって異なります。

複合的な節約可能額

戦略1、2、3を組み合わせることで、標準1024px画像の$0.067から約$0.022まで実効コストを削減できます。これは67%の削減です。最大節約シナリオは、サードパーティプロバイダーを通じた1024px解像度でのバッチ処理を使用するもので、2026年初頭時点で複数の本番チームが開発者コミュニティの議論で達成を報告しています。

より安い価格でGemini 3.1 Flash Imageにアクセスする方法

Google公式レートを下回る価格でGemini 3.1 Flash Image Previewにアクセスすることは、代替エンドポイントを通じて同じモデルを提供するサードパーティAPIアグリゲーションプラットフォームを通じて可能です。これらのプラットフォームはAPIクォータをプールし、ボリューム条件を交渉した上で、その節約分を個人開発者や小規模チームに還元しています。個人ではエンタープライズ料金の資格を得られないユーザーにとって貴重な選択肢です。

Gemini Flash Imageの最安アクセス方法を探している開発者にとって、最も実用的なオプションはGeminiモデルをサポートするOpenAI互換APIプロバイダーです。これらのサービスはOpenAIのAPIと同じリクエスト形式を受け付けるため、すでにOpenAIベースのコードがある場合の統合は非常に簡単で、通常はベースURLとAPIキーの変更のみで、プロンプト構造やレスポンス処理ロジックの修正は不要です。

laozhang.aiはそのようなプラットフォームの1つで、Gemini 3.1 Flash Image Previewへのアクセスを1024px画像1枚約$0.030で提供しており、Googleの直接料金から55%の節約を実現します。このプラットフォームはOpenAI互換エンドポイント、Googleがアカウントレベルで課すものを超えるレート制限の制約なし、トークンベースのコスト計算の複雑さを排除する定額の1枚あたり料金を提供します。大量の画像を生成するチームにとって、コスト差は大きく積み重なります。1日1,000枚で$0.030対$0.067は、月$1,110の節約になります。

サードパーティプロバイダーを評価する際は、生の価格以外にもいくつかの要素を考慮する必要があります。プロバイダーのインフラと地理的近接性によってレスポンスレイテンシが異なる場合があります。アップタイム保証はGoogleの直接SLAコミットメントとは異なります。データ処理とプライバシーポリシーはGoogleのエンタープライズグレードの基準と一致しない場合があります。マーケティング素材、ソーシャルメディアコンテンツ、一般的なクリエイティブ作業などの機密性のない画像生成タスクでは、これらのトレードオフは通常許容範囲内です。機密データを扱うアプリケーションやSLA保証が必要な場合は、高コストにもかかわらずGoogleの直接APIが適切な選択肢です。

ほとんどのサードパーティプロバイダーのセットアッププロセスは一貫したパターンに従います。アカウントを登録し、APIキーを取得し、既存のコードをGoogleのエンドポイントの代わりにプロバイダーのベースURLを指すように設定し、残りの統合は変更なしで維持します。ほとんどのプロバイダーはサービスをテストするための初回無料クレジット（通常$0.50〜$1.00）を提供しており、有料プランにコミットする前に特定のユースケースでの品質とレイテンシをリスクなしで確認する方法を提供しています。

クイックスタート：最初の画像を生成する

Gemini 3.1 Flash Image Previewを使い始めるには、Google AI StudioのAPIキーとシンプルなAPI呼び出しが必要です。以下の例は、画像生成のための最小限のリクエストを示しており、解像度制御、スタイルガイダンス、マルチターン会話のための追加パラメータで拡張できます。

Pythonの例

python
import google.generativeai as genai
from PIL import Image
from io import BytesIO
import base64


genai.configure(api_key="YOUR_API_KEY")

# Initialize the model
model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Generate an image
response = model.generate_content(
    "Generate a professional product photo of a sleek wireless mouse "
    "on a clean white background with soft studio lighting"
)

# Extract and save the image
for part in response.candidates[0].content.parts:
    if hasattr(part, "inline_data"):
        image_data = base64.b64decode(part.inline_data.data)
        image = Image.open(BytesIO(image_data))
        image.save("generated_image.png")
        print(f"Image saved: {image.size[0]}x{image.size[1]}px")

cURLの例

bash
curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{
        "text": "Generate a professional product photo of a sleek wireless mouse on a clean white background"
      }]
    }],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

コストに直結する重要パラメータ

3つのパラメータがリクエストあたりのコストに直接影響します。responseModalitiesフィールドに"IMAGE"を含める必要があり、これを省略するとはるかに安い$1.50/100万のテキスト出力レートでテキストのみの応答が生成されます。解像度は生成設定で制御され、低い解像度を指定すると出力トークン数が直接減少し、コストも低下します。candidateCountパラメータはリクエストごとに生成される画像バリエーションの数を決定し、追加の候補ごとに画像出力トークンコストが比例して増加します。

コスト効率の高い本番利用には、実際の表示要件に合わせた解像度の設定、バリエーションが特に必要でない限りリクエストあたり1候補の生成、繰り返しのテンプレートベース生成パターンへのプロンプトキャッシングの実装をお勧めします。これら3つの設定選択と、緊急でないワークロード向けのバッチAPIを組み合わせることで、コスト最適化されたGemini画像生成の基盤が形成されます。

レスポンス形式が一般的な画像生成APIとは異なる点にも注意が必要です。Geminiはレスポンスコンテンツパーツ内のインラインデータとしてbase64エンコードされた画像を返します。各レスポンスにはテキストと画像データが混在する複数のパーツが含まれる場合があるため、パース処理ではすべてのパーツを反復処理し、各タイプを適切に処理する必要があります。Python SDKはこの複雑さの多くを抽象化していますが、cURLやカスタムHTTPクライアント経由でREST APIを直接操作する場合は、レスポンスJSONからbase64画像データをデコードしてファイルに書き込む必要があります。エラー処理では、モデルがテキストのみの応答を返すケース（プロンプトが画像生成を明確にリクエストしていない場合やコンテンツ安全フィルターがトリガーされた場合に発生する可能性があります）や、高トラフィック期間中のレート制限応答にも対応する必要があります。

よくある質問

Gemini 3.1 Flash Image Previewは無料で使えますか？

いいえ。Google AI Studioを通じて寛大な無料枠を提供する他のほとんどのGeminiモデルとは異なり、Gemini 3.1 Flash Image Previewモデルには無料枠がありません。生成されるすべての画像に対して、出力トークン数に基づいた課金が発生し、512px画像で$0.045からです。Googleはこのモデルの無料枠導入の計画を示していませんが、「Preview」ステータスのため変更の可能性はあります。テスト目的では、1枚の1024px画像生成が$0.067なので、10〜15枚のテスト画像で1ドル未満の費用です。

Geminiで1日1,000枚の画像を生成するとコストはいくらですか？

デフォルトの1024px解像度で標準（非バッチ）料金を使用した場合、1日1,000枚の画像生成は月約$2,010（$0.067 × 1,000 × 30）かかります。バッチモードに切り替えると月$1,020に削減されます。バッチ相当の料金のサードパーティプロバイダーを使用すると合計約月$900になります。選択する解像度によってこの数値は大きく変わります。バッチ料金の512px画像なら、同じボリュームでも月わずか$660です。

Geminiの画像生成はDALL-E 3やGPT Imageより安いですか？

1024px画像1枚$0.067のGemini 3.1 Flash Imageは、DALL-E 3 Standard（$0.040）やGPT Image 1 Medium（$0.042）より高価ですが、GPT Image 1 High（$0.167）やDALL-E 3 HD（$0.080）よりは大幅に安いです。ただし、Geminiのバッチモード$0.034ならDALL-E 3 Standardと競合でき、ネイティブマルチモーダル機能、つまりコンテキスト理解、会話ベースの生成、自然言語による画像編集は、スタンドアロンの画像生成ツールがどの価格帯でも提供できない機能を備えています。

AI StudioとAPIドキュメントの料金不一致の原因は何ですか？

2026年3月時点で、なぜAI Studioが入力トークン料金を$0.50/100万、テキスト出力を$3.00/100万と表示し、APIドキュメントがそれぞれ$0.25/100万と$1.50/100万と記載しているのか、Googleは公式に説明していません。画像出力トークンレート（$60/100万）は両ソースで同一なので、1枚あたりのコストには影響しません。開発者コミュニティの報告では、実際の課金は低い方のAPIドキュメントレートに従っているようですが、Googleが公式な説明を発表するまで、高い方のAI Studioレートで予算を組むことをお勧めします。

Gemini 3.1 Flash Image Previewを商用プロジェクトに使用できますか？

はい、Gemini 3.1 Flash Image Preview APIを通じて生成された画像は、Googleの標準APIサービス利用規約の下で商用目的に使用できます。ただし、「Preview」という指定は、Googleが一般提供モデルに適用されるよりも短い通知で、モデルの変更や廃止を行う権利を留保していることを意味します。ミッションクリティカルな本番アプリケーションでは、プレビューモデルに変更があった場合に代替生成モデルにフォールバックできるアーキテクチャを確保してください。生成された画像にはウォーターマークはなく、Googleの現在の規約ではユーザーが所有しますが、生成コンテンツに特有のアップデートがないか、最新のAPIサービス利用規約を確認することをお勧めします。

Gemini 3.1 Flash Image Previewのレート制限はどうなっていますか？

レート制限はティアによって異なります。ティア1アカウント（新しいAPIキーのデフォルト）は、使用履歴が増えるにつれて徐々に増加する低い1分あたりリクエスト制限から始まります。Googleの階層システムでは、大量の本番利用にはティアレベルを上げるまでの時間か、Google Cloud営業との直接的な取り決めが必要です。バッチAPIリクエストには別の、通常はより高いエンキュー制限があり、ティア1で100万トークンのエンキュー、ティア3で最大7億5,000万トークンが許可されます。初日から安定して高いスループットを必要とするアプリケーションでは、サードパーティプロバイダーが階層的な段階的増加なしにより予測可能なレート制限を提供することが多く、APIアクセス方法を選択する際の考慮事項の1つです。

Gemini 3.1 Flash ImageがPreviewから正式版になると料金は変わりますか？

Googleはモデルがプレビューから一般提供（GA）に移行する際の料金変更について公約を発表していません。歴史的に、Googleはモデルに応じてGA移行時に値上げと値下げの両方を行っています。現在の画像出力トークン100万あたり$60のレートは、需要に対してモデルが安すぎるとGoogleが判断すれば値上がりし、OpenAIや他のプロバイダーからの競争圧力が値下げを正当化すれば値下がりする可能性があります。予算策定には、変更に対応できる柔軟性を維持しながら、現在の料金をベースラインとして使用することをお勧めします。Googleの料金ページと開発者ブログのアナウンスを監視することが、変更に先んじる最も確実な方法です。

Nano Banana Pro

4K画像80%OFF

Google Gemini 3 Pro Image · AI画像生成

10万+の開発者にサービス提供

$0.24/枚

$0.05/枚

期間限定·企業レベル安定性·Alipay/WeChat

Gemini 3

ネイティブモデル

ダイレクト接続

20ms遅延

4K超高解像度

2048px

30秒生成

超高速

|@laozhang_cn|$0.05獲得

200+ AI Models API

Jan 2026

GPT-5.2Claude 4.5Gemini 3Grok 4+195

Image

80% OFF

gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video

80% OFF

Veo3 · Sora2$0.15/gen

16% OFF⚡ 5-Min📊 99.9% SLA👥 100K+

Get $0.1 Free Docs

#Gemini画像生成料金 #AI画像API価格 #Google Gemini API