このページでは、Vertex AI の Gemini API の割り当てと料金構成について説明します。
リージョンとモデル別の割り当て
1 分あたりのリクエスト数(RPM)の割り当ては、ベースモデルと、そのモデルのすべてのバージョン、識別子、チューニング済みバージョンに適用されます。以下の例をご参照ください。
gemini-1.0-pro
へのリクエストとgemini-1.0-pro-001
へのリクエストは、ベースモデルgemini-1.0 pro
の RPM 割り当てに対して 2 件のリクエストとしてカウントされます。gemini-1.0-pro-001
へのリクエストとgemini-1.0-pro-001
に基づくチューニング済みモデルへのリクエストは、ベースモデルgemini-1.0-pro
の RPM 割り当てに対して 2 件のリクエストとしてカウントされます。
これらの割り当てはプロジェクト レベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。また、Vertex AI for Firebase SDK、サーバー SDK(Gemini Firebase Extensions を含む)、REST 呼び出し、Vertex AI Studio のいずれを使用している場合でも、Gemini API のすべての呼び出しに割り当てが適用されます。
Google Cloud ドキュメントで各リージョンの各モデルの割り当てを確認してください。
割り当ての増加をリクエストする
Vertex AI の割り当てを増やす場合は、Google Cloud コンソールを使用して割り当ての増加をリクエストできます。割り当ての詳細については、割り当てを操作するをご覧ください。
料金
Vertex AI から Gemini API を使用するには、Firebase プロジェクトで Blaze の従量課金制プランを使用する必要があります。
Google Cloud ドキュメントで各モデルの料金を確認する。