割り当てと料金

このページでは、Vertex AI の Gemini API の割り当てと料金構成について説明します。

リージョンとモデル別の割り当て

1 分あたりのリクエスト数(RPM)の割り当ては、ベースモデルと、そのモデルのすべてのバージョン、識別子、チューニング済みバージョンに適用されます。以下の例をご参照ください。

  • gemini-1.0-pro へのリクエストと gemini-1.0-pro-001 へのリクエストは、ベースモデル gemini-1.0 pro の RPM 割り当てに対して 2 件のリクエストとしてカウントされます。

  • gemini-1.0-pro-001 へのリクエストと gemini-1.0-pro-001 に基づくチューニング済みモデルへのリクエストは、ベースモデル gemini-1.0-pro の RPM 割り当てに対して 2 件のリクエストとしてカウントされます。

これらの割り当てはプロジェクト レベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。また、Vertex AI for Firebase SDK、サーバー SDK(Gemini Firebase Extensions を含む)、REST 呼び出し、Vertex AI Studio のいずれを使用している場合でも、Gemini API のすべての呼び出しに割り当てが適用されます。

Google Cloud ドキュメントで各リージョンの各モデルの割り当てを確認してください。

割り当ての増加をリクエストする

Vertex AI の割り当てを増やす場合は、Google Cloud コンソールを使用して割り当ての増加をリクエストできます。割り当ての詳細については、割り当てを操作するをご覧ください。



料金

Vertex AI から Gemini API を使用するには、Firebase プロジェクトで Blaze の従量課金制プランを使用する必要があります。

Google Cloud ドキュメントで各モデルの料金を確認する。