Gemini API の費用、使用量、その他の指標をモニタリングする

Gemini API の費用、使用量、その他の指標をモニタリングすることは、本番環境のアプリを実行するうえで重要な部分です。アプリの通常の使用パターンを把握し、重要なしきい値内に収まっていることを確認することが重要です。

費用をモニタリングする

Firebase コンソールの [使用量と請求額] ダッシュボードで、Vertex AI Gemini API の呼び出しに関連するプロジェクトの費用を確認できます。

ダッシュボードに表示される費用は、Vertex AI in Firebase クライアント SDK を介した呼び出しに固有のものではありません。表示される費用は、Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase GenkitGemini APIFirebase Extensions、REST 呼び出し、Vertex AI Studio、または他の API クライアントを使用しているかどうかにかかわらず、Vertex AI Gemini API へのすべての呼び出しに関連付けられます。

Count Tokens API を使用して、リクエストのトークンサイズと課金対象文字数の推定値を取得することもできます。詳しくは、モデルあたりのトークン数の上限モデルあたりの料金をご覧ください。

アラートの設定

想定外の請求が発生しないように、予算アラートを設定してください。

予算アラートは予算の上限ではありません。構成したしきい値に近づいたときやしきい値を超えたときにアラートが送信されるため、アプリやプロジェクトで適切な対応を取ることができます。

使用状況とその他の指標をモニタリングする

各 API のプロジェクトの指標(使用状況など)は、Google Cloud コンソールで確認できます。

  1. Google Cloud コンソールで、各 API ページ(Vertex AI APIVertex AI in Firebase API)に移動します。

    • Vertex AI API ページ: Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase GenkitGemini APIFirebase Extensions、REST 呼び出し、Vertex AI Studio など、Vertex AI Gemini API の呼び出しに関連する使用方法です。

    • Vertex AI in Firebase API ページ: これは、Vertex AI in Firebase SDK からの呼び出しにのみ使用します。

  2. [管理] をクリックします。

  3. [指標] タブをクリックします。

  4. プルダウン メニューを使用して、レスポンス コード別のトラフィック、API メソッド別のエラー、全体的なレイテンシ、API メソッド別のレイテンシなど、目的の指標を表示します。