Gemini API の費用、使用量、その他の指標をモニタリングすることは、本番環境のアプリを実行するうえで重要な部分です。アプリの通常の使用パターンを把握し、重要なしきい値内に収まっていることを確認することが重要です。
費用をモニタリングする
Firebase コンソールの [使用量と請求額] ダッシュボードで、Vertex AI Gemini API の呼び出しに関連するプロジェクトの費用を確認できます。
ダッシュボードに表示される費用は、Vertex AI in Firebase クライアント SDK を介した呼び出しに固有のものではありません。表示される費用は、Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase Genkit、Gemini API の Firebase Extensions、REST 呼び出し、Vertex AI Studio、または他の API クライアントを使用しているかどうかにかかわらず、Vertex AI Gemini API へのすべての呼び出しに関連付けられます。
Count Tokens API を使用して、リクエストのトークンサイズと課金対象文字数の推定値を取得することもできます。詳しくは、モデルあたりのトークン数の上限とモデルあたりの料金をご覧ください。
アラートの設定
想定外の請求が発生しないように、予算アラートを設定してください。
予算アラートは予算の上限ではありません。構成したしきい値に近づいたときやしきい値を超えたときにアラートが送信されるため、アプリやプロジェクトで適切な対応を取ることができます。
使用状況とその他の指標をモニタリングする
各 API のプロジェクトの指標(使用状況など)は、Google Cloud コンソールで確認できます。
Google Cloud コンソールで、各 API ページ(Vertex AI API と Vertex AI in Firebase API)に移動します。
Vertex AI API ページ: Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase Genkit、Gemini API の Firebase Extensions、REST 呼び出し、Vertex AI Studio など、Vertex AI Gemini API の呼び出しに関連する使用方法です。
Vertex AI in Firebase API ページ: これは、Vertex AI in Firebase SDK からの呼び出しにのみ使用します。
[管理] をクリックします。
[指標] タブをクリックします。
プルダウン メニューを使用して、レスポンス コード別のトラフィック、API メソッド別のエラー、全体的なレイテンシ、API メソッド別のレイテンシなど、目的の指標を表示します。