监控 Gemini API 的费用、使用情况和其他指标是运行正式版应用的重要环节。请务必了解应用的正常使用模式,并确保其未超出重要阈值。
监控费用
在 Firebase 控制台的使用量和结算信息中心中,您可以查看项目调用 Vertex AI Gemini API 的费用。
信息中心中显示的费用不一定仅限于通过 Vertex AI in Firebase 客户端 SDK 进行的调用。显示的费用与对 Vertex AI Gemini API 的任何调用相关联,无论是使用 Vertex AI in Firebase 客户端 SDK、Vertex AI 服务器 SDK、Firebase Genkit、Gemini API 的 Firebase Extensions、REST 调用、Vertex AI Studio 还是其他 API 客户端。
您还可以使用 Count Tokens API 估算请求的令牌大小和计费字符数。详细了解每个模型的令牌限制和每个模型的价格。
设置提醒
为避免出现意外费用,请务必设置预算提醒。
请注意,预算提醒不是预算上限。当您接近或超过配置的阈值时,系统会向您发送提醒信息,以便您在应用或项目中采取行动。
监控使用情况和其他指标
您可以在 Google Cloud 控制台中查看项目中每个 API 的指标,例如其用量。
在 Google Cloud 控制台中,前往各个 API 页面:Vertex AI API 和 Vertex AI in Firebase API。
Vertex AI API 页面:这是与对 Vertex AI Gemini API 的任何调用相关的用量,无论是使用 Vertex AI in Firebase 客户端 SDK、Vertex AI 服务器 SDK、Firebase Genkit、Gemini API 的 Firebase Extensions、REST 调用、Vertex AI Studio 等。
Vertex AI in Firebase API 页面:此用法专门适用于来自 Vertex AI in Firebase SDK 的调用。
点击管理。
点击指标标签页。
使用下拉菜单查看感兴趣的指标,例如按响应代码划分的流量、按 API 方法划分的错误、总体延迟时间,以及按 API 方法划分的延迟时间。