Мониторинг затрат, использования и других показателей Gemini API — важная часть запуска рабочего приложения. Важно знать, как выглядят обычные шаблоны использования вашего приложения, и следить за тем, чтобы вы оставались в пределах важных для вас пороговых значений.
Мониторинг расходов
На панели «Использование и выставление счетов» консоли Firebase вы можете просмотреть затраты вашего проекта на вызов Vertex AI Gemini API .
Стоимость, отображаемая на информационной панели, не обязательно относится к вызовам через Vertex AI in Firebase . Отображаемые затраты связаны с любым вызовом Vertex AI Gemini API , будь то использование Vertex AI in Firebase , SDK сервера Vertex AI , Firebase Genkit , Firebase Extensions для Gemini API , вызовов REST, Vertex AI Studio или другие клиенты API.
Вы также можете получить оценку размера токена и оплачиваемых символов ваших запросов с помощью API подсчета токенов. Узнайте больше об ограничениях токенов для каждой модели и ценах на каждую модель .
Настройка оповещений
Чтобы избежать неожиданных счетов, обязательно настройте оповещения о бюджете .
Обратите внимание, что оповещения о бюджете не являются ограничением бюджета. Когда вы приближаетесь к настроенному порогу или превышаете его, вам будет отправлено оповещение, чтобы вы могли принять меры в своем приложении или проекте.
Отслеживайте использование и другие показатели
Вы можете просмотреть показатели вашего проекта для каждого API, а также его использование, в консоли Google Cloud .
В консоли Google Cloud перейдите на каждую страницу API: Vertex AI API и Vertex AI in Firebase API .
Страница Vertex AI API : это использование, связанное с любым вызовом Vertex AI Gemini API , будь то использование Vertex AI in Firebase , SDK сервера Vertex AI , Firebase Genkit , Firebase Extensions для Gemini API , REST. звонки, Vertex AI Studio и т. д.
Страница Vertex AI in Firebase API : это использование специально для вызовов, поступающих от Vertex AI in Firebase SDK.
Нажмите «Управление» .
Откройте вкладку «Метрики» .
Используйте раскрывающиеся меню для просмотра интересующих показателей, таких как трафик по коду ответа, ошибки по методу API, общая задержка и задержка по методу API.