Kosten, Nutzung und andere Messwerte der Gemini API im Blick behalten

Das Monitoring Ihrer Kosten, Nutzung und anderer Messwerte der Gemini API ist ein wichtiger Bestandteil der Ausführung einer Produktionsanwendung. Es ist wichtig zu wissen, wie normale Nutzungsmuster für Ihre App aussehen, und dafür zu sorgen, dass Sie innerhalb der für Sie wichtigen Grenzwerte bleiben.

Kosten überwachen

Im Dashboard Nutzung und Abrechnung der Firebase Console können Sie die Kosten für das Aufrufen der Vertex AI Gemini API für Ihr Projekt einsehen.

Die im Dashboard angezeigten Kosten beziehen sich nicht unbedingt auf Aufrufe über die Vertex AI in Firebase-Client-SDKs. Die angezeigten Kosten sind mit jedem Aufruf an Vertex AI Gemini API verknüpft, unabhängig davon, ob die Vertex AI in Firebase-Client-SDKs, die Vertex AI-Server-SDKs, Firebase Genkit, die Firebase Extensions für Gemini API, REST-Aufrufe, Vertex AI Studio oder andere API-Clients verwendet werden.

Mit der Count Tokens API können Sie auch eine Schätzung der Tokengröße und der abrechenbaren Zeichen Ihrer Anfragen abrufen. Weitere Informationen zu den Tokenlimits pro Modell und den Preisen pro Modell

Benachrichtigung einrichten

Richten Sie Budgetbenachrichtigungen ein, um Überraschungsrechnungen zu vermeiden.

Budgetbenachrichtigungen sind keine Budgetlimits. Sie erhalten eine Benachrichtigung, wenn Sie den konfigurierten Grenzwert erreichen oder überschreiten, damit Sie Maßnahmen in Ihrer App oder Ihrem Projekt ergreifen können.

Nutzung und andere Messwerte im Blick behalten

In der Google Cloud Console können Sie die Messwerte Ihres Projekts für jede API aufrufen, z. B. die Nutzung.

  1. Rufen Sie in der Google Cloud-Konsole die einzelnen API-Seiten auf: Vertex AI API und Vertex AI in Firebase API.

    • Vertex AI API-Seite: Dieser Wert ist mit jeder Aufruf der Vertex AI Gemini API verknüpft, unabhängig davon, ob die Vertex AI in Firebase Client-SDKs, die Vertex AI Server-SDKs, Firebase Genkit, die Firebase Extensions für die Gemini API, REST-Aufrufe oder Vertex AI Studio verwendet werden.

    • Vertex AI in Firebase API-Seite: Das ist die Nutzung speziell für Aufrufe, die von den Vertex AI in Firebase-SDKs stammen.

  2. Klicken Sie auf Verwalten.

  3. Klicken Sie auf den Tab Messwerte.

  4. Über die Drop-down-Menüs können Sie die gewünschten Messwerte aufrufen, z. B. Traffic nach Antwortcode, Fehler nach API-Methode, Gesamtlatenz und Latenz nach API-Methode.