Surveiller vos coûts, votre utilisation et d'autres métriques de l'API Gemini

Surveiller vos coûts, votre utilisation et d'autres métriques de l'Gemini API est une partie importante de l'exécution d'une application de production. Il est important de savoir à quoi ressemblent les modèles d'utilisation normaux pour votre application et de vous assurer de respecter les seuils qui vous intéressent.

Surveiller les coûts

Dans le tableau de bord "Utilisation et facturation" de la console Firebase, vous pouvez consulter les coûts de votre projet pour appeler Vertex AI Gemini API.

Les coûts affichés dans le tableau de bord ne sont pas nécessairement spécifiques aux appels via les SDK clients Vertex AI in Firebase. Les coûts affichés sont associés à tout appel à Vertex AI Gemini API, qu'il utilise les SDK client Vertex AI in Firebase, les SDK serveur Vertex AI, Firebase Genkit, le Firebase Extensions pour le Gemini API, les appels REST, Vertex AI Studio ou d'autres clients d'API.

Vous pouvez également obtenir une estimation de la taille des jetons et des caractères facturables de vos requêtes à l'aide de l'API Count Tokens. En savoir plus sur les limites de jetons par modèle et les tarifs par modèle

Configurer les alertes

Pour éviter les factures inattendues, veillez à configurer des alertes budgétaires.

Notez que les alertes de budget ne sont pas des plafonds de budget. Une alerte vous sera envoyée lorsque vous approcherez ou dépasserez le seuil que vous avez configuré afin que vous puissiez prendre des mesures dans votre application ou votre projet.

Surveiller l'utilisation et d'autres métriques

Vous pouvez consulter les métriques de votre projet pour chaque API, comme son utilisation, dans la console Google Cloud.

  1. Dans la console Google Cloud, accédez à chaque page d'API : API Vertex AI et API Vertex AI in Firebase.

    • Page de l'API Vertex AI: il s'agit de l'utilisation associée à tout appel à Vertex AI Gemini API, que ce soit à l'aide des SDK client Vertex AI in Firebase, des SDK serveur Vertex AI, de Firebase Genkit, de Firebase Extensions pour Gemini API, d'appels REST, de Vertex AI Studio, etc.

    • Page de l'API Vertex AI in Firebase: utilisation spécifique aux appels provenant des SDK Vertex AI in Firebase.

  2. Cliquez sur Gérer.

  3. Cliquez sur l'onglet Métriques.

  4. Utilisez les menus déroulants pour afficher les métriques qui vous intéressent, comme le trafic par code de réponse, les erreurs par méthode d'API, la latence globale et la latence par méthode d'API.