The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Surveiller les coûts, l'utilisation et d'autres métriques

La surveillance des coûts, de l'utilisation et d'autres métriques de vos fonctionnalités d'IA est un élément important de l'exécution d'une application de production. Vous devez connaître les modèles d'utilisation normaux de votre application et vous assurer de respecter les seuils qui vous intéressent.

Cette page décrit certaines options recommandées pour surveiller vos coûts, votre utilisation et d'autres métriques dans les consoles Firebase et Google Cloud.

Surveiller les coûts

Dans le tableau de bord Utilisation et facturation de la console Firebase, vous pouvez consulter les coûts de votre projet pour l'appel de Vertex AI Gemini API et de Gemini Developer API (si vous avez souscrit le forfait Blaze).

Les coûts affichés dans le tableau de bord ne sont pas nécessairement spécifiques aux appels utilisant les SDK client Firebase AI Logic. Les coûts affichés sont associés à tous les appels à ces "API Gemini", qu'ils utilisent les SDK clients Firebase AI Logic, les SDK serveur Google GenAI Genkit, Firebase Extensions pour Gemini API, les appels REST, l'un des AI Studios ou d'autres clients API.

En savoir plus sur les tarifs des produits associés à votre utilisation de Firebase AI Logic

Configurer les alertes

Pour éviter les mauvaises surprises sur votre facture, assurez-vous de configurer des alertes budgétaires lorsque vous utilisez le forfait Blaze.

Notez que les alertes de budget ne sont pas des plafonds budgétaires. Une alerte vous envoie des communications lorsque vous approchez ou dépassez le seuil configuré, ce qui vous permet de prendre des mesures dans votre application ou votre projet.

Observer l'utilisation de vos fonctionnalités d'IA dans la console Firebase

Vous pouvez activer la surveillance de l'IA sur la page Firebase AI Logic de la console Firebase pour observer diverses métriques et utilisations au niveau de l'application. Vous obtiendrez ainsi une visibilité complète sur vos requêtes à partir des SDK clients Firebase AI Logic. Ces tableaux de bord sont plus détaillés que les nombres de jetons de base que vous obtenez en appelant l'API Count Tokens.

Voici les principales fonctionnalités de surveillance de l'IA dans la console Firebase :

Afficher des métriques quantitatives telles que le volume de requêtes, la latence, les erreurs et l'utilisation de jetons par modalité pour chacune de vos applications.
Inspecter les traces pour voir les attributs, les entrées et les sorties de vos requêtes, ce qui peut vous aider à déboguer et à améliorer la qualité.
segmenter les données par dimensions telles que l'état de la requête, la latence minimale, le nom du modèle, etc. ;

Toutes ces fonctionnalités sont conçues à l'aide de Google Cloud Observability Suite (voir les informations détaillées sur le produit ci-dessous).

Activer AI Monitoring

Voici comment activer AI Monitoring dans la console Firebase :

Lorsque vous parcourez le workflow de configuration guidée initiale depuis la page Services d'IA > Firebase AI Logic
À tout moment dans Services d'IA > Logique d'IA > onglet Paramètres

Conditions requises pour activer et utiliser la surveillance par IA :

Vous devez être propriétaire ou éditeur du projet, ou administrateur Firebase Vertex AI.
Votre application doit utiliser au minimum les versions suivantes de la bibliothèque Firebase :
iOS : v11.13.0 ou version ultérieure | Android : v16.0.0 ou version ultérieure (BoM : v33.14.0 ou version ultérieure) | Web : v11.8.0 ou version ultérieure | Flutter : v2.0.0 ou version ultérieure (BoM : v3.11.0 ou version ultérieure) | Unity : v12.9.0 ou version ultérieure
La collecte des données d'acceptation doit être activée dans votre application (elle l'est par défaut).

Une fois que votre application répond à ces exigences et que vous avez activé la surveillance de l'IA dans la console, vous n'avez rien d'autre à faire dans votre application ni dans la console pour que les données commencent à s'afficher dans les tableaux de bord de l'onglet Services d'IA > Logique d'IA > Surveillance de l'IA. Il peut y avoir un léger délai (parfois jusqu'à cinq minutes) avant que la télémétrie d'une requête ne soit disponible dans la console Firebase.

Utilisation avancée

Cette section décrit la configuration du taux d'échantillonnage, ainsi que différentes options pour afficher et utiliser vos données.

Taux d'échantillonnage

Si vous effectuez un grand nombre de requêtes, nous vous recommandons de profiter de la configuration du taux d'échantillonnage. Le taux d'échantillonnage indique la proportion de requêtes pour lesquelles les détails des traces sont réellement collectés.

Dans l'onglet Paramètres > Logique d'IA > Services d'IA de la console Firebase, vous pouvez configurer le taux d'échantillonnage de votre projet sur une valeur comprise entre 1 et 100 %. 100 % signifie que la surveillance de l'IA collectera les traces de l'ensemble de votre trafic. La valeur par défaut est de 100 %. La collecte d'un nombre réduit de traces diminuera vos coûts, mais aussi le nombre de traces que vous pourrez surveiller. Notez que, quel que soit votre taux d'échantillonnage, les graphiques affichés dans le tableau de bord de surveillance refléteront toujours le volume de trafic réel.

Options supplémentaires en dehors de la console Firebase

En plus de la surveillance de l'IA disponible dans la console Firebase, pensez aux options suivantes :

Explorez Vertex AI Model Garden.
Ces tableaux de bord fournissent des insights supplémentaires sur les tendances de la latence et du débit des modèles gérés, en complément des insights de la surveillance de l'IA dans la console Firebase.
Explorer et utiliser vos données avec Google Cloud Observability Suite
Étant donné que les données de télémétrie pour la surveillance de l'IA sont stockées dans Google Cloud Observability Suite associé à votre projet, vous pouvez explorer vos données dans ses tableaux de bord, y compris Trace Explorer et Logs Explorer, qui sont associés lorsque vous inspectez vos traces individuelles dans la console Firebase. Vous pouvez également utiliser vos données pour créer des tableaux de bord personnalisés, configurer des alertes et plus encore.

Informations détaillées sur les produits utilisés pour la surveillance de l'IA

La surveillance de l'IA stocke vos données de télémétrie dans différents produits disponibles dans Google Cloud Observability Suite, y compris Cloud Monitoring, Cloud Trace et Cloud Logging.

Cloud Monitoring : stocke les métriques, y compris le nombre de requêtes, le taux de réussite et la latence des requêtes.
Cloud Trace : stocke les traces de chacune de vos requêtes afin que vous puissiez afficher les détails individuellement, au lieu de les afficher de manière agrégée. Une trace est généralement associée à des journaux pour vous permettre d'examiner le contenu et le timing de chaque interaction.
Cloud Logging : capture les métadonnées d'entrée, de sortie et de configuration pour fournir des informations détaillées sur chaque partie de votre requête d'IA.

Étant donné que vos données de télémétrie sont stockées dans ces produits, vous pouvez spécifier vos paramètres de conservation et d'accès directement dans chacun d'eux (pour en savoir plus, consultez la documentation de Cloud Monitoring, Cloud Trace et Cloud Logging).

Notez que la surveillance de l'IA stocke les requêtes réelles et les résultats générés à partir de chaque requête échantillonnée dans Cloud Logging afin que ces données soient accessibles dans la console Firebase. Vous pouvez éventuellement désactiver le stockage des requêtes et des réponses.

Tarifs

Projets avec le forfait Spark sans frais (disponible uniquement lorsque vous utilisez Gemini Developer API) : l'utilisation des services sous-jacents pour AI Monitoring est sans frais.
Projets utilisant le forfait Blaze avec paiement à l'usage : l'utilisation des produits Google Cloud Observability Suite sous-jacents utilisés par AI Monitoring vous sera facturée (quel que soit le fournisseur Gemini API choisi). Toutefois, chaque produit Google Cloud Observability Suite propose des niveaux sans frais généreux. Pour en savoir plus, consultez la documentation sur les tarifs de Google Cloud Observability Suite.

(Facultatif) Désactiver le stockage des requêtes et des réponses

Par défaut, la surveillance de l'IA capture les requêtes réelles envoyées au modèle et les réponses générées par le modèle, y compris les informations sensibles (comme les informations permettant d'identifier personnellement l'utilisateur) dans ces requêtes et réponses. Toutes ces données sont stockées dans Cloud Logging afin d'être accessibles dans la console Firebase.

Pour désactiver le stockage des requêtes et des réponses, ajoutez le filtre d'exclusion suivant à votre récepteur Cloud Logging (généralement le récepteur _Default) : resource.type="firebasevertexai.googleapis.com/Model".

Afficher les métriques d'API au niveau du projet dans la console Google Cloud

Pour chaque API, vous pouvez afficher des métriques au niveau du projet, comme l'utilisation, dans la console Google Cloud.

Notez que les pages de la console Google Cloud décrites dans cette section n'incluent pas d'informations telles que le contenu des requêtes et des réponses, et le nombre de jetons. Pour surveiller ce type d'informations, envisagez d'utiliser la surveillance de l'IA dans la console Firebase (voir la section précédente).

Dans la consoleGoogle Cloud, accédez à la page Métriques de l'API que vous souhaitez afficher :
- API Vertex AI : affichez l'utilisation associée à n'importe quelle requête adressée à Vertex AI Gemini API.
  - Cela inclut les requêtes utilisant les SDK clients Firebase AI Logic, les SDK serveur Google GenAI Genkit, Firebase Extensions pour Gemini API, l'API REST Vertex AI Studio, etc.
- Gemini Developer API : affiche l'utilisation associée à n'importe quelle requête adressée à Gemini Developer API.
  - Cela inclut les requêtes utilisant les SDK clients Firebase AI Logic, les SDK serveur Google GenAI Genkit, Firebase Extensions pour Gemini API, l'API REST Google AI Studio, etc.
  - Le nom à afficher de cette API dans la console Google Cloud est "Generative Language API".
Si vous vous trouvez sur une page de présentation de l'API, cliquez sur Gérer, puis sur l'onglet Métriques.

Remarque : Dans la console Google Cloud, vous pouvez également afficher les métriques au niveau du projet pour l'API Firebase AI Logic, qui est le service proxy pour Firebase AI Logic. Ces métriques reflètent uniquement les requêtes provenant des SDK clients Firebase AI Logic.
Utilisez les menus déroulants pour afficher les métriques qui vous intéressent, comme le trafic par code de réponse, les erreurs par méthode d'API, la latence globale et la latence par méthode d'API.