Compter les jetons et les caractères facturables


Les modèles d'IA générative (comme les modèles Gemini) décomposent les données en unités appelées jetons pour le traitement. Chaque modèle Gemini a un nombre maximal de jetons qu'il peut gérer dans une requête et une réponse.

Cette page explique comment obtenir une estimation du nombre de jetons et du nombre caractères facturables pour une requête.

Quelles informations sont incluses dans ce décompte ?

Veuillez noter les points suivants concernant le comptage des jetons et des caractères facturables:

  • Compter le nombre total de jetons

    • Ce nombre permet de s'assurer que vos requêtes ne dépassent pas les quotas dans la fenêtre de contexte.

    • Le nombre de jetons reflète la taille de tous les fichiers (images, par exemple) fournis dans l'entrée de la requête. Elle ne comptabilise pas la valeur le nombre d'images ou le nombre de secondes d'une vidéo.

    • Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 les jetons représentent environ 60 à 80 mots anglais.

  • Comptabiliser le nombre total de caractères facturables

    • Ce nombre est utile pour comprendre et contrôler vos coûts, car Pour Vertex AI, le nombre de caractères est pris en compte dans le calcul du prix.

    • Le nombre de caractères facturables reflète le nombre de caractères dans text fourni dans l'entrée request.

Pour Vertex AI, les jetons ne sont pas pris en compte dans le calcul du prix. En savoir plus sur Limites de jetons par modèle et les tarifs par modèle.

Tarifs et quota pour le comptage des jetons et des caractères facturables

L'utilisation de l'API CountTokens n'entraîne aucuns frais ni aucune restriction de quota. Le quota maximal pour l'API CountTokens est de 3 000 requêtes par minute.

Exemples de code

Saisie en texte uniquement

Saisie multimodale