I modelli di IA generativa (come i modelli Gemini) suddividono i dati in unità chiamate token per l'elaborazione. Ogni modello Gemini ha un numero massimo di token che può gestire in un prompt e una risposta.
Questa pagina mostra come ottenere una stima del conteggio dei token e del numero di caratteri fatturabili per una richiesta.
Quali informazioni vengono fornite nel conteggio?
Tieni presente quanto segue per il conteggio dei token e dei caratteri fatturabili:
Conteggio dei token totali
Questo conteggio è utile per assicurarti che le tue richieste non superino la finestra di contesto consentita.
Il conteggio dei token riflette le dimensioni di tutti i file (ad esempio le immagini) forniti nell'input della richiesta. Non viene conteggiato il numero di immagini o il numero di secondi di un video.
Per tutti i modelli Gemini, un token equivale a circa 4 caratteri. 100 token corrispondono a circa 60-80 parole in inglese.
Contare il numero totale di caratteri fatturabili
Questo conteggio è utile per comprendere e controllare i costi, poiché per Vertex AI il numero di caratteri fa parte del calcolo del prezzo.
Il numero di caratteri fatturabili riflette il numero di caratteri nel testo fornito nell'input della richiesta.
Per Vertex AI, i token non fanno parte del calcolo del prezzo. Scopri di più sui limiti di token per modello e sui prezzi per modello.
Prezzi e quote per il conteggio di token e caratteri fatturabili
Non sono previsti costi o limitazioni di quota per l'utilizzo dell'API CountTokens
. La quota massima per l'API CountTokens
è di 3000 richieste al minuto.