I modelli di IA generativa (come i modelli Gemini) suddividono i dati in unità chiamate token per l'elaborazione. Ogni modello Gemini ha un numero massimo di token che può gestire in un prompt e una risposta.
Questa pagina mostra come ottenere una stima del conteggio dei token e del numero di caratteri fatturabili per una richiesta.
Quali informazioni vengono fornite nel conteggio?
Tieni presente quanto segue sul conteggio dei token e dei caratteri fatturabili:
Conteggio dei token totali
Questo conteggio è utile per assicurarsi che le richieste non superino il limite consentito finestra contestuale.
Il numero di token rifletterà le dimensioni di tutti i file (ad esempio le immagini) forniti nell'ambito dell'input della richiesta. Non conteggerà il numero di immagini o il numero di secondi di un video.
Per tutti i modelli Gemini, un token equivale a circa 4 caratteri. 100 di token sono circa 60-80 parole inglesi.
Contare il numero totale di caratteri fatturabili
Questo conteggio è utile per comprendere e controllare i costi, in quanto per Vertex AI, il numero di caratteri fa parte del calcolo del prezzo.
Il numero di caratteri fatturabili riflette il numero di caratteri nel testo fornito nell'input della richiesta.
Per Vertex AI, i token non fanno parte del calcolo del prezzo. Scopri di più su limiti di token per modello e prezzi per modello.
Prezzi e quota per il conteggio dei token e dei caratteri fatturabili
Non sono previsti addebiti o limitazioni di quota per l'utilizzo dell'API CountTokens
. La
La quota massima per l'API CountTokens
è di 3000 richieste al minuto.