Contare i token e i caratteri fatturabili


I modelli di IA generativa (come i modelli Gemini) suddividono i dati in unità chiamate token per l'elaborazione. Ogni modello Gemini ha un numero massimo di token che può gestire in un prompt e una risposta.

Questa pagina mostra come ottenere una stima del conteggio dei token e del numero di caratteri fatturabili per una richiesta.

Quali informazioni vengono fornite nel conteggio?

Tieni presente quanto segue sul conteggio dei token e dei caratteri fatturabili:

  • Conteggio dei token totali

    • Questo conteggio è utile per assicurarsi che le richieste non superino il limite consentito finestra contestuale.

    • Il numero di token rifletterà le dimensioni di tutti i file (ad esempio le immagini) forniti nell'ambito dell'input della richiesta. Non conteggerà il numero di immagini o il numero di secondi di un video.

    • Per tutti i modelli Gemini, un token equivale a circa 4 caratteri. 100 di token sono circa 60-80 parole inglesi.

  • Contare il numero totale di caratteri fatturabili

    • Questo conteggio è utile per comprendere e controllare i costi, in quanto per Vertex AI, il numero di caratteri fa parte del calcolo del prezzo.

    • Il numero di caratteri fatturabili riflette il numero di caratteri nel testo fornito nell'input della richiesta.

Per Vertex AI, i token non fanno parte del calcolo del prezzo. Scopri di più su limiti di token per modello e prezzi per modello.

Prezzi e quota per il conteggio dei token e dei caratteri fatturabili

Non sono previsti addebiti o limitazioni di quota per l'utilizzo dell'API CountTokens. La La quota massima per l'API CountTokens è di 3000 richieste al minuto.

Esempi di codice

Input di solo testo

Input multimodale