Modelle für generative KI (z. B. Gemini-Modelle) zerlegen Daten zur Verarbeitung in Einheiten, die als Tokens bezeichnet werden. Jedes Gemini-Modell hat eine maximale Anzahl von Tokens, die es in einem Prompt und einer Antwort verarbeiten kann.
Auf dieser Seite erfahren Sie, wie Sie eine Schätzung der Anzahl der Tokens und der Anzahl der abrechenbaren Zeichen für eine Anfrage abrufen.
Welche Informationen werden in der Zählung angegeben?
Beachten Sie Folgendes zum Zählen von Tokens und abrechenbaren Zeichen:
Anzahl der Tokens insgesamt zählen
Dieser Wert ist hilfreich, um sicherzustellen, dass Ihre Anfragen das zulässige Kontextfenster nicht überschreiten.
Die Tokenanzahl entspricht der Größe aller Dateien (z. B. Bilder), die im Rahmen der Anfrage bereitgestellt werden. Die Anzahl der Bilder oder die Anzahl der Sekunden in einem Video werden nicht gezählt.
Bei allen Gemini-Modellen entspricht ein Token etwa vier Zeichen. 100 Tokens entsprechen etwa 60–80 englischen Wörtern.
Abrechenbare Zeichen insgesamt zählen
Diese Anzahl ist hilfreich, um Ihre Kosten zu verstehen und zu kontrollieren, da die Anzahl der Zeichen bei Vertex AI Teil der Preisberechnung ist.
Die abrechenbare Zeichenanzahl entspricht der Anzahl der Zeichen im Text, der als Teil der Anfrage-Eingabe bereitgestellt wird.
Bei Vertex AI werden Tokens nicht bei der Preisberechnung berücksichtigt. Weitere Informationen zu Tokenlimits pro Modell und Preisen pro Modell
Preise und Kontingente für die Zählung von Tokens und abrechenbaren Zeichen
Für die Verwendung der CountTokens
API fallen keine Gebühren an und es gibt keine Kontingentbeschränkungen. Das maximale Kontingent für die CountTokens
API beträgt 3.000 Anfragen pro Minute.