生成 AI モデル(Gemini モデルなど)は、データを トークンを処理するために使用できます。 各 Gemini モデルにはトークンの最大数があります プロンプトとレスポンスで処理できます。
このページでは、リクエストのトークン数と課金対象文字数の見積もりを取得する方法について説明します。
カウントにはどのような情報が表示されますか?
トークンと課金対象文字数のカウントについて、次の点に注意してください。
トークンの合計数をカウントする
このカウントは、リクエストが許容されるコンテキスト ウィンドウを超えないようにするのに役立ちます。
トークン数には、すべてのファイル(画像など)のサイズが反映されます。 request 入力の一部として指定される値。動画内の画像数や秒数はカウントされません。
すべての Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60~80 ワード(英語)です。
課金対象文字数の合計のカウント
Vertex AI では文字数が料金計算の一部となるため、このカウントは費用の把握と管理に役立ちます。
課金対象の文字数は、文字列の文字数を反映して、 text: request 入力の一部として指定されています。
Vertex AI の場合、トークンは料金計算に含まれません。 詳細: モデルあたりのトークンの上限 モデルごとの料金です
トークンと課金対象文字数のカウントの料金と割り当て
CountTokens
API の使用に料金や割り当ての制限はありません。CountTokens
API の最大割り当ては、1 分あたり 3,000 リクエストです。