トークンと課金対象文字数をカウントする


生成 AI モデル(Gemini モデルなど)は、データを トークンを処理するために使用できます。 各 Gemini モデルにトークンの最大数がある プロンプトとレスポンスで処理できます。

このページでは、トークン数とトークン数の推定を行う方法について説明します。 リクエストの課金対象文字数

カウントに含まれる情報は何ですか?

トークンと課金対象文字数のカウントについては、次の点に注意してください。

  • 合計トークンのカウント

    • この数は、リクエストが許容される上限を超えないようにするのに役立ちます。 表示されます。

    • トークン数には、すべてのファイル(画像など)のサイズが反映されます。 request 入力の一部として指定される値。 画像の数や動画の秒数などです

    • すべての Gemini モデルで、1 トークンは約 4 文字に相当します。100 人 約 60 ~ 80 語です。

  • 課金対象文字数の合計のカウント

    • この数は、費用の把握と管理に役立ちます。なぜなら、 Vertex AI の場合、文字数は料金の計算に含まれます。

    • 課金対象の文字数は、文字列の文字数を反映して、 text: request 入力の一部として指定されています。

Vertex AI の場合、トークンは料金計算に含まれません。 詳細: モデルあたりのトークンの上限 モデルごとの料金です

トークンと課金対象文字数のカウントの料金と割り当て

CountTokens API の使用に料金や割り当ての制限はありません。「 CountTokens API の最大割り当ては 1 分あたり 3,000 リクエストです。

コードサンプル

テキストのみの入力

マルチモーダル入力