Menghitung token dan karakter yang dapat ditagih


Model AI generatif (seperti model Gemini) memecah data menjadi beberapa unit yang disebut token untuk diproses. Setiap model Gemini memiliki jumlah token maksimum yang dapat ditangani dalam sebuah prompt dan respons.

Halaman ini menampilkan cara mendapatkan perkiraan jumlah token dan jumlah karakter yang dapat ditagih untuk permintaan.

Informasi apa yang diberikan dalam hitungan tersebut?

Perhatikan hal-hal berikut terkait penghitungan token dan karakter yang dapat ditagih:

  • Menghitung total token

    • Jumlah ini berguna untuk memastikan permintaan Anda tidak melewati batas yang diizinkan jendela konteks tambahan.

    • Jumlah token akan mencerminkan ukuran semua file (misalnya, gambar) yang disediakan sebagai bagian dari input request. Asisten Google tidak akan menghitung jumlah gambar, atau jumlah detik dalam video.

    • Untuk semua model Gemini, token setara dengan sekitar 4 karakter. 100 token terdiri dari sekitar 60-80 kata dalam bahasa Inggris.

  • Menghitung total karakter yang dapat ditagih

    • Jumlah ini berguna untuk memahami dan mengendalikan biaya Anda, karena untuk Vertex AI, jumlah karakter adalah bagian dari penghitungan harga.

    • Jumlah karakter yang dapat ditagih akan mencerminkan jumlah karakter dalam text yang disediakan sebagai bagian dari input request.

Untuk Vertex AI, token bukan bagian dari penghitungan harga. Pelajari lebih lanjut cara batas token per model dan harga per model.

Harga dan kuota untuk menghitung token dan karakter yang dapat ditagih

Tidak ada biaya atau pembatasan kuota untuk menggunakan CountTokens API. Tujuan kuota maksimum untuk CountTokens API adalah 3000 permintaan per menit.

Contoh kode

Input hanya teks

Input multimodal