Model AI generatif (seperti model Gemini) membagi data menjadi unit yang disebut token untuk diproses. Setiap model Gemini memiliki jumlah maksimum token yang dapat ditanganinya dalam perintah dan respons.
Halaman ini menunjukkan cara mendapatkan estimasi jumlah token dan jumlah karakter yang dapat ditagih untuk permintaan.
Informasi apa yang diberikan dalam jumlah tersebut?
Perhatikan hal-hal berikut terkait penghitungan token dan karakter yang dapat ditagih:
Menghitung total token
Jumlah ini berguna untuk memastikan permintaan Anda tidak melebihi periode konteks yang diizinkan.
Jumlah token akan mencerminkan ukuran semua file (misalnya, gambar) yang disediakan sebagai bagian dari input permintaan. Metode ini tidak akan menghitung jumlah gambar atau jumlah detik dalam video.
Untuk semua model Gemini, token setara dengan sekitar 4 karakter. 100 token adalah sekitar 60-80 kata dalam bahasa Inggris.
Menghitung total karakter yang dapat ditagih
Jumlah ini berguna untuk memahami dan mengontrol biaya Anda, karena untuk Vertex AI, jumlah karakter merupakan bagian dari penghitungan harga.
Jumlah karakter yang dapat ditagih akan mencerminkan jumlah karakter dalam teks yang disediakan sebagai bagian dari input request.
Untuk Vertex AI, token bukan bagian dari penghitungan harga. Pelajari lebih lanjut batas token per model dan harga per model.
Harga dan kuota untuk menghitung token dan karakter yang dapat ditagih
Penggunaan CountTokens
API tidak dikenai batasan biaya atau kuota. Kuota maksimum untuk CountTokens
API adalah 3.000 permintaan per menit.