Các mô hình AI tạo sinh (như mô hình Gemini) chia nhỏ dữ liệu thành các đơn vị được gọi là mã thông báo để xử lý. Mỗi mô hình Gemini có số lượng mã thông báo tối đa mà mô hình đó có thể xử lý trong một câu lệnh và câu trả lời.
Trang này cho bạn biết cách ước tính số lượng mã thông báo và số lượng ký tự có thể tính phí cho một yêu cầu.
Số liệu này cung cấp thông tin gì?
Xin lưu ý những điều sau đây về việc tính mã thông báo và ký tự có thể tính phí:
Tính tổng số mã thông báo
Số lượng này hữu ích để đảm bảo các yêu cầu của bạn không vượt quá cửa sổ ngữ cảnh cho phép.
Số lượng mã thông báo sẽ phản ánh kích thước của tất cả các tệp (ví dụ: hình ảnh) được cung cấp trong dữ liệu đầu vào yêu cầu. Chỉ số này sẽ không tính số lượng hình ảnh hoặc số giây trong một video.
Đối với tất cả mô hình Gemini, một mã thông báo tương đương với khoảng 4 ký tự. 100 mã thông báo tương đương với khoảng 60-80 từ tiếng Anh.
Đếm tổng số ký tự có thể tính phí
Số lượng này hữu ích để hiểu và kiểm soát chi phí, vì đối với Vertex AI, số lượng ký tự là một phần của quá trình tính giá.
Số ký tự có thể tính phí sẽ phản ánh số ký tự trong văn bản được cung cấp trong dữ liệu đầu vào yêu cầu.
Đối với Vertex AI, mã thông báo không nằm trong quá trình tính giá. Tìm hiểu thêm về giới hạn mã thông báo cho mỗi mô hình và mức giá cho mỗi mô hình.
Giá và hạn mức để tính mã thông báo và ký tự có thể tính phí
Bạn không phải trả phí hoặc bị hạn chế về hạn mức khi sử dụng API CountTokens
. Hạn mức tối đa cho API CountTokens
là 3.000 yêu cầu mỗi phút.