Hạn mức và giá

Trang này mô tả các hạn mức và cơ cấu giá cho Gemini API từ Vertex AI.

Hạn mức theo khu vực và mô hình

Hạn mức yêu cầu mỗi phút (RPM) áp dụng cho mô hình cơ sở và tất cả các phiên bản, mã nhận dạng và các phiên bản được điều chỉnh của mô hình đó. Sau đây là một số ví dụ:

  • Một yêu cầu đến gemini-1.0-pro và một yêu cầu đến gemini-1.0-pro-001 sẽ được tính là hai yêu cầu vào hạn mức RPM của mô hình cơ sở, gemini-1.0 pro.

  • Một yêu cầu đến gemini-1.0-pro-001 và một yêu cầu đối với mô hình đã được điều chỉnh dựa trên gemini-1.0-pro-001 được tính là hai yêu cầu vào hạn mức RPM của mô hình cơ sở gemini-1.0-pro.

Các hạn mức này áp dụng ở cấp dự án và được chia sẻ cho tất cả ứng dụng và địa chỉ IP sử dụng dự án Firebase đó. Ngoài ra, hạn mức áp dụng cho bất kỳ lệnh gọi nào đến Gemini API, cho dù lệnh gọi đó đang sử dụng Vertex AI cho Firebase SDK, SDK máy chủ (bao gồm cả thông qua Tiện ích của Gemini Firebase), lệnh gọi REST hoặc Vertex AI Studio.

Tìm hạn mức cho mỗi mô hình cho từng khu vực trong tài liệu của Google Cloud.

Yêu cầu tăng hạn mức

Nếu muốn tăng hạn mức cho Vertex AI, bạn có thể sử dụng bảng điều khiển Google Cloud để yêu cầu tăng hạn mức. Để tìm hiểu thêm về hạn mức, xem phần Làm việc với hạn mức.



Giá

Để sử dụng Gemini API của Vertex AI, bạn phải dự án Firebase của mình sử dụng Gói giá trả tiền theo mức dùng.

Tìm giá cho từng kiểu máy trong tài liệu của Google Cloud.