Định mức và giá

Trang này mô tả hạn mức và cơ cấu giá cho API Gemini từ Vertex AI.

Hạn mức theo khu vực và mô hình

Hạn mức số yêu cầu mỗi phút (RPM) áp dụng cho mô hình cơ sở và tất cả các phiên bản, giá trị nhận dạng và phiên bản đã điều chỉnh của mô hình đó. Sau đây là một số ví dụ:

  • Một yêu cầu đến gemini-1.0-pro và một yêu cầu đến gemini-1.0-pro-001 sẽ được tính là 2 yêu cầu vào hạn mức RPM của mô hình cơ sở, gemini-1.0 pro.

  • Một yêu cầu đến gemini-1.0-pro-001 và một yêu cầu đối với một mô hình được điều chỉnh dựa trên gemini-1.0-pro-001 sẽ được tính là 2 yêu cầu đối với hạn mức RPM của mô hình cơ sở, gemini-1.0-pro.

Các hạn mức này áp dụng ở cấp dự án và được dùng chung trên tất cả các ứng dụng cũng như địa chỉ IP sử dụng dự án Firebase đó. Ngoài ra, hạn mức áp dụng cho bất kỳ lệnh gọi nào đến Gemini API, cho dù đó là sử dụng Vertex AI cho Firebase SDK, SDK máy chủ (bao gồm cả qua Tiện ích Firebase Firebase), lệnh gọi REST hay Vertex AI Studio.

Tìm điểm số của mỗi mô hình ở từng khu vực trong tài liệu của Google Cloud.

Yêu cầu tăng hạn mức

Nếu muốn tăng bất kỳ hạn mức nào cho Vertex AI, bạn có thể sử dụng bảng điều khiển Google Cloud để yêu cầu tăng hạn mức. Để tìm hiểu thêm về hạn mức, hãy xem bài viết Làm việc với hạn mức.



Giá

Để sử dụng API Gemini của Vertex AI, dự án Firebase của bạn phải sử dụng gói giá trả tiền theo mức dùng của Blaze.

Tìm giá cho từng mô hình trong tài liệu của Google Cloud.