Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Trang này được dịch bởi Cloud Translation API.

Hạn mức và hạn mức về số lượng yêu cầu

Nhấp vào nhà cung cấp Gemini API để xem nội dung và mã dành riêng cho nhà cung cấp trên trang này.

Giới hạn về tốc độ (thường được gọi là hạn mức) điều chỉnh số lượng yêu cầu mà bạn có thể gửi đến Gemini API trong một khung thời gian nhất định. Các giới hạn này giúp đảm bảo việc sử dụng hợp lý, ngăn chặn hành vi sai trái và duy trì hiệu suất hệ thống cho tất cả người dùng.

Khi sử dụng Firebase AI Logic để gửi yêu cầu đến các mô hình Gemini và Imagen, hạn mức yêu cầu của dự án sẽ phụ thuộc vào nhà cung cấp "Gemini API" mà bạn chọn. Firebase AI Logic cũng cung cấp một cách để đặt giới hạn về tốc độ "cho mỗi người dùng".

Xem hạn mức sử dụng cho Gemini Developer API

Nếu vượt quá hạn mức, bạn sẽ gặp lỗi 429 vượt quá hạn mức.

Cách hoạt động của hạn mức (hạn mức sử dụng)

Giới hạn về tốc độ (hạn mức) được đo lường theo 4 phương diện:

Số yêu cầu mỗi phút (RPM)
Số yêu cầu mỗi ngày (RPD)
Số mã thông báo mỗi phút (TPM)
Số mã thông báo mỗi ngày (TPD)

Mức sử dụng của bạn được đánh giá dựa trên từng hạn mức và việc vượt quá bất kỳ hạn mức nào trong số đó sẽ kích hoạt lỗi 429 vượt quá hạn mức. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc thực hiện 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá giới hạn TPM hoặc các giới hạn khác.

Giới hạn về tốc độ được áp dụng ở cấp dự án và áp dụng cho tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.

Hạn mức sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số hạn mức chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Imagen), nhưng về mặt khái niệm thì tương tự như TPM.

Các mô hình thử nghiệm và mô hình xem trước có giới hạn về tốc độ chặt chẽ hơn.

Yêu cầu tăng hạn mức

Nếu đang sử dụng "gói có tính phí" cho Gemini Developer API, thì bạn có thể yêu cầu tăng hạn mức sử dụng.

Đặt hạn mức "cho mỗi người dùng"

Để sử dụng Firebase AI Logic, dự án của bạn cần bật nhà cung cấp Gemini API mà bạn chọn, nhưng bạn cũng cần bật API Firebase AI Logic. API này đóng vai trò là cổng giữa các SDK ứng dụng của chúng tôi và nhà cung cấp Gemini API của bạn. API này sẽ được bật cho bạn khi bạn thiết lập Firebase AI Logic lần đầu trong dự án Firebase.

Bạn có thể sử dụng hạn mức tỷ lệ (hạn ngạch) API Firebase AI Logic làm hạn mức tỷ lệ "trên mỗi người dùng" cho ứng dụng của mình, cụ thể là đối với những tính năng AI dựa vào Firebase AI Logic. Bạn nên đặt giới hạn này để đáp ứng một cách hợp lý nhu cầu truy cập vào các tính năng AI của một người dùng, đồng thời đảm bảo rằng không có người dùng nào vượt quá giới hạn của nhà cung cấp Gemini API (dành cho tất cả người dùng của bạn).

Thông tin chi tiết về giới hạn tốc độ "cho mỗi người dùng"

Sau đây là một số thông tin quan trọng về hạn mức (hạn ngạch) API Firebase AI Logic – cụ thể là số yêu cầu mỗi phút (RPM):

Hạn mức này dựa trên "Yêu cầu tạo nội dung" theo từng người dùng, từng khu vực và từng phút, đồng thời không dựa trên mô hình.
Đây là giới hạn về tốc độ áp dụng cho tất cả người dùng của bạn. Hiện tại, không có cách nào để đặt hạn mức cho một người dùng cụ thể hoặc một nhóm người dùng cụ thể^*.
Quy tắc này áp dụng ở cấp dự án và áp dụng cho tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.
Quy tắc này áp dụng cho mọi lệnh gọi đến từ bất kỳ SDK Firebase AI Logic nào.
Giới hạn tốc độ mặc định là 100 RPM cho mỗi người dùng.
Xin lưu ý rằng bạn vẫn cần cân nhắc các giới hạn cho trình cung cấp Gemini API (xem ở trên), các giới hạn này sẽ được ưu tiên hơn API Firebase AI Logic.

^{* Nếu đang sử dụng Vertex AI Gemini API và ứng dụng của bạn chuyển hướng người dùng đến các khu vực khác nhau (ví dụ: sử dụng Firebase Remote Config), thì bạn có thể đặt một giới hạn tỷ lệ cụ thể cho người dùng ở một khu vực cụ thể.}

Điều chỉnh hạn mức "cho mỗi người dùng"

Để điều chỉnh hạn mức, bạn phải có quyền serviceusage.quotas.update. Theo mặc định, quyền này có trong vai trò Chủ sở hữu và Người chỉnh sửa.

Sau đây là cách chỉnh sửa hạn mức (hạn ngạch) hoặc yêu cầu tăng hạn mức:

Trong bảng điều khiển Google Cloud, hãy chuyển đến trang dành cho Firebase AI Logic API.
Nhấp vào Quản lý.
Ở phía dưới trang, hãy nhấp vào thẻ Hạn mức và giới hạn hệ thống.
Lọc bảng để cho thấy những hạn mức bạn quan tâm, chẳng hạn như khả năng (yêu cầu tạo nội dung) và khu vực.

Ví dụ: để xem hạn mức cho mỗi người dùng đối với việc tạo yêu cầu tạo nội dung ở bất kỳ khu vực nào được hỗ trợ tại Châu Á, bộ lọc của bạn sẽ có dạng như sau: Generate content requests + Dimension:region:asia

Lưu ý: Để tạo bộ lọc Dimension, bạn cần sử dụng công cụ lọc thay vì chỉ sao chép và dán các giá trị trong ví dụ ở trên. Ngoài ra, hàng hạn mức (default) không áp dụng cho Firebase AI Logic.
Chọn hộp đánh dấu ở bên trái mỗi hạn mức mà bạn quan tâm.
Ở cuối hàng của hạn mức, hãy nhấp vào biểu tượng , rồi chọn Chỉnh sửa hạn mức.
Trong biểu mẫu Thay đổi hạn mức, hãy làm như sau:
1. Nhập hạn mức mới vào trường Giá trị mới.
  
  Hạn mức này áp dụng ở cấp dự án và được chia sẻ trên tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.
2. Điền vào các trường khác trong biểu mẫu, rồi nhấp vào Xong.
3. Nhấp vào Gửi yêu cầu.