Limity i ceny

Na tej stronie opisujemy limity i cennik interfejsu Gemini API Vertex AI.

Limity według regionu i modelu

Limit żądań na minutę (RPM) dotyczy modelu podstawowego oraz wszystkich wersji, identyfikatorów i dostrojonych wersji tego modelu. Oto kilka przykładów:

  • Żądanie do gemini-1.0-pro i żądanie do gemini-1.0-pro-001 są liczone jako 2 żądania w ramach limitu RPM modelu podstawowego gemini-1.0 pro.

  • Żądanie do gemini-1.0-pro-001 i żądanie do dostrojonego modelu opartego na gemini-1.0-pro-001 są zliczane jako 2 żądania do limitu RPM modelu podstawowego gemini-1.0-pro.

Limity te obowiązują na poziomie projektu i są wspólne dla wszystkich aplikacji oraz adresów IP, które z niego korzystają. Limity dotyczą dowolnych wywołań interfejsu Gemini API niezależnie od tego, czy są używane pakiety SDK Vertex AI dla Firebase, pakiety SDK serwera (w tym z użyciem rozszerzeń Gemini Firebase), wywołania REST czy Vertex AI Studio.

Sprawdź limity dla poszczególnych modeli dla poszczególnych regionów w dokumentacji Google Cloud.

Poproś o zwiększenie limitu

Jeśli chcesz zwiększyć limity Vertex AI, możesz poprosić o zwiększenie limitu w konsoli Google Cloud. Więcej informacji o limitach znajdziesz w artykule Praca z limitami.



Ceny

Korzystanie z interfejsu Gemini API z Vertex AI wymaga, aby projekt Firebase korzystał z abonamentu Blaze z płatnościami według wykorzystania.

Ceny poszczególnych modeli znajdziesz w dokumentacji Google Cloud.