Na tej stronie opisujemy limity i cennik interfejsu Gemini API Vertex AI.
Limity według regionu i modelu
Limit żądań na minutę (RPM) dotyczy modelu podstawowego oraz wszystkich wersji, identyfikatorów i dostrojonych wersji tego modelu. Oto kilka przykładów:
Żądanie do
gemini-1.0-pro
i żądanie dogemini-1.0-pro-001
są liczone jako 2 żądania w ramach limitu RPM modelu podstawowegogemini-1.0 pro
.Żądanie do
gemini-1.0-pro-001
i żądanie do dostrojonego modelu opartego nagemini-1.0-pro-001
są zliczane jako 2 żądania do limitu RPM modelu podstawowegogemini-1.0-pro
.
Limity te obowiązują na poziomie projektu i są wspólne dla wszystkich aplikacji oraz adresów IP, które z niego korzystają. Limity dotyczą dowolnych wywołań interfejsu Gemini API niezależnie od tego, czy są używane pakiety SDK Vertex AI dla Firebase, pakiety SDK serwera (w tym z użyciem rozszerzeń Gemini Firebase), wywołania REST czy Vertex AI Studio.
Sprawdź limity dla poszczególnych modeli dla poszczególnych regionów w dokumentacji Google Cloud.
Poproś o zwiększenie limitu
Jeśli chcesz zwiększyć limity Vertex AI, możesz poprosić o zwiększenie limitu w konsoli Google Cloud. Więcej informacji o limitach znajdziesz w artykule Praca z limitami.
Ceny
Korzystanie z interfejsu Gemini API z Vertex AI wymaga, aby projekt Firebase korzystał z abonamentu Blaze z płatnościami według wykorzystania.
Ceny poszczególnych modeli znajdziesz w dokumentacji Google Cloud.