Na tej stronie opisujemy limity i strukturę cen za interfejs Gemini API Vertex AI.
Limity według regionu i modelu
Limit żądań na minutę (RPM) dotyczy modelu podstawowego i wszystkich wersji, identyfikatorów i dostrojonych wersji danego modelu. Oto przykłady:
Prośba do
gemini-1.0-pro
igemini-1.0-pro-001
została wysłana liczone jako 2 żądania w ramach limitu RPM modelu podstawowego,gemini-1.0 pro
Żądanie do
gemini-1.0-pro-001
oraz żądanie do dostrojonego modelu, który na podstawiegemini-1.0-pro-001
są liczone jako 2 żądania w ramach limitu RPM modelu podstawowego,gemini-1.0-pro
.
Limity te są stosowane na poziomie projektu i są wspólne dla wszystkich aplikacji i adresów IP, które korzystają z tego projektu Firebase. Ponadto limity dotyczy dowolnego wywołania interfejsu Gemini API, niezależnie od tego, czy używa Pakiety SDK Vertex AI dla Firebase, pakiety SDK serwera (w tym Gemini w Firebase), wywołania REST lub Vertex AI Studio.
Znajdź limity dla każdego modelu dla każdego regionu znajdziesz w dokumentacji Google Cloud.
Poproś o zwiększenie limitu
Jeśli chcesz zwiększyć dowolny limit w Vertex AI, możesz użyć Google Cloud, aby poprosić o zwiększenie limitu. Aby dowiedzieć się więcej o limitach, Więcej informacji: Praca z limitami.
Ceny
Użycie interfejsu Gemini API z Vertex AI wymaga, aby Twój projekt Firebase użyj Abonament Blaze z płatnością według wykorzystania
Znajdź ceny dla każdego modelu znajdziesz w dokumentacji Google Cloud.