할당량 및 가격 책정

이 페이지에서는 Vertex AI의 Gemini API 할당량 및 가격 책정 구조를 설명합니다.

리전 및 모델별 할당량

분당 요청 수 (RPM) 할당량은 기본 모델과 해당 모델의 모든 버전, 식별자, 조정된 버전에 적용됩니다. 예를 들면 다음과 같습니다.

  • gemini-1.0-pro에 대한 요청과 gemini-1.0-pro-001에 대한 요청은 기본 모델 gemini-1.0 pro의 RPM 할당량에 대한 요청 2개로 집계됩니다.

  • gemini-1.0-pro-001에 대한 요청과 gemini-1.0-pro-001에 기반한 조정된 모델에 대한 요청은 기본 모델 gemini-1.0-pro의 RPM 할당량에 대한 요청 2회로 집계됩니다.

이러한 할당량은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다. 또한 Firebase용 Vertex AI SDK, 서버 SDK (Gemini Firebase Extensions 사용 포함), REST 호출 또는 Vertex AI Studio를 사용하든 Gemini API에 대한 모든 호출에 적용됩니다.

Google Cloud 문서에서 리전별 모델별 할당량을 확인하세요.

할당량 상향 조정 요청

Vertex AI의 할당량을 상향 조정하려면 Google Cloud 콘솔을 사용하여 할당량 증가를 요청하면 됩니다. 할당량에 대한 자세한 내용은 할당량 작업을 참조하세요.



가격 책정

Vertex AI에서 Gemini API를 사용하려면 Firebase 프로젝트에서 사용한 만큼만 지불하는 Blaze 요금제를 사용해야 합니다.

Google Cloud 문서에서 각 모델의 가격 책정을 확인하세요.