Live API의 한도 및 사양


이 페이지에서는 Live API 및 해당 모델 사용에 관한 다양한 제한사항과 사양을 설명합니다.

세션 관련 한도

Live API의 경우 세션은 동일한 연결을 통해 입력과 출력이 지속적으로 스트리밍되는 영구 연결을 나타냅니다.

세션이 다음 한도 중 하나라도 초과하면 연결이 종료됩니다.

  • 연결 길이는 약 10분으로 제한됩니다.

  • 세션 길이는 입력 모달리티에 따라 다릅니다.

    • 오디오 전용 입력 세션은 15분으로 제한됩니다.
    • 동영상 + 오디오 입력은 2분으로 제한됩니다.
  • 세션 컨텍스트 윈도우는 토큰 128,000개로 제한됩니다.

비율 제한

Live API에는 Firebase 프로젝트당 동시 세션과 분당 토큰 수 (TPM)에 대한 속도 제한이 있습니다.

  • Gemini Developer API:

  • Vertex AI Gemini API:

    • Firebase 프로젝트당 동시 세션 수 1,000개
    • 분당 토큰 4백만 개

오디오 형식

Live API는 다음 오디오 형식을 지원합니다.

  • 입력 오디오 형식: 16kHz의 원시 16비트 PCM 오디오, little-endian
  • 출력 오디오 형식: 24kHz의 원시 16비트 PCM 오디오, little-endian

  • 지원되는 MIME 유형: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

입력 오디오의 샘플링 레이트를 전달하려면 오디오가 포함된 각 Blob의 MIME 유형을 audio/pcm;rate=16000과 같은 값으로 설정합니다.

동영상 형식

Live API는 개별 이미지 프레임 시퀀스를 예상하며 초당 1프레임 (FPS)의 동영상 프레임 입력을 지원합니다.

  • 권장 입력: 1FPS의 기본 768x768 해상도

  • 지원되는 MIME 유형: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

이 사양으로 인해 Live API는 고속 스포츠의 플레이별 분석과 같이 빠르게 변경되는 동영상을 분석해야 하는 사용 사례에는 적합하지 않습니다.

대답 음성

Live API은 다음 응답 음성 옵션을 지원합니다. 각 음성이 어떻게 들리는지 데모를 보려면 Chirp 3: HD 음성을 참고하세요.

대답 음성을 지정하지 않으면 기본값은 Puck입니다.

대답 음성을 지정하는 방법을 알아보세요.

Zephyr -- 밝음
Kore -- 단호함
Orus -- 단호함
Autonoe -- 밝음
Umbriel -- 느긋함
Erinome -- 명료함
Laomedeia -- 경쾌함
Schedar -- 차분함
Achird -- 친근함
Sadachbia -- 활기참
Puck -- 경쾌한
Fenrir -- 흥분한
Aoede -- 산들바람
Enceladus -- 숨소리
Algieba -- 부드러운
Algenib -- 거친
Achernar -- 부드러운
Gacrux -- 성숙한
Zubenelgenubi -- 캐주얼한
Sadaltager -- 지식이 풍부한
Charon -- 정보 제공
Leda -- 젊은
Callirrhoe -- 편안한
Iapetus -- 명확한
Despina -- 부드러운
Rasalgethi -- 정보 제공
Alnilam -- 단호한
Pulcherrima -- 전진
Vindemiatrix -- 부드러운
Sulafat -- 따뜻한

언어

Live API는 다음 언어를 지원합니다. 대답 언어에 영향을 주는 방법을 알아보세요.

언어 BCP-47 코드 언어 BCP-47 코드
아랍어(이집트) ar-EG 독일어(독일) de-DE
영어(미국) en-US 스페인어(미국) es-US
프랑스어(프랑스) fr-FR 힌디어(인도) hi-IN
인도네시아어(인도네시아) id-ID 이탈리아어(이탈리아) it-IT
일본어(일본) ja-JP 한국어(대한민국) ko-KR
포르투갈어(브라질) pt-BR 러시아어(러시아) ru-RU
네덜란드어(네덜란드) nl-NL 폴란드어(폴란드) pl-PL
태국어(태국) th-TH 터키어(터키) tr-TR
베트남어(베트남) vi-VN 루마니아어(루마니아) ro-RO
우크라이나어(우크라이나) uk-UA 벵골어(방글라데시) bn-BD
영어(인도) en-IN 및 hi-IN 번들 마라티어(인도) mr-IN
타밀어(인도) ta-IN 텔루구어(인도) te-IN