이 페이지에서는 Live API 및 해당 모델 사용에 관한 다양한 제한사항과 사양을 설명합니다.
세션 관련 한도
Live API의 경우 세션은 동일한 연결을 통해 입력과 출력이 지속적으로 스트리밍되는 영구 연결을 나타냅니다.
세션이 다음 한도 중 하나라도 초과하면 연결이 종료됩니다.
연결 길이는 약 10분으로 제한됩니다.
세션 길이는 입력 모달리티에 따라 다릅니다.
- 오디오 전용 입력 세션은 15분으로 제한됩니다.
- 동영상 + 오디오 입력은 2분으로 제한됩니다.
세션 컨텍스트 윈도우는 토큰 128,000개로 제한됩니다.
비율 제한
Live API에는 Firebase 프로젝트당 동시 세션과 분당 토큰 수 (TPM)에 대한 속도 제한이 있습니다.
Gemini Developer API:
- 한도는 프로젝트의 Gemini Developer API '사용량 등급'에 따라 다릅니다(요청 빈도 제한 문서 참고).
Vertex AI Gemini API:
- Firebase 프로젝트당 동시 세션 수 1,000개
- 분당 토큰 4백만 개
오디오 형식
Live API는 다음 오디오 형식을 지원합니다.
- 입력 오디오 형식: 16kHz의 원시 16비트 PCM 오디오, little-endian
출력 오디오 형식: 24kHz의 원시 16비트 PCM 오디오, little-endian
지원되는 MIME 유형:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
입력 오디오의 샘플링 레이트를 전달하려면 오디오가 포함된 각 Blob의 MIME 유형을 audio/pcm;rate=16000과 같은 값으로 설정합니다.
동영상 형식
Live API는 개별 이미지 프레임 시퀀스를 예상하며 초당 1프레임 (FPS)의 동영상 프레임 입력을 지원합니다.
권장 입력: 1FPS의 기본 768x768 해상도
지원되는 MIME 유형:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
이 사양으로 인해 Live API는 고속 스포츠의 플레이별 분석과 같이 빠르게 변경되는 동영상을 분석해야 하는 사용 사례에는 적합하지 않습니다.
대답 음성
Live API은 다음 응답 음성 옵션을 지원합니다. 각 음성이 어떻게 들리는지 데모를 보려면 Chirp 3: HD 음성을 참고하세요.
대답 음성을 지정하지 않으면 기본값은 Puck입니다.
대답 음성을 지정하는 방법을 알아보세요.
Zephyr -- 밝음Kore -- 단호함Orus -- 단호함Autonoe -- 밝음Umbriel -- 느긋함Erinome -- 명료함Laomedeia -- 경쾌함Schedar -- 차분함Achird -- 친근함Sadachbia -- 활기참
|
Puck -- 경쾌한Fenrir -- 흥분한Aoede -- 산들바람Enceladus -- 숨소리Algieba -- 부드러운Algenib -- 거친Achernar -- 부드러운Gacrux -- 성숙한Zubenelgenubi -- 캐주얼한Sadaltager -- 지식이 풍부한
|
Charon -- 정보 제공Leda -- 젊은Callirrhoe -- 편안한Iapetus -- 명확한Despina -- 부드러운Rasalgethi -- 정보 제공Alnilam -- 단호한Pulcherrima -- 전진Vindemiatrix -- 부드러운Sulafat -- 따뜻한
|
언어
Live API는 다음 언어를 지원합니다. 대답 언어에 영향을 주는 방법을 알아보세요.
| 언어 | BCP-47 코드 | 언어 | BCP-47 코드 |
|---|---|---|---|
| 아랍어(이집트) | ar-EG | 독일어(독일) | de-DE |
| 영어(미국) | en-US | 스페인어(미국) | es-US |
| 프랑스어(프랑스) | fr-FR | 힌디어(인도) | hi-IN |
| 인도네시아어(인도네시아) | id-ID | 이탈리아어(이탈리아) | it-IT |
| 일본어(일본) | ja-JP | 한국어(대한민국) | ko-KR |
| 포르투갈어(브라질) | pt-BR | 러시아어(러시아) | ru-RU |
| 네덜란드어(네덜란드) | nl-NL | 폴란드어(폴란드) | pl-PL |
| 태국어(태국) | th-TH | 터키어(터키) | tr-TR |
| 베트남어(베트남) | vi-VN | 루마니아어(루마니아) | ro-RO |
| 우크라이나어(우크라이나) | uk-UA | 벵골어(방글라데시) | bn-BD |
| 영어(인도) | en-IN 및 hi-IN 번들 | 마라티어(인도) | mr-IN |
| 타밀어(인도) | ta-IN | 텔루구어(인도) | te-IN |