หน้านี้อธิบายขีดจํากัดและข้อกําหนดต่างๆ ในการใช้ Live API และโมเดลของ Live API
ขีดจำกัดที่เกี่ยวข้องกับเซสชัน
สำหรับ Live API เซสชันหมายถึงการเชื่อมต่อแบบถาวรที่สตรีมอินพุต และเอาต์พุตอย่างต่อเนื่องผ่านการเชื่อมต่อเดียวกัน
หากเซสชันเกินขีดจำกัดใดต่อไปนี้ ระบบจะ สิ้นสุดการเชื่อมต่อ
ระยะเวลาการเชื่อมต่อจะจำกัดไว้ที่ประมาณ 10 นาที
ระยะเวลาเซสชันจะขึ้นอยู่กับรูปแบบการป้อนข้อมูล ดังนี้
- เซสชันการป้อนข้อมูลแบบเสียงเท่านั้นจะจำกัดไว้ที่ 15 นาที
- การป้อนข้อมูลวิดีโอและเสียงถูกจำกัดไว้ที่ 2 นาที
หน้าต่างบริบทของเซสชันจำกัดไว้ที่ 128,000 โทเค็น
ขีดจำกัดอัตรา
Live API มีการจำกัดอัตราสำหรับทั้งเซสชันพร้อมกันต่อโปรเจ็กต์ Firebase และโทเค็นต่อนาที (TPM)
Gemini Developer API:
- ขีดจำกัดจะแตกต่างกันไปตามGemini Developer API "ระดับการใช้งาน" ของโปรเจ็กต์ (ดูเอกสารประกอบเกี่ยวกับขีดจำกัดของอัตรา)
Vertex AI Gemini API:
- 1,000 เซสชันพร้อมกันต่อโปรเจ็กต์ Firebase
- โทเค็น 4 ล้านรายการต่อนาที
รูปแบบเสียง
Live API รองรับรูปแบบเสียงต่อไปนี้
- รูปแบบเสียงอินพุต: เสียง PCM แบบ 16 บิตดิบที่ 16 kHz แบบ Little-Endian
รูปแบบเสียงเอาต์พุต: เสียง PCM แบบ 16 บิตดิบที่ 24kHz แบบ Little-Endian
ประเภท MIME ที่รองรับ:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
หากต้องการระบุอัตราการสุ่มตัวอย่างของเสียงที่ป้อน ให้ตั้งค่าประเภท MIME ของ Blob ที่มีเสียงแต่ละรายการเป็นค่า เช่น audio/pcm;rate=16000
รูปแบบวิดีโอ
Live API คาดหวังลำดับของเฟรมรูปภาพแบบแยกและรองรับอินพุตเฟรมวิดีโอ ที่ 1 เฟรมต่อวินาที (FPS)
อินพุตที่แนะนำ: ความละเอียด 768x768 ดั้งเดิมที่ 1 FPS
ประเภท MIME ที่รองรับ:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
โปรดทราบว่าข้อกำหนดนี้ทำให้ Live API ไม่เหมาะกับกรณีการใช้งาน ที่ต้องวิเคราะห์วิดีโอที่มีการเปลี่ยนแปลงอย่างรวดเร็ว เช่น การเล่นแบบทีละช็อตในกีฬาความเร็วสูง
เสียงตอบกลับ
Live API รองรับตัวเลือกเสียงตอบกลับต่อไปนี้ ดูตัวอย่างเสียงแต่ละเสียงได้ที่ Chirp 3: เสียง HD
หากไม่ได้ระบุเสียงตอบกลับ ค่าเริ่มต้นจะเป็น Puck
ดูวิธีระบุเสียงตอบกลับ
Zephyr -- สดใสKore -- หนักแน่นOrus -- หนักแน่นAutonoe -- สดใสUmbriel -- สบายๆErinome -- ชัดเจนLaomedeia -- ร่าเริงSchedar -- สม่ำเสมอAchird -- เป็นมิตรSadachbia -- มีชีวิตชีวา
|
Puck -- ร่าเริงFenrir -- ตื่นเต้นAoede -- สบายๆEnceladus -- กระซิบAlgieba -- นุ่มนวลAlgenib -- แหบAchernar -- อ่อนโยนGacrux -- สุขุมZubenelgenubi -- เป็นกันเองSadaltager -- รอบรู้
|
Charon -- ให้ข้อมูลLeda -- กระตือรือร้นCallirrhoe -- สบายๆIapetus -- ชัดเจนDespina -- ราบรื่นRasalgethi -- ให้ข้อมูลAlnilam -- หนักแน่นPulcherrima -- ตรงไปตรงมาVindemiatrix -- นุ่มนวลSulafat -- อบอุ่น
|
ภาษา
Live API รองรับภาษาต่อไปนี้ ดูวิธีกำหนดภาษาของคำตอบ
| ภาษา | รหัส BCP-47 | ภาษา | รหัส BCP-47 |
|---|---|---|---|
| อาหรับ (อียิปต์) | ar-EG | เยอรมัน (เยอรมนี) | de-DE |
| อังกฤษ (อเมริกัน) | th-TH | สเปน (สหรัฐอเมริกา) | es-US |
| ฝรั่งเศส (ฝรั่งเศส) | fr-FR | ฮินดี (อินเดีย) | hi-IN |
| อินโดนีเซีย (อินโดนีเซีย) | id-ID | อิตาลี (อิตาลี) | it-IT |
| ญี่ปุ่น (ญี่ปุ่น) | ja-JP | เกาหลี (เกาหลี) | ko-KR |
| โปรตุเกส (บราซิล) | pt-BR | รัสเซีย (รัสเซีย) | ru-RU |
| ดัตช์ (เนเธอร์แลนด์) | nl-NL | โปแลนด์ (โปแลนด์) | pl-PL |
| ไทย (ไทย) | th-TH | ตุรกี (ตุรกี) | tr-TR |
| เวียดนาม (เวียดนาม) | vi-VN | โรมาเนีย (โรมาเนีย) | ro-RO |
| ยูเครน (ยูเครน) | uk-UA | เบงกาลี (บังคลาเทศ) | bn-BD |
| อังกฤษ (อินเดีย) | แพ็กเกจ en-IN และ hi-IN | มราฐี (อินเดีย) | mr-IN |
| ทมิฬ (อินเดีย) | ta-IN | เตลูกู (อินเดีย) | te-IN |