ขีดจำกัดและข้อกำหนดของ Live API


หน้านี้อธิบายขีดจํากัดและข้อกําหนดต่างๆ ในการใช้ Live API และโมเดลของ Live API

ขีดจำกัดที่เกี่ยวข้องกับเซสชัน

สำหรับ Live API เซสชันหมายถึงการเชื่อมต่อแบบถาวรที่สตรีมอินพุต และเอาต์พุตอย่างต่อเนื่องผ่านการเชื่อมต่อเดียวกัน

หากเซสชันเกินขีดจำกัดใดต่อไปนี้ ระบบจะ สิ้นสุดการเชื่อมต่อ

  • ระยะเวลาการเชื่อมต่อจะจำกัดไว้ที่ประมาณ 10 นาที

  • ระยะเวลาเซสชันจะขึ้นอยู่กับรูปแบบการป้อนข้อมูล ดังนี้

    • เซสชันการป้อนข้อมูลแบบเสียงเท่านั้นจะจำกัดไว้ที่ 15 นาที
    • การป้อนข้อมูลวิดีโอและเสียงถูกจำกัดไว้ที่ 2 นาที
  • หน้าต่างบริบทของเซสชันจำกัดไว้ที่ 128,000 โทเค็น

ขีดจำกัดอัตรา

Live API มีการจำกัดอัตราสำหรับทั้งเซสชันพร้อมกันต่อโปรเจ็กต์ Firebase และโทเค็นต่อนาที (TPM)

รูปแบบเสียง

Live API รองรับรูปแบบเสียงต่อไปนี้

  • รูปแบบเสียงอินพุต: เสียง PCM แบบ 16 บิตดิบที่ 16 kHz แบบ Little-Endian
  • รูปแบบเสียงเอาต์พุต: เสียง PCM แบบ 16 บิตดิบที่ 24kHz แบบ Little-Endian

  • ประเภท MIME ที่รองรับ: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

หากต้องการระบุอัตราการสุ่มตัวอย่างของเสียงที่ป้อน ให้ตั้งค่าประเภท MIME ของ Blob ที่มีเสียงแต่ละรายการเป็นค่า เช่น audio/pcm;rate=16000

รูปแบบวิดีโอ

Live API คาดหวังลำดับของเฟรมรูปภาพแบบแยกและรองรับอินพุตเฟรมวิดีโอ ที่ 1 เฟรมต่อวินาที (FPS)

  • อินพุตที่แนะนำ: ความละเอียด 768x768 ดั้งเดิมที่ 1 FPS

  • ประเภท MIME ที่รองรับ: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

โปรดทราบว่าข้อกำหนดนี้ทำให้ Live API ไม่เหมาะกับกรณีการใช้งาน ที่ต้องวิเคราะห์วิดีโอที่มีการเปลี่ยนแปลงอย่างรวดเร็ว เช่น การเล่นแบบทีละช็อตในกีฬาความเร็วสูง

เสียงตอบกลับ

Live API รองรับตัวเลือกเสียงตอบกลับต่อไปนี้ ดูตัวอย่างเสียงแต่ละเสียงได้ที่ Chirp 3: เสียง HD

หากไม่ได้ระบุเสียงตอบกลับ ค่าเริ่มต้นจะเป็น Puck

ดูวิธีระบุเสียงตอบกลับ

Zephyr -- สดใส
Kore -- หนักแน่น
Orus -- หนักแน่น
Autonoe -- สดใส
Umbriel -- สบายๆ
Erinome -- ชัดเจน
Laomedeia -- ร่าเริง
Schedar -- สม่ำเสมอ
Achird -- เป็นมิตร
Sadachbia -- มีชีวิตชีวา
Puck -- ร่าเริง
Fenrir -- ตื่นเต้น
Aoede -- สบายๆ
Enceladus -- กระซิบ
Algieba -- นุ่มนวล
Algenib -- แหบ
Achernar -- อ่อนโยน
Gacrux -- สุขุม
Zubenelgenubi -- เป็นกันเอง
Sadaltager -- รอบรู้
Charon -- ให้ข้อมูล
Leda -- กระตือรือร้น
Callirrhoe -- สบายๆ
Iapetus -- ชัดเจน
Despina -- ราบรื่น
Rasalgethi -- ให้ข้อมูล
Alnilam -- หนักแน่น
Pulcherrima -- ตรงไปตรงมา
Vindemiatrix -- นุ่มนวล
Sulafat -- อบอุ่น

ภาษา

Live API รองรับภาษาต่อไปนี้ ดูวิธีกำหนดภาษาของคำตอบ

ภาษา รหัส BCP-47 ภาษา รหัส BCP-47
อาหรับ (อียิปต์) ar-EG เยอรมัน (เยอรมนี) de-DE
อังกฤษ (อเมริกัน) th-TH สเปน (สหรัฐอเมริกา) es-US
ฝรั่งเศส (ฝรั่งเศส) fr-FR ฮินดี (อินเดีย) hi-IN
อินโดนีเซีย (อินโดนีเซีย) id-ID อิตาลี (อิตาลี) it-IT
ญี่ปุ่น (ญี่ปุ่น) ja-JP เกาหลี (เกาหลี) ko-KR
โปรตุเกส (บราซิล) pt-BR รัสเซีย (รัสเซีย) ru-RU
ดัตช์ (เนเธอร์แลนด์) nl-NL โปแลนด์ (โปแลนด์) pl-PL
ไทย (ไทย) th-TH ตุรกี (ตุรกี) tr-TR
เวียดนาม (เวียดนาม) vi-VN โรมาเนีย (โรมาเนีย) ro-RO
ยูเครน (ยูเครน) uk-UA เบงกาลี (บังคลาเทศ) bn-BD
อังกฤษ (อินเดีย) แพ็กเกจ en-IN และ hi-IN มราฐี (อินเดีย) mr-IN
ทมิฬ (อินเดีย) ta-IN เตลูกู (อินเดีย) te-IN