توضّح هذه الصفحة الحدود والمواصفات المختلفة لاستخدام Live API ونماذجه.
الحدود القصوى المتعلّقة بالجلسات
بالنسبة إلى Live API، تشير الجلسة إلى اتصال دائم يتم فيه بث البيانات المدخلة والمخرجة بشكل مستمر عبر الاتصال نفسه.
إذا تجاوزت الجلسة أيًا من الحدود التالية، سيتم إنهاء الاتصال.
تقتصر مدة الاتصال على 10 دقائق تقريبًا.
تعتمد مدة الجلسة على طرق الإدخال التالية:
- تقتصر مدة جلسات الإدخال الصوتي فقط على 15 دقيقة.
- تقتصر مدة الفيديو والصوت على دقيقتَين.
يقتصر عدد الرموز المميزة المستندة إلى السياق في الجلسة على 128 ألف رمز مميز.
حدود معدّل الاستخدام
يفرض Live API حدودًا على معدّل الجلسات المتزامنة لكل مشروع في Firebase، بالإضافة إلى عدد الرموز المميزة في الدقيقة (TPM).
Gemini Developer API:
- تختلف الحدود القصوى حسب Gemini Developer API"فئة الاستخدام" الخاصة بمشروعك (راجِع مستندات حدود المعدّل)
Vertex AI Gemini API:
- 1,000 جلسة متزامنة لكل مشروع على Firebase
- 4 مليون رمز مميّز في الدقيقة
تنسيقات الصوت
يتوافق Live API مع تنسيقات الصوت التالية:
- تنسيق الصوت المُدخَل: صوت PCM خام بمعدّل 16 بت و16 كيلوهرتز بنظام الترتيب الصغير
تنسيق إخراج الصوت: صوت PCM خام 16 بت بترتيب وحدات البايت الأصغر أولاً بمعدل 24 كيلوهرتز
أنواع MIME المتوافقة:
audio/x-aacوaudio/flacوaudio/mp3وaudio/m4aوaudio/mpegوaudio/mpgaوaudio/mp4وaudio/oggوaudio/pcmوaudio/wavوaudio/webm
لتحديد معدّل عيّنات الصوت المُدخَل، اضبط نوع MIME لكل Blob يحتوي على صوت على قيمة مثل audio/pcm;rate=16000.
أشكال إعلانات الفيديو
تتوقّع Live API تسلسلاً من لقطات الصور المنفصلة وتتيح إدخال لقطات الفيديو بمعدّل لقطة واحدة في الثانية.
البيانات المُدخَلة المقترَحة: دقة 768x768 الأصلية بمعدّل لقطة واحدة في الثانية.
أنواع MIME المتوافقة:
video/x-flvوvideo/quicktimeوvideo/mpegوvideo/mpegsوvideo/mpgوvideo/mp4وvideo/webmوvideo/wmvوvideo/3gpp
يُرجى العِلم أنّ هذه المواصفات تجعل Live API غير مناسبة لحالات الاستخدام التي تتطلّب تحليل فيديو سريع التغيّر، مثل اللقطات السريعة في المباريات الرياضية.
أصوات الردود
يتوافق Live API مع خيارات الصوت التالية للردود. للحصول على عيّنات من كل صوت، يُرجى الاطّلاع على Chirp 3: أصوات عالية الدقة.
إذا لم تحدّد صوتًا للردّ، سيكون الصوت التلقائي هو Puck.
Zephyr -- مشرقKore -- حازمOrus -- حازمAutonoe -- مشرقUmbriel -- هادئErinome -- واضحLaomedeia -- مبهجSchedar -- متوازنAchird -- ودودSadachbia -- حيوي
|
Puck -- مفعم بالحيويةFenrir -- متحمّسAoede -- هادئEnceladus -- مريحAlgieba -- ناعمAlgenib -- خشنAchernar -- لطيفGacrux -- ناضجZubenelgenubi -- عاديSadaltager -- مُطّلع
|
Charon -- مفيدLeda -- حيويCallirrhoe -- هادئIapetus -- واضحDespina -- سلسRasalgethi -- مفيدAlnilam -- حازمPulcherrima -- مقدامVindemiatrix -- لطيفSulafat -- دافئ
|
اللغات
يتوفّر Live API باللغات التالية. كيفية التأثير في لغة الردّ
| اللغة | رمز BCP-47 | اللغة | رمز BCP-47 |
|---|---|---|---|
| العربية (مصر) | ar-EG | الألمانية (ألمانيا) | de-DE |
| الإنجليزية (الولايات المتحدة) | en-US | الإسبانية (الولايات المتحدة) | es-US |
| الفرنسية (فرنسا) | fr-FR | الهندية (الهند) | hi-IN |
| الإندونيسية (إندونيسيا) | id-ID | الإيطالية (إيطاليا) | it-IT |
| اليابانية (اليابان) | ja-JP | الكورية (كوريا) | ko-KR |
| البرتغالية (البرازيل) | pt-BR | الروسية (روسيا) | ru-RU |
| الهولندية (هولندا) | nl-NL | البولندية (بولندا) | pl-PL |
| التايلاندية (تايلاند) | th-TH | التركية (تركيا) | tr-TR |
| الفيتنامية (فيتنام) | vi-VN | الرومانية (رومانيا) | ro-RO |
| الأوكرانية (أوكرانيا) | uk-UA | البنغالية (بنغلاديش) | bn-BD |
| الإنجليزية (الهند) | حزمة en-IN وhi-IN | الماراثية (الهند) | mr-IN |
| التاميلية (الهند) | ta-IN | التيلوغوية (الهند) | te-IN |