Live API'nin sınırları ve spesifikasyonları


Bu sayfada, Live API ve modellerinin kullanımına ilişkin çeşitli sınırlar ve özellikler açıklanmaktadır.

Oturumla ilgili sınırlar

Live API için oturum, giriş ve çıkışın aynı bağlantı üzerinden sürekli olarak aktarıldığı kalıcı bir bağlantıyı ifade eder.

Oturum, aşağıdaki sınırlardan herhangi birini aşarsa bağlantı sonlandırılır.

  • Bağlantı süresi yaklaşık 10 dakika ile sınırlıdır.

  • Oturum süresi, giriş biçimlerine bağlıdır:

    • Yalnızca ses girişli oturumlar 15 dakika ile sınırlıdır.
    • Video ve ses girişi 2 dakika ile sınırlıdır.
  • Oturum bağlam penceresi 128 bin jetonla sınırlıdır.

Hız sınırları

Live API, Firebase projesi başına eşzamanlı oturumlar ve dakikadaki jeton sayısı (TPM) için hız sınırlarına sahiptir.

  • Gemini Developer API:

  • Vertex AI Gemini API:

    • Firebase projesi başına 1.000 eşzamanlı oturum
    • Dakikada 4 milyon jeton

Ses biçimleri

Live API aşağıdaki ses biçimlerini destekler:

  • Giriş ses biçimi: 16 kHz little-endian ham 16 bit PCM ses
  • Çıkış ses biçimi: 24 kHz little-endian ham 16 bit PCM ses

  • Desteklenen MIME türleri: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

Giriş sesinin örnekleme hızını iletmek için ses içeren her Blob'un MIME türünü audio/pcm;rate=16000 gibi bir değere ayarlayın.

Video biçimleri

Live API, ayrı görüntü kareleri dizisi bekler ve saniyede 1 kare (FPS) hızında video kareleri girişini destekler.

  • Önerilen giriş: 1 FPS'de doğal 768x768 çözünürlük.

  • Desteklenen MIME türleri: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

Bu spesifikasyonun, Live API öğesini hızlı değişen videoların analiz edilmesini gerektiren kullanım alanları (ör. yüksek hızlı sporlarda anlık anlatım) için uygunsuz hale getirdiğini unutmayın.

Yanıt sesleri

Live API aşağıdaki yanıt sesi seçeneklerini destekler. Her sesin nasıl duyulduğuyla ilgili demolar için Chirp 3: HD sesler başlıklı makaleyi inceleyin.

Yanıt sesi belirtmezseniz varsayılan olarak Puck kullanılır.

Yanıt sesini nasıl belirleyeceğinizi öğrenin.

Zephyr -- Parlak
Kore -- Sert
Orus -- Sert
Autonoe -- Parlak
Umbriel -- Rahat
Erinome -- Net
Laomedeia -- Neşeli
Schedar -- Dengeli
Achird -- Samimi
Sadachbia -- Canlı
Puck -- Neşeli
Fenrir -- Heyecanlı
Aoede -- Sakin
Enceladus -- Fısıltılı
Algieba -- Akıcı
Algenib -- Gıcırtılı
Achernar -- Yumuşak
Gacrux -- Olgun
Zubenelgenubi -- Günlük
Sadaltager -- Bilgili
Charon -- Bilgilendirici
Leda -- Genç
Callirrhoe -- Rahat
Iapetus -- Net
Despina -- Akıcı
Rasalgethi -- Bilgilendirici
Alnilam -- Kararlı
Pulcherrima -- İleriye dönük
Vindemiatrix -- Nazik
Sulafat -- Sıcakkanlı

Diller

Live API aşağıdaki dilleri destekler. Yanıt dilini nasıl etkileyeceğinizi öğrenin.

Dil BCP-47 kodu Dil BCP-47 kodu
Arapça (Mısır) ar-EG Almanca (Almanya) de-DE
İngilizce (ABD) en-US İspanyolca (ABD) es-US
Fransızca (Fransa) fr-FR Hintçe (Hindistan) hi-IN
Endonezce (Endonezya) id-ID İtalyanca (İtalya) it-IT
Japonca (Japonya) ja-JP Korece (Kore) ko-KR
Portekizce (Brezilya) pt-BR Rusça (Rusya) ru-RU
Felemenkçe (Hollanda) nl-NL Lehçe (Polonya) pl-PL
Tayca (Tayland) th-TH Türkçe (Türkiye) tr-TR
Vietnamca (Vietnam) vi-VN Rumence (Romanya) ro-RO
Ukraynaca (Ukrayna) uk-UA Bengalce (Bangladeş) bn-BD
İngilizce (Hindistan) en-IN ve hi-IN paketi Marathi dili (Hindistan) mr-IN
Tamilce (Hindistan) ta-IN Telugu dili (Hindistan) te-IN