লাইভ এপিআই-এর সীমা এবং স্পেসিফিকেশন


এই পৃষ্ঠায় Live API এবং এর মডেলগুলি ব্যবহারের জন্য বিভিন্ন সীমা এবং স্পেসিফিকেশন বর্ণনা করা হয়েছে।

সেশন-সম্পর্কিত সীমা

Live API ক্ষেত্রে, একটি সেশন বলতে একটি স্থায়ী সংযোগকে বোঝায় যেখানে ইনপুট এবং আউটপুট একই সংযোগের মাধ্যমে ক্রমাগত স্ট্রিম করা হয়।

যদি সেশনটি নিম্নলিখিত সীমা অতিক্রম করে, তাহলে সংযোগটি বন্ধ করে দেওয়া হবে।

  • সংযোগের দৈর্ঘ্য প্রায় ১০ মিনিটের মধ্যে সীমাবদ্ধ।

  • সেশনের দৈর্ঘ্য ইনপুট পদ্ধতির উপর নির্ভর করে:

    • শুধুমাত্র অডিও ইনপুট সেশনগুলি ১৫ মিনিটের মধ্যে সীমাবদ্ধ।
    • ভিডিও + অডিও ইনপুট 2 মিনিটের মধ্যে সীমাবদ্ধ।
  • সেশন কনটেক্সট উইন্ডো ১২৮,০০০ টোকেনের মধ্যে সীমাবদ্ধ।

হারের সীমা

Live API ফায়ারবেস প্রকল্পের জন্য সমসাময়িক সেশনের পাশাপাশি টোকেন প্রতি মিনিট (TPM) উভয়ের জন্যই হারের সীমা রয়েছে।

  • জেমিনি ডেভেলপার এপিআই :

    • আপনার প্রকল্পের জেমিনি ডেভেলপার API "ব্যবহার স্তর" এর উপর ভিত্তি করে সীমা পরিবর্তিত হয় (তাদের হার সীমা ডকুমেন্টেশন দেখুন)
  • ভার্টেক্স এআই জেমিনি এপিআই :

    • প্রতি ফায়ারবেস প্রকল্পে ১,০০০টি একযোগে সেশন
    • প্রতি মিনিটে ৪ মিলিয়ন টোকেন

অডিও ফর্ম্যাট

Live API নিম্নলিখিত অডিও ফর্ম্যাটগুলিকে সমর্থন করে:

  • ইনপুট অডিও ফর্ম্যাট: ১৬kHz লিটল-এন্ডিয়ানে কাঁচা ১৬ বিট পিসিএম অডিও
  • আউটপুট অডিও ফর্ম্যাট: 24kHz লিটল-এন্ডিয়ানে কাঁচা 16 বিট PCM অডিও

  • সমর্থিত MIME প্রকার : audio/x-aac , audio/flac , audio/mp3 , audio/m4a , audio/mpeg , audio/mpga , audio/mp4 , audio/ogg , audio/pcm , অডিও audio/wav , audio/webm

ইনপুট অডিওর নমুনা হার বোঝাতে, প্রতিটি অডিও-ধারণকারী Blob-এর MIME প্রকারকে audio/pcm;rate=16000 এর মতো একটি মানের উপর সেট করুন।

ভিডিও ফর্ম্যাট

Live API বিচ্ছিন্ন চিত্র ফ্রেমের একটি ক্রম আশা করে এবং প্রতি সেকেন্ডে 1 ফ্রেম (FPS) এ ভিডিও ফ্রেম ইনপুট সমর্থন করে।

  • প্রস্তাবিত ইনপুট : ১ এফপিএসে নেটিভ ৭৬৮x৭৬৮ রেজোলিউশন।

  • সমর্থিত MIME প্রকার : video/x-flv , video/quicktime , video/mpeg , video/mpegs , video/mpg , video/mp4 , video/webm , video/wmv , video/3gpp

মনে রাখবেন যে এই স্পেসিফিকেশনটি দ্রুত পরিবর্তনশীল ভিডিও বিশ্লেষণের প্রয়োজন হয় এমন ব্যবহারের ক্ষেত্রে Live API অনুপযুক্ত করে তোলে, যেমন উচ্চ-গতির খেলাধুলায় প্লে-বাই-প্লে।

প্রতিক্রিয়া কণ্ঠস্বর

Live API নিম্নলিখিত প্রতিক্রিয়া ভয়েস বিকল্পগুলিকে সমর্থন করে। প্রতিটি ভয়েস কেমন শোনাচ্ছে তার ডেমোগুলির জন্য, Chirp 3: HD ভয়েসেস দেখুন।

যদি আপনি একটি প্রতিক্রিয়া ভয়েস নির্দিষ্ট না করেন, তাহলে ডিফল্ট হল Puck

প্রতিক্রিয়ার কণ্ঠস্বর কীভাবে নির্দিষ্ট করতে হয় তা শিখুন।

Zephyr -- উজ্জ্বল
Kore -- ফার্ম
Orus -- ফার্ম
Autonoe -- উজ্জ্বল
Umbriel -- শান্ত-সুলভ
Erinome -- পরিষ্কার
Laomedeia -- উচ্ছ্বসিত
Schedar -- জোড়
Achird -- বন্ধুত্বপূর্ণ
Sadachbia -- প্রাণবন্ত
Puck -- উচ্ছ্বসিত
Fenrir -- উত্তেজনাপূর্ণ
Aoede -- হাওয়ালা
Enceladus -- শ্বাসরুদ্ধকর
Algieba -- মসৃণ
Algenib -- গ্রেভেলি
Achernar -- নরম
Gacrux -- পরিণত
Zubenelgenubi -- ক্যাজুয়াল
Sadaltager -- জ্ঞানী
Charon -- তথ্যবহুল
Leda -- তরুণ
Callirrhoe -- আরামদায়ক
Iapetus -- পরিষ্কার
Despina -- মসৃণ
Rasalgethi -- তথ্যবহুল
Alnilam -- দৃঢ়
Pulcherrima -- ফরোয়ার্ড
Vindemiatrix -- ভদ্র
Sulafat -- উষ্ণ

ভাষাসমূহ

Live API নিম্নলিখিত ভাষাগুলিকে সমর্থন করে। প্রতিক্রিয়া ভাষাকে কীভাবে প্রভাবিত করতে হয় তা শিখুন।

ভাষা BCP-47 কোড ভাষা BCP-47 কোড
আরবি (মিশরীয়) এআর-ইজি জার্মান (জার্মানি) ডি-ডি
ইংরেজি (মার্কিন) en-US সম্পর্কে স্প্যানিশ (মার্কিন) মার্কিন যুক্তরাষ্ট্র
ফরাসি (ফ্রান্স) fr-FR সম্পর্কে হিন্দি (ভারত) হাই-ইন
ইন্দোনেশিয়ান (ইন্দোনেশিয়া) আইডি-আইডি ইতালীয় (ইতালি) এটি-আইটি
জাপানি (জাপান) জা-জেপি কোরিয়ান (কোরিয়া) কো-কেআর
পর্তুগিজ (ব্রাজিল) pt-BR সম্পর্কে রাশিয়ান (রাশিয়া) ru-RU
ডাচ (নেদারল্যান্ডস) nl-NL সম্পর্কে পোলিশ (পোল্যান্ড) পিএল-পিএল
থাই (থাইল্যান্ড) ম-ম তুর্কি (তুরস্ক) টিআর-টিআর
ভিয়েতনামী (ভিয়েতনাম) ভিআই-ভিএন রোমানিয়ান (রোমানিয়া) ro-RO
ইউক্রেনীয় (ইউক্রেন) যুক্তরাজ্য-ইউএ বাংলা (বাংলাদেশ) বিএন-বিডি
ইংরেজি (ভারত) এন-ইন এবং হাই-ইন বান্ডেল মারাঠি (ভারত) মিস্টার-ইন
তামিল (ভারত) টা-ইন তেলেগু (ভারত) te-IN সম্পর্কে