|
इस पेज पर, सेवा देने वाली कंपनी के हिसाब से कॉन्टेंट और कोड देखने के लिए, Gemini API सेवा देने वाली कंपनी पर क्लिक करें. |
दर सीमाएं (आम तौर पर इन्हें कोटा कहा जाता है) यह तय करती हैं कि किसी तय समयसीमा में Gemini API से कितने अनुरोध किए जा सकते हैं. इन सीमाओं से यह पक्का करने में मदद मिलती है कि सभी लोग, एआई का सही तरीके से इस्तेमाल करें. साथ ही, इससे एआई के गलत इस्तेमाल को रोकने और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.
Gemini और Imagen मॉडल को अनुरोध भेजने के लिए Firebase AI Logic का इस्तेमाल करते समय, आपके प्रोजेक्ट के लिए तय की गई दर की सीमाएं, "Gemini API" सेवा देने वाली कंपनी पर निर्भर करती हैं. Firebase AI Logic की मदद से, "हर उपयोगकर्ता" के लिए दर सीमाएं सेट की जा सकती हैं.
Gemini Developer API के लिए दर की सीमाएं देखना
दर की सीमाएं (कोटा) कैसे काम करती हैं
दर की सीमाओं (कोटा) को चार डाइमेंशन के हिसाब से मेज़र किया जाता है:
- हर मिनट के हिसाब से अनुरोध (आरपीएम)
- हर दिन के अनुरोध (आरपीडी)
- टोकन प्रति मिनट (टीपीएम)
- हर दिन के टोकन (टीपीडी)
आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, कोटा खत्म होने की वजह से 429 गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आपकी आरपीएम सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
दर की सीमाएं, प्रोजेक्ट-लेवल पर लागू होती हैं. साथ ही, ये उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं (Imagen). हालांकि, यह टीपीएम के जैसा ही होता है.
एक्सपेरिमेंट के तौर पर उपलब्ध और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
अगर आपने Gemini Developer API का "पैसे चुकाकर लिया जाने वाला टियर" चुना है, तो दर की सीमा बढ़ाने का अनुरोध किया जा सकता है.
"हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करना
Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में Gemini API की सेवा देने वाली कंपनी की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API भी चालू करना होगा. यह हमारे क्लाइंट एसडीके और Gemini API की सेवा देने वाली कंपनी के बीच गेटवे के तौर पर काम करता है. जब Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप किया जाता है, तब यह एपीआई आपके लिए चालू हो जाता है.
Firebase AI Logic एपीआई के लिए तय की गई दर की सीमा (कोटा) को, अपने ऐप्लिकेशन के लिए "हर उपयोगकर्ता" के हिसाब से तय की गई दर की सीमा के तौर पर इस्तेमाल किया जा सकता है. खास तौर पर, उन एआई सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह सीमा सेट करनी चाहिए, ताकि कोई एक उपयोगकर्ता आपकी एआई सुविधाओं का आसानी से इस्तेमाल कर सके. साथ ही, यह भी पक्का किया जा सके कि कोई एक उपयोगकर्ता, Gemini API की तय सीमा से ज़्यादा इस्तेमाल न करे. यह सीमा, आपके सभी उपयोगकर्ताओं के लिए तय की गई है.
ज़रूरतों को पूरा कर सके."हर उपयोगकर्ता के हिसाब से" दर सीमा के बारे में जानकारी
Firebase AI Logic एपीआई के लिए, अनुरोधों की संख्या से जुड़ी सीमाएं (कोटा) -- खास तौर पर, हर मिनट किए जाने वाले अनुरोधों (आरपीएम) के बारे में यहां कुछ अहम जानकारी दी गई है:
यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. यह हर उपयोगकर्ता, हर इलाके, और हर मिनट के हिसाब से तय होता है. यह मॉडल पर आधारित नहीं होता.
यह दर सीमा, आपके सभी उपयोगकर्ताओं पर लागू होती है. फ़िलहाल, किसी उपयोगकर्ता या उपयोगकर्ताओं के किसी ग्रुप* के लिए, दर सीमा सेट करने का कोई तरीका उपलब्ध नहीं है.
यह प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
यह उस कॉल पर लागू होता है जो खास तौर पर किसी Firebase AI Logic SDK से आता है.
डिफ़ॉल्ट रूप से, हर उपयोगकर्ता के लिए अनुरोधों की दर की सीमा 100 आरपीएम होती है.
ध्यान दें कि आपको अब भी Gemini API प्रदाता की सीमाएं (ऊपर देखें) ध्यान में रखनी होंगी. ये सीमाएं, Firebase AI Logic एपीआई की सीमाओं से ज़्यादा अहम होती हैं.
* अगर Vertex AI Gemini API का इस्तेमाल किया जा रहा है और आपका ऐप्लिकेशन लोगों को अलग-अलग देशों/इलाकों में रीडायरेक्ट करता है (उदाहरण के लिए, Firebase Remote Config का इस्तेमाल करके), तो किसी देश/इलाके के लोगों के लिए, अनुरोधों की संख्या की सीमा तय की जा सकती है.
"हर उपयोगकर्ता के लिए" दर की सीमा को अडजस्ट करना
दर सीमा (कोटा) में बदलाव करने के लिए, आपके पास serviceusage.quotas.update
अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.
यहां दर की सीमा (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका बताया गया है:
Google Cloud कंसोल में, Firebase AI Logic एपीआई के पेज पर जाएं.
प्रबंधित करें पर क्लिक करें.
पेज पर नीचे की ओर, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.
टेबल को फ़िल्टर करके, अपनी दिलचस्पी के कोटे दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र.
उदाहरण के लिए, अगर आपको एशिया के किसी भी ऐसे देश/इलाके में कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से तय किए गए कोटे देखने हैं जहां Gemini Pro उपलब्ध है, तो आपका फ़िल्टर कुछ इस तरह दिखेगा:
Generate content requests+Dimension:region:asiaजिस कोटे के बारे में आपको जानना है उसके बाईं ओर मौजूद चेकबॉक्स को चुनें.
कोटे की लाइन के आखिर में, पर क्लिक करें. इसके बाद, कोटे में बदलाव करें को चुनें.
कोटा में बदलाव वाले फ़ॉर्म में, यह तरीका अपनाएं:
नई वैल्यू फ़ील्ड में, बढ़ा हुआ कोटा डालें.
यह कोटा, प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.
फ़ॉर्म में मौजूद अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.
अनुरोध भेजें पर क्लिक करें.