दर की सीमाएं और कोटा

इस पेज पर, Gemini API उपलब्ध कराने वाली कंपनी के हिसाब से कॉन्टेंट और कोड देखने के लिए, उस कंपनी पर क्लिक करें.


दर सीमाएं (जिन्हें आम तौर पर कोटा कहा जाता है) यह तय करती हैं कि किसी तय समयसीमा में, Gemini API से कितने अनुरोध किए जा सकते हैं. इन सीमाओं से यह पक्का करने में मदद मिलती है कि सभी लोग, एआई का सही तरीके से इस्तेमाल करें. साथ ही, इससे एआई के गलत इस्तेमाल को रोकने और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

Gemini और Imagen मॉडल को अनुरोध भेजने के लिए, Firebase AI Logic का इस्तेमाल करते समय, आपके प्रोजेक्ट के लिए तय की गई दर की सीमाएं, "Gemini API" सेवा देने वाली कंपनी पर निर्भर करती हैं. Firebase AI Logic की मदद से, "हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट की जा सकती हैं.

Gemini Developer API के लिए दर की सीमाएं देखना

दर की सीमाएं (कोटा) कैसे काम करती हैं

दर की सीमाओं (कोटा) को चार डाइमेंशन के हिसाब से मेज़र किया जाता है:

  • हर मिनट के हिसाब से अनुरोध (आरपीएम)
  • हर दिन के अनुरोध (आरपीडी)
  • टोकन प्रति मिनट (टीपीएम)
  • हर दिन के टोकन (टीपीडी)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, कोटे से ज़्यादा इस्तेमाल करने की वजह से 429 गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आपकी आरपीएम सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

दर की सीमाएं, प्रोजेक्ट-लेवल पर लागू होती हैं. साथ ही, ये उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं (Imagen 3). हालांकि, यह टीपीएम के जैसा ही होता है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

अगर आपने Gemini Developer API के लिए "पैसे चुकाकर ली जाने वाली सदस्यता" ली है, तो दर सीमा बढ़ाने का अनुरोध किया जा सकता है.

"हर उपयोगकर्ता के हिसाब से" दर की सीमाएं सेट करना

Firebase AI Logic का इस्तेमाल करने के लिए, आपके प्रोजेक्ट में Gemini API की सेवा देने वाली कंपनी की सुविधा चालू होनी चाहिए. हालांकि, आपको Firebase AI Logic API भी चालू करना होगा. यह हमारे क्लाइंट एसडीके और Gemini API की सेवा देने वाली कंपनी के बीच गेटवे के तौर पर काम करता है. इस एपीआई को आपके लिए तब चालू किया जाता है, जब Firebase प्रोजेक्ट में पहली बार Firebase AI Logic सेट अप किया जाता है.

Firebase AI Logic एपीआई के लिए तय की गई दर की सीमा (कोटा) को, अपने ऐप्लिकेशन के लिए "हर उपयोगकर्ता" के हिसाब से तय की गई दर की सीमा के तौर पर इस्तेमाल किया जा सकता है. खास तौर पर, उन एआई सुविधाओं के लिए जो Firebase AI Logic पर निर्भर करती हैं. आपको यह सीमा सेट करनी चाहिए, ताकि कोई एक उपयोगकर्ता आपकी एआई सुविधाओं का आसानी से इस्तेमाल कर सके. साथ ही, यह भी पक्का किया जा सके कि कोई एक उपयोगकर्ता, Gemini API की तय सीमा से ज़्यादा इस्तेमाल न करे. यह सीमा, आपके सभी उपयोगकर्ताओं के लिए तय की गई है.

ज़रूरतों को पूरा कर सके.

"हर उपयोगकर्ता" के हिसाब से तय की गई दर सीमा के बारे में जानकारी

Firebase AI Logic एपीआई के लिए, अनुरोधों की संख्या से जुड़ी सीमाएं (कोटा) -- खास तौर पर, हर मिनट किए जाने वाले अनुरोधों (आरपीएम) के बारे में यहां कुछ अहम जानकारी दी गई है:

  • यह "कॉन्टेंट जनरेट करने के अनुरोध" पर आधारित है. यह हर उपयोगकर्ता के लिए, हर इलाके के हिसाब से, हर मिनट के हिसाब से तय की जाती है. यह मॉडल पर आधारित नहीं होती है.

  • यह प्रोजेक्ट-लेवल पर लागू होती है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों पर लागू होती है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

  • यह उस कॉल पर लागू होता है जो खास तौर पर किसी Firebase AI Logic SDK से आता है.

  • डिफ़ॉल्ट रूप से, हर उपयोगकर्ता के लिए अनुरोधों की सीमा 100 आरपीएम होती है.
    ध्यान दें कि आपको अब भी Gemini API सेवा देने वाली कंपनी की तय की गई सीमाएं (ऊपर देखें) ध्यान में रखनी होंगी. ये सीमाएं, Firebase AI Logic एपीआई की सीमाओं से ज़्यादा अहम होती हैं.

"हर उपयोगकर्ता के लिए" दर की सीमा में बदलाव करना

दर सीमा (कोटा) में बदलाव करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.

यहां दर की सीमा (कोटा) में बदलाव करने या इसे बढ़ाने का अनुरोध करने का तरीका बताया गया है:

  1. Google Cloud कंसोल में, Firebase AI Logic एपीआई के पेज पर जाएं.

  2. प्रबंधित करें पर क्लिक करें.

  3. पेज पर नीचे की ओर, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.

  4. टेबल को फ़िल्टर करके, अपनी दिलचस्पी के कोटे दिखाएं. जैसे, क्षमता (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र.

    उदाहरण के लिए, अगर आपको एशिया के किसी भी ऐसे देश/इलाके में कॉन्टेंट जनरेट करने के अनुरोधों के लिए, हर उपयोगकर्ता के हिसाब से तय किए गए कोटे देखने हैं जहां Gemini Pro उपलब्ध है, तो आपका फ़िल्टर कुछ इस तरह दिखेगा: Generate content requests + Dimension:region:asia

  5. जिस कोटे के बारे में आपको जानकारी चाहिए उसके बाईं ओर मौजूद चेकबॉक्स को चुनें.

  6. कोटे की लाइन के आखिर में, पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.

  7. कोटा में बदलाव वाले फ़ॉर्म में, यह तरीका अपनाएं:

    1. नई वैल्यू फ़ील्ड में, बढ़ा हुआ कोटा डालें.

      यह कोटा, प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, यह उन सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

    2. फ़ॉर्म में मौजूद अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.

    3. अनुरोध भेजें पर क्लिक करें.