कोटा के बारे में जानना और उन्हें मैनेज करना

Vertex AI in Firebase के लिए, दो अलग-अलग एपीआई (हर एक के लिए अलग कोटा) की ज़रूरत होती है: Vertex AI एपीआई और Vertex AI in Firebase एपीआई.

इनमें से हर एपीआई का एक कोटा है, जिसे अनुरोध प्रति मिनट (आरपीएम) के तौर पर गिना जाता है — खास तौर पर, "कॉन्टेंट जनरेट करने" के अनुरोध (स्ट्रीमिंग और बिना स्ट्रीमिंग वाले, दोनों). Vertex AI एपीआई में, हर मिनट इनपुट टोकन के लिए कोटा भी होता है.

इस पेज पर इनके बारे में जानकारी दी गई है:

Google Cloud दस्तावेज़ में, कोटा के बारे में सामान्य जानकारी देखी जा सकती है.

हर एपीआई के लिए कोटा के बारे में जानकारी

हर एपीआई का कोटा थोड़ा अलग होता है. इसका मतलब है कि उनका इस्तेमाल अलग-अलग कामों के लिए किया जा सकता है.

Vertex AI एपीआई कोटा के बारे में जानकारी

Vertex AI एपीआई कोटा, हर मॉडल के लिए हर क्षेत्र में हर मिनट के हिसाब से, "कॉन्टेंट के अनुरोध जनरेट करें" पर आधारित होते हैं.

यहां इन कोटा के बारे में कुछ अहम जानकारी दी गई है (खास तौर पर, हर मिनट के लिए अनुरोध और हर मिनट के लिए इनपुट टोकन):

  • ये प्रोजेक्ट-लेवल पर लागू होते हैं और उन सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किए जाते हैं जो उस Firebase प्रोजेक्ट का इस्तेमाल करते हैं.

  • ये Vertex AI Gemini API के किसी भी कॉल पर लागू होते हैं. भले ही, वह Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Firebase Genkit, Gemini Firebase Extensions, REST कॉल, Vertex AI Studio या अन्य एपीआई क्लाइंट का इस्तेमाल करता हो.

  • ये सेटिंग, किसी बेस मॉडल और उस मॉडल के सभी वर्शन, आइडेंटिफ़ायर, और ट्यून किए गए वर्शन पर लागू होती हैं. यहां कुछ उदाहरण दिए गए हैं:

    • gemini-1.0-pro और gemini-1.0-pro-001 के लिए किए गए अनुरोधों को, बेस मॉडल gemini-1.0 pro के आरपीएम कोटे के लिए दो अनुरोधों के तौर पर गिना जाता है.

    • gemini-1.0-pro-001 के लिए किए गए अनुरोध और gemini-1.0-pro-001 पर आधारित ट्यून किए गए मॉडल के लिए किए गए अनुरोध को, बेस मॉडल gemini-1.0-pro के आरपीएम कोटे के लिए दो अनुरोधों के तौर पर गिना जाता है.

  • Google Cloud दस्तावेज़ में, हर मॉडल और हर इलाके के लिए डिफ़ॉल्ट कोटा देखे जा सकते हैं.

आम तौर पर, इस एपीआई के कोटा को अपने सभी उपयोगकर्ताओं के लिए "कुल" कोटा माना जा सकता है. ये ऐसे उपयोगकर्ता होते हैं जो आपके ऐप्लिकेशन में, किसी खास मॉडल और इलाके में मौजूद एआई की सुविधाओं का इस्तेमाल करते हैं.

ये कोटा ज़रूरत के हिसाब से होने चाहिए, ताकि किसी खास इलाके के उन असली उपयोगकर्ताओं की कुल संख्या को ध्यान में रखा जा सके जो किसी खास मॉडल पर आधारित एआई की सुविधाओं को ऐक्सेस कर सकते हैं. ये कोटा हर मिनट के हिसाब से तय किए जाते हैं. इसलिए, यह संभावना कम है कि किसी इलाके में आपके सभी उपयोगकर्ता एक ही समय पर सुविधाओं के एक ही सेट का इस्तेमाल करें और ये कोटा खत्म कर दें. हालांकि, हर ऐप्लिकेशन अलग होता है. इसलिए, इन कोटा को उसके हिसाब से अडजस्ट करें.

के लिए "इलाका" है.

Vertex AI in Firebase एपीआई कोटा को समझना

Vertex AI in Firebase एपीआई कोटा, हर उपयोगकर्ता के लिए हर क्षेत्र में हर मिनट के हिसाब से, "कॉन्टेंट के अनुरोध जनरेट करें" पर आधारित होता है.

इस कोटे के बारे में कुछ अहम जानकारी यहां दी गई है. खास तौर पर, हर मिनट के अनुरोधों की संख्या:

  • यह प्रोजेक्ट-लेवल पर लागू होता है. साथ ही, यह उस Firebase प्रोजेक्ट का इस्तेमाल करने वाले सभी ऐप्लिकेशन और आईपी पतों पर लागू होता है.

  • यह किसी भी ऐसे कॉल पर लागू होता है जो खास तौर पर किसी भी Vertex AI in Firebase SDK टूल से जाता है.

  • डिफ़ॉल्ट कोटा, हर उपयोगकर्ता के लिए 100 आरपीएम होता है.
    ध्यान दें कि आपको अब भी Vertex AI एपीआई के लिए कोटा की सीमाओं को ध्यान में रखना होगा. खास तौर पर तब, जब वे इस 100 आरपीएम से कम हों.

Vertex AI in Firebase पर आधारित एआई की सुविधाओं के लिए, इस एपीआई के कोटे को "हर उपयोगकर्ता" के कोटे के तौर पर माना जा सकता है.

यह कोटा इतना ज़्यादा होना चाहिए कि Vertex AI in Firebase पर आधारित एआई की सुविधाओं को ऐक्सेस करने वाले एक उपयोगकर्ता के लिए, ज़रूरत के हिसाब से जगह हो. यह एपीआई, Vertex AI एपीआई के गेटवे के तौर पर काम करता है. इसलिए, Vertex AI in Firebase एपीआई कोटा का इस्तेमाल करके यह पक्का किया जा सकता है कि किसी भी उपयोगकर्ता का Vertex AI एपीआई कोटा खत्म न हो. इसे आपके सभी उपयोगकर्ता शेयर करते हैं.

हर एपीआई के लिए कोटा देखना

Google Cloud कंसोल में, हर एपीआई के लिए कोटा देखा जा सकता है.

  1. Google Cloud कंसोल में, अपनी पसंद के एपीआई के पेज पर जाएं: Vertex AI एपीआई या Vertex AI in Firebase एपीआई.

  2. प्रबंधित करें पर क्लिक करें.

  3. पेज पर नीचे, कोटा और सिस्टम की सीमाएं टैब पर क्लिक करें.

  4. अपनी पसंद के कोटा दिखाने के लिए, टेबल को फ़िल्टर करें.

    ध्यान दें कि Dimension फ़िल्टर बनाने के लिए, आपको नीचे दिए गए उदाहरणों में वैल्यू को कॉपी करके चिपकाने के बजाय, फ़िल्टर टूल का इस्तेमाल करना होगा.

    • Vertex AI एपीआई के लिए: सुविधा (कॉन्टेंट जनरेट करने के अनुरोध), मॉडल का नाम, और क्षेत्र की जानकारी दें.

      उदाहरण के लिए, ईयू के किसी भी इलाके में Gemini 1.5 Flash की मदद से कॉन्टेंट के अनुरोध जनरेट करने के लिए कोटा देखने के लिए, आपका फ़िल्टर ऐसा दिखेगा:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • Vertex AI in Firebase एपीआई के लिए: सुविधा (कॉन्टेंट जनरेट करने के अनुरोध) और क्षेत्र की जानकारी दें.

      उदाहरण के लिए, एशिया के किसी भी देश/इलाके में कॉन्टेंट के अनुरोध जनरेट करने के लिए, हर उपयोगकर्ता के कोटे की जानकारी देखने के लिए, आपका फ़िल्टर इस तरह दिखेगा:
      Generate content requests + Dimension:region:asia

      ध्यान दें कि Vertex AI in Firebase एपीआई कोटा किसी खास मॉडल के हिसाब से नहीं होता है. साथ ही, (default) कोटा की लाइन, Vertex AI in Firebase पर लागू नहीं होती.

कोटा में बदलाव करना या कोटा बढ़ाने का अनुरोध करना

प्रोडक्शन में जाने से पहले या कोटा से ज़्यादा अनुरोध करने पर मिलने वाली 429 गड़बड़ी को ठीक करने के लिए, आपको कोटा में बदलाव करना पड़ सकता है या कोटा बढ़ाने का अनुरोध करना पड़ सकता है. पक्का करें कि आपने हर एपीआई के कोटे में इसी हिसाब से बदलाव किया हो. इस बारे में ज़्यादा जानने के लिए, इस पेज पर पहले दिया गया हर एपीआई के कोटे को समझना लेख पढ़ें.

कोटे में बदलाव करने के लिए, आपके पास serviceusage.quotas.update अनुमति होनी चाहिए. यह अनुमति, मालिक और एडिटर की भूमिका में डिफ़ॉल्ट रूप से शामिल होती है.

कोटा में बदलाव करने या कोटा बढ़ाने का अनुरोध करने का तरीका यहां बताया गया है:

  1. हर एपीआई के कोटे देखने के लिए, पिछले सब-सेक्शन में दिए गए निर्देशों का पालन करें.

  2. अपनी दिलचस्पी के हर कोटे के बाईं ओर मौजूद चेकबॉक्स को चुनें.

  3. कोटा की लाइन के आखिर में, तीन बिंदु वाले मेन्यू पर क्लिक करें. इसके बाद, कोटा में बदलाव करें को चुनें.

  4. कोटा में बदलाव फ़ॉर्म में, ये काम करें:

    1. नई वैल्यू फ़ील्ड में, बढ़ाई गई कोटा डालें.

      यह कोटा प्रोजेक्ट-लेवल पर लागू होता है और इसे उस Firebase प्रोजेक्ट का इस्तेमाल करने वाले सभी ऐप्लिकेशन और आईपी पतों के साथ शेयर किया जाता है.

    2. फ़ॉर्म में मौजूद अन्य फ़ील्ड भरें. इसके बाद, हो गया पर क्लिक करें.

    3. अनुरोध सबमिट करें पर क्लिक करें.