मल्टीमॉडल अनुरोधों में बड़ी फ़ाइलें शामिल करें और 'Firebase के लिए Cloud Storage' का इस्तेमाल करके फ़ाइलें मैनेज करें

Vertex AI in Firebase SDK टूल का इस्तेमाल करके, अपने ऐप्लिकेशन से Gemini API को कॉल करते समय, Gemini मॉडल को कई तरह के इनपुट के आधार पर टेक्स्ट जनरेट करने के लिए कहा जा सकता है. मल्टीमोडल प्रॉम्प्ट में कई मोड (या इनपुट के टाइप) शामिल हो सकते हैं. जैसे, इमेज, PDF, वीडियो, और ऑडियो के साथ टेक्स्ट.

इनपुट के टेक्स्ट वाले हिस्सों के अलावा, मीडिया फ़ाइलों जैसे अन्य हिस्सों को अनुरोध में शामिल करने के लिए, Cloud Storage for Firebase का इस्तेमाल किया जा सकता है. हालांकि, ऐसा करना ज़रूरी नहीं है. इस सुविधा के बारे में आपको ये बातें जाननी चाहिए:

  • Cloud Storage for Firebase का इस्तेमाल, कई तरीकों से किए जाने वाले अनुरोध के साथ किया जा सकता है. जैसे, टेक्स्ट जनरेशन और चैट, दोनों. इस गाइड में दिए गए उदाहरणों में, टेक्स्ट और इमेज का बुनियादी इनपुट दिखाया गया है.

  • अनुरोध इनपुट में, फ़ाइल का MIME टाइप और उसका Cloud Storage for Firebase यूआरएल (जो हमेशा gs:// से शुरू होता है) डाला जाता है. ये वैल्यू, Cloud Storage बकेट में अपलोड की गई किसी भी फ़ाइल को अपने-आप असाइन किया गया मेटाडेटा होता है.

  • आपको फ़ाइल टाइप और यूआरएल का इस्तेमाल करना होगा.


इस समाधान गाइड में, Cloud Storage for Firebase को सेट अप करने, अपने ऐप्लिकेशन से Cloud Storage for Firebase बकेट में फ़ाइल अपलोड करने, और फिर Gemini API के लिए अपने मल्टीमोडल अनुरोध में फ़ाइल का MIME टाइप और Cloud Storage for Firebase यूआरएल शामिल करने का तरीका बताया गया है.

क्या आपको कोड के उदाहरण देखने हैं? क्या आपने पहले से ही Cloud Storage for Firebase सेट अप कर लिया है और अब आपको कई तरीकों से किए जाने वाले अनुरोधों के साथ इसका इस्तेमाल करना है?

कोड के उदाहरणों पर जाएं

अपने ऐप्लिकेशन के साथ Cloud Storage for Firebase का इस्तेमाल क्यों करना चाहिए?

Cloud Storage for Firebase, ब्लॉब और फ़ाइलों को सेव करने के लिए, Google Cloud Storage के जैसे ही तेज़, सुरक्षित, और स्केलेबल इन्फ़्रास्ट्रक्चर का इस्तेमाल करता है. साथ ही, इसके क्लाइंट SDK टूल खास तौर पर मोबाइल और वेब ऐप्लिकेशन के लिए बनाए गए हैं.

Vertex AI in Firebase एसडीके के लिए, अनुरोध का ज़्यादा से ज़्यादा साइज़ 20 एमबी है. अगर अनुरोध बहुत बड़ा है, तो आपको एचटीटीपी 413 गड़बड़ी का मैसेज मिलता है. अगर किसी फ़ाइल की वजह से, अनुरोध का कुल साइज़ 20 एमबी से ज़्यादा हो जाता है, तो मल्टीमोडल अनुरोध में फ़ाइल को शामिल करने के लिए, Cloud Storage for Firebase यूआरएल का इस्तेमाल करें. हालांकि, अगर कोई फ़ाइल छोटी है, तो अक्सर उसे सीधे इनलाइन डेटा के तौर पर पास किया जा सकता है. ध्यान दें कि इनलाइन डेटा के तौर पर दी गई फ़ाइल को ट्रांज़िट में Base64 में एन्कोड किया जाता है. इससे अनुरोध का साइज़ बढ़ जाता है.

Cloud Storage for Firebase का इस्तेमाल करने के कुछ और फ़ायदे यहां दिए गए हैं:

  • असली उपयोगकर्ता, सीधे आपके ऐप्लिकेशन से Cloud Storage for Firebase बकेट में इमेज अपलोड कर सकते हैं. इसके बाद, फ़ाइल के MIME टाइप और Cloud Storage for Firebase यूआरएल (जो फ़ाइल का आइडेंटिफ़ायर होता है) की जानकारी देकर, उन इमेज को अपने मल्टीमोडल प्रॉम्प्ट में शामिल किया जा सकता है.

  • अगर उपयोगकर्ताओं को इमेज सबमिट करनी हैं, तो आपके पास उनका समय और बैंडविड्थ बचाने का विकल्प है. ऐसा खास तौर पर तब किया जा सकता है, जब उनके नेटवर्क की क्वालिटी खराब हो या कभी-कभी काम न कर रही हो.

    • अगर किसी फ़ाइल को अपलोड या डाउनलोड करने के दौरान रुकावट आती है, तो Cloud Storage for Firebase SDK, उस प्रोसेस को वहीं से फिर से शुरू कर देते हैं जहां से वह रुकी थी.
    • अपलोड की गई एक ही फ़ाइल का इस्तेमाल कई बार किया जा सकता है. इसके लिए, असली उपयोगकर्ता को हर बार उस फ़ाइल को अपलोड करने की ज़रूरत नहीं पड़ती. जैसे, नए मल्टीमोडल अनुरोध में.
  • Firebase Security Rules का इस्तेमाल करके, Cloud Storage for Firebase में सेव की गई फ़ाइलों के लिए, असली उपयोगकर्ता के ऐक्सेस पर पाबंदी लगाई जा सकती है. इससे सिर्फ़ अनुमति वाले उपयोगकर्ता को ही फ़ाइलें अपलोड, डाउनलोड या मिटाने की अनुमति मिलती है.

  • अपनी बकेट में मौजूद फ़ाइलों को Firebase या Google Cloud से ऐक्सेस किया जा सकता है. इससे, आपको Google Cloud Storage एपीआई का इस्तेमाल करके, सर्वर साइड प्रोसेसिंग करने की सुविधा मिलती है. जैसे, इमेज फ़िल्टर करना या वीडियो ट्रांसकोड करना.

किस तरह की फ़ाइलें और यूआरएल इस्तेमाल किए जा सकते हैं?

Vertex AI in Firebase SDK टूल के साथ Cloud Storage for Firebase यूआरएल इस्तेमाल करने के लिए, फ़ाइलों और यूआरएल से जुड़ी ज़रूरी शर्तें यहां दी गई हैं:

  • Vertex AI in Firebase SDK टूल का इस्तेमाल करते समय, फ़ाइल को मल्टीमोडल अनुरोधों के लिए इनपुट फ़ाइलों की ज़रूरी शर्तों को पूरा करना होगा. इसमें MIME टाइप और फ़ाइल साइज़ जैसी ज़रूरी शर्तें शामिल हैं.

  • फ़ाइल को Cloud Storage for Firebase बकेट में सेव करना ज़रूरी है. इसका मतलब है कि बकेट को Firebase Security Rules जैसी Firebase सेवाओं से ऐक्सेस किया जा सकता है. अगर आपको अपनी बकेट, Firebase कंसोल में दिखती है, तो यह Cloud Storage for Firebase बकेट है.

  • Cloud Storage for Firebase बकेट उसी Firebase प्रोजेक्ट में होनी चाहिए जिसमें आपने अपना ऐप्लिकेशन रजिस्टर किया है.

  • फ़ाइल का Cloud Storage for Firebase यूआरएल gs:// से शुरू होना चाहिए. इसी तरह, सभी Google Cloud Storage यूआरएल बनाए जाते हैं.

  • फ़ाइल का यूआरएल, "ब्राउज़र" यूआरएल नहीं हो सकता. उदाहरण के लिए, इंटरनेट पर मिलने वाली इमेज का यूआरएल.

साथ ही, आपकी बकेट के लिए Firebase Security Rules को फ़ाइल का सही ऐक्सेस देना चाहिए. उदाहरण के लिए:

  • अगर आपके पास सार्वजनिक नियम हैं, तो कोई भी उपयोगकर्ता या क्लाइंट, Vertex AI in Firebase SDK टूल का इस्तेमाल करके, फ़ाइल को ऐक्सेस कर सकता है और कॉल में उसका यूआरएल दे सकता है. इस तरह के नियमों का इस्तेमाल सिर्फ़ प्रोटोटाइप बनाने के शुरुआती दौर में और प्रोटोटाइप बनाने के लिए किया जाना चाहिए. ऐसा तब तक करना चाहिए, जब तक फ़ाइलों को सार्वजनिक तौर पर ऐक्सेस नहीं किया जा सकता.

  • अगर आपके पास मज़बूत नियम हैं, तो (इसका सुझाव दिया जाता है) Firebase, दिए गए यूआरएल से कॉल को अनुमति देने से पहले, यह जांच करेगा कि साइन इन किए हुए उपयोगकर्ता या क्लाइंट के पास फ़ाइल का ज़रूरत के मुताबिक ऐक्सेस है या नहीं.

Vertex AI in Firebase के साथ Cloud Storage for Firebase यूआरएल का इस्तेमाल करना

पहला चरण: Cloud Storage for Firebase सेट अप करना

यहां कुछ मुख्य टास्क दिए गए हैं, जिन्हें आपको पूरा करना होगा:

  1. अपने Firebase प्रोजेक्ट में Cloud Storage for Firebase बकेट बनाएं.

  2. इस बकेट पर Firebase Security Rules लागू करें. Firebase Security Rules की मदद से, अपनी फ़ाइलों को सुरक्षित रखा जा सकता है. इसके लिए, आपको सिर्फ़ उन असली उपयोगकर्ताओं को ऐक्सेस देना होगा जिन्हें अनुमति मिली है.

  3. अपने ऐप्लिकेशन में Cloud Storage for Firebase के लिए क्लाइंट लाइब्रेरी जोड़ें.

    ध्यान दें कि इस टास्क को छोड़ा जा सकता है. हालांकि, इसके बाद आपको हमेशा मल्टीमोडल अनुरोधों में एमआईएम टाइप और Cloud Storage for Firebase यूआरएल वैल्यू साफ़ तौर पर शामिल करनी होंगी.

दूसरा चरण: किसी बकेट में फ़ाइल अपलोड करना

जब किसी फ़ाइल को बकेट में अपलोड किया जाता है, तो Cloud Storage उस फ़ाइल पर नीचे दी गई दो जानकारी अपने-आप लागू कर देता है. आपको इन वैल्यू को, कई मोड वाले अनुरोध में शामिल करना होगा, जैसा कि इस गाइड के अगले चरण में दिखाया गया है.

  • एमआईएम टाइप: यह फ़ाइल का मीडिया टाइप है. उदाहरण के लिए, image/png. अपलोड के दौरान, Cloud Storage for Firebase अपने-आप एमआईएम टाइप का पता लगाने की कोशिश करेगा और उस मेटाडेटा को बकेट में मौजूद ऑब्जेक्ट पर लागू करेगा. हालांकि, अपलोड के दौरान MIME टाइप की जानकारी देना ज़रूरी नहीं है.

  • Cloud Storage for Firebase यूआरएल: यह फ़ाइल के लिए यूनीक आइडेंटिफ़ायर होता है. यूआरएल gs:// से शुरू होना चाहिए.

तीसरा चरण: अलग-अलग तरीकों से अनुरोध करने के लिए, फ़ाइल का MIME टाइप और यूआरएल शामिल करना

जब किसी फ़ाइल को Cloud Storage for Firebase बकेट में सेव कर लिया जाता है, तो कई तरीकों से अनुरोध करने के लिए, उसके MIME टाइप और Cloud Storage for Firebase यूआरएल को शामिल किया जा सकता है. ध्यान दें कि इन उदाहरणों में, स्ट्रीमिंग के बिना generateContent अनुरोध दिखाया गया है. हालांकि, स्ट्रीमिंग और चैट के साथ Cloud Storage for Firebase यूआरएल का इस्तेमाल भी किया जा सकता है.

अनुरोध में फ़ाइल शामिल करने के लिए, इनमें से किसी एक विकल्प का इस्तेमाल किया जा सकता है:

पहला विकल्प: स्टोरेज रेफ़रंस का इस्तेमाल करके MIME टाइप और यूआरएल शामिल करना

अगर आपने फ़ाइल को अभी-अभी बकेट में अपलोड किया है और आपको उसे कई तरीकों से अनुरोध करने की सुविधा वाले अनुरोध में, स्टोरेज रेफ़रंस के ज़रिए तुरंत शामिल करना है, तो इस विकल्प का इस्तेमाल करें. कॉल के लिए, MIME टाइप और Cloud Storage for Firebase यूआरएल, दोनों की ज़रूरत होती है.

दूसरा विकल्प: MIME टाइप और यूआरएल को साफ़ तौर पर शामिल करें

अगर आपको MIME टाइप और Cloud Storage for Firebase यूआरएल की वैल्यू पता है और आपको उन्हें कई मोड वाले अनुरोध में साफ़ तौर पर शामिल करना है, तो इस विकल्प का इस्तेमाल करें. कॉल के लिए, MIME टाइप और यूआरएल, दोनों की ज़रूरत होती है.