मॉडल के Gemini फ़ैमिली को मल्टीमॉडल माना जाता है, क्योंकि वे इसमें सक्षम हैं कई तरीकों से जानकारी प्रोसेस की जाती है. इनमें इमेज, वीडियो, और और टेक्स्ट. उदाहरण के लिए, Gemini मॉडल को प्लेट की प्लेट की फ़ोटो भेजी जा सकती है कुकी ढूंढी है और इससे उन कुकी की रेसिपी आपको देने के लिए कह सकती है.
प्रॉम्प्ट | जवाब |
मुझे इन कुकीज़ की रेसिपी बताओ. |
**सामग्री** - 1 सी. (2 स्टिक) बिना नमक वाला, नर्म किया हुआ मक्खन - 3/4 सी. दानेदार शुगर - 3/4 सी. ब्राउन शुगर, पैक की गई - 1 छोटा चम्मच . वनिला एक्स्ट्रैक्ट - 2 बड़े अंडे - 2 1/4 सी. सभी तरह का आटा - 1 छोटा चम्मच. बेकिंग सोडा - 1 छोटा चम्मच. नमक ... |
मॉडल के Gemini फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. इसके लिए, इनका इस्तेमाल करें: Vertex AI की ओर से दिया गया Gemini API Google Cloud को. मोबाइल और वेब ऐप्लिकेशन के लिए, Vertex AI in Firebase SDK टूल, Gemini API को कॉल करने और Gemini के मॉडल सीधे आपके ऐप्लिकेशन से डाउनलोड किए जा सकते हैं.
इस पेज पर, Gemini के मॉडल के बारे में यह जानकारी दी गई है:
Gemini के इस्तेमाल के उदाहरणों की बेहतर तरीके से तुलना साथ ही, इसमें मॉडल के साथ काम करने वाले इनपुट टाइप भी शामिल करें.
हर मॉडल के ब्यौरे की तुलना, उदाहरण के लिए अधिकतम इनपुट टोकन या वीडियो की अधिकतम अवधि.
Gemini के मॉडल के वर्शन होने की जानकारी. ख़ास तौर पर, इस बारे में जानकारी उनके स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन शामिल होने चाहिए.
अपने कॉलम में शामिल करने के लिए, उपलब्ध मॉडल नामों की सूचियां कोड को लागू करना शुरू करें.
Gemini मॉडल के लिए, इस्तेमाल की जा सकने वाली भाषाओं की सूची.
उपलब्ध मॉडल
Vertex AI in Firebase के साथ, Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:
Gemini 1.5 Flash
एक जैसे इनपुट और आउटपुट के साथ काम करने वाला मल्टीमोडल मॉडल 1.5 Pro के तौर पर टाइप करता है, लेकिन लंबी अवधि के हिसाब से 10 लाख टोकन की जानकारी देता है. Gemini 1.5 Flash को खास तौर पर, ज़्यादा वॉल्यूम वाले और किफ़ायती प्लान के लिए डिज़ाइन किया गया है का इस्तेमाल करें.Gemini 1.5 Pro
मल्टीमोडल मॉडल की मदद से इमेज, ऑडियो, वीडियो, और टेक्स्ट या चैट प्रॉम्प्ट में PDF फ़ाइलें शामिल हों. साथ ही, यह 20 लाख टोकन की मदद से लंबी अवधि के कॉन्टेक्स्ट को समझने की सुविधा देता है.Gemini 1.0 Pro विज़न
टेक्स्ट और टेक्स्ट को हैंडल करने के लिए डिज़ाइन किया गया मल्टीमोडल मॉडल टेक्स्ट या कोड से मिलने वाले जवाब के लिए इमेज और वीडियो. चैट के लिए इस्तेमाल नहीं किया जा सकता.Gemini 1.0 Pro
नैचुरल लैंग्वेज से जुड़े टास्क पूरे करने के लिए डिज़ाइन किया गया मॉडल. टेक्स्ट और कोड के साथ चैट करें. साथ ही, कोड जनरेट करें.
अपने कोड में शामिल करने के लिए, सीधे मॉडल का नाम पर जाएं
हर मॉडल के लिए इस्तेमाल के उदाहरण और सुविधाएं
Gemini के हर मॉडल में, अलग-अलग कामों के लिए अलग-अलग सुविधाएँ उपलब्ध हैं. Google Cloud दस्तावेज़ में, इन चीज़ों के बारे में ज़्यादा जानकारी पाई जा सकती है Gemini के मॉडल.
हर मॉडल के लिए काम करने वाले इनपुट और आउटपुट
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro विज़न | Gemini 1.0 Pro | |
---|---|---|---|---|
इनपुट के टाइप | ||||
टेक्स्ट | ||||
कोड | ||||
इमेज | ||||
वीडियो (सिर्फ़ फ़्रेम) | ||||
वीडियो (फ़्रेम और ऑडियो) | ||||
ऑडियो | ||||
आउटपुट टाइप | ||||
टेक्स्ट | ||||
कोड |
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, यहां जाएं Vertex AI Gemini API के लिए इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.
हर मॉडल के लिए इस्तेमाल की जा सकने वाली सुविधाएं और सामान्य सुविधाएं
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro विज़न | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करना | |||||
मल्टीमॉडल प्रॉम्प्ट से टेक्स्ट जनरेट करना | |||||
JSON आउटपुट (सीमित स्कीमा मोड) (जल्द ही Vertex AI in Firebase SDK टूल पर उपलब्ध होगा) |
|||||
बारी-बारी से चैट करने की सुविधा | |||||
फ़ंक्शन कॉलिंग | |||||
बेसिक फ़ंक्शन कॉलिंग | |||||
पैरलल फ़ंक्शन कॉलिंग | |||||
फ़ंक्शन कॉलिंग मोड | |||||
काउंट टोकन और बिल करने लायक वर्ण | |||||
सिस्टम के लिए निर्देश |
हर मॉडल के बारे में विस्तृत जानकारी
प्रॉपर्टी | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro विज़न | Gemini 1.0 Pro |
---|---|---|---|---|
टोकन की कुल सीमा (सभी इनपुट और आउटपुट मिले-जुले) * | 10,48,576 टोकन | 20,97,152 टोकन | 16,384 टोकन | 32,760 टोकन |
आउटपुट टोकन की सीमा * | 8,192 टोकन | 8,192 टोकन | 2,048 टोकन | 8,192 टोकन |
हर अनुरोध में ज़्यादा से ज़्यादा इमेज की संख्या | 3,000 इमेज | 3,000 इमेज | 16 इमेज | लागू नहीं |
base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ | 7 एमबी | 7 एमबी | 7 एमबी | लागू नहीं |
PDF का ज़्यादा से ज़्यादा साइज़ | 30 एमबी | 30 एमबी | 30 एमबी | लागू नहीं |
हर अनुरोध के लिए वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या | 10 वीडियो फ़ाइलें | 10 वीडियो फ़ाइलें | 1 वीडियो फ़ाइल | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा अवधि (सिर्फ़ फ़्रेम के लिए) | ~60 मिनट का वीडियो | ~60 मिनट का वीडियो | 2 मिनट | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा अवधि (फ़्रेम और ऑडियो) | ~45 मिनट का वीडियो | ~45 मिनट का वीडियो | लागू नहीं | लागू नहीं |
हर अनुरोध में ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या | 1 ऑडियो फ़ाइल | 1 ऑडियो फ़ाइल | लागू नहीं | लागू नहीं |
ऑडियो कितना लंबा हो सकता है | ~8.4 घंटे का ऑडियो | ~8.4 घंटे का ऑडियो | लागू नहीं | लागू नहीं |
* Gemini के सभी मॉडल के लिए, एक टोकन में करीब चार वर्ण होते हैं,
इसलिए 100 टोकन, करीब 60 से 80 शब्दों के अंग्रेज़ी के होते हैं. आपके पास कुल संख्या तय करने का विकल्प होता है
का उपयोग करके आपके अनुरोधों में टोकन की
countTokens
.
यहां बताया गया है कि मॉडल कैसे काम करते हैं और इनपुट फ़ाइलें:
ज़्यादा जानने के लिए, Google Cloud दस्तावेज़ में दिए गए मल्टीमॉडल मॉडल के बीच अंतर.
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप, MIME टाइप तय करने के तरीके, और उन्हें बनाने के तरीके के बारे में जानें पक्का करें कि आपकी फ़ाइलें और मल्टीमोडल अनुरोध ज़रूरी शर्तों को पूरा करते हों. साथ ही, सबसे सही तरीके Vertex AI Gemini API के लिए इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.
मॉडल की वर्शनिंग
Gemini के मॉडल को स्टेबल, अपने-आप अपडेट होने वाले, और झलक में दिखाया जाता है वर्शन हैं.
स्टेबल वर्शन को सामान्य रूप से उपलब्ध माना जाता है.
- स्थिर वर्शन में मॉडल का नाम होता है
तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए
.gemini-1.0-pro-001
- स्थिर वर्शन में मॉडल का नाम होता है
तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए
अपने-आप अपडेट होने वाले वर्शन हमेशा, इसके सबसे नए स्टेबल वर्शन पर ले जाते हैं वह मॉडल; अगर कोई नया स्टेबल वर्शन रिलीज़ किया गया है, तो अपने-आप अपडेट होने वाला वर्शन अपने-आप उस नए स्थिर वर्शन की ओर पॉइंट करना शुरू कर देता है.
- अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है
जोड़ें, उदाहरण के लिए
.gemini-1.0-pro
- अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है
जोड़ें, उदाहरण के लिए
झलक देखें वर्शन में नई सुविधाएं जोड़ी गई हैं. इसलिए, इन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वर्शन हमेशा इसके सबसे नए झलक वर्शन पर ले जाते हैं वह मॉडल; अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक दिखाने वाला कोई भी मौजूदा वर्शन अपने-आप उस नए झलक वर्शन पर ले जाना शुरू कर देता है.
- झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं
और मॉडल की शुरुआती रिलीज़ तारीख (-preview
), उदाहरण के लिए-MMDD
(9 अप्रैल, 2024 को रिलीज़ किया गया).gemini-1.5-pro-preview-0409
- झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं
ज़्यादा जानने के लिए, Gemini के उपलब्ध वर्शन और उनका लाइफ़साइकल Google Cloud दस्तावेज़ में पढ़ें.
उपलब्ध मॉडल के नाम
मॉडल के नाम वे स्पष्ट वैल्यू होते हैं जिन्हें आप अपने कोड में जनरेटिव मॉडल शुरू करना (जो कि Gemini API). अपनी भाषा के शुरुआती उदाहरण देखने के लिए, शुरुआती निर्देश.
Gemini 1.5 Flash मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-flash-001 |
Gemini 1.5 फ़्लैश का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले की नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-flash |
उपयोगकर्ता, 1.5 फ़्लैश के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-flash-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
वर्शन की झलक देखना | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 फ़्लैश के नए वर्शन की झलक | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले की नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-pro |
उपयोगकर्ताओं को 1.5 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
वर्शन की झलक देखना | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro के नए वर्शन की झलक | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
gemini-1.5-pro-preview-0514 (यह झलक का सबसे नया वर्शन है) |
सभी के लिए उपलब्ध झलक | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले की नहीं है |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.0-pro-vision |
उपयोगकर्ताओं को 1.5 Pro Vision के नए और स्थिर वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001 |
सामान्य रूप से उपलब्ध | 2024-01-04 | --- |
Gemini 1.0 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-04-09 | 09-04-2025 से पहले की नहीं है |
gemini-1.0-pro-001 |
Gemini 1.0 Pro का स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले की नहीं है |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.0-pro |
उपयोगकर्ताओं को 1.0 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002 |
सामान्य रूप से उपलब्ध | 2024-02-15 | --- |
यह सुविधा इन भाषाओं में काम करती है
Gemini के सभी मॉडल, Gemini Chat की मदद से इन भाषाओं में उपलब्ध है:
ऐरेबिक (ar), बांग्ला (bn), बल्गेरियन (bg), चाइनीज़ सिंप्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हीब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुएनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चुगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)
Gemini 1.5 Pro और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं में समझ सकते हैं और जवाब दे सकते हैं:
अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़रबैजानी (az), बेलारूसियन (be), बोस्नियन (bs), कैटलैन (ca), सेबुआनो (ceb), कॉर्सिकन (co), वेल्श (cy), दिवेही (dv), एस्पेरेंटो (eo), बास्क (eu), पर्शियन (fa), फ़िलिपीनो (टैगालॉग) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉट्स गैलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (Haw), हमॉन्ग (hmn), हैतियन क्रियोल (ht), आर्मेनियन (hy), Igbo (ig), आइसलैंडिक (is), जैवनीज़ (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (कि॰मी॰), कन्नड़ (N), क्रिओ (क्री), कुर्द (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मैलगासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मैतेलॉन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टा (mt), म्यांमार (बर्मीस) (मेरा), नेपाली (ne), न्यांजा (चिचेवा) (ny), ओड़िया (ओड़िया) (या), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंहला (सिंहली) (si), समोअन (sm), शोना (sn), सोमाली (so), अल्बेनियन (sq), सेसोथो (st), संडनीज़ (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइगर (ug), उर्दू (ur), उज़्बेक (oz), ज़ोसा (xh), यिदिश (Y), योरुबा (यो), ज़ुलु (zu)
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- एक के बाद एक बातचीत (चैट) बनाएं.
- यहां से टेक्स्ट जनरेट करें सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट.
- यहां से टेक्स्ट जनरेट करें मल्टीमॉडल प्रॉम्प्ट (इसमें टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो शामिल हैं).
- कनेक्ट करने के लिए, फ़ंक्शन कॉलिंग का इस्तेमाल करें जनरेटिव मॉडल से लेकर बाहरी सिस्टम और जानकारी.