Gemini मॉडल की फ़ैमिली को मल्टीमोडल माना जाता है, क्योंकि इनमें इमेज, वीडियो, और टेक्स्ट जैसी कई तरह की जानकारी को प्रोसेस किया जा सकता है. उदाहरण के लिए, Gemini मॉडल को एक प्लेट की फ़ोटो भेजी जा सकती है. इस फ़ोटो को कुकी की प्लेट की तरह दिखाया जाता है. साथ ही, इससे कुकी की रेसिपी की जानकारी मांगी जा सकती है.
प्रॉम्प्ट | जवाब |
मुझे इन कुकीज़ की रेसिपी बताओ. ![]() |
**सामग्री** - 1 c. (2 स्टिक) बिना नमक वाला मक्खन, मुलायम - 3/4 सी. दानेदार शुगर - 3/4 सी. ब्राउन शुगर, पैक की हुई - 1 चम्मच . वनीला एक्सट्रैक्ट - 2 बड़े अंडे - 2 1/4 सी. पूरी तरह से बना आटा - 1 चम्मच बेकिंग सोडा - 1 चम्मच. नमक ... |
Google Cloud पर Vertex AI के उपलब्ध कराए गए Gemini API का इस्तेमाल करके, Gemini मॉडल फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. मोबाइल और वेब ऐप्लिकेशन के मामले में, Firebase के लिए Vertex AI SDK टूल का इस्तेमाल करके, Gemini API को कॉल किया जा सकता है और सीधे अपने ऐप्लिकेशन से Gemini मॉडल से इंटरैक्ट किया जा सकता है.
इस पेज पर Gemini मॉडल के बारे में यह जानकारी दी गई है:
Gemini मॉडल के लिए, इस्तेमाल के उदाहरणों की बहुत ज़्यादा तुलना. इसमें, इस्तेमाल किए जा सकने वाले इनपुट टाइप की जानकारी भी शामिल है.
हर मॉडल की जानकारी की तुलना. उदाहरण के लिए, ज़्यादा से ज़्यादा इनपुट टोकन या वीडियो की ज़्यादा से ज़्यादा लंबाई.
Gemini मॉडल के वर्शन के बारे में जानकारी, खास तौर पर उनके स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन.
शुरू करने के दौरान, अपने कोड में शामिल करने के लिए, उपलब्ध मॉडल के नामों की सूचियां.
Gemini मॉडल के लिए इस्तेमाल की जा सकने वाली भाषाओं की सूची.
उपलब्ध मॉडल
Firebase के लिए Vertex AI के साथ Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:
Gemini 1.5 Flash: मल्टीमोडल मॉडल जो 1.5 प्रो (साथ ही कुल टोकन संख्या) जैसे इनपुट और आउटपुट टाइप के साथ काम करता है, लेकिन 1.5 Flash को खास तौर पर ज़्यादा वॉल्यूम और किफ़ायती ऐप्लिकेशन के लिए डिज़ाइन किया गया है.
Gemini 1.5 Pro: एक ऐसा मल्टीमोडल मॉडल जिसमें टेक्स्ट या चैट प्रॉम्प्ट में इमेज, ऑडियो, वीडियो, और PDF फ़ाइलें जोड़ने की सुविधा होती है. इनका इस्तेमाल करके, टेक्स्ट या कोड वाले रिस्पॉन्स के लिए इमेज, ऑडियो, वीडियो, और PDF फ़ाइलें जोड़ी जा सकती हैं. साथ ही, यह 10 लाख तक टोकन के साथ लंबी अवधि के संदर्भ को समझने में भी मदद करती है.
Gemini 1.0 Pro Vision: एक मल्टीमोडल मॉडल, जिसे टेक्स्ट या कोड रिस्पॉन्स के लिए टेक्स्ट, इमेज, और वीडियो को हैंडल करने के लिए डिज़ाइन किया गया है. चैट के लिए इस्तेमाल नहीं किया जा सकता.
Gemini 1.0 Pro: इस मॉडल को इस तरह से डिज़ाइन किया गया है कि भाषा से जुड़े काम आसानी से पूरे किए जा सकें. साथ ही, टेक्स्ट और कोड से बार-बार चैट करने और कोड जनरेट करने की सुविधा भी मिलती है.
अपने कोड में शामिल करने के लिए मॉडल के नाम पर जाएं
हर मॉडल के लिए इस्तेमाल का उदाहरण
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|
इनपुट के टाइप | |||
टेक्स्ट | |||
कोड | |||
Image | |||
वीडियो (सिर्फ़ फ़्रेम के लिए) | |||
वीडियो (फ़्रेम और ऑडियो) | |||
ऑडियो | |||
आउटपुट टाइप | |||
टेक्स्ट | |||
कोड | |||
इस्तेमाल के सामान्य उदाहरण | |||
मल्टीमोडल अनुरोध | |||
मल्टी-टर्न चैट |
Google Cloud दस्तावेज़ में, Gemini मॉडल के इस्तेमाल के उदाहरणों के बारे में ज़्यादा जानें:
- Gemini 1.5 Flash के इस्तेमाल के उदाहरण
- Gemini 1.5 Pro के इस्तेमाल के उदाहरण
- Gemini 1.0 Pro Vision के इस्तेमाल के उदाहरण
- Gemini 1.0 Pro के इस्तेमाल के उदाहरण
हर मॉडल के बारे में ज़्यादा जानकारी
Gemini के सभी मॉडल के लिए टोकन, करीब चार वर्णों के बराबर होता है. 100 टोकन में तकरीबन 60 से 80 अंग्रेज़ी शब्द होते हैं. countTokens
का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.
प्रॉपर्टी |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|
टोकन की कुल सीमा (इनपुट और आउटपुट को मिलाकर) | 10 लाख टोकन | 16,384 टोकन | 32,760 टोकन |
आउटपुट टोकन की सीमा | 8,192 टोकन | 2,048 टोकन | 8,192 टोकन |
हर अनुरोध के लिए ज़्यादा से ज़्यादा इमेज की संख्या | 3,000 इमेज | 16 इमेज | लागू नहीं |
Base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ | 7 एमबी | 7 एमबी | लागू नहीं |
PDF का ज़्यादा से ज़्यादा साइज़ | 30 एमबी | 30 एमबी | लागू नहीं |
हर अनुरोध के लिए ज़्यादा से ज़्यादा वीडियो फ़ाइलें | 10 वीडियो फ़ाइलें | 1 वीडियो फ़ाइल | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा लंबाई (सिर्फ़ फ़्रेम के लिए) | 60 मिनट का वीडियो | 2 मिनट | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा लंबाई (फ़्रेम और ऑडियो) | ~45 मिनट का वीडियो | लागू नहीं | लागू नहीं |
हर अनुरोध के लिए ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या | 1 ऑडियो फ़ाइल | लागू नहीं | लागू नहीं |
ऑडियो की ज़्यादा से ज़्यादा लंबाई | ~8.4 घंटे का ऑडियो | लागू नहीं | लागू नहीं |
यहां आपको मॉडल और इनपुट फ़ाइलों के बारे में ज़्यादा जानकारी मिल सकती है.
Google Cloud के दस्तावेज़ में, मल्टीमॉडल मॉडल के बीच के अंतर के बारे में जानें.
साथ काम करने वाले फ़ाइल टाइप, MIME टाइप बताने का तरीका, और यह पक्का करने का तरीका जानें कि आपकी फ़ाइलें और मल्टीमोडल अनुरोध ज़रूरी शर्तों का पालन करते हों. साथ ही, Vertex AI Gemini API के साथ काम करने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें में दिए गए सबसे सही तरीके अपनाएं.
मॉडल के वर्शन
Gemini के मॉडल स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन में उपलब्ध हैं.
स्टेबल वर्शन आम तौर पर उपलब्ध माने जाते हैं.
- स्टेबल वर्शन में मॉडल के नाम जुड़े होते हैं. इन नामों के साथ तीन अंकों वाला वर्शन नंबर जुड़ा होता है, जैसे कि
.gemini-1.0-pro-001
- स्टेबल वर्शन में मॉडल के नाम जुड़े होते हैं. इन नामों के साथ तीन अंकों वाला वर्शन नंबर जुड़ा होता है, जैसे कि
अपने-आप अपडेट होने वाला वर्शन हमेशा उस मॉडल के नए स्टेबल वर्शन पर ले जाता है. अगर कोई नया स्टेबल वर्शन रिलीज़ होता है, तो अपने-आप अपडेट होने वाला वर्शन, अपने-आप उस नए स्टेबल वर्शन के बारे में बताने लगता है.
- अपने-आप अपडेट होने वाले वर्शन में, ऐसे मॉडल के नाम होते हैं जिनमें
कोई एलिमेंट नहीं जोड़ा जाता. उदाहरण के लिए,
.gemini-1.0-pro
- अपने-आप अपडेट होने वाले वर्शन में, ऐसे मॉडल के नाम होते हैं जिनमें
कोई एलिमेंट नहीं जोड़ा जाता. उदाहरण के लिए,
झलक वर्शन में नई सुविधाएं हैं और उन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वाले वर्शन हमेशा उस मॉडल के नए झलक वर्शन के बारे में बताते हैं. अगर झलक वाला कोई नया वर्शन रिलीज़ होता है, तो झलक वाला कोई भी मौजूदा वर्शन अपने-आप उस नए वर्शन पर ले जाता है.
- झलक वाले वर्शन में मॉडल के नाम के साथ
जुड़े होते हैं. साथ ही, मॉडल की रिलीज़ की शुरुआती तारीख (-preview
) भी शामिल होती है. उदाहरण के लिए,-MMDD
(9 अप्रैल, 2024 को रिलीज़ हुआ).gemini-1.5-pro-preview-0409
- झलक वाले वर्शन में मॉडल के नाम के साथ
Google Cloud के दस्तावेज़ में, Gemini मॉडल के उपलब्ध वर्शन और उनकी लाइफ़साइकल के बारे में ज़्यादा जानें.
मॉडल के उपलब्ध नाम
मॉडल के नाम, साफ़ तौर पर दी गई वैल्यू होती हैं. इन्हें जनरेटिव मॉडल शुरू होने के दौरान, अपने कोड में शामिल किया जाता है. यह Gemini API को कॉल करने के लिए ज़रूरी चरण है. अपनी भाषा के लिए शुरू करने के उदाहरण देखने के लिए, शुरुआती निर्देश देखें.
Gemini 1.5 फ़्लैश मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | खाता बंद करने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-flash-001 |
Gemini 1.5 फ़्लैश का सबसे नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले नहीं |
अपने-आप अपडेट किया गया वर्शन | ||||
gemini-1.5-flash |
1.5 फ़्लैश के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-flash-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
झलक के वर्शन | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 फ़्लैश का नया वर्शन की झलक | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | खाता बंद करने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले नहीं |
अपने-आप अपडेट किया गया वर्शन | ||||
gemini-1.5-pro |
1.5 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
झलक के वर्शन | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro वर्शन की झलक के नए वर्शन का नया वर्शन | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
gemini-1.5-pro-preview-0514 पर ले जाता है(यह झलक वाला सबसे नया वर्शन है) |
सभी के लिए उपलब्ध झलक | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | खाता बंद करने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले नहीं |
अपने-आप अपडेट किया गया वर्शन | ||||
gemini-1.0-pro-vision |
1.5 Pro Vision के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001 |
सामान्य रूप से उपलब्ध | 2024-01-04 | --- |
Gemini 1.0 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | खाता बंद करने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-04-09 | 09-04-2025 से पहले नहीं |
gemini-1.0-pro-001 |
Gemini 1.0 Pro का स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले नहीं |
अपने-आप अपडेट किया गया वर्शन | ||||
gemini-1.0-pro |
1.0 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002 |
सामान्य रूप से उपलब्ध | 2024-02-15 | --- |
यह सुविधा इन भाषाओं में काम करती है
Gemini मॉडल में इन भाषाओं का इस्तेमाल किया जा सकता है:
ऐरेबिक (ar), बांग्ला (bn), बुल्गेरियन (bg), चाइनीज़ सिंप्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), इंग्लिश (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (हुए), इंडोनेशियन (iw), इटैलियन (it)
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- एक के बाद एक बातचीत (चैट) बनाएं.
- सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करें.
- मल्टीमोडल प्रॉम्प्ट (इसमें टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो शामिल हैं) से टेक्स्ट जनरेट करें.
- जनरेटिव मॉडल को बाहरी सिस्टम और जानकारी से जोड़ने के लिए, फ़ंक्शन कॉलिंग का इस्तेमाल करें.