Gemini मॉडल के बारे में जानें

Gemini मॉडल की फ़ैमिली को मल्टीमोडल माना जाता है, क्योंकि इनमें इमेज, वीडियो, और टेक्स्ट जैसी कई तरह की जानकारी को प्रोसेस किया जा सकता है. उदाहरण के लिए, Gemini मॉडल को एक प्लेट की फ़ोटो भेजी जा सकती है. इस फ़ोटो को कुकी की प्लेट की तरह दिखाया जाता है. साथ ही, इससे कुकी की रेसिपी की जानकारी मांगी जा सकती है.

प्रॉम्प्ट जवाब

मुझे इन कुकीज़ की रेसिपी बताओ.

कई चॉकलेट चिप कुकीज़ की तस्वीर
**सामग्री**
- 1 c. (2 स्टिक) बिना नमक वाला मक्खन, मुलायम
- 3/4 सी. दानेदार शुगर
- 3/4 सी. ब्राउन शुगर, पैक की हुई
- 1 चम्मच . वनीला एक्सट्रैक्ट
- 2 बड़े अंडे
- 2 1/4 सी. पूरी तरह से बना आटा
- 1 चम्मच बेकिंग सोडा
- 1 चम्मच. नमक
...

Google Cloud पर Vertex AI के उपलब्ध कराए गए Gemini API का इस्तेमाल करके, Gemini मॉडल फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. मोबाइल और वेब ऐप्लिकेशन के मामले में, Firebase के लिए Vertex AI SDK टूल का इस्तेमाल करके, Gemini API को कॉल किया जा सकता है और सीधे अपने ऐप्लिकेशन से Gemini मॉडल से इंटरैक्ट किया जा सकता है.

इस पेज पर Gemini मॉडल के बारे में यह जानकारी दी गई है:

उपलब्ध मॉडल

Firebase के लिए Vertex AI के साथ Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:

  • Gemini 1.5 Flash: मल्टीमोडल मॉडल जो 1.5 प्रो (साथ ही कुल टोकन संख्या) जैसे इनपुट और आउटपुट टाइप के साथ काम करता है, लेकिन 1.5 Flash को खास तौर पर ज़्यादा वॉल्यूम और किफ़ायती ऐप्लिकेशन के लिए डिज़ाइन किया गया है.

  • Gemini 1.5 Pro: एक ऐसा मल्टीमोडल मॉडल जिसमें टेक्स्ट या चैट प्रॉम्प्ट में इमेज, ऑडियो, वीडियो, और PDF फ़ाइलें जोड़ने की सुविधा होती है. इनका इस्तेमाल करके, टेक्स्ट या कोड वाले रिस्पॉन्स के लिए इमेज, ऑडियो, वीडियो, और PDF फ़ाइलें जोड़ी जा सकती हैं. साथ ही, यह 10 लाख तक टोकन के साथ लंबी अवधि के संदर्भ को समझने में भी मदद करती है.

  • Gemini 1.0 Pro Vision: एक मल्टीमोडल मॉडल, जिसे टेक्स्ट या कोड रिस्पॉन्स के लिए टेक्स्ट, इमेज, और वीडियो को हैंडल करने के लिए डिज़ाइन किया गया है. चैट के लिए इस्तेमाल नहीं किया जा सकता.

  • Gemini 1.0 Pro: इस मॉडल को इस तरह से डिज़ाइन किया गया है कि भाषा से जुड़े काम आसानी से पूरे किए जा सकें. साथ ही, टेक्स्ट और कोड से बार-बार चैट करने और कोड जनरेट करने की सुविधा भी मिलती है.

अपने कोड में शामिल करने के लिए मॉडल के नाम पर जाएं

हर मॉडल के लिए इस्तेमाल का उदाहरण

Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
इनपुट के टाइप
टेक्स्ट
कोड
Image
PDF
वीडियो (सिर्फ़ फ़्रेम के लिए)
वीडियो (फ़्रेम और ऑडियो)
ऑडियो
आउटपुट टाइप
टेक्स्ट
कोड
इस्तेमाल के सामान्य उदाहरण
मल्टीमोडल अनुरोध
मल्टी-टर्न चैट

Google Cloud दस्तावेज़ में, Gemini मॉडल के इस्तेमाल के उदाहरणों के बारे में ज़्यादा जानें:

हर मॉडल के बारे में ज़्यादा जानकारी

Gemini के सभी मॉडल के लिए टोकन, करीब चार वर्णों के बराबर होता है. 100 टोकन में तकरीबन 60 से 80 अंग्रेज़ी शब्द होते हैं. countTokens का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.

प्रॉपर्टी Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
टोकन की कुल सीमा (इनपुट और आउटपुट को मिलाकर) 10 लाख टोकन 16,384 टोकन 32,760 टोकन
आउटपुट टोकन की सीमा 8,192 टोकन 2,048 टोकन 8,192 टोकन
हर अनुरोध के लिए ज़्यादा से ज़्यादा इमेज की संख्या 3,000 इमेज 16 इमेज लागू नहीं
Base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ 7 एमबी 7 एमबी लागू नहीं
PDF का ज़्यादा से ज़्यादा साइज़ 30 एमबी 30 एमबी लागू नहीं
हर अनुरोध के लिए ज़्यादा से ज़्यादा वीडियो फ़ाइलें 10 वीडियो फ़ाइलें 1 वीडियो फ़ाइल लागू नहीं
वीडियो की ज़्यादा से ज़्यादा लंबाई (सिर्फ़ फ़्रेम के लिए) 60 मिनट का वीडियो 2 मिनट लागू नहीं
वीडियो की ज़्यादा से ज़्यादा लंबाई (फ़्रेम और ऑडियो) ~45 मिनट का वीडियो लागू नहीं लागू नहीं
हर अनुरोध के लिए ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या 1 ऑडियो फ़ाइल लागू नहीं लागू नहीं
ऑडियो की ज़्यादा से ज़्यादा लंबाई ~8.4 घंटे का ऑडियो लागू नहीं लागू नहीं

यहां आपको मॉडल और इनपुट फ़ाइलों के बारे में ज़्यादा जानकारी मिल सकती है.

मॉडल के वर्शन

Gemini के मॉडल स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन में उपलब्ध हैं.

  • स्टेबल वर्शन आम तौर पर उपलब्ध माने जाते हैं.

    • स्टेबल वर्शन में मॉडल के नाम जुड़े होते हैं. इन नामों के साथ तीन अंकों वाला वर्शन नंबर जुड़ा होता है, जैसे कि gemini-1.0-pro-001.
  • अपने-आप अपडेट होने वाला वर्शन हमेशा उस मॉडल के नए स्टेबल वर्शन पर ले जाता है. अगर कोई नया स्टेबल वर्शन रिलीज़ होता है, तो अपने-आप अपडेट होने वाला वर्शन, अपने-आप उस नए स्टेबल वर्शन के बारे में बताने लगता है.

    • अपने-आप अपडेट होने वाले वर्शन में, ऐसे मॉडल के नाम होते हैं जिनमें कोई एलिमेंट नहीं जोड़ा जाता. उदाहरण के लिए, gemini-1.0-pro.
  • झलक वर्शन में नई सुविधाएं हैं और उन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वाले वर्शन हमेशा उस मॉडल के नए झलक वर्शन के बारे में बताते हैं. अगर झलक वाला कोई नया वर्शन रिलीज़ होता है, तो झलक वाला कोई भी मौजूदा वर्शन अपने-आप उस नए वर्शन पर ले जाता है.

    • झलक वाले वर्शन में मॉडल के नाम के साथ -preview जुड़े होते हैं. साथ ही, मॉडल की रिलीज़ की शुरुआती तारीख (-MMDD) भी शामिल होती है. उदाहरण के लिए, gemini-1.5-pro-preview-0409 (9 अप्रैल, 2024 को रिलीज़ हुआ).

Google Cloud के दस्तावेज़ में, Gemini मॉडल के उपलब्ध वर्शन और उनकी लाइफ़साइकल के बारे में ज़्यादा जानें.

मॉडल के उपलब्ध नाम

मॉडल के नाम, साफ़ तौर पर दी गई वैल्यू होती हैं. इन्हें जनरेटिव मॉडल शुरू होने के दौरान, अपने कोड में शामिल किया जाता है. यह Gemini API को कॉल करने के लिए ज़रूरी चरण है. अपनी भाषा के लिए शुरू करने के उदाहरण देखने के लिए, शुरुआती निर्देश देखें.

Gemini 1.5 फ़्लैश मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख खाता बंद करने की तारीख
स्टेबल वर्शन
gemini-1.5-flash-001 Gemini 1.5 फ़्लैश का सबसे नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले नहीं
अपने-आप अपडेट किया गया वर्शन
gemini-1.5-flash 1.5 फ़्लैश के नए स्टेबल वर्शन पर ले जाता है
(फ़िलहाल, gemini-1.5-flash-001)
सामान्य रूप से उपलब्ध 2024-05-24 ---
झलक के वर्शन
gemini-1.5-flash-preview-0514 Gemini 1.5 फ़्लैश का नया वर्शन की झलक सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24

Gemini 1.5 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख खाता बंद करने की तारीख
स्टेबल वर्शन
gemini-1.5-pro-001 Gemini 1.5 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले नहीं
अपने-आप अपडेट किया गया वर्शन
gemini-1.5-pro 1.5 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001)
सामान्य रूप से उपलब्ध 2024-05-24 ---
झलक के वर्शन
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro वर्शन की झलक के नए वर्शन का नया वर्शन सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 gemini-1.5-pro-preview-0514
पर ले जाता है(यह झलक वाला सबसे नया वर्शन है)
सभी के लिए उपलब्ध झलक 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख खाता बंद करने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले नहीं
अपने-आप अपडेट किया गया वर्शन
gemini-1.0-pro-vision 1.5 Pro Vision
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001)
सामान्य रूप से उपलब्ध 2024-01-04 ---

Gemini 1.0 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख खाता बंद करने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-002 Gemini 1.0 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-04-09 09-04-2025 से पहले नहीं
gemini-1.0-pro-001 Gemini 1.0 Pro का स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले नहीं
अपने-आप अपडेट किया गया वर्शन
gemini-1.0-pro 1.0 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002)
सामान्य रूप से उपलब्ध 2024-02-15 ---

यह सुविधा इन भाषाओं में काम करती है

Gemini मॉडल में इन भाषाओं का इस्तेमाल किया जा सकता है:

ऐरेबिक (ar), बांग्ला (bn), बुल्गेरियन (bg), चाइनीज़ सिंप्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), इंग्लिश (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (हुए), इंडोनेशियन (iw), इटैलियन (it)

अगले चरण

Gemini API की सुविधाओं को आज़माएं