Gemini के मॉडल के बारे में जानकारी

मॉडल के Gemini फ़ैमिली को मल्टीमॉडल माना जाता है, क्योंकि वे इसमें सक्षम हैं कई तरीकों से जानकारी प्रोसेस की जाती है. इनमें इमेज, वीडियो, और और टेक्स्ट. उदाहरण के लिए, Gemini मॉडल को प्लेट की प्लेट की फ़ोटो भेजी जा सकती है कुकी ढूंढी है और इससे उन कुकी की रेसिपी आपको देने के लिए कह सकती है.

प्रॉम्प्ट जवाब

मुझे इन कुकीज़ की रेसिपी बताओ.

कई चॉकलेट चिप कुकी की तस्वीर
**सामग्री**
- 1 सी. (2 स्टिक) बिना नमक वाला, नर्म किया हुआ मक्खन
- 3/4 सी. दानेदार शुगर
- 3/4 सी. ब्राउन शुगर, पैक की गई
- 1 छोटा चम्मच . वनिला एक्स्ट्रैक्ट
- 2 बड़े अंडे
- 2 1/4 सी. सभी तरह का आटा
- 1 छोटा चम्मच. बेकिंग सोडा
- 1 छोटा चम्मच. नमक
...

मॉडल के Gemini फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. इसके लिए, इनका इस्तेमाल करें: Vertex AI की ओर से दिया गया Gemini API Google Cloud को. मोबाइल और वेब ऐप्लिकेशन के लिए, Vertex AI in Firebase SDK टूल, Gemini API को कॉल करने और Gemini के मॉडल सीधे आपके ऐप्लिकेशन से डाउनलोड किए जा सकते हैं.

इस पेज पर, Gemini के मॉडल के बारे में यह जानकारी दी गई है:

  • Gemini के इस्तेमाल के उदाहरणों की बेहतर तरीके से तुलना साथ ही, इसमें मॉडल के साथ काम करने वाले इनपुट टाइप भी शामिल करें.

  • हर मॉडल के ब्यौरे की तुलना, उदाहरण के लिए अधिकतम इनपुट टोकन या वीडियो की अधिकतम अवधि.

  • Gemini के मॉडल के वर्शन होने की जानकारी. ख़ास तौर पर, इस बारे में जानकारी उनके स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन शामिल होने चाहिए.

  • अपने कॉलम में शामिल करने के लिए, उपलब्ध मॉडल नामों की सूचियां कोड को लागू करना शुरू करें.

  • Gemini मॉडल के लिए, इस्तेमाल की जा सकने वाली भाषाओं की सूची.

उपलब्ध मॉडल

Vertex AI in Firebase के साथ, Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:

  • Gemini 1.5 Flash
    एक जैसे इनपुट और आउटपुट के साथ काम करने वाला मल्टीमोडल मॉडल 1.5 Pro के तौर पर टाइप करता है, लेकिन लंबी अवधि के हिसाब से 10 लाख टोकन की जानकारी देता है. Gemini 1.5 Flash को खास तौर पर, ज़्यादा वॉल्यूम वाले और किफ़ायती प्लान के लिए डिज़ाइन किया गया है का इस्तेमाल करें.

  • Gemini 1.5 Pro
    मल्टीमोडल मॉडल की मदद से इमेज, ऑडियो, वीडियो, और टेक्स्ट या चैट प्रॉम्प्ट में PDF फ़ाइलें शामिल हों. साथ ही, यह 20 लाख टोकन की मदद से लंबी अवधि के कॉन्टेक्स्ट को समझने की सुविधा देता है.

  • Gemini 1.0 Pro विज़न
    टेक्स्ट और टेक्स्ट को हैंडल करने के लिए डिज़ाइन किया गया मल्टीमोडल मॉडल टेक्स्ट या कोड से मिलने वाले जवाब के लिए इमेज और वीडियो. चैट के लिए इस्तेमाल नहीं किया जा सकता.

  • Gemini 1.0 Pro
    नैचुरल लैंग्वेज से जुड़े टास्क पूरे करने के लिए डिज़ाइन किया गया मॉडल. टेक्स्ट और कोड के साथ चैट करें. साथ ही, कोड जनरेट करें.

अपने कोड में शामिल करने के लिए, सीधे मॉडल का नाम पर जाएं

हर मॉडल के लिए इस्तेमाल के उदाहरण और सुविधाएं

Gemini के हर मॉडल में, अलग-अलग कामों के लिए अलग-अलग सुविधाएँ उपलब्ध हैं. Google Cloud दस्तावेज़ में, इन चीज़ों के बारे में ज़्यादा जानकारी पाई जा सकती है Gemini के मॉडल.

हर मॉडल के लिए काम करने वाले इनपुट और आउटपुट

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro विज़न Gemini 1.0 Pro
इनपुट के टाइप
टेक्स्ट
कोड
इमेज
PDF
वीडियो (सिर्फ़ फ़्रेम)
वीडियो (फ़्रेम और ऑडियो)
ऑडियो
आउटपुट टाइप
टेक्स्ट
कोड

इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, यहां जाएं Vertex AI Gemini API के लिए इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.

हर मॉडल के लिए इस्तेमाल की जा सकने वाली सुविधाएं और सामान्य सुविधाएं

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro विज़न Gemini 1.0 Pro
सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करना
मल्टीमॉडल प्रॉम्प्ट से टेक्स्ट जनरेट करना
JSON आउटपुट (सीमित स्कीमा मोड)
(जल्द ही Vertex AI in Firebase SDK टूल पर उपलब्ध होगा)
बारी-बारी से चैट करने की सुविधा
फ़ंक्शन कॉलिंग
बेसिक फ़ंक्शन कॉलिंग
पैरलल फ़ंक्शन कॉलिंग
फ़ंक्शन कॉलिंग मोड
काउंट टोकन और बिल करने लायक वर्ण
सिस्टम के लिए निर्देश

हर मॉडल के बारे में विस्तृत जानकारी

प्रॉपर्टी Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro विज़न Gemini 1.0 Pro
टोकन की कुल सीमा (सभी इनपुट और आउटपुट मिले-जुले) * 10,48,576 टोकन 20,97,152 टोकन 16,384 टोकन 32,760 टोकन
आउटपुट टोकन की सीमा * 8,192 टोकन 8,192 टोकन 2,048 टोकन 8,192 टोकन
हर अनुरोध में ज़्यादा से ज़्यादा इमेज की संख्या 3,000 इमेज 3,000 इमेज 16 इमेज लागू नहीं
base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ 7 एमबी 7 एमबी 7 एमबी लागू नहीं
PDF का ज़्यादा से ज़्यादा साइज़ 30 एमबी 30 एमबी 30 एमबी लागू नहीं
हर अनुरोध के लिए वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या 10 वीडियो फ़ाइलें 10 वीडियो फ़ाइलें 1 वीडियो फ़ाइल लागू नहीं
वीडियो की ज़्यादा से ज़्यादा अवधि (सिर्फ़ फ़्रेम के लिए) ~60 मिनट का वीडियो ~60 मिनट का वीडियो 2 मिनट लागू नहीं
वीडियो की ज़्यादा से ज़्यादा अवधि (फ़्रेम और ऑडियो) ~45 मिनट का वीडियो ~45 मिनट का वीडियो लागू नहीं लागू नहीं
हर अनुरोध में ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या 1 ऑडियो फ़ाइल 1 ऑडियो फ़ाइल लागू नहीं लागू नहीं
ऑडियो कितना लंबा हो सकता है ~8.4 घंटे का ऑडियो ~8.4 घंटे का ऑडियो लागू नहीं लागू नहीं

* Gemini के सभी मॉडल के लिए, एक टोकन में करीब चार वर्ण होते हैं, इसलिए 100 टोकन, करीब 60 से 80 शब्दों के अंग्रेज़ी के होते हैं. आपके पास कुल संख्या तय करने का विकल्प होता है का उपयोग करके आपके अनुरोधों में टोकन की countTokens.

यहां बताया गया है कि मॉडल कैसे काम करते हैं और इनपुट फ़ाइलें:

मॉडल की वर्शनिंग

Gemini के मॉडल को स्टेबल, अपने-आप अपडेट होने वाले, और झलक में दिखाया जाता है वर्शन हैं.

  • स्टेबल वर्शन को सामान्य रूप से उपलब्ध माना जाता है.

    • स्थिर वर्शन में मॉडल का नाम होता है तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए gemini-1.0-pro-001.
  • अपने-आप अपडेट होने वाले वर्शन हमेशा, इसके सबसे नए स्टेबल वर्शन पर ले जाते हैं वह मॉडल; अगर कोई नया स्टेबल वर्शन रिलीज़ किया गया है, तो अपने-आप अपडेट होने वाला वर्शन अपने-आप उस नए स्थिर वर्शन की ओर पॉइंट करना शुरू कर देता है.

    • अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है जोड़ें, उदाहरण के लिए gemini-1.0-pro.
  • झलक देखें वर्शन में नई सुविधाएं जोड़ी गई हैं. इसलिए, इन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वर्शन हमेशा इसके सबसे नए झलक वर्शन पर ले जाते हैं वह मॉडल; अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक दिखाने वाला कोई भी मौजूदा वर्शन अपने-आप उस नए झलक वर्शन पर ले जाना शुरू कर देता है.

    • झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं -preview और मॉडल की शुरुआती रिलीज़ तारीख (-MMDD), उदाहरण के लिए gemini-1.5-pro-preview-0409 (9 अप्रैल, 2024 को रिलीज़ किया गया).

ज़्यादा जानने के लिए, Gemini के उपलब्ध वर्शन और उनका लाइफ़साइकल Google Cloud दस्तावेज़ में पढ़ें.

उपलब्ध मॉडल के नाम

मॉडल के नाम वे स्पष्ट वैल्यू होते हैं जिन्हें आप अपने कोड में जनरेटिव मॉडल शुरू करना (जो कि Gemini API). अपनी भाषा के शुरुआती उदाहरण देखने के लिए, शुरुआती निर्देश.

Gemini 1.5 Flash मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-flash-001 Gemini 1.5 फ़्लैश का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले की नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-flash उपयोगकर्ता, 1.5 फ़्लैश
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-flash-001 है)
सामान्य रूप से उपलब्ध 2024-05-24 ---
वर्शन की झलक देखना
gemini-1.5-flash-preview-0514 Gemini 1.5 फ़्लैश के नए वर्शन की झलक सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24

Gemini 1.5 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-pro-001 Gemini 1.5 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले की नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-pro उपयोगकर्ताओं को 1.5 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001 है)
सामान्य रूप से उपलब्ध 2024-05-24 ---
वर्शन की झलक देखना
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro के नए वर्शन की झलक सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 gemini-1.5-pro-preview-0514 पर ले जाता है
(यह झलक का सबसे नया वर्शन है)
सभी के लिए उपलब्ध झलक 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले की नहीं है
अपने-आप अपडेट होने वाला वर्शन
gemini-1.0-pro-vision उपयोगकर्ताओं को 1.5 Pro Vision
के नए और स्थिर वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001 है)
सामान्य रूप से उपलब्ध 2024-01-04 ---

Gemini 1.0 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-002 Gemini 1.0 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-04-09 09-04-2025 से पहले की नहीं है
gemini-1.0-pro-001 Gemini 1.0 Pro का स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले की नहीं है
अपने-आप अपडेट होने वाला वर्शन
gemini-1.0-pro उपयोगकर्ताओं को 1.0 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002 है)
सामान्य रूप से उपलब्ध 2024-02-15 ---

यह सुविधा इन भाषाओं में काम करती है

  • Gemini के सभी मॉडल, Gemini Chat की मदद से इन भाषाओं में उपलब्ध है:

    ऐरेबिक (ar), बांग्ला (bn), बल्गेरियन (bg), चाइनीज़ सिंप्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हीब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुएनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चुगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)

  • Gemini 1.5 Pro और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं में समझ सकते हैं और जवाब दे सकते हैं:

    अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़रबैजानी (az), बेलारूसियन (be), बोस्नियन (bs), कैटलैन (ca), सेबुआनो (ceb), कॉर्सिकन (co), वेल्श (cy), दिवेही (dv), एस्पेरेंटो (eo), बास्क (eu), पर्शियन (fa), फ़िलिपीनो (टैगालॉग) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉट्स गैलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (Haw), हमॉन्ग (hmn), हैतियन क्रियोल (ht), आर्मेनियन (hy), Igbo (ig), आइसलैंडिक (is), जैवनीज़ (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (कि॰मी॰), कन्नड़ (N), क्रिओ (क्री), कुर्द (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मैलगासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मैतेलॉन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टा (mt), म्यांमार (बर्मीस) (मेरा), नेपाली (ne), न्यांजा (चिचेवा) (ny), ओड़िया (ओड़िया) (या), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंहला (सिंहली) (si), समोअन (sm), शोना (sn), सोमाली (so), अल्बेनियन (sq), सेसोथो (st), संडनीज़ (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइगर (ug), उर्दू (ur), उज़्बेक (oz), ज़ोसा (xh), यिदिश (Y), योरुबा (यो), ज़ुलु (zu)

अगले चरण

Gemini API की सुविधाओं को आज़माएं