मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase AI Logic एसडीके टूल की मदद से, Gemini मॉडल और Imagen मॉडल के साथ इंटरैक्ट किया जा सकता है. ऐसा सीधे तौर पर अपने ऐप्लिकेशन से किया जा सकता है.
Gemini मॉडल को मल्टीमॉडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई फ़ॉर्मैट में जानकारी को प्रोसेस कर सकते हैं. साथ ही, इन फ़ॉर्मैट में कॉन्टेंट जनरेट भी कर सकते हैं. Imagen मॉडल को टेक्स्ट प्रॉम्प्ट देकर, इमेज जनरेट करने के लिए कहा जा सकता है.
साथ ही, उन सभी मॉडल के बारे में हमारे अक्सर पूछे जाने वाले सवाल पढ़ें जिनके साथ Firebase AI Logic काम करता है और जिनके साथ काम नहीं करता.
चुनिंदा मॉडल
Gemini 3 Pro
gemini-3-pro-preview
यह मल्टीमॉडल को समझने वाला हमारा सबसे बेहतरीन मॉडल है. साथ ही, यह अब तक का सबसे बेहतरीन एजेंटिक और वाइब-कोडिंग मॉडल है. इससे आपको बेहतर विज़ुअल और ज़्यादा इंटरैक्टिविटी मिलती है. यह सब, रीज़निंग की बेहतरीन टेक्नोलॉजी पर आधारित है. (बिलिंग ज़रूरी है)
Gemini 2.5 Pro
gemini-2.5-pro
यह हमारा सबसे बेहतरीन थिंकिंग मॉडल है. यह कोड, गणित, और विज्ञान, टेक्नोलॉजी, इंजीनियरिंग, और गणित (एसटीईएम) से जुड़ी मुश्किल समस्याओं को हल कर सकता है. साथ ही, लंबे कॉन्टेक्स्ट का इस्तेमाल करके बड़े डेटासेट, कोडबेस, और दस्तावेज़ों का विश्लेषण कर सकता है.
Gemini 2.5 Flash
gemini-2.5-flash
कीमत और परफ़ॉर्मेंस के हिसाब से हमारा सबसे अच्छा मॉडल. इसमें कई तरह की सुविधाएं मिलती हैं. 2.5 Flash, बड़े पैमाने पर प्रोसेसिंग करने, कम समय में जवाब देने, और ज़्यादा डेटा वाले ऐसे टास्क के लिए सबसे अच्छा है जिनमें सोच-विचार करने की ज़रूरत होती है. साथ ही, यह एजेंटिक इस्तेमाल के उदाहरणों के लिए भी सबसे अच्छा है.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
यह हमारा सबसे तेज़ फ़्लैश मॉडल है. इसे कम लागत और ज़्यादा थ्रूपुट के लिए ऑप्टिमाइज़ किया गया है.
इमेज जनरेट करने वाले मॉडल
इमेज जनरेट करने के लिए, Gemini या Imagen मॉडल का इस्तेमाल किया जा सकता है.
Gemini
Gemini 2.5 Flash Image (इसे nano banana भी कहा जाता है)
gemini-2.5-flash-image
यह हमारा स्टैंडर्ड फ़्लैश मॉडल है. इसे इमेज जनरेट करने और बातचीत वाली, कई बार की जाने वाली एडिटिंग की सुविधाओं के साथ, क्रिएटिव वर्कफ़्लो को तेज़ी से पूरा करने के लिए अपग्रेड किया गया है. (बिलिंग ज़रूरी है)
Imagen
Imagen 4
imagen-4.0-generate-001
यह नैचुरल लैंग्वेज में दिए गए टेक्स्ट प्रॉम्प्ट से, अच्छी क्वालिटी वाली असली इमेज जनरेट करता है. (बिलिंग ज़रूरी है)
Imagen 4 Fast
imagen-4.0-fast-generate-001
यह प्रोटोटाइपिंग या कम समय में इस्तेमाल किए जाने वाले मामलों के लिए इमेज जनरेट करता है. (बिलिंग ज़रूरी है)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
यह नैचुरल लैंग्वेज में दिए गए टेक्स्ट प्रॉम्प्ट से, अच्छी क्वालिटी वाली असली इमेज जनरेट करता है. (बिलिंग ज़रूरी है)
पिछली जनरेशन के मॉडल
ये मॉडल चालू हैं, लेकिन पिछली जनरेशन के हैं. हमारा सुझाव है कि जब भी मुमकिन हो, तो इसके बजाय किसी नए मॉडल का इस्तेमाल करें.
Gemini के मॉडल
Gemini 2.0 Flash
gemini-2.0-flash-001
यह हमारा दूसरी जनरेशन का मॉडल है. यह 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो के साथ उपलब्ध है. इसमें अगली पीढ़ी की सुविधाएं और बेहतर क्षमताएं मिलती हैं. जैसे, तेज़ स्पीड और नेटिव टूल का इस्तेमाल.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
यह हमारा दूसरी जनरेशन का छोटा मॉडल है. यह 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो के साथ उपलब्ध है. लागत कम रखने और कम समय में नतीजे पाने के लिए ऑप्टिमाइज़ किया गया है.
इस पेज के बाकी हिस्से में, Firebase AI Logic के साथ काम करने वाले मॉडल के बारे में ज़्यादा जानकारी दी गई है.
-
- इनपुट और आउटपुट के लिए उपलब्ध भाषाएं
- सहायता पाने से जुड़ी सुविधाओं की तुलना
- खास जानकारी और सीमाएं. उदाहरण के लिए, ज़्यादा से ज़्यादा इनपुट टोकन या इनपुट वीडियो की ज़्यादा से ज़्यादा अवधि
मॉडल के वर्शन के बारे में जानकारी. खास तौर पर, उनके स्टेबल, अपने-आप अपडेट होने वाले, प्रीव्यू, और एक्सपेरिमेंटल वर्शन के बारे में जानकारी
शुरू करने के दौरान अपने कोड में शामिल करने के लिए, उपलब्ध मॉडल के नामों की सूचियां
मॉडल के लिए, इस्तेमाल की जा सकने वाली भाषाओं की सूचियां
इस पेज पर सबसे नीचे, पिछली जनरेशन के मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.
मॉडल की तुलना करें
हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में मदद मिल सके. ध्यान दें कि इस सेक्शन में मौजूद हर टेबल में, हर मॉडल के बारे में बताया गया है जब इसे Firebase AI Logic के साथ इस्तेमाल किया जाता है. हर मॉडल में ऐसी अतिरिक्त क्षमताएं हो सकती हैं जो हमारे एसडीके का इस्तेमाल करते समय उपलब्ध नहीं होती हैं.
अगर आपको नीचे दिए गए उप-सेक्शन में अपनी ज़रूरत की जानकारी नहीं मिलती है, तो आपको एपीआई सेवा देने वाली कंपनी के दस्तावेज़ में ज़्यादा जानकारी मिल सकती है:
Gemini Developer API: Gemini मॉडल और Imagen मॉडल
Vertex AI Gemini API: Gemini मॉडल और Imagen मॉडल
इनपुट और आउटपुट के लिए उपलब्ध भाषाएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के लिए ये टाइप इस्तेमाल किए जा सकते हैं:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (जनरेट करें) | Imagen (क्षमता) | |
|---|---|---|---|---|---|---|
| इनपुट टाइप | ||||||
| टेक्स्ट | ||||||
| टेक्स्ट (स्ट्रीमिंग) | ||||||
| कोड | ||||||
| दस्तावेज़ (PDF या सामान्य टेक्स्ट) |
||||||
| इमेज | ||||||
| वीडियो | ||||||
| ऑडियो | ||||||
| ऑडियो (स्ट्रीमिंग) | ||||||
| आउटपुट टाइप | ||||||
| टेक्स्ट | ||||||
| टेक्स्ट (स्ट्रीमिंग) | ||||||
| कोड | ||||||
| स्ट्रक्चर्ड आउटपुट (जैसे कि JSON) |
||||||
| इमेज | ||||||
| ऑडियो | ||||||
| ऑडियो (स्ट्रीमिंग) | ||||||
इस्तेमाल की जा सकने वाली फ़ाइल टाइप के बारे में जानने के लिए, इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें लेख पढ़ें.
इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएँ और क्षमताएँ काम करती हैं:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (जनरेट करें) | Imagen (क्षमता) | |
|---|---|---|---|---|---|---|
| सोचना | ||||||
| सिर्फ़ टेक्स्ट या मल्टीमॉडल इनपुट से टेक्स्ट जनरेट करना | इंटरलीव किया गया हो या इमेज का हिस्सा हो | सिर्फ़ स्ट्रीमिंग | ||||
|
इमेज जनरेट करें (Gemini या Imagen) |
||||||
|
इमेज में बदलाव करें (Gemini या Imagen) |
||||||
| ऑडियो जनरेट करना | सिर्फ़ स्ट्रीमिंग | |||||
|
स्ट्रक्चर्ड आउटपुट जनरेट करना
(जैसे कि JSON) |
||||||
|
दस्तावेज़ों का विश्लेषण करना
(PDF या सामान्य टेक्स्ट) |
||||||
| इमेज का विश्लेषण करना (विजन) | ||||||
| वीडियो का विश्लेषण करें (विजन) | ||||||
| ऑडियो का विश्लेषण करना | सिर्फ़ स्ट्रीमिंग | |||||
| एक से ज़्यादा बार चैट करना | ||||||
| दोनों ओर से मल्टीमॉडल स्ट्रीमिंग | ||||||
| फ़ंक्शन कॉलिंग | ||||||
| कोड को चलाने की सुविधा | ||||||
| Google Search की मदद से, ज़्यादा जानकारी पाना | ||||||
| सिस्टम के लिए निर्देश | ||||||
| टोकन की संख्या गिनना |
खासियतें और सीमाएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएँ लागू होती हैं:
| प्रॉपर्टी |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (जनरेट करें) | Imagen (क्षमता) |
|---|---|---|---|---|---|---|
| कॉन्टेक्स्ट विंडो * टोकन की कुल सीमा (इनपुट+आउटपुट मिलाकर) |
10 लाख टोकन | 10,48,576 टोकन | 32,768 टोकन | 32,768 टोकन | 480 टोकन | 480 टोकन |
| आउटपुट टोकन की सीमा * | 64 हज़ार टोकन | 65,536 टोकन | 8,192 टोकन | 8,192 टोकन | --- | --- |
| जानकारी न मिलने की तारीख | जनवरी 2025 | जनवरी 2025 | जून 2025 | अगस्त 2024 | --- | --- |
| PDF (हर अनुरोध के लिए) | ||||||
| इनपुट की गई PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या ** |
900 फ़ाइलें | 3,000 फ़ाइलें | तीन फ़ाइलें | --- | --- | --- |
| इनपुट की गई हर PDF फ़ाइल में ज़्यादा से ज़्यादा पेज की संख्या ** |
900 पेज | 1,000 पेज | 3 पेज | --- | --- | --- |
| हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़ |
50 एमबी | 50 एमबी | 50 एमबी | --- | --- | --- |
| इमेज (हर अनुरोध के लिए) | ||||||
| इनपुट इमेज की ज़्यादा से ज़्यादा संख्या |
1,000 इमेज | 3,000 इमेज | तीन इमेज | --- | --- | चार इमेज |
| आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या |
--- | --- | 10 इमेज | --- | चार इमेज | चार इमेज |
| हर इनपुट के लिए, base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ |
7 एमबी | 7 एमबी | 7 एमबी | --- | --- | --- |
| वीडियो (हर अनुरोध के लिए) | ||||||
| इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
10 फ़ाइलें | 10 फ़ाइलें | --- | --- | --- | --- |
| सभी इनपुट वीडियो (सिर्फ़ फ़्रेम) की ज़्यादा से ज़्यादा लंबाई |
~60 मिनट | ~60 मिनट | --- | --- | --- | --- |
| सभी इनपुट वीडियो (फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा लंबाई |
~45 मिनट | ~45 मिनट | --- | --- | --- | --- |
| ऑडियो (हर अनुरोध के लिए) | ||||||
| इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
1 फ़ाइल | 1 फ़ाइल | --- | --- | --- | --- |
| आउटपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
--- | --- | --- | --- | --- | --- |
| सभी इनपुट ऑडियो की ज़्यादा से ज़्यादा अवधि |
~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | --- | --- | --- |
| सभी आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई |
--- | --- | --- | --- | --- | --- |
*
सभी Gemini मॉडल के लिए, एक टोकन का मतलब करीब चार वर्ण होता है. इसलिए, 100 टोकन का मतलब अंग्रेज़ी के करीब 60 से 80 शब्द होते हैं. Gemini मॉडल के लिए, countTokens का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या का पता लगाया जा सकता है.
** PDF को इमेज माना जाता है. इसलिए, PDF के एक पेज को एक इमेज माना जाता है. अनुरोध में शामिल किए जा सकने वाले पेजों की संख्या, मॉडल के साथ काम करने वाली इमेज की संख्या से ज़्यादा नहीं होनी चाहिए.
ज़्यादा जानकारी पाना
हर मॉडल के लिए, कोटा और कीमत अलग-अलग होती है. कीमत, इनपुट और आउटपुट पर भी निर्भर करती है.
इनपुट फ़ाइल के लिए इस्तेमाल किए जा सकने वाले फ़ाइल टाइप, MIME टाइप तय करने का तरीका, और यह पक्का करने का तरीका जानें कि आपकी इनपुट फ़ाइलें और मल्टीमॉडल अनुरोध, इनपुट फ़ाइल के लिए इस्तेमाल किए जा सकने वाले फ़ाइल टाइप और ज़रूरी शर्तों में बताई गई ज़रूरी शर्तों को पूरा करते हों और सबसे सही तरीकों का पालन करते हों.
मॉडल के वर्शन और नाम रखने के पैटर्न
मॉडल, स्टेबल, प्रीव्यू, और एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन में उपलब्ध होते हैं. आसानी के लिए, वर्शन की वैल्यू के बिना इस्तेमाल किए जाने वाले उपनामों का इस्तेमाल किया जा सकता है.
अपने कोड में इस्तेमाल करने के लिए, मॉडल के नाम ढूंढने के लिए, इस पेज पर नीचे दिया गया "उपलब्ध मॉडल के नाम" सेक्शन देखें.
| वर्शन का टाइप / रिलीज़ का चरण |
ब्यौरा | मॉडल के नाम का पैटर्न | |
|---|---|---|---|
| Stable |
स्टेबल वर्शन, रिलीज़ की तारीख से प्रोडक्शन में इस्तेमाल के लिए उपलब्ध होते हैं और इनका इस्तेमाल किया जा सकता है.
|
|
|
| अपने-आप अपडेट होने वाला स्टेबल एलियास (सिर्फ़ Gemini 2.0 मॉडल के लिए) |
अपने-आप अपडेट होने वाले स्टेबल एलियास हमेशा उस मॉडल के स्टेबल नए वर्शन की ओर इशारा करते हैं.
|
सिर्फ़ Gemini 2.0 मॉडल
उदाहरण: |
|
| झलक देखें |
प्रीव्यू वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता है.
|
प्रीव्यू वर्शन के मॉडल के नामों में
उदाहरण: |
|
| एक्सपेरिमेंटल |
एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन में नई सुविधाएं होती हैं. हालांकि, इन्हें स्टेबल नहीं माना जाता.
|
एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन के मॉडल के नाम के साथ
उदाहरण: |
|
| रिटायर्ड |
बंद किए गए वर्शन, बंद होने की तारीख के बाद उपलब्ध नहीं होते हैं. इन्हें हमेशा के लिए बंद कर दिया जाता है.
|
--- |
|
उपलब्ध मॉडल के नाम
मॉडल के नाम, वे वैल्यू होती हैं जिन्हें मॉडल को शुरू करते समय अपने कोड में शामिल किया जाता है.
Gemini मॉडल के नामों पर जाएं Imagen मॉडल के नामों पर जाएं
प्रोग्राम के हिसाब से, सभी उपलब्ध मॉडल की सूची बनाना
REST API का इस्तेमाल करके, उपलब्ध सभी मॉडल के नाम देखे जा सकते हैं:
Gemini Developer API:
models.listएंडपॉइंट को कॉल करेंVertex AI Gemini API:
publishers.models.listएंडपॉइंट को कॉल करें
ध्यान दें कि इस सूची में, एपीआई उपलब्ध कराने वाली कंपनियों के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Firebase AI Logic सिर्फ़ इस पेज पर बताए गए Gemini और Imagen मॉडल के साथ काम करता है.
यह भी ध्यान दें कि अपने-आप अपडेट होने वाले एलियास (उदाहरण के लिए, gemini-2.0-flash) लिस्ट नहीं किए जाते, क्योंकि ये बुनियादी मॉडल के लिए सुविधा एलियास होते हैं.
Gemini मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरण देखने के लिए, शुरुआती निर्देश देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानकारी के लिए, मॉडल वर्शनिंग और नाम रखने के पैटर्न देखें. खास तौर पर, इस्तेमाल के उदाहरण, बिलिंग, और बंद करने के बारे में जानकारी देखें.
Gemini 3 Pro मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-3-pro-preview |
Gemini 3 Pro के झलक वर्शन के बारे में जानकारी | झलक देखें | 2025-11-18 | निर्धारण शेष |
Gemini 2.5 Pro मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro का स्टेबल वर्शन | स्टेबल | 2025-06-17 | 2026-06-17 से पहले की नहीं होनी चाहिए |
Gemini 2.5 Flash मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash का स्टेबल वर्शन | स्टेबल | 2025-06-17 | 2026-06-17 से पहले की नहीं होनी चाहिए |
Gemini 2.5 Flash‑Lite मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite का स्टेबल वर्शन | स्टेबल | 2025-07-22 | 2026-07-22 से पहले की नहीं होनी चाहिए |
Gemini 2.5 Flash Image मॉडल के नाम (इन्हें "नैनो बनाना" भी कहा जाता है)
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-2.5-flash-image |
Gemini 2.5 Flash Image (इसे "nano banana" भी कहा जाता है) का स्टेबल वर्शन | स्टेबल | 2025-10-02 | 2026-10-02 से पहले की नहीं होनी चाहिए |
Gemini 2.5 Flash Live मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-live-2.5-flash |
Gemini 2.5 Flash Live का स्टेबल वर्शन | स्टेबल (निजी GA) 1 |
2025-06-01 | 2026-06-01 से पहले नहीं |
gemini-live-2.5-flash-preview 2 |
Gemini 2.5 Flash Live के लिए झलक वाला वर्शन | झलक देखें | 2025-06-01 | निर्धारण शेष |
Firebase AI Logic, अभी नेटिव ऑडियो मॉडल (जैसे कि gemini-2.5-flash-native-audio-preview-09-2025) के साथ काम नहीं करता.
1 ऐक्सेस का अनुरोध करने के लिए, Google Cloud खाते की टीम के प्रतिनिधि से संपर्क करें. 2 Vertex AI Gemini API में यह सुविधा काम नहीं करती है. इसे किसी भी तरीके से ऐक्सेस नहीं किया जा सकता.
Gemini 2.0 Flash Live मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Gemini 2.0 Flash Live का स्टेबल वर्शन | स्टेबल | 2025-04-01 | 2026-04-01 से पहले नहीं |
gemini-2.0-flash-live-preview-04-09 |
Gemini 2.0 Flash Live के लिए झलक वाला वर्शन | झलक देखें | 2025-04-09 | निर्धारण शेष |
2 Vertex AI Gemini API के साथ काम नहीं करता है. इसे किसी भी तरीके से ऐक्सेस नहीं किया जा सकता.
Imagen मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरण देखने के लिए, Imagen की मदद से इमेज जनरेट करने से जुड़ी गाइड देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानकारी के लिए, मॉडल वर्शनिंग और नाम रखने के पैटर्न देखें. खास तौर पर, इस्तेमाल के उदाहरण, बिलिंग, और बंद करने के बारे में जानकारी देखें.
Imagen 4 मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4 का स्टेबल वर्शन | स्टेबल | 2025-08-14 | 2026-08-14 से पहले की नहीं होनी चाहिए |
Imagen 4 Fast मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast का स्टेबल वर्शन | स्टेबल | 2025-08-14 | 2026-08-14 से पहले की नहीं होनी चाहिए |
Imagen 4 Ultra मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra का स्टेबल वर्शन | स्टेबल | 2025-08-14 | 2026-08-14 से पहले की नहीं होनी चाहिए |
Imagen 3 Capability मॉडल के नाम
| मॉडल का नाम | ब्यौरा | रिलीज़ का चरण | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Imagen 3 Capability का शुरुआती स्टेबल वर्शन | स्टेबल | 2024-12-10 | 2025-12-10 से पहले की तारीख नहीं होनी चाहिए |
3 Gemini Developer API के साथ काम नहीं करता, भले ही इसे किसी भी तरीके से ऐक्सेस किया जाए.
यह सुविधा इन भाषाओं में काम करती है
Gemini
सभी Gemini मॉडल, इन भाषाओं में समझ सकते हैं और जवाब दे सकते हैं:
अरेबिक (ar), बंगाली (bn), बल्गेरियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डैनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लैटवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चुगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), तुर्किश (tr), यूक्रेनियन (uk), वियतनामी (vi)
Gemini 2.0 Flash, Gemini 1.5 Pro, और Gemini 1.5 Flash मॉडल, यहां दी गई अतिरिक्त भाषाओं में समझ सकते हैं और जवाब दे सकते हैं:
अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़रबैजानी (az), बेलारूशियन (be), बोस्नियन (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दिवेही (dv), एस्पेरांतो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपीनो (टैगैलॉग) (fil), फ़्रिसियन (fy), आइरिश (ga), स्कॉट्स गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतियन क्रियोल (ht), आर्मेनियन (hy), इग्बो (ig), आइसलैंडिक (is), जावानीज़ (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दिश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मालागासी (mg), माओरी (mi), मेसिडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मैतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टिज़ (mt), म्यांमार (बर्मी) (my), नेपाली (ne), न्यंजा (चिचेवा) (ny), ओडिया (उड़िया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंहला (सिंहाला) (si), समोअन (sm), शोना (sn), सोमाली (so), अल्बानियन (sq), सेसोथो (st), सुंडानीज़ (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइगर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), यिडिश (yi), योरुबा (yo), ज़ुलु (zu)
Imagen
सामान्य रूप से उपलब्ध: अंग्रेज़ी
झलक: चाइनीज़ (सिम्प्लिफ़ाइड), चाइनीज़ (ट्रेडिशनल), हिन्दी, जैपनीज़, कोरियन, पॉर्चुगीज़, स्पैनिश
पिछले मॉडल के बारे में जानकारी
ये मॉडल चालू हैं, लेकिन पिछली जनरेशन के हैं. हमारा सुझाव है कि जहां मुमकिन हो वहां किसी नए मॉडल का इस्तेमाल करें.
Gemini मॉडल
| मॉडल | इनपुट | आउटपुट | ब्यौरा |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अगली पीढ़ी की सुविधाओं और बेहतर क्षमताओं वाला हमारा मल्टीमॉडल. इसमें ये सुविधाएँ शामिल हैं: बेहतर स्पीड, बिल्ट-इन टूल का इस्तेमाल, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | यह हमारा सबसे तेज़ और किफ़ायती Flash मॉडल है. यह 1.5 Flash के उपयोगकर्ताओं के लिए अपग्रेड का विकल्प है. इससे उन्हें उसी कीमत और स्पीड में बेहतर क्वालिटी मिलती है. |
Imagen मॉडल
| मॉडल | इनपुट | आउटपुट | ब्यौरा |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
टेक्स्ट | इमेज | नैचुरल लैंग्वेज में दिए गए टेक्स्ट प्रॉम्प्ट से, असल जैसी अच्छी क्वालिटी वाली इमेज जनरेट करता है |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
टेक्स्ट | इमेज | यह प्रोटोटाइपिंग या कम समय में इस्तेमाल किए जाने वाले मामलों के लिए इमेज जनरेट करता है |
2 Gemini Developer API में इसका इस्तेमाल नहीं किया जा सकता. भले ही, इसे किसी भी तरीके से ऐक्सेस किया जाए.
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- एक से ज़्यादा बार बातचीत (चैट) करने की सुविधा बनाएं.
- सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करना.
- इमेज, PDF, वीडियो, और ऑडियो जैसे अलग-अलग फ़ाइल टाइप का इस्तेमाल करके, टेक्स्ट जनरेट किया जा सकता है.
- टेक्स्ट और मल्टीमॉडल, दोनों तरह के प्रॉम्प्ट से स्ट्रक्चर्ड आउटपुट (जैसे कि JSON) जनरेट करना.
- टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करें (Gemini या Imagen).
- Gemini Live API का इस्तेमाल करके, स्ट्रीम इनपुट और आउटपुट (इसमें ऑडियो भी शामिल है) करें.
- Gemini मॉडल को अपने ऐप्लिकेशन के अन्य हिस्सों और बाहरी सिस्टम और जानकारी से कनेक्ट करने के लिए, टूल (जैसे, फ़ंक्शन कॉलिंग और Google Search के साथ ग्राउंडिंग) का इस्तेमाल करें.