با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، کیت‌های توسعه نرم‌افزار Firebase AI Logic به شما امکان می‌دهند مستقیماً از طریق برنامه خود با مدل‌های Gemini و Imagen پشتیبانی‌شده تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدل‌های Imagen را می‌توان با متن برای تولید تصاویر تحریک کرد.

همچنین، سوالات متداول ما را در مورد تمام مدل‌هایی که Firebase AI Logic پشتیبانی می‌کند و پشتیبانی نمی‌کند، بررسی کنید.

مدل‌های عمومی

پرش به مقایسه مدل‌ها

باهوش‌ترین مدل ما

gemini-3-pro-preview

بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنی‌تر و تعامل عمیق‌تری را ارائه می‌دهد، و همگی بر پایه استدلال پیشرفته ساخته شده‌اند. (ارائه صورتحساب الزامی است)


مدل تفکر پیشرفته ما

gemini-2.5-pro

مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه داده‌های بزرگ، پایگاه‌های کد و اسناد با استفاده از متن طولانی.

سریع و هوشمند

gemini-2.5-flash

بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیت‌های جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است.

فوق العاده سریع

gemini-2.5-flash-lite

سریع‌ترین مدل فلش ما برای صرفه‌جویی در هزینه و توان عملیاتی بالا بهینه شده است.

مدل‌های تولید تصویر

شما می‌توانید تصاویر را با مدل‌های Gemini یا Imagen تولید کنید.

پرش به مقایسه مدل‌ها

جوزا

gemini-3-pro-image-preview

طراحی شده برای تولید حرفه‌ای دارایی‌ها و دستورالعمل‌های پیچیده. این نرم‌افزار با استفاده از جستجوی گوگل، یک فرآیند پیش‌فرض «تفکر» که ترکیب‌بندی را قبل از تولید اصلاح می‌کند، زمینه‌سازی در دنیای واقعی را ارائه می‌دهد و می‌تواند تصاویری با وضوح حداکثر 4K تولید کند. (نیازمند پرداخت صورتحساب)

gemini-2.5-flash-image

طراحی شده برای سرعت و کارایی. برای کارهای با حجم بالا و تأخیر کم بهینه شده و تصاویر را با وضوح 1024 پیکسل تولید می‌کند. (نیاز به پرداخت صورتحساب)

ایمیجِن

imagen-4.0-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

imagen-4.0-fast-generate-001

تصاویر را برای نمونه‌سازی اولیه یا موارد استفاده با تأخیر کم تولید می‌کند. (نیاز به پرداخت صورتحساب)

imagen-4.0-ultra-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

پرش به مقایسه مدل‌ها

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند.

مدل‌های نسل قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

پرش به مقایسه مدل‌ها

مدل‌های جمینی

مدل نسل دوم و کارآمد ما

gemini-2.0-flash-001

مدل نسل دوم و قدرتمند ما، با پنجره‌ی زمینه‌ی ۱ میلیون توکن. ویژگی‌های نسل بعدی و قابلیت‌های بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه می‌دهد.

مدل سریع نسل دوم ما

gemini-2.0-flash-lite-001

مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهره‌وری هزینه و تأخیر کم.


ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .



مقایسه مدل‌ها

هر مدل قابلیت‌های متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح می‌دهند. هر مدل ممکن است قابلیت‌های اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید:

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
انواع ورودی
متن (پخش جریانی)
کد
اسناد
(پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو (پخش جریانی)
صوتی (پخش جریانی)
انواع خروجی
متن
متن (پخش) (رونویسی)
کد
خروجی ساختاریافته
(مثل جیسون)
تصاویر
صوتی (پخش جریانی)

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

این قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی به صورت لایه لایه یا به عنوان بخشی از تصویر به صورت لایه لایه یا به عنوان بخشی از تصویر فقط رونویسی
تولید تصاویر
( جوزا یا ایمیجن )
ویرایش تصاویر
( جوزا یا ایمیجن )
تولید صدا فقط پخش جریانی
تولید خروجی ساختاریافته
(مثل جیسون)
اسناد را تجزیه و تحلیل کنید
(پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی) فقط پخش جریانی
تجزیه و تحلیل صدا فقط پخش جریانی
چت چند نوبتی فقط پخش جریانی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌ها

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
محدودیت توکن ورودی * ۱,۰۴۸,۵۷۶ توکن ۶۵,۵۳۶ توکن ۱,۰۴۸,۵۷۶ توکن ۳۲۷۶۸ توکن ۳۲ هزار توکن (پیش‌فرض؛ قابل ارتقا به ۱۲۸ هزار) ۴۸۰ توکن ۴۸۰ توکن
محدودیت توکن خروجی * ۶۵,۵۳۶ توکن ۳۲۷۶۸ توکن ۶۵,۵۳۶ توکن ۸,۱۹۲ توکن ۶۴ هزار توکن --- ---
تاریخ پایان دانش ژانویه ۲۰۲۵ ژانویه ۲۰۲۵ ژانویه ۲۰۲۵ ژوئن ۲۰۲۵ ژانویه ۲۰۲۵ --- ---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد
از فایل‌های PDF ورودی **
۹۰۰ فایل ۱۴ فایل ۳۰۰۰ فایل ۳ فایل --- --- ---
حداکثر تعداد
از صفحات
به ازای هر فایل PDF ورودی **
۹۰۰ صفحه ۱۴ صفحه ۱۰۰۰ صفحه ۳ صفحه --- --- ---
حداکثر اندازه
به ازای هر فایل PDF ورودی
۵۰ مگابایت ۵۰ مگابایت ۵۰ مگابایت ۵۰ مگابایت --- --- ---
تصاویر (بنا به درخواست)
حداکثر تعداد
از تصاویر ورودی
۱۰۰۰ تصویر ۱۴ تصویر ۳۰۰۰ تصویر ۳ تصویر --- --- ۴ تصویر
حداکثر تعداد
از تصاویر خروجی
--- ۱۰ تصویر --- ۱۰ تصویر --- ۴ تصویر ۴ تصویر
حداکثر اندازه
تصویر کدگذاری شده با base64 به ازای هر ورودی
۷ مگابایت ۷ مگابایت ۷ مگابایت ۷ مگابایت --- --- ---
ویدئو (به درخواست)
حداکثر تعداد
از فایل‌های ویدیویی ورودی
۱۰ فایل --- ۱۰ فایل --- --- --- ---
حداکثر طول
از تمام ویدیوهای ورودی
(فقط قاب‌ها)
حدود ۶۰ دقیقه --- حدود ۶۰ دقیقه --- --- --- ---
حداکثر طول
از تمام ویدیوهای ورودی
(فریم‌ها + صدا)
حدود ۴۵ دقیقه --- حدود ۴۵ دقیقه --- --- --- ---
صدا (به درخواست)
حداکثر تعداد
از فایل‌های صوتی ورودی
۱ فایل --- ۱ فایل --- --- --- ---
حداکثر تعداد
از فایل‌های صوتی خروجی
--- --- --- --- --- --- ---
حداکثر طول
از تمام صداهای ورودی
حدود ۸.۴ ساعت --- حدود ۸.۴ ساعت --- --- --- ---
حداکثر طول
از تمام صداهای خروجی
--- --- --- --- --- --- ---

* برای همه مدل‌های Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل توکن‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.

** فایل‌های PDF به عنوان تصویر در نظر گرفته می‌شوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته می‌شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می‌تواند پشتیبانی کند.

*** مدل‌های Gemini 2.5 Flash-Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند.

اطلاعات دقیق اضافی را پیدا کنید



الگوهای نسخه‌بندی و نامگذاری مدل

مدل‌ها در نسخه‌های پایدار ، پیش‌نمایش و آزمایشی ارائه می‌شوند. برای راحتی، از نام‌های مستعار بدون مقادیر نسخه صریح پشتیبانی می‌شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه /
مرحله انتشار
توضیحات الگوی نام مدل
پایدار نسخه‌های پایدار از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند.
  • یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.
  • مدل‌های جمینی ۲.۵
    نام مدل‌های نسخه‌های پایدار پسوند ندارند

    مثال: gemini-2.5-pro

  • مدل‌های Gemini 2.0 و Imagen
    نام مدل‌های نسخه‌های پایدار با یک شماره نسخه سه رقمی خاص ضمیمه می‌شوند

    مثال: gemini-2.0-flash-001
    مثال:
    imagen-3.0-generate-002

نام مستعار پایدار با به‌روزرسانی خودکار
(فقط مدل‌های Gemini 2.0 )
نام‌های مستعار پایدار که به صورت خودکار به‌روزرسانی می‌شوند، همیشه به آخرین نسخه پایدار آن مدل اشاره می‌کنند.
  • اگر نسخه پایدار جدیدی منتشر شود، نام مستعار به‌روزرسانی‌شده خودکار به‌طور خودکار شروع به اشاره به آن نسخه پایدار جدید می‌کند.

فقط مدل‌های Gemini 2.0
نام‌های مدلِ مستعار پسوند ندارند

مثال: gemini-2.0-flash

پیش‌نمایش نسخه‌های پیش‌نمایش دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند .
  • این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند.
  • این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند.
  • برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های پیش‌نمایش منتشر شده پس از ژوئن ۲۰۲۵ معمولاً از شما می‌خواهند که موقعیت مکانی مدل را روی global تنظیم کنید .

نام مدل‌های نسخه‌های پیش‌نمایش به همراه ... پیوست شده‌اند. -preview و اغلب تاریخ انتشار مدل ( -MM-DD برای مدل‌های قدیمی‌تر یا (برای مدل‌های جدیدتر -MM-YYYY )

مثال‌ها:
gemini-2.5-flash-preview-04-17
(منتشر شده در ۱۷ آوریل ۲۰۲۵)
یا
gemini-2.5-flash-preview-09-2025
(منتشر شده در سپتامبر ۲۰۲۵)
یا
gemini-3-pro-preview
(منتشر شده در نوامبر ۲۰۲۵)

تجربی نسخه‌های آزمایشی قابلیت‌های جدیدی دارند و پایدار تلقی نمی‌شوند .
  • این مدل‌ها برای استفاده در محیط تولید توصیه نمی‌شوند و محدودیت‌های نرخ بیشتری دارند. مدل‌های آزمایشی برای جمع‌آوری بازخورد و امکان آزمایش با جدیدترین ویژگی‌های ما در نظر گرفته شده‌اند.
  • این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند.
  • برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های آزمایشی که پس از ژوئن ۲۰۲۵ منتشر شده‌اند، شما را ملزم می‌کنند که موقعیت مکانی مدل را روی global تنظیم کنید .

نام مدل‌های نسخه‌های آزمایشی به همراه ... پیوست شده است. -exp به همراه تاریخ انتشار مدل ( -MM-DD )

مثال: gemini-2.5-pro-exp-03-25
(منتشر شده در ۲۵ مارس ۲۰۲۵)

بازنشسته نسخه‌های از رده خارج شده، تاریخ انقضایشان گذشته و برای همیشه غیرفعال شده‌اند.
  • مدل‌های منسوخ‌شده دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیستند و درخواستی که از نام مدل منسوخ‌شده استفاده می‌کند، خطای ۴۰۴ را برمی‌گرداند.

---



نام مدل‌های موجود

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

پرش به نام مدل‌های پرش به نام مدل‌های Imagen

لیست کردن تمام مدل‌های موجود به صورت برنامه‌نویسی شده

شما می‌توانید با استفاده از REST API، نام تمام مدل‌های موجود را فهرست کنید:

توجه داشته باشید که این لیست برگشتی شامل تمام مدل‌های پشتیبانی‌شده توسط ارائه‌دهندگان API خواهد بود، اما Firebase AI Logic فقط از مدل‌های Gemini و Imagen که در این صفحه توضیح داده شده‌اند، پشتیبانی می‌کند. همچنین توجه داشته باشید که نام‌های مستعار به‌روزرسانی‌شده خودکار (به عنوان مثال، gemini-2.0-flash ) در فهرست قرار نگرفته‌اند زیرا آنها یک نام مستعار برای مدل پایه هستند.

نام مدل‌های جمینی

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای شروع به کار مراجعه کنید.

برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخه‌بندی و نامگذاری مدل مراجعه کنید.

نام مدل‌های جمینی ۳ پرو

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-3-pro-preview نسخه پیش‌نمایش Gemini 3 Pro پیش‌نمایش ۲۰۲۵-۱۱-۱۸ تعیین خواهد شد

نام مدل‌های Gemini 3 Pro Image (معروف به "nano banana pro")

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-3-pro-image-preview نسخه پیش‌نمایش تصویر Gemini 3 Pro
(معروف به "نانو موز پرو")
پیش‌نمایش ۲۰۲۵-۱۱-۲۰ تعیین خواهد شد

نام مدل‌های Gemini 2.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-2.5-pro نسخه پایدار Gemini 2.5 Pro پایدار ۲۰۲۵-۰۶-۱۷ نه زودتر از
۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-2.5-flash نسخه پایدار Gemini 2.5 Flash پایدار ۲۰۲۵-۰۶-۱۷ نه زودتر از
۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash‑Lite

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-2.5-flash-lite نسخه پایدار Gemini 2.5 Flash‑Lite پایدار ۲۰۲۵-۰۷-۲۲ نه زودتر از
۲۰۲۶-۰۷-۲۲

نام مدل‌های تصویر فلش Gemini 2.5 (معروف به "نانو موز")

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-2.5-flash-image نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز") پایدار ۲۰۲۵-۱۰-۰۲ نه زودتر از
۲۰۲۶-۱۰-۰۲

نام مدل‌های Gemini 2.5 Flash Live

مدل‌های Gemini 2.5 Flash Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند. اگرچه این مدل بسته به ارائه‌دهنده Gemini API نام‌های مختلفی دارد، اما رفتار و ویژگی‌های مدل یکسان است.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی
نام مدل
توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-2.5-flash-native-audio-preview-12-2025 ۱ آخرین نسخه پیش‌نمایش برای Live API در Gemini Developer API پیش‌نمایش ۲۰۲۵-۱۲-۱۲ تعیین خواهد شد
gemini-2.5-flash-native-audio-preview-09-2025 ۱ نسخه پیش‌نمایش اولیه برای Live API در Gemini Developer API پیش‌نمایش ۲۰۲۵-۰۹-۱۸ تعیین خواهد شد
Vertex AI Gemini API
نام مدل
توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
gemini-live-2.5-flash-native-audio شده‌اند نسخه پایدار برای Live API روی API Vertex AI Gemini پایدار ۲۰۲۵-۱۲-۱۲ نه زودتر از
۲۰۲۶-۱۲-۱۲
gemini-live-2.5-flash-preview-native-audio-09-2025 2 نسخه پیش‌نمایش برای Live API در Vertex AI Gemini API پیش‌نمایش ۲۰۲۵-۰۹-۱۸ تعیین خواهد شد

۱ فقط توسط رابط برنامه‌نویسی نرم‌افزار Gemini Developer پشتیبانی می‌شود. همچنین، اگرچه اینها مدل‌های پیش‌نمایش هستند، اما در «ردیف رایگان» رابط برنامه‌نویسی نرم‌افزار Gemini Developer در دسترس هستند.
۲ فقط توسط Vertex AI Gemini API پشتیبانی می‌شود. همچنین، این مدل‌ها در موقعیت global پشتیبانی نمی‌شوند.

نام مدل‌های ایمیجن

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای تولید تصاویر با Imagen مراجعه کنید.

برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخه‌بندی و نامگذاری مدل مراجعه کنید.

نام مدل‌های ایمیجن ۴

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
imagen-4.0-generate-001 نسخه پایدار Imagen 4 پایدار ۱۴-۰۸-۲۰۲۵ زودتر از 2026-08-14 مجاز نیست

نام مدل‌های Imagen 4 Fast

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
imagen-4.0-fast-generate-001 نسخه پایدار Imagen 4 Fast پایدار ۱۴-۰۸-۲۰۲۵ زودتر از 2026-08-14 مجاز نیست

نام مدل‌های ایمیجن ۴ اولترا

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
imagen-4.0-ultra-generate-001 نسخه پایدار Imagen 4 Ultra پایدار ۱۴-۰۸-۲۰۲۵ زودتر از 2026-08-14 مجاز نیست

نام مدل‌های قابلیت Imagen 3

نام مدل توضیحات مرحله انتشار تاریخ انتشار تاریخ بازنشستگی
imagen-3.0-capability-001 2 نسخه پایدار اولیه قابلیت Imagen 3 پایدار ۲۰۲۴-۱۲-۱۰ زودتر از 2025-12-10

۲- صرف نظر از نحوه دسترسی شما، توسط رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini پشتیبانی نمی‌شود.



زبان‌های پشتیبانی‌شده

جوزا

  • تمام مدل‌های Gemini می‌توانند زبان‌های زیر را درک کرده و به آنها پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده‌شده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، کره‌ای (ko)، لتونیایی (lv)، لیتوانیایی (lt)، نروژی (no)، لهستانی (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (uk)، ویتنامی (vi)

  • مدل‌های Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند زبان‌های اضافی زیر را درک کرده و به آنها پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مقدونی، مالاگاسی (mk)، مالایالام (ml)، مغولی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (Pa), Pashtoinhales (Pashto) (si)، ساموآیی (sm)، شونا (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغور (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)

ایمیجِن

  • دسترسی عمومی : انگلیسی

  • پیش‌نمایش : چینی (ساده‌شده)، چینی (سنتی)، هندی، ژاپنی، کره‌ای، پرتغالی، اسپانیایی



اطلاعات مربوط به مدل‌های قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

مدل‌های جمینی

  • gemini-2.0-flash-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash )
  • gemini-2.0-flash-lite-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash-lite )

برای اطلاعات بیشتر در مورد مدل‌های قدیمی‌تر Gemini Live API ، به مستندات ارائه‌دهنده Gemini API مراجعه کنید:

مدل‌های ایمیجن

  • imagen-3.0-generate-002
  • imagen-3.0-fast-generate-001



مراحل بعدی

قابلیت‌های رابط برنامه‌نویسی Gemini را امتحان کنید

،

برای برنامه‌های موبایل و وب، کیت‌های توسعه نرم‌افزار Firebase AI Logic به شما امکان می‌دهند مستقیماً از طریق برنامه خود با مدل‌های Gemini و Imagen پشتیبانی‌شده تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدل‌های Imagen را می‌توان با متن برای تولید تصاویر تحریک کرد.

همچنین، سوالات متداول ما را در مورد تمام مدل‌هایی که Firebase AI Logic پشتیبانی می‌کند و پشتیبانی نمی‌کند، بررسی کنید.

مدل‌های عمومی

پرش به مقایسه مدل‌ها

باهوش‌ترین مدل ما

gemini-3-pro-preview

بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنی‌تر و تعامل عمیق‌تری را ارائه می‌دهد، و همگی بر پایه استدلال پیشرفته ساخته شده‌اند. (ارائه صورتحساب الزامی است)


مدل تفکر پیشرفته ما

gemini-2.5-pro

مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه داده‌های بزرگ، پایگاه‌های کد و اسناد با استفاده از متن طولانی.

سریع و هوشمند

gemini-2.5-flash

بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیت‌های جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است.

فوق العاده سریع

gemini-2.5-flash-lite

سریع‌ترین مدل فلش ما برای صرفه‌جویی در هزینه و توان عملیاتی بالا بهینه شده است.

مدل‌های تولید تصویر

شما می‌توانید تصاویر را با مدل‌های Gemini یا Imagen تولید کنید.

پرش به مقایسه مدل‌ها

جوزا

gemini-3-pro-image-preview

طراحی شده برای تولید حرفه‌ای دارایی‌ها و دستورالعمل‌های پیچیده. این نرم‌افزار با استفاده از جستجوی گوگل، یک فرآیند پیش‌فرض «تفکر» که ترکیب‌بندی را قبل از تولید اصلاح می‌کند، زمینه‌سازی در دنیای واقعی را ارائه می‌دهد و می‌تواند تصاویری با وضوح حداکثر 4K تولید کند. (نیازمند پرداخت صورتحساب)

gemini-2.5-flash-image

طراحی شده برای سرعت و کارایی. برای کارهای با حجم بالا و تأخیر کم بهینه شده و تصاویر را با وضوح 1024 پیکسل تولید می‌کند. (نیاز به پرداخت صورتحساب)

ایمیجِن

imagen-4.0-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

imagen-4.0-fast-generate-001

تصاویر را برای نمونه‌سازی اولیه یا موارد استفاده با تأخیر کم تولید می‌کند. (نیاز به پرداخت صورتحساب)

imagen-4.0-ultra-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

پرش به مقایسه مدل‌ها

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند.

مدل‌های نسل قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

پرش به مقایسه مدل‌ها

مدل‌های جمینی

مدل نسل دوم و کارآمد ما

gemini-2.0-flash-001

مدل نسل دوم و قدرتمند ما، با پنجره‌ی زمینه‌ی ۱ میلیون توکن. ویژگی‌های نسل بعدی و قابلیت‌های بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه می‌دهد.

مدل سریع نسل دوم ما

gemini-2.0-flash-lite-001

مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهره‌وری هزینه و تأخیر کم.


ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .



مقایسه مدل‌ها

هر مدل قابلیت‌های متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح می‌دهند. هر مدل ممکن است قابلیت‌های اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید:

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
انواع ورودی
متن (پخش جریانی)
کد
اسناد
(پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو (پخش جریانی)
صوتی (پخش جریانی)
انواع خروجی
متن
متن (پخش) (رونویسی)
کد
خروجی ساختاریافته
(مثل جیسون)
تصاویر
صوتی (پخش جریانی)

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

این قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی به صورت لایه لایه یا به عنوان بخشی از تصویر به صورت لایه لایه یا به عنوان بخشی از تصویر فقط رونویسی
تولید تصاویر
( جوزا یا ایمیجن )
ویرایش تصاویر
( جوزا یا ایمیجن )
تولید صدا فقط پخش جریانی
تولید خروجی ساختاریافته
(مثل جیسون)
اسناد را تجزیه و تحلیل کنید
(پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی) فقط پخش جریانی
تجزیه و تحلیل صدا فقط پخش جریانی
چت چند نوبتی فقط پخش جریانی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌ها

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک جوزا
۳ پرو
جوزا
۳ پرو
تصویر
جوزا
۲.۵ پرو، فلش، فلش-لایت
جوزا
۲.۵ فلش
تصویر
جوزا
۲.۵ فلش-
زنده ***
تصویر (تولید) تصویر (قابلیت)
محدودیت توکن ورودی * ۱,۰۴۸,۵۷۶ توکن ۶۵,۵۳۶ توکن ۱,۰۴۸,۵۷۶ توکن ۳۲۷۶۸ توکن ۳۲ هزار توکن (پیش‌فرض؛ قابل ارتقا به ۱۲۸ هزار) ۴۸۰ توکن ۴۸۰ توکن
محدودیت توکن خروجی * ۶۵,۵۳۶ توکن ۳۲۷۶۸ توکن ۶۵,۵۳۶ توکن ۸,۱۹۲ توکن ۶۴ هزار توکن --- ---
تاریخ پایان دانش ژانویه ۲۰۲۵ ژانویه ۲۰۲۵ ژانویه ۲۰۲۵ ژوئن ۲۰۲۵ ژانویه ۲۰۲۵ --- ---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد
از فایل‌های PDF ورودی **
۹۰۰ فایل ۱۴ فایل ۳۰۰۰ فایل ۳ فایل --- --- ---
حداکثر تعداد
از صفحات
به ازای هر فایل PDF ورودی **
۹۰۰ صفحه ۱۴ صفحه ۱۰۰۰ صفحه ۳ صفحه --- --- ---
حداکثر اندازه
به ازای هر فایل PDF ورودی
۵۰ مگابایت ۵۰ مگابایت ۵۰ مگابایت ۵۰ مگابایت --- --- ---
تصاویر (بنا به درخواست)
حداکثر تعداد
از تصاویر ورودی
۱۰۰۰ تصویر ۱۴ تصویر ۳۰۰۰ تصویر ۳ تصویر --- --- ۴ تصویر
حداکثر تعداد
از تصاویر خروجی
--- ۱۰ تصویر --- ۱۰ تصویر --- ۴ تصویر ۴ تصویر
حداکثر اندازه
تصویر کدگذاری شده با base64 به ازای هر ورودی
۷ مگابایت ۷ مگابایت ۷ مگابایت ۷ مگابایت --- --- ---
ویدئو (به درخواست)
حداکثر تعداد
از فایل‌های ویدیویی ورودی
۱۰ فایل --- ۱۰ فایل --- --- --- ---
حداکثر طول
از تمام ویدیوهای ورودی
(فقط قاب‌ها)
حدود ۶۰ دقیقه --- حدود ۶۰ دقیقه --- --- --- ---
حداکثر طول
از تمام ویدیوهای ورودی
(فریم‌ها + صدا)
حدود ۴۵ دقیقه --- حدود ۴۵ دقیقه --- --- --- ---
صدا (به درخواست)
حداکثر تعداد
از فایل‌های صوتی ورودی
۱ فایل --- ۱ فایل --- --- --- ---
حداکثر تعداد
از فایل‌های صوتی خروجی
--- --- --- --- --- --- ---
حداکثر طول
از تمام صداهای ورودی
حدود ۸.۴ ساعت --- حدود ۸.۴ ساعت --- --- --- ---
حداکثر طول
از تمام صداهای خروجی
--- --- --- --- --- --- ---

* برای همه مدل‌های Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل توکن‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.

** فایل‌های PDF به عنوان تصویر در نظر گرفته می‌شوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته می‌شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می‌تواند پشتیبانی کند.

*** مدل‌های Gemini 2.5 Flash-Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند.

اطلاعات دقیق اضافی را پیدا کنید



الگوهای نسخه‌بندی و نامگذاری مدل

مدل‌ها در نسخه‌های پایدار ، پیش‌نمایش و آزمایشی ارائه می‌شوند. برای راحتی، از نام‌های مستعار بدون مقادیر نسخه صریح پشتیبانی می‌شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه /
مرحله انتشار
توضیحات الگوی نام مدل
پایدار نسخه‌های پایدار از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند.
  • یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.
  • مدل‌های جمینی ۲.۵
    نام مدل‌های نسخه‌های پایدار پسوند ندارند

    مثال: gemini-2.5-pro

  • مدل‌های Gemini 2.0 و Imagen
    نام مدل‌های نسخه‌های پایدار با یک شماره نسخه سه رقمی خاص ضمیمه می‌شوند

    مثال: gemini-2.0-flash-001
    مثال:
    imagen-3.0-generate-002

نام مستعار پایدار با به‌روزرسانی خودکار
(فقط مدل‌های Gemini 2.0 )
نام‌های مستعار پایدار که به صورت خودکار به‌روزرسانی می‌شوند، همیشه به آخرین نسخه پایدار آن مدل اشاره می‌کنند.
  • اگر نسخه پایدار جدیدی منتشر شود، نام مستعار به‌روزرسانی‌شده خودکار به‌طور خودکار شروع به اشاره به آن نسخه پایدار جدید می‌کند.

فقط مدل‌های Gemini 2.0
نام‌های مدلِ مستعار پسوند ندارند

مثال: gemini-2.0-flash

پیش‌نمایش نسخه‌های پیش‌نمایش دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند .
  • این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند.
  • این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند.
  • برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های پیش‌نمایش منتشر شده پس از ژوئن ۲۰۲۵ معمولاً از شما می‌خواهند که موقعیت مکانی مدل را روی global تنظیم کنید .

Model names of preview versions are appended with -preview and often the model's release date ( -MM-DD for older models or -MM-YYYY for newer models)

مثال‌ها:
gemini-2.5-flash-preview-04-17
(released on April 17, 2025)
یا
gemini-2.5-flash-preview-09-2025
(released in September 2025)
یا
gemini-3-pro-preview
(released in November 2025)

تجربی Experimental versions have new capabilities and are considered not stable .
  • These models are not recommended for production use and come with more restrictive rate limits. Experimental models are intended for gathering feedback and to enable experimentation with our latest features.
  • These models are retired within a few weeks or months after their associated stable version is released.
  • For the Vertex AI Gemini API , experimental models released after June 2025 require you to set the model's location to global .

Model names of experimental versions are appended with -exp along with the model's release date ( -MM-DD )

مثال: gemini-2.5-pro-exp-03-25
(released on March 25, 2025)

بازنشسته Retired versions are past their retirement date and have been permanently deactivated.
  • Retired models are no longer accessible or supported by Google, and a request using a retired model name returns a 404 error.

---



Available model names

Model names are the explicit values that you include in your code during initialization of the model.

Jump to Gemini model names Jump to Imagen model names

Programmatically list all available models

You can list all available models names using the REST API:

Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash ) aren't listed because they're a convenience alias for the base model.

Gemini model names

For initialization examples for your platform, see the getting started guide .

For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .

Gemini 3 Pro model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-3-pro-preview Preview version of Gemini 3 Pro پیش‌نمایش ۲۰۲۵-۱۱-۱۸ تعیین خواهد شد

Gemini 3 Pro Image model names (aka "nano banana pro")

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-3-pro-image-preview Preview version of Gemini 3 Pro Image
(aka "nano banana pro")
پیش‌نمایش ۲۰۲۵-۱۱-۲۰ تعیین خواهد شد

Gemini 2.5 Pro model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-2.5-pro Stable version of Gemini 2.5 Pro پایدار ۲۰۲۵-۰۶-۱۷ No earlier than
2026-06-17

Gemini 2.5 Flash model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-2.5-flash Stable version of Gemini 2.5 Flash پایدار ۲۰۲۵-۰۶-۱۷ No earlier than
2026-06-17

Gemini 2.5 Flash‑Lite model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-2.5-flash-lite Stable version of Gemini 2.5 Flash‑Lite پایدار ۲۰۲۵-۰۷-۲۲ No earlier than
2026-07-22

Gemini 2.5 Flash Image model names (aka "nano banana")

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
gemini-2.5-flash-image Stable version for Gemini 2.5 Flash Image (aka "nano banana") پایدار ۲۰۲۵-۱۰-۰۲ No earlier than
2026-10-02

Gemini 2.5 Flash Live model names

Gemini 2.5 Flash Live models are the native audio models that support the Gemini Live API . Even though the model has different model names depending on the Gemini API provider, the behavior and features of the model are the same.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی
نام مدل
توضیحات Release stage تاریخ انتشار Retirement date
gemini-2.5-flash-native-audio-preview-12-2025 1 Latest preview version for the Live API on the Gemini Developer API پیش‌نمایش ۲۰۲۵-۱۲-۱۲ تعیین خواهد شد
gemini-2.5-flash-native-audio-preview-09-2025 1 Initial preview version for the Live API on the Gemini Developer API پیش‌نمایش ۲۰۲۵-۰۹-۱۸ تعیین خواهد شد
Vertex AI Gemini API
نام مدل
توضیحات Release stage تاریخ انتشار Retirement date
gemini-live-2.5-flash-native-audio 2 Stable version for the Live API on the Vertex AI Gemini API پایدار ۲۰۲۵-۱۲-۱۲ No earlier than
2026-12-12
gemini-live-2.5-flash-preview-native-audio-09-2025 2 Preview version for the Live API on the Vertex AI Gemini API پیش‌نمایش ۲۰۲۵-۰۹-۱۸ تعیین خواهد شد

1 Only supported by the Gemini Developer API . Also, even though these are preview models, they're available on the "free tier" of the Gemini Developer API .
2 Only supported by the Vertex AI Gemini API . Also, these models are not supported in the global location.

Imagen model names

For initialization examples for your platform, see the generate images with Imagen guide .

For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .

Imagen 4 model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
imagen-4.0-generate-001 Stable version of Imagen 4 پایدار ۱۴-۰۸-۲۰۲۵ No earlier than 2026-08-14

Imagen 4 Fast model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
imagen-4.0-fast-generate-001 Stable version of Imagen 4 Fast پایدار ۱۴-۰۸-۲۰۲۵ No earlier than 2026-08-14

Imagen 4 Ultra model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
imagen-4.0-ultra-generate-001 Stable version of Imagen 4 Ultra پایدار ۱۴-۰۸-۲۰۲۵ No earlier than 2026-08-14

Imagen 3 Capability model names

نام مدل توضیحات Release stage تاریخ انتشار Retirement date
imagen-3.0-capability-001 2 Initial stable version of Imagen 3 Capability پایدار ۲۰۲۴-۱۲-۱۰ No earlier than 2025-12-10

2 Not supported by the Gemini Developer API no matter how you access it.



زبان‌های پشتیبانی‌شده

جوزا

  • All the Gemini models can understand and respond in the following languages:

    Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)

  • Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:

    Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

ایمیجِن

  • General availability : English

  • Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish



Information about previous models

The following are active, but previous generation models. We recommend using one of the latest models instead when possible.

مدل‌های جمینی

  • gemini-2.0-flash-001 (and its auto-updated alias gemini-2.0-flash )
  • gemini-2.0-flash-lite-001 (and its auto-updated alias gemini-2.0-flash-lite )

For information about older Gemini Live API models, see the Gemini API provider documentation:

Imagen models

  • imagen-3.0-generate-002
  • imagen-3.0-fast-generate-001



مراحل بعدی

Try out the capabilities of the Gemini API