The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، کیت‌های توسعه نرم‌افزار Firebase AI Logic به شما امکان می‌دهند مستقیماً از طریق برنامه خود با مدل‌های پشتیبانی‌شده Gemini تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند.

همچنین، سوالات متداول ما را در مورد تمام مدل‌هایی که Firebase AI Logic پشتیبانی می‌کند و پشتیبانی نمی‌کند، بررسی کنید.

مدل‌های عمومی

به جداول با جزئیات مدل

مدل‌های عمومی Gemini 3.x

مدل تفکر پیشرفته ما

جمینی ۳.۱ پرو

gemini-3.1-pro-preview

هوش پیشرفته، مهارت‌های حل مسئله پیچیده و قابلیت‌های قدرتمند کدنویسی عاملی و ارتعاشی. (ارائه صورتحساب الزامی است)

سریع و هوشمند

فلش جمینی ۳.۵

gemini-3.5-flash

عملکردی در سطح کلاس Frontier که با کسری از قیمت، مدل‌های بزرگ‌تر را به رقابت می‌خواند. (نیازی به ارائه صورتحساب نیست )

فوق العاده سریع

جمینی ۳.۱ فلش-لایت

gemini-3.1-flash-lite

مدلی کارآمد، مقرون‌به‌صرفه و با حجم تولید بالا، با عملکرد و کیفیت سری Gemini 3. (نیازی به ارائه صورتحساب نیست )

مدل‌های عمومی Gemini 2.5

جمینی ۲.۵ پرو ( gemini-2.5-pro ): پیشرفته‌ترین مدل برای کارهای پیچیده از سری جمینی ۲.۵ ، با قابلیت‌های استدلال عمیق و کدنویسی. (نیازی به پرداخت صورتحساب نیست)
Gemini 2.5 Flash ( gemini-2.5-flash ): بهترین مدل از سری Gemini 2.5 با عملکرد و قیمت مناسب، به ویژه برای کارهای با حجم بالا و تأخیر کم که نیاز به استدلال دارند. (نیازی به پرداخت صورتحساب نیست)
Gemini 2.5 Flash ( gemini-2.5-flash-lite ): سریع‌ترین و مقرون‌به‌صرفه‌ترین مدل چندوجهی سری Gemini 2.5 . (نیازی به ارائه صورتحساب نیست)

مدل‌های تولید تصویر

به جداول با جزئیات مدل

مدل‌های تولید تصویر Gemini 3.x

تصویر Gemini 3 Pro ( نانو موز پرو )

gemini-3-pro-image

مدل‌های پیشرفته تولید و ویرایش تصویر برای خلق تصاویر بومی با بافت بسیار بالا. (ارائه صورتحساب الزامی است)

ایمیج فلش Gemini 3.1 ( نانو موز ۲ )

gemini-3.1-flash-image

تولید و ویرایش تصویر قدرتمند و با راندمان بالا، بهینه شده برای سرعت و موارد استفاده با حجم بالا. (ارائه صورتحساب الزامی است)

ایمیج Gemini 3.1 Flash-Lite ( نانو موز ۲ لایت )

gemini-3.1-flash-lite-image

تولید و ویرایش تصویر با تأخیر بسیار کم و مقرون‌به‌صرفه، طراحی‌شده برای موارد استفاده تعاملی با حجم بالا. (ارائه صورتحساب الزامی است)

مدل‌های تولید تصویر Gemini 2.5

فلش ایمیج Gemini 2.5 ( gemini-2.5-flash-image ، با نام مستعار "Nano Banana"): طراحی شده برای سرعت و کارایی، بهینه شده برای وظایف با حجم بالا و تأخیر کم. (نیاز به پرداخت صورتحساب)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

رفتن به صفحه جزئیات مدل

فلش Gemini 2.5 با صدای بومی Gemini Live API

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند. (نیازی به ارائه صورتحساب نیست )

ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

مقایسه مدل‌ها :
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیت‌های پشتیبانی‌شده
- مشخصات و محدودیت‌ها، برای مثال حداکثر توکن‌های ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه‌ی نسخه‌بندی مدل‌ها ، به ویژه نسخه‌های پایدار ، به‌روزرسانی خودکار ، پیش‌نمایش و آزمایشی آنها
فهرست نام مدل‌های موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبان‌های پشتیبانی‌شده برای مدل‌ها

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .

برای جزئیات بیشتر در مورد مدل‌های Gemini Live API (مانند gemini-live-2.5-flash-native-audio )، به محدودیت‌ها و مشخصات Live API مراجعه کنید.

مقایسه مدل‌ها

هر مدل قابلیت‌های متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح می‌دهند. هر مدل ممکن است قابلیت‌های اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید: Gemini Developer API یاVertex AI Gemini API .

ورودی و خروجی پشتیبانی شده

جدول زیر انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic را فهرست می‌کند.

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

	جمینی ۳.x پرو، فلش، فلش-لایت	جمینی ۳.x حرفه‌ای تصویر	جمینی ۳.x فلش تصویر	جمینی ۳.x فلش لایت تصویر
انواع ورودی
متن
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو
صوتی
انواع خروجی
متن
متن (پخش)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی

ورودی و خروجی پشتیبانی شده (مدل‌های Gemini 2.5 )

	جمینی ۲.۵ پرو، فلش، فلش-لایت		جمینی ۲.۵ فلش تصویر
انواع ورودی
متن
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو
صوتی
انواع خروجی
متن
متن (پخش)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

جدول زیر قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic را فهرست می‌کند.

	جمینی ۳.x حرفه‌ای تصویر	جمینی ۳.x فلش تصویر	جمینی ۳.x فلش لایت تصویر
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی	به صورت لایه لایه یا به عنوان بخشی از تصویر	به صورت لایه لایه یا به عنوان بخشی از تصویر	به صورت لایه لایه یا به عنوان بخشی از تصویر
تولید تصاویر
ویرایش تصاویر
تولید صدا
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده) ( خروجی متن \| خروجی تصویر )
تصاویر را تجزیه و تحلیل کنید ( خروجی متن \| خروجی تصویر )
تجزیه و تحلیل ویدیو ( خروجی متن \| خروجی تصویر )
تجزیه و تحلیل صدا
چت چند نوبتی
جریان‌سازی چندوجهی دوطرفه
ابزارهای پشتیبانی شده
فراخوانی تابع
اجرای کد
زمینه URL
اتصال به زمین با Google Search
اتصال به زمین با Google Maps

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده (مدل‌های Gemini 2.5 )

	جمینی ۲.۵ پرو، فلش، فلش-لایت		جمینی ۲.۵ فلش تصویر
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی			به صورت لایه لایه یا به عنوان بخشی از تصویر
تولید تصاویر
ویرایش تصاویر
تولید صدا
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده) ( خروجی متن \| خروجی تصویر )
تصاویر را تجزیه و تحلیل کنید ( خروجی متن \| خروجی تصویر )
تجزیه و تحلیل ویدیو ( خروجی متن \| خروجی تصویر )
تجزیه و تحلیل صدا
چت چند نوبتی
جریان‌سازی چندوجهی دوطرفه
ابزارهای پشتیبانی شده
فراخوانی تابع
اجرای کد
زمینه URL
اتصال به زمین با Google Search
اتصال به زمین با Google Maps

مشخصات و محدودیت‌ها

جدول زیر مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic را فهرست می‌کند.

ملک	جمینی ۳.x پرو، فلش، فلش-لایت	جمینی ۳.x حرفه‌ای تصویر	جمینی ۳.x فلش تصویر	جمینی ۳.x فلش لایت تصویر
محدودیت توکن ورودی *	۱,۰۴۸,۵۷۶ توکن	۶۵,۵۳۶ توکن	۱۳۱,۰۷۲ توکن	۶۵,۵۳۶ توکن
محدودیت توکن خروجی *	۶۵,۵۳۶ توکن	۳۲۷۶۸ توکن	۳۲۷۶۸ توکن	۴,۰۹۶ توکن
تاریخ پایان دانش	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۹۰۰ فایل	۱۴ فایل	۱۴ فایل	۱۴ فایل
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۹۰۰ صفحه	۱۴ صفحه	۱۴ صفحه	۱۴ صفحه
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۱۰۰۰ تصویر	۱۴ تصویر	۱۴ تصویر	۱۴ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت	۷ مگابایت	۷ مگابایت
حداکثر تعداد از تصاویر خروجی	---	حداکثر محدودیت توکن خروجی	حداکثر محدودیت توکن خروجی	حداکثر محدودیت توکن خروجی
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	---	حداکثر محدودیت توکن ورودی	حداکثر محدودیت توکن ورودی
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	---	حدود ۲۵ دقیقه	حدود ۱۲ دقیقه
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	---	---	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	---	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	---	---	---

مشخصات و محدودیت‌ها (مدل‌های Gemini 2.5 )

	جمینی ۲.۵ پرو، فلش، فلش-لایت	جمینی ۲.۵ فلش تصویر
محدودیت توکن ورودی *	۱,۰۴۸,۵۷۶ توکن	۳۲۷۶۸ توکن
محدودیت توکن خروجی *	۶۵,۵۳۶ توکن	۸,۱۹۲ توکن
تاریخ پایان دانش	ژانویه ۲۰۲۵	ژوئن ۲۰۲۴
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۳۰۰۰ فایل	۳ فایل
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۱۰۰۰ صفحه	۳ صفحه
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۳۰۰۰ تصویر	۳ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت
حداکثر تعداد از تصاویر خروجی	---	حداکثر محدودیت توکن خروجی
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	---
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	---
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	---

^{* برای همه مدل‌های Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل توکن‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.}

^{** فایل‌های PDF به عنوان تصویر در نظر گرفته می‌شوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته می‌شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می‌تواند پشتیبانی کند.}

اطلاعات دقیق اضافی را پیدا کنید

سهمیه‌ها و قیمت‌گذاری برای هر مدل متفاوت است. قیمت‌گذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما الزامات را برآورده می‌کنند و از بهترین شیوه‌ها در فایل‌ها و الزامات ورودی پشتیبانی‌شده پیروی می‌کنند، اطلاعات کسب کنید.
مهم : محدودیت حجم کل درخواست ۲۰ مگابایت است. برای ارسال فایل‌های بزرگ، گزینه‌های ارائه فایل‌ها در درخواست‌های چندوجهی را بررسی کنید.
برای جزئیات بیشتر در مورد مدل‌های Gemini Live API ، به محدودیت‌ها و مشخصات Live API مراجعه کنید.

الگوهای نسخه‌بندی و نامگذاری مدل

مدل‌ها در نسخه‌های پایدار ، پیش‌نمایش و آزمایشی ارائه می‌شوند. برای راحتی، از نام‌های مستعار بدون مقادیر نسخه صریح پشتیبانی می‌شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه / مرحله انتشار	توضیحات	الگوی نام مدل
پایدار	نسخه‌های *پایدار* از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند. یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.	مدل‌های Gemini 2.5 و بالاتر نام مدل‌های نسخه‌های پایدار پسوند ندارند مثال: `gemini-3.5-flash`
پیش‌نمایش	نسخه‌های *پیش‌نمایش* دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند . این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، خاموش (از رده خارج) می‌شوند. برای API مربوط به Vertex AI Gemini ، مدل‌های پیش‌نمایش معمولاً از شما می‌خواهند که مکانی را که به مدل دسترسی دارید، روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های پیش‌نمایش به همراه ... پیوست شده‌اند. `-preview` و اغلب تاریخ انتشار مدل ( `-MM-DD` برای مدل‌های قدیمی‌تر یا (برای مدل‌های جدیدتر `-MM-YYYY` ) مثال‌ها: `gemini-2.5-flash-preview-04-17` (منتشر شده در ۱۷ آوریل ۲۰۲۵) یا `gemini-2.5-flash-preview-09-2025` (منتشر شده در سپتامبر ۲۰۲۵) یا `gemini-3-pro-preview` (منتشر شده در نوامبر ۲۰۲۵)
تجربی	نسخه‌های *آزمایشی* قابلیت‌های جدیدی دارند و پایدار تلقی نمی‌شوند . این مدل‌ها برای استفاده در محیط تولید توصیه نمی‌شوند و محدودیت‌های نرخ بیشتری دارند. مدل‌های آزمایشی برای جمع‌آوری بازخورد و امکان آزمایش با جدیدترین ویژگی‌های ما در نظر گرفته شده‌اند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، خاموش (از رده خارج) می‌شوند. برای API مربوط به Vertex AI Gemini ، مدل‌های آزمایشی از شما می‌خواهند که مکانی را که به مدل دسترسی دارید، روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های آزمایشی به همراه ... پیوست شده است. `-exp` به همراه تاریخ انتشار مدل ( `-MM-DD` ) مثال: `gemini-2.5-pro-exp-03-25` (منتشر شده در ۲۵ مارس ۲۰۲۵)
خاموشی (بازنشستگی)	نسخه‌های *خاموش (بازنشسته)* از تاریخ خاموشی (بازنشستگی) خود گذشته‌اند و به‌طور دائم غیرفعال شده‌اند. مدل‌های خاموش (بازنشسته) دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیستند و درخواستی که از نام مدل بازنشسته استفاده می‌کند، خطای ۴۰۴ را برمی‌گرداند.	---

برای موارد استفاده در محیط عملیاتی، توصیه می‌کنیم از نام مدل صریح برای جدیدترین نسخه پایدار استفاده کنید. اگرچه یک نام مستعار پایدار که به صورت خودکار به‌روزرسانی می‌شود به یک نسخه پایدار اشاره می‌کند، نسخه مدل واقعی که به آن اشاره می‌کند، هر زمان که نسخه پایدار جدیدی منتشر شود، به طور خودکار تغییر می‌کند، که می‌تواند به معنای رفتار یا پاسخ‌های غیرمنتظره باشد.

نسخه‌های پیش‌نمایش و آزمایشی فقط در طول نمونه‌سازی اولیه توصیه می‌شوند.

ما همچنین استفاده از Firebase Remote Config توصیه می‌کنیم تا بتوانید مدل و نسخه برنامه خود را به صورت پویا و بدون انتشار نسخه جدید برنامه خود تغییر دهید .

نام مدل‌های موجود

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

مدل‌های عمومی (مانند gemini-3.5-flash )
مدل‌های تولیدکننده تصویر (مانند gemini-3.1-flash-image ، که با نام مدل‌های "نانو موز" نیز شناخته می‌شوند)
مدل‌های تولید صدا (مانند gemini-live-2.5-flash-native-audio )

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای شروع به کار مراجعه کنید.

برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و خاموش کردن)، به الگوهای نسخه‌بندی و نامگذاری مدل مراجعه کنید.

لیست کردن تمام مدل‌های موجود به صورت برنامه‌نویسی شده

شما می‌توانید با استفاده از REST API، نام تمام مدل‌های موجود را فهرست کنید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : فراخوانی نقطه پایانی models.list
رابط برنامه‌نویسی کاربردی Vertex AI Gemini : فراخوانی نقطه پایانی publishers.models.list

توجه داشته باشید که این لیست برگشتی شامل تمام مدل‌های پشتیبانی‌شده توسط ارائه‌دهندگان API خواهد بود، اما Firebase AI Logic فقط از مدل‌های Gemini که در این صفحه توضیح داده شده‌اند، پشتیبانی می‌کند.

مدل‌های عمومی

نام مدل‌های Gemini 3.x Pro

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3.1-pro-preview`	آخرین نسخه پیش‌نمایش Gemini 3.x Pro	پیش‌نمایش	۲۰۲۶-۰۲-۱۹	تعیین خواهد شد

نام مدل‌های Gemini 3.x Flash

^{اگر از رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان Gemini استفاده می‌کنید، نیازی به طرح قیمت‌گذاری Blaze با پرداخت در محل ندارید .}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3.5-flash`	نسخه پایدار Gemini 3.x Flash	جی ای	۲۰۲۶-۰۵-۱۹	نه زودتر از ۲۰۲۷-۰۵-۱۹
`gemini-3-flash-preview`	نسخه پیش‌نمایش Gemini 3.x Flash	پیش‌نمایش	۲۰۲۵-۱۲-۱۷	تعیین خواهد شد

نام مدل‌های Gemini 3.x Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3.1-flash-lite`	نسخه پایدار Gemini 3.x Flash‑Lite	جی ای	۲۰۲۶-۰۵-۰۷	نه زودتر از ۲۰۲۷-۰۵-۰۷

نام مدل‌های Gemini 2.5 Pro

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.5-pro`	نسخه پایدار Gemini 2.5 Pro	جی ای	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.5-flash`	نسخه پایدار Gemini 2.5 Flash	جی ای	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.5-flash-lite`	نسخه پایدار Gemini 2.5 Flash‑Lite	جی ای	۲۰۲۵-۰۷-۲۲	نه زودتر از ۲۰۲۶-۰۷-۲۲

مدل‌های تولید تصویر

نام مدل‌های Gemini 3.x Pro Image (معروف به "Nano Banana Pro")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3-pro-image`	نسخه پایدار Gemini 3.x Pro Image (معروف به "نانو موز پرو")	جی ای	۲۰۲۶-۰۵-۲۸	نه زودتر از ۲۰۲۷-۰۵-۲۸
`gemini-3-pro-image-preview`	نسخه پیش‌نمایش Gemini 3.x Pro Image (معروف به "نانو موز پرو")	پیش‌نمایش	۲۰۲۵-۱۱-۲۰	همان اوایل که ۲۰۲۶-۰۶-۲۵

نام‌های مدل تصویر فلش Gemini 3.x (معروف به "نانو موز ۲")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3.1-flash-image`	نسخه پایدار Gemini 3.x Flash Image (معروف به "نانو موز ۲")	جی ای	۲۰۲۶-۰۵-۲۸	نه زودتر از ۲۰۲۷-۰۵-۲۸
`gemini-3.1-flash-image-preview`	نسخه پیش‌نمایش تصویر فلش Gemini 3.x (معروف به "نانو موز ۲")	پیش‌نمایش	۲۶-۰۲-۲۰۲۶	همان اوایل که ۲۰۲۶-۰۶-۲۵

نام‌های مدل تصویر Gemini 3.x Flash‑Lite (معروف به "Nano Banana 2 Lite")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3.1-flash-lite-image`	نسخه پایدار Gemini 3.x Flash‑Lite Image (معروف به "نانو موز ۲ لایت")	جی ای	۲۰۲۶-۰۶-۳۰	نه زودتر از ۲۰۲۷-۰۶-۳۰

نام مدل‌های Gemini 2.5 Flash Image (معروف به "نانو موز")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.5-flash-image`	نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز")	جی ای	۲۰۲۵-۱۰-۰۲	نه زودتر از ۲۰۲۶-۱۰-۰۲

مدل‌های تولید صدا

نام مدل‌های Gemini 2.5 Flash Live

^{اگر از رابط برنامه‌نویسی Gemini Developer API استفاده می‌کنید، نیازی به طرح قیمت‌گذاری Blaze که در صورت استفاده پرداخت می‌شود، ندارد (معمولاً مدل‌های پیش‌نمایش به طرح پولی نیاز دارند).}

مدل‌های Gemini 2.5 Flash Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند. اگرچه این مدل بسته به ارائه‌دهنده Gemini API نام‌های مختلفی دارد، اما رفتار و ویژگی‌های مدل یکسان است.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.5-flash-native-audio-preview-12-2025` ^۱	آخرین نسخه پیش‌نمایش برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۱۲-۱۲	تعیین خواهد شد
`gemini-2.5-flash-native-audio-preview-09-2025` ^۱	نسخه پیش‌نمایش اولیه برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

Vertex AI Gemini API نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-live-2.5-flash-native-audio` ^{شده‌اند}	نسخه پایدار برای Live API روی API Vertex AI Gemini	جی ای	۲۰۲۵-۱۲-۱۲	نه زودتر از ۲۰۲۶-۱۲-۱۲
`gemini-live-2.5-flash-preview-native-audio-09-2025` ²	نسخه پیش‌نمایش برای Live API در Vertex AI Gemini API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

^{۱ فقط توسط رابط برنامه‌نویسی نرم‌افزار Gemini Developer پشتیبانی می‌شود. همچنین، اگرچه اینها مدل‌های پیش‌نمایش هستند، اما در «ردیف رایگان» رابط برنامه‌نویسی نرم‌افزار Gemini Developer در دسترس هستند.}
^{۲ فقط توسط Vertex AI Gemini API پشتیبانی می‌شود. همچنین، این مدل‌ها در موقعیت global پشتیبانی نمی‌شوند .}

زبان‌های پشتیبانی‌شده

تمام مدل‌های Gemini می‌توانند زبان‌های زیر را درک کرده و به آنها پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده‌شده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، کره‌ای (ko)، لتونیایی (lv)، لیتوانیایی (lt)، نروژی (no)، لهستانی (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (uk)، ویتنامی (vi)
مدل‌های Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند زبان‌های اضافی زیر را درک کرده و به آنها پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مقدونی، مالاگاسی (mk)، مالایالام (ml)، مغولی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (Pa), Pashtoinhales (Pashto) (si)، ساموآیی (sm)، شونا (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغور (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)

اطلاعات مربوط به مدل‌های قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : مدل‌های Gemini و مدل‌های Imagen
Vertex AI Gemini API : مدل‌های Gemini و مدل‌های Imagen

مدل‌های Gemini 2.0 Flash و Gemini 2.0 Flash‑Lite در تاریخ ۱ ژوئن ۲۰۲۶ از کار افتادند (مدل‌های پایدار Gemini Live API 2.0 تحت تأثیر قرار نگرفته‌اند). همه مدل‌های Gemini 1.0 و Gemini 1.5 از قبل از کار افتاده‌اند و همه درخواست‌ها به این مدل‌ها خطای ۴۰۴ را برمی‌گردانند.

برای جلوگیری از اختلال در سرویس، به مدل جدیدتری (مثلاً gemini-3.1-flash-lite ) به‌روزرسانی کنید. اطلاعات بیشتر

وقتی که به طور جدی شروع به توسعه برنامه خود می‌کنید، توصیه می‌کنیم از Firebase Remote Config استفاده کنید تا بتوانید از راه دور مدل و نسخه برنامه خود را بدون انتشار نسخه جدید برنامه تغییر دهید .

مدل‌های قدیمی‌تر جمینی

gemini-2.0-flash-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash )
gemini-2.0-flash-lite-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash-lite )

برای اطلاعات بیشتر در مورد مدل‌های قدیمی‌تر Gemini Live API ، به مستندات ارائه‌دهنده Gemini API مراجعه کنید:

مدل‌های قدیمی‌تر ایمیجن

imagen-4.0-ultra-generate-001
imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-3.0-capability-001
imagen-3.0-generate-002
imagen-3.0-generate-001
imagen-3.0-fast-generate-001

مشاهده جزئیات درباره مدل‌های قبلی

مشاهده ورودی و خروجی پشتیبانی شده از مدل‌های نسل قبلی

اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جمینی ۲.۰ فلش	جمینی ۲.۰ فلش لایت	ایمیجِن (تولید کردن)	ایمیجِن (قابلیت)
انواع ورودی
متن
متن (پخش)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو
صوتی
صدا (پخش جریانی)
انواع خروجی
متن
متن (پخش)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی
صدا (پخش جریانی)

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده از مدل‌های نسل قبلی

این قابلیت‌ها و ویژگی‌ها هنگام استفاده از هر مدل با Firebase AI Logic وجود دارد:

	جمینی ۲.۰ فلش	جمینی ۲.۰ فلش لایت	ایمیجِن (تولید کردن)	ایمیجِن (قابلیت)
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)
تجزیه و تحلیل صدا
چت چند نوبتی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با Google Search
اتصال به زمین با Google Maps
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌های مدل‌های نسل قبلی

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جمینی ۲.۰ فلش	جمینی ۲.۰ فلش لایت	ایمیجِن (تولید کردن)	ایمیجِن (قابلیت)
پنجره زمینه * محدودیت کل توکن (ورودی + خروجی ترکیبی)	۱,۰۴۸,۵۷۶ توکن	۱,۰۴۸,۵۷۶ توکن	۴۸۰ توکن	۴۸۰ توکن
محدودیت توکن خروجی *	۸,۱۹۲ توکن	۸,۱۹۲ توکن	---	---
تاریخ پایان دانش	ژوئن ۲۰۲۴	ژوئن ۲۰۲۴	---	---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۳۰۰۰ فایل	۳۰۰۰ فایل	---	---
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۱۰۰۰ صفحه	۱۰۰۰ صفحه	---	---
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت	---	---
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۳۰۰۰ تصویر	۳۰۰۰ تصویر	---	۴ تصویر
حداکثر تعداد از تصاویر خروجی	---	---	۴ تصویر	۴ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت	---	---
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	۱۰ فایل	---	---
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	حدود ۶۰ دقیقه	---	---
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	حدود ۴۵ دقیقه	---	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	۱ فایل	---	---
حداکثر تعداد از فایل‌های صوتی خروجی	---	---	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	حدود ۸.۴ ساعت	---	---
حداکثر طول از تمام صداهای خروجی	---	---	---	---

نام مدل‌های موجود از مدل‌های نسل قبلی (شامل تاریخ خاموش شدن)

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

مدل‌های جمینی

نام مدل‌های پیش‌نمایش Gemini 3 Pro

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-3-pro-preview`	نسخه پیش‌نمایش اولیه Gemini 3 Pro Preview	پیش‌نمایش	۲۰۲۵-۱۱-۱۸	۲۰۲۶-۰۳-۰۹

نام مدل‌های Gemini 2.0 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.0-flash-001`	آخرین نسخه پایدار Gemini 2.0 Flash	پایدار	۲۰۲۵-۰۲-۰۵	۲۰۲۶-۰۶-۰۱
`gemini-2.0-flash`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash اشاره دارد (در حال حاضر `gemini-2.0-flash-001` )	پایدار	۲۰۲۵-۰۲-۱۰	۲۰۲۶-۰۶-۰۱

نام مدل‌های Gemini 2.0 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`gemini-2.0-flash-lite-001`	آخرین نسخه پایدار Gemini 2.0 Flash‑Lite	پایدار	2025-02-25	۲۰۲۶-۰۶-۰۱
`gemini-2.0-flash-lite`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash‑Lite اشاره دارد (در حال حاضر `gemini-2.0-flash-lite-001` )	پایدار	2025-02-25	۲۰۲۶-۰۶-۰۱

مدل‌های ایمیجن

نام مدل‌های ایمیجن ۴

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-4.0-generate-001`	نسخه پایدار Imagen 4	پایدار	۱۴-۰۸-۲۰۲۵	۲۰۲۶-۰۶-۳۰

نام مدل‌های Imagen 4 Fast

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-4.0-fast-generate-001`	نسخه پایدار Imagen 4 Fast	پایدار	۱۴-۰۸-۲۰۲۵	۲۰۲۶-۰۶-۳۰

نام مدل‌های ایمیجن ۴ اولترا

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-4.0-ultra-generate-001`	نسخه پایدار Imagen 4 Ultra	پایدار	۱۴-۰۸-۲۰۲۵	۲۰۲۶-۰۶-۳۰

نام مدل‌های قابلیت Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-3.0-capability-001`	نسخه پایدار اولیه قابلیت Imagen 3	پایدار	۲۰۲۴-۱۲-۱۰	۲۰۲۶-۰۶-۳۰

نام مدل‌های ایمیجن ۳

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-3.0-generate-002`	آخرین نسخه پایدار Imagen 3	پایدار	۲۰۲۵-۰۱-۲۳	۲۰۲۶-۰۶-۳۰
`imagen-3.0-generate-001`	نسخه پایدار اولیه Imagen 3	پایدار	۲۰۲۴-۰۷-۳۱	۲۰۲۶-۰۶-۳۰

نام مدل‌های سریع Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ خاموش شدن
`imagen-3.0-fast-generate-001`	نسخه پایدار اولیه Imagen 3 Fast	پایدار	۲۰۲۴-۰۷-۳۱	۲۰۲۶-۰۶-۳۰

مراحل بعدی

قابلیت‌های رابط برنامه‌نویسی Gemini را امتحان کنید

مکالمات چند نوبتی (چت) بسازید.
تولید متن از درخواست‌های فقط متنی .
با استفاده از انواع فایل‌های مختلف، مانند تصاویر ، فایل‌های PDF ، ویدیو و صدا ، متن را با پرس‌وجو تولید کنید.
خروجی ساختاریافته (مانند JSON) را از هر دو حالت متنی و چندوجهی تولید کنید .
تصاویر را از متن و فرم‌های چندوجهی تولید و ویرایش کنید .
ورودی و خروجی (از جمله صدا) را با استفاده از Gemini Live API استریم کنید.
از ابزارهایی (مانند فراخوانی تابع و اتصال به زمین با جستجوی گوگل ) برای اتصال یک مدل Gemini به سایر بخش‌های برنامه و سیستم‌ها و اطلاعات خارجی خود استفاده کنید.