Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، کیت‌های توسعه نرم‌افزار Firebase AI Logic به شما امکان می‌دهند مستقیماً از طریق برنامه خود با مدل‌های Gemini و Imagen پشتیبانی‌شده تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدل‌های Imagen را می‌توان با متن برای تولید تصاویر تحریک کرد.

همچنین، سوالات متداول ما را در مورد تمام مدل‌هایی که Firebase AI Logic پشتیبانی می‌کند و پشتیبانی نمی‌کند، بررسی کنید.

مدل‌های عمومی

پرش به مقایسه مدل‌ها

باهوش‌ترین مدل ما

جمینی ۳ پرو

gemini-3-pro-preview

بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنی‌تر و تعامل عمیق‌تری را ارائه می‌دهد، همگی بر پایه استدلال پیشرفته ساخته شده‌اند. (ارائه صورتحساب الزامی است)

سریع‌ترین و هوشمندترین مدل ما

فلش جمینی ۳

gemini-3-flash-preview

هوشمندترین مدل ما که برای سرعت، کارایی و هزینه ساخته شده است. این مدل، کارهای روزمره را با استدلال بهبود یافته امکان‌پذیر می‌کند، در حالی که همچنان قادر به انجام پیچیده‌ترین گردش‌های کاری عامل‌محور است. (نیازی به ارائه صورتحساب نیست )

مدل تفکر پیشرفته ما

جمینی ۲.۵ پرو

gemini-2.5-pro

مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه داده‌های بزرگ، پایگاه‌های کد و اسناد با استفاده از متن طولانی. (نیازی به ارائه صورتحساب نیست )

سریع و هوشمند

فلش جمینی ۲.۵

gemini-2.5-flash

بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیت‌های جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است. (نیازی به ارائه صورتحساب نیست )

فوق العاده سریع

جمینی ۲.۵ فلش-لایت

gemini-2.5-flash-lite

سریع‌ترین مدل فلش ما برای صرفه‌جویی در هزینه و توان عملیاتی بالا بهینه شده است. (نیازی به ارائه صورتحساب نیست )

مدل‌های تولید تصویر

شما می‌توانید تصاویر را با مدل‌های Gemini یا Imagen تولید کنید.

پرش به مقایسه مدل‌ها

جوزا

تصویر Gemini 3 Pro (معروف به نانو موز پرو )

gemini-3-pro-image-preview

طراحی شده برای تولید حرفه‌ای دارایی‌ها و دستورالعمل‌های پیچیده. این نرم‌افزار با استفاده از جستجوی گوگل، زمینه‌سازی در دنیای واقعی را ارائه می‌دهد، یک فرآیند «تفکر» پیش‌فرض که ترکیب‌بندی را قبل از تولید اصلاح می‌کند و می‌تواند تصاویری با وضوح حداکثر 4K تولید کند. (ارائه صورتحساب الزامی است)

ایمیج فلش Gemini 2.5 (معروف به نانو موز )

gemini-2.5-flash-image

برای سرعت و کارایی طراحی شده است. برای کارهای با حجم بالا و تأخیر کم بهینه شده است و تصاویر را با وضوح 1024 پیکسل تولید می‌کند. (ارائه صورتحساب الزامی است)

ایمیجِن

تصویر ۴

imagen-4.0-generate-001

تصاویر واقع‌گرایانه و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (ارائه صورتحساب الزامی است)

ایمجین ۴ سریع

imagen-4.0-fast-generate-001

تصاویر را برای نمونه‌سازی اولیه یا موارد استفاده با تأخیر کم تولید می‌کند. (ارائه صورتحساب الزامی است)

ایمیجن ۴ اولترا

imagen-4.0-ultra-generate-001

تصاویر واقع‌گرایانه و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (ارائه صورتحساب الزامی است)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

پرش به مقایسه مدل‌ها

فلش Gemini 2.5 با صدای بومی Gemini Live API

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند. (نیازی به ارائه صورتحساب نیست )

مدل‌های نسل قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

پرش به مقایسه مدل‌ها

مدل‌های جمینی

مدل نسل دوم و کارآمد ما

فلش جمینی ۲.۰

gemini-2.0-flash-001

مدل نسل دوم و قدرتمند ما، با پنجره‌ی زمینه‌ی ۱ میلیون توکن. ویژگی‌های نسل بعدی و قابلیت‌های بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه می‌دهد. (نیازی به ارائه صورتحساب نیست )

مدل سریع نسل دوم ما

جمینی ۲.۰ فلش-لایت

gemini-2.0-flash-lite-001

مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهره‌وری هزینه و تأخیر کم. (نیازی به ارائه صورتحساب نیست )

ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

مقایسه مدل‌ها :
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیت‌های پشتیبانی‌شده
- مشخصات و محدودیت‌ها، برای مثال حداکثر توکن‌های ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه‌ی نسخه‌بندی مدل‌ها ، به ویژه نسخه‌های پایدار ، به‌روزرسانی خودکار ، پیش‌نمایش و آزمایشی آنها
فهرست نام مدل‌های موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبان‌های پشتیبانی‌شده برای مدل‌ها

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .

مقایسه مدل‌ها

هر مدل قابلیت‌های متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح می‌دهند. هر مدل ممکن است قابلیت‌های اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : مدل‌های Gemini و مدل‌های Imagen
Vertex AI Gemini API : مدل‌های Gemini و مدل‌های Imagen

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو، فلش	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
انواع ورودی
متن					(پخش جریانی)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو					(پخش جریانی)
صوتی					(پخش جریانی)
انواع خروجی
متن
متن (پخش)					(رونویسی)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی					(پخش جریانی)

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

این قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو تصویر	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی	به صورت لایه لایه یا به عنوان بخشی از تصویر	به صورت لایه لایه یا به عنوان بخشی از تصویر	فقط رونویسی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا			فقط پخش جریانی
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)			فقط پخش جریانی
تجزیه و تحلیل صدا			فقط پخش جریانی
چت چند نوبتی			فقط پخش جریانی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌ها

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جوزا ۳ پرو، فلش	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
محدودیت توکن ورودی *	۱,۰۴۸,۵۷۶ توکن	۶۵,۵۳۶ توکن	۱,۰۴۸,۵۷۶ توکن	۳۲۷۶۸ توکن	۳۲ هزار توکن (پیش‌فرض؛ قابل ارتقا به ۱۲۸ هزار)	۴۸۰ توکن	۴۸۰ توکن
محدودیت توکن خروجی *	۶۵,۵۳۶ توکن	۳۲۷۶۸ توکن	۶۵,۵۳۶ توکن	۸,۱۹۲ توکن	۶۴ هزار توکن	---	---
تاریخ پایان دانش	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژوئن ۲۰۲۵	ژانویه ۲۰۲۵	---	---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۹۰۰ فایل	۱۴ فایل	۳۰۰۰ فایل	۳ فایل	---	---	---
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۹۰۰ صفحه	۱۴ صفحه	۱۰۰۰ صفحه	۳ صفحه	---	---	---
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	---	---	---
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۱۰۰۰ تصویر	۱۴ تصویر	۳۰۰۰ تصویر	۳ تصویر	---	---	۴ تصویر
حداکثر تعداد از تصاویر خروجی	---	۱۰ تصویر	---	۱۰ تصویر	---	۴ تصویر	۴ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت	۷ مگابایت	۷ مگابایت	---	---	---
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	---	۱۰ فایل	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	---	حدود ۶۰ دقیقه	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	---	حدود ۴۵ دقیقه	---	---	---	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	---	۱ فایل	---	---	---	---
حداکثر تعداد از فایل‌های صوتی خروجی	---	---	---	---	---	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	---	حدود ۸.۴ ساعت	---	---	---	---
حداکثر طول از تمام صداهای خروجی	---	---	---	---	---	---	---

^{* برای همه مدل‌های Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل توکن‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.}

^{** فایل‌های PDF به عنوان تصویر در نظر گرفته می‌شوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته می‌شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می‌تواند پشتیبانی کند.}

^{*** مدل‌های Gemini 2.5 Flash-Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند.}

اطلاعات دقیق اضافی را پیدا کنید

سهمیه‌ها و قیمت‌گذاری برای هر مدل متفاوت است. قیمت‌گذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما الزامات را برآورده می‌کنند و از بهترین شیوه‌ها در فایل‌ها و الزامات ورودی پشتیبانی‌شده پیروی می‌کنند، اطلاعات کسب کنید.
مهم : محدودیت حجم کل درخواست ۲۰ مگابایت است. برای ارسال فایل‌های بزرگ، گزینه‌های ارائه فایل‌ها در درخواست‌های چندوجهی را بررسی کنید.

الگوهای نسخه‌بندی و نامگذاری مدل

مدل‌ها در نسخه‌های پایدار ، پیش‌نمایش و آزمایشی ارائه می‌شوند. برای راحتی، از نام‌های مستعار بدون مقادیر نسخه صریح پشتیبانی می‌شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه / مرحله انتشار		توضیحات	الگوی نام مدل
پایدار		نسخه‌های *پایدار* از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند. یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.	مدل‌های جمینی ۲.۵ نام مدل‌های نسخه‌های پایدار پسوند ندارند مثال: `gemini-2.5-pro` مدل‌های Gemini 2.0 و Imagen نام مدل‌های نسخه‌های پایدار با یک شماره نسخه سه رقمی خاص ضمیمه می‌شوند مثال: `gemini-2.0-flash-001` مثال: `imagen-3.0-generate-002`
	نام مستعار پایدار با به‌روزرسانی خودکار (فقط مدل‌های Gemini 2.0 )	نام‌های مستعار پایدار *که به صورت خودکار به‌روزرسانی می‌شوند،* همیشه به آخرین نسخه پایدار آن مدل اشاره می‌کنند. اگر نسخه پایدار جدیدی منتشر شود، نام مستعار به‌روزرسانی‌شده خودکار به‌طور خودکار شروع به اشاره به آن نسخه پایدار جدید می‌کند.	فقط مدل‌های Gemini 2.0 نام‌های مدلِ مستعار پسوند ندارند مثال: `gemini-2.0-flash`
پیش‌نمایش		نسخه‌های *پیش‌نمایش* دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند . این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند. برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های پیش‌نمایش منتشر شده پس از ژوئن ۲۰۲۵ معمولاً از شما می‌خواهند که موقعیت مکانی مدل را روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های پیش‌نمایش به همراه ... پیوست شده‌اند. `-preview` و اغلب تاریخ انتشار مدل ( `-MM-DD` برای مدل‌های قدیمی‌تر یا (برای مدل‌های جدیدتر `-MM-YYYY` ) مثال‌ها: `gemini-2.5-flash-preview-04-17` (منتشر شده در ۱۷ آوریل ۲۰۲۵) یا `gemini-2.5-flash-preview-09-2025` (منتشر شده در سپتامبر ۲۰۲۵) یا `gemini-3-pro-preview` (منتشر شده در نوامبر ۲۰۲۵)
تجربی		نسخه‌های *آزمایشی* قابلیت‌های جدیدی دارند و پایدار تلقی نمی‌شوند . این مدل‌ها برای استفاده در محیط تولید توصیه نمی‌شوند و محدودیت‌های نرخ بیشتری دارند. مدل‌های آزمایشی برای جمع‌آوری بازخورد و امکان آزمایش با جدیدترین ویژگی‌های ما در نظر گرفته شده‌اند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند. برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های آزمایشی که پس از ژوئن ۲۰۲۵ منتشر شده‌اند، شما را ملزم می‌کنند که موقعیت مکانی مدل را روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های آزمایشی به همراه ... پیوست شده است. `-exp` به همراه تاریخ انتشار مدل ( `-MM-DD` ) مثال: `gemini-2.5-pro-exp-03-25` (منتشر شده در ۲۵ مارس ۲۰۲۵)
بازنشسته		نسخه‌های *از رده خارج شده،* تاریخ انقضایشان گذشته و برای همیشه غیرفعال شده‌اند. مدل‌های منسوخ‌شده دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیستند و درخواستی که از نام مدل منسوخ‌شده استفاده می‌کند، خطای ۴۰۴ را برمی‌گرداند.	---

برای موارد استفاده در محیط عملیاتی، توصیه می‌کنیم از نام مدل صریح برای جدیدترین نسخه پایدار استفاده کنید. اگرچه یک نام مستعار پایدار که به صورت خودکار به‌روزرسانی می‌شود به یک نسخه پایدار اشاره می‌کند، نسخه مدل واقعی که به آن اشاره می‌کند، هر زمان که نسخه پایدار جدیدی منتشر شود، به طور خودکار تغییر می‌کند، که می‌تواند به معنای رفتار یا پاسخ‌های غیرمنتظره باشد.

نسخه‌های پیش‌نمایش و آزمایشی فقط در طول نمونه‌سازی اولیه توصیه می‌شوند.

ما همچنین استفاده از Firebase Remote Config توصیه می‌کنیم تا بتوانید مدل و نسخه برنامه خود را به صورت پویا و بدون انتشار نسخه جدید برنامه خود تغییر دهید .

نام مدل‌های موجود

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

پرش به نام مدل‌های پرش به نام مدل‌های Imagen

لیست کردن تمام مدل‌های موجود به صورت برنامه‌نویسی شده

شما می‌توانید با استفاده از REST API، نام تمام مدل‌های موجود را فهرست کنید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : فراخوانی نقطه پایانی models.list
رابط برنامه‌نویسی کاربردی Vertex AI Gemini : فراخوانی نقطه پایانی publishers.models.list

توجه داشته باشید که این لیست برگشتی شامل تمام مدل‌های پشتیبانی‌شده توسط ارائه‌دهندگان API خواهد بود، اما Firebase AI Logic فقط از مدل‌های Gemini و Imagen که در این صفحه توضیح داده شده‌اند، پشتیبانی می‌کند. همچنین توجه داشته باشید که نام‌های مستعار به‌روزرسانی‌شده خودکار (به عنوان مثال، gemini-2.0-flash ) در فهرست قرار نگرفته‌اند زیرا آنها یک نام مستعار برای مدل پایه هستند.

نام مدل‌های جمینی

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای شروع به کار مراجعه کنید.

برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخه‌بندی و نامگذاری مدل مراجعه کنید.

نام مدل‌های جمینی ۳ پرو

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-3-pro-preview`	نسخه پیش‌نمایش Gemini 3 Pro	پیش‌نمایش	۲۰۲۵-۱۱-۱۸	تعیین خواهد شد

نام مدل‌های Gemini 3 Flash

^{اگر از رابط برنامه‌نویسی Gemini Developer API استفاده می‌کنید، نیازی به طرح قیمت‌گذاری Blaze که در صورت استفاده پرداخت می‌شود، ندارد (معمولاً مدل‌های پیش‌نمایش به طرح پولی نیاز دارند).}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-3-flash-preview`	نسخه پیش‌نمایش Gemini 3 Flash	پیش‌نمایش	۲۰۲۵-۱۲-۱۷	تعیین خواهد شد

نام مدل‌های Gemini 3 Pro Image (معروف به "nano banana pro")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-3-pro-image-preview`	نسخه پیش‌نمایش تصویر Gemini 3 Pro (معروف به "نانو موز پرو")	پیش‌نمایش	۲۰۲۵-۱۱-۲۰	تعیین خواهد شد

نام مدل‌های Gemini 2.5 Pro

^{اگر از رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان Gemini استفاده می‌کنید، نیازی به طرح قیمت‌گذاری Blaze با پرداخت در محل ندارید .}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-pro`	نسخه پایدار Gemini 2.5 Pro	پایدار	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash`	نسخه پایدار Gemini 2.5 Flash	پایدار	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-lite`	نسخه پایدار Gemini 2.5 Flash‑Lite	پایدار	۲۰۲۵-۰۷-۲۲	نه زودتر از ۲۰۲۶-۰۷-۲۲

نام مدل‌های تصویر فلش Gemini 2.5 (معروف به "نانو موز")

^{صرف نظر از ارائه دهنده API Gemini شما ، به طرح قیمت گذاری Blaze با پرداخت در محل نیاز دارد.}

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-image`	نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز")	پایدار	۲۰۲۵-۱۰-۰۲	نه زودتر از ۲۰۲۶-۱۰-۰۲

نام مدل‌های Gemini 2.5 Flash Live

مدل‌های Gemini 2.5 Flash Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند. اگرچه این مدل بسته به ارائه‌دهنده Gemini API نام‌های مختلفی دارد، اما رفتار و ویژگی‌های مدل یکسان است.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-native-audio-preview-12-2025` ^۱	آخرین نسخه پیش‌نمایش برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۱۲-۱۲	تعیین خواهد شد
`gemini-2.5-flash-native-audio-preview-09-2025` ^۱	نسخه پیش‌نمایش اولیه برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

Vertex AI Gemini API نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-live-2.5-flash-native-audio` ^{شده‌اند}	نسخه پایدار برای Live API روی API Vertex AI Gemini	پایدار	۲۰۲۵-۱۲-۱۲	نه زودتر از ۲۰۲۶-۱۲-۱۲
`gemini-live-2.5-flash-preview-native-audio-09-2025` ²	نسخه پیش‌نمایش برای Live API در Vertex AI Gemini API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

^{۱ فقط توسط رابط برنامه‌نویسی نرم‌افزار Gemini Developer پشتیبانی می‌شود. همچنین، اگرچه اینها مدل‌های پیش‌نمایش هستند، اما در «ردیف رایگان» رابط برنامه‌نویسی نرم‌افزار Gemini Developer در دسترس هستند.}
^{۲ فقط توسط Vertex AI Gemini API پشتیبانی می‌شود. همچنین، این مدل‌ها در موقعیت global پشتیبانی نمی‌شوند.}

نام مدل‌های ایمیجن

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای تولید تصاویر با Imagen مراجعه کنید.

نام مدل‌های ایمیجن ۴

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-generate-001`	نسخه پایدار Imagen 4	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های Imagen 4 Fast

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-fast-generate-001`	نسخه پایدار Imagen 4 Fast	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های ایمیجن ۴ اولترا

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-ultra-generate-001`	نسخه پایدار Imagen 4 Ultra	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های قابلیت Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-capability-001` ²	نسخه پایدار اولیه قابلیت Imagen 3	پایدار	۲۰۲۴-۱۲-۱۰	زودتر از 2025-12-10

^{۲- صرف نظر از نحوه دسترسی شما، توسط رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini پشتیبانی نمی‌شود.}

زبان‌های پشتیبانی‌شده

جوزا

تمام مدل‌های Gemini می‌توانند زبان‌های زیر را درک کرده و به آنها پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده‌شده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، کره‌ای (ko)، لتونیایی (lv)، لیتوانیایی (lt)، نروژی (no)، لهستانی (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (uk)، ویتنامی (vi)
مدل‌های Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند زبان‌های اضافی زیر را درک کرده و به آنها پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مقدونی، مالاگاسی (mk)، مالایالام (ml)، مغولی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (Pa), Pashtoinhales (Pashto) (si)، ساموآیی (sm)، شونا (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغور (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)

ایمیجِن

دسترسی عمومی : انگلیسی
پیش‌نمایش : چینی (ساده‌شده)، چینی (سنتی)، هندی، ژاپنی، کره‌ای، پرتغالی، اسپانیایی

اطلاعات مربوط به مدل‌های قبلی

مدل‌های جمینی

gemini-2.0-flash-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash )
gemini-2.0-flash-lite-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash-lite )

برای اطلاعات بیشتر در مورد مدل‌های قدیمی‌تر Gemini Live API ، به مستندات ارائه‌دهنده Gemini API مراجعه کنید:

مدل‌های ایمیجن

imagen-3.0-generate-002
imagen-3.0-fast-generate-001

مشاهده ورودی و خروجی پشتیبانی شده از مدل‌های نسل قبلی

اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
انواع ورودی
متن
متن (پخش)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو
صوتی
صدا (پخش جریانی)
انواع خروجی
متن
متن (پخش)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی
صدا (پخش جریانی)

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده از مدل‌های نسل قبلی

این قابلیت‌ها و ویژگی‌ها هنگام استفاده از هر مدل با Firebase AI Logic وجود دارد:

	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)
تجزیه و تحلیل صدا
چت چند نوبتی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌های مدل‌های نسل قبلی

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
پنجره زمینه * محدودیت کل توکن (ورودی + خروجی ترکیبی)	۱,۰۴۸,۵۷۶ توکن	۱,۰۴۸,۵۷۶ توکن
محدودیت توکن خروجی *	۸,۱۹۲ توکن	۸,۱۹۲ توکن
تاریخ پایان دانش	ژوئن ۲۰۲۴	ژوئن ۲۰۲۴
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۳۰۰۰ فایل	۳۰۰۰ فایل
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۱۰۰۰ صفحه	۱۰۰۰ صفحه
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۳۰۰۰ تصویر	۳۰۰۰ تصویر
حداکثر تعداد از تصاویر خروجی	---	---
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	۱۰ فایل
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	حدود ۶۰ دقیقه
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	حدود ۴۵ دقیقه
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	۱ فایل
حداکثر تعداد از فایل‌های صوتی خروجی	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	حدود ۸.۴ ساعت
حداکثر طول از تمام صداهای خروجی	---	---

نام مدل‌های موجود از مدل‌های نسل قبلی (شامل تاریخ‌های بازنشستگی)

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

مدل‌های جمینی

نام مدل‌های Gemini 2.0 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.0-flash-001`	آخرین نسخه پایدار Gemini 2.0 Flash	پایدار	۲۰۲۵-۰۲-۰۵	نه زودتر از ۲۰۲۶-۰۲-۰۵
`gemini-2.0-flash`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash اشاره دارد (در حال حاضر `gemini-2.0-flash-001` )	پایدار	۲۰۲۵-۰۲-۱۰	---

نام مدل‌های Gemini 2.0 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.0-flash-lite-001`	آخرین نسخه پایدار Gemini 2.0 Flash‑Lite	پایدار	2025-02-25	نه زودتر از ۲۰۲۶-۰۲-۲۵
`gemini-2.0-flash-lite`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash‑Lite اشاره دارد (در حال حاضر `gemini-2.0-flash-lite-001` )	پایدار	2025-02-25	---

مدل‌های ایمیجن

نام مدل‌های ایمیجن ۳

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-generate-002`	آخرین نسخه پایدار Imagen 3	پایدار	۲۰۲۵-۰۱-۲۳	زودتر از 2026-01-23 مجاز نیست
`imagen-3.0-generate-001` ³	نسخه پایدار اولیه Imagen 3	پایدار	۲۰۲۴-۰۷-۳۱	زودتر از 2025-07-31 مجاز نیست

نام مدل‌های سریع Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-fast-generate-001` ³	نسخه پایدار اولیه Imagen 3 Fast	پایدار	۲۰۲۴-۰۷-۳۱	زودتر از 2025-07-31 مجاز نیست

^{۳ صرف نظر از نحوه دسترسی شما، توسط رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini پشتیبانی نمی‌شود.}

مراحل بعدی

قابلیت‌های رابط برنامه‌نویسی Gemini را امتحان کنید

مکالمات چند نوبتی (چت) بسازید.
تولید متن از درخواست‌های فقط متنی .
با استفاده از انواع فایل‌های مختلف، مانند تصاویر ، فایل‌های PDF ، ویدیو و صدا ، متن را با پرس‌وجو تولید کنید.
خروجی ساختاریافته (مانند JSON) را از هر دو حالت متنی و چندوجهی تولید کنید.
تصاویر را از متن‌های پیشنهادی ( Gemini یا Imagen ) تولید کنید.
ورودی و خروجی (از جمله صدا) را با استفاده از Gemini Live API استریم کنید.
از ابزارهایی (مانند فراخوانی تابع و اتصال به زمین با جستجوی گوگل ) برای اتصال یک مدل Gemini به سایر بخش‌های برنامه و سیستم‌ها و اطلاعات خارجی خود استفاده کنید.