برای برنامههای موبایل و وب، کیتهای توسعه نرمافزار Firebase AI Logic به شما امکان میدهند مستقیماً از طریق برنامه خود با مدلهای Gemini و Imagen پشتیبانیشده تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدلهای Imagen را میتوان با متن برای تولید تصاویر تحریک کرد.
همچنین، سوالات متداول ما را در مورد تمام مدلهایی که Firebase AI Logic پشتیبانی میکند و پشتیبانی نمیکند، بررسی کنید.
مدلهای عمومی
جمینی ۳ پرو
gemini-3-pro-preview
بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنیتر و تعامل عمیقتری را ارائه میدهد، و همگی بر پایه استدلال پیشرفته ساخته شدهاند. (ارائه صورتحساب الزامی است)
جمینی ۲.۵ پرو
gemini-2.5-pro
مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه دادههای بزرگ، پایگاههای کد و اسناد با استفاده از متن طولانی.
فلش جمینی ۲.۵
gemini-2.5-flash
بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیتهای جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است.
جمینی ۲.۵ فلش-لایت
gemini-2.5-flash-lite
سریعترین مدل فلش ما برای صرفهجویی در هزینه و توان عملیاتی بالا بهینه شده است.
مدلهای تولید تصویر
شما میتوانید تصاویر را با مدلهای Gemini یا Imagen تولید کنید.
جوزا
تصویر Gemini 3 Pro (معروف به نانو موز پرو )
gemini-3-pro-image-preview
طراحی شده برای تولید حرفهای داراییها و دستورالعملهای پیچیده. این نرمافزار با استفاده از جستجوی گوگل، یک فرآیند پیشفرض «تفکر» که ترکیببندی را قبل از تولید اصلاح میکند، زمینهسازی در دنیای واقعی را ارائه میدهد و میتواند تصاویری با وضوح حداکثر 4K تولید کند. (نیازمند پرداخت صورتحساب)
ایمیج فلش Gemini 2.5 (معروف به نانو موز )
gemini-2.5-flash-image
طراحی شده برای سرعت و کارایی. برای کارهای با حجم بالا و تأخیر کم بهینه شده و تصاویر را با وضوح 1024 پیکسل تولید میکند. (نیاز به پرداخت صورتحساب)
ایمیجِن
تصویر ۴
imagen-4.0-generate-001
تصاویر واقعی و با کیفیت بالا را از متنهای زبان طبیعی تولید میکند. (نیاز به پرداخت هزینه دارد)
ایمجین ۴ سریع
imagen-4.0-fast-generate-001
تصاویر را برای نمونهسازی اولیه یا موارد استفاده با تأخیر کم تولید میکند. (نیاز به پرداخت صورتحساب)
ایمیجن ۴ اولترا
imagen-4.0-ultra-generate-001
تصاویر واقعی و با کیفیت بالا را از متنهای زبان طبیعی تولید میکند. (نیاز به پرداخت هزینه دارد)
مدلهای تولید صدا
شما میتوانید با مدلهایی که از Gemini Live API پشتیبانی میکنند، صدای استریم شده تولید کنید.
فلش Gemini 2.5 با صدای بومی Gemini Live API
رابط برنامهنویسی کاربردی توسعهدهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025
رابط برنامهنویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio
تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکانپذیر میکند.
مدلهای نسل قبلی
مدلهای زیر فعال هستند، اما از نسل قبلی میباشند. توصیه میکنیم در صورت امکان از جدیدترین مدلها استفاده کنید.
مدلهای جمینی
فلش جمینی ۲.۰
gemini-2.0-flash-001
مدل نسل دوم و قدرتمند ما، با پنجرهی زمینهی ۱ میلیون توکن. ویژگیهای نسل بعدی و قابلیتهای بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه میدهد.
جمینی ۲.۰ فلش-لایت
gemini-2.0-flash-lite-001
مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهرهوری هزینه و تأخیر کم.
ادامهی این صفحه اطلاعات دقیقی در مورد مدلهای پشتیبانیشده توسط Firebase AI Logic ارائه میدهد.
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیتهای پشتیبانیشده
- مشخصات و محدودیتها، برای مثال حداکثر توکنهای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوهی نسخهبندی مدلها ، به ویژه نسخههای پایدار ، بهروزرسانی خودکار ، پیشنمایش و آزمایشی آنها
فهرست نام مدلهای موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبانهای پشتیبانیشده برای مدلها
در پایین این صفحه، میتوانید اطلاعات دقیقی در مورد مدلهای نسل قبلی مشاهده کنید .
مقایسه مدلها
هر مدل قابلیتهای متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح میدهند. هر مدل ممکن است قابلیتهای اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.
اگر اطلاعات مورد نظر خود را در زیربخشهای زیر پیدا نکردید، میتوانید اطلاعات بیشتری را در مستندات ارائهدهنده API انتخابی خود بیابید:
رابط برنامهنویسی کاربردی توسعهدهندگان Gemini : مدلهای Gemini و مدلهای Imagen
Vertex AI Gemini API : مدلهای Gemini و مدلهای Imagen
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
| جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) | |
|---|---|---|---|---|---|---|---|
| انواع ورودی | |||||||
| متن | (پخش جریانی) | ||||||
| کد | |||||||
| اسناد (پیدیاف یا متن ساده) | |||||||
| تصاویر | |||||||
| ویدئو | (پخش جریانی) | ||||||
| صوتی | (پخش جریانی) | ||||||
| انواع خروجی | |||||||
| متن | |||||||
| متن (پخش) | (رونویسی) | ||||||
| کد | |||||||
| خروجی ساختاریافته (مثل جیسون) | |||||||
| تصاویر | |||||||
| صوتی | (پخش جریانی) | ||||||
برای آشنایی با انواع فایلهای پشتیبانیشده، به بخش فایلهای ورودی پشتیبانیشده و الزامات مراجعه کنید.
قابلیتها و ویژگیهای پشتیبانیشده
این قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
| جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) | |
|---|---|---|---|---|---|---|---|
| تفکر | |||||||
| تولید متن از ورودیهای فقط متنی یا چندوجهی | به صورت لایه لایه یا به عنوان بخشی از تصویر | به صورت لایه لایه یا به عنوان بخشی از تصویر | فقط رونویسی | ||||
| تولید تصاویر ( جوزا یا ایمیجن ) | |||||||
| ویرایش تصاویر ( جوزا یا ایمیجن ) | |||||||
| تولید صدا | فقط پخش جریانی | ||||||
| تولید خروجی ساختاریافته (مثل جیسون) | |||||||
| اسناد را تجزیه و تحلیل کنید (پیدیاف یا متن ساده) | |||||||
| تحلیل تصاویر (بینایی) | |||||||
| تجزیه و تحلیل ویدیو (بینایی) | فقط پخش جریانی | ||||||
| تجزیه و تحلیل صدا | فقط پخش جریانی | ||||||
| چت چند نوبتی | فقط پخش جریانی | ||||||
| جریانسازی چندوجهی دوطرفه | |||||||
| فراخوانی تابع | |||||||
| اجرای کد | |||||||
| اتصال به زمین با جستجوی گوگل | |||||||
| دستورالعملهای سیستم | |||||||
| تعداد توکنها |
مشخصات و محدودیتها
مشخصات و محدودیتهای استفاده از هر مدل با Firebase AI Logic به شرح زیر است:
| ملک | جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) |
|---|---|---|---|---|---|---|---|
| محدودیت توکن ورودی * | ۱,۰۴۸,۵۷۶ توکن | ۶۵,۵۳۶ توکن | ۱,۰۴۸,۵۷۶ توکن | ۳۲۷۶۸ توکن | ۳۲ هزار توکن (پیشفرض؛ قابل ارتقا به ۱۲۸ هزار) | ۴۸۰ توکن | ۴۸۰ توکن |
| محدودیت توکن خروجی * | ۶۵,۵۳۶ توکن | ۳۲۷۶۸ توکن | ۶۵,۵۳۶ توکن | ۸,۱۹۲ توکن | ۶۴ هزار توکن | --- | --- |
| تاریخ پایان دانش | ژانویه ۲۰۲۵ | ژانویه ۲۰۲۵ | ژانویه ۲۰۲۵ | ژوئن ۲۰۲۵ | ژانویه ۲۰۲۵ | --- | --- |
| فایلهای PDF (بنا به درخواست) | |||||||
| حداکثر تعداد از فایلهای PDF ورودی ** | ۹۰۰ فایل | ۱۴ فایل | ۳۰۰۰ فایل | ۳ فایل | --- | --- | --- |
| حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی ** | ۹۰۰ صفحه | ۱۴ صفحه | ۱۰۰۰ صفحه | ۳ صفحه | --- | --- | --- |
| حداکثر اندازه به ازای هر فایل PDF ورودی | ۵۰ مگابایت | ۵۰ مگابایت | ۵۰ مگابایت | ۵۰ مگابایت | --- | --- | --- |
| تصاویر (بنا به درخواست) | |||||||
| حداکثر تعداد از تصاویر ورودی | ۱۰۰۰ تصویر | ۱۴ تصویر | ۳۰۰۰ تصویر | ۳ تصویر | --- | --- | ۴ تصویر |
| حداکثر تعداد از تصاویر خروجی | --- | ۱۰ تصویر | --- | ۱۰ تصویر | --- | ۴ تصویر | ۴ تصویر |
| حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی | ۷ مگابایت | ۷ مگابایت | ۷ مگابایت | ۷ مگابایت | --- | --- | --- |
| ویدئو (به درخواست) | |||||||
| حداکثر تعداد از فایلهای ویدیویی ورودی | ۱۰ فایل | --- | ۱۰ فایل | --- | --- | --- | --- |
| حداکثر طول از تمام ویدیوهای ورودی (فقط قابها) | حدود ۶۰ دقیقه | --- | حدود ۶۰ دقیقه | --- | --- | --- | --- |
| حداکثر طول از تمام ویدیوهای ورودی (فریمها + صدا) | حدود ۴۵ دقیقه | --- | حدود ۴۵ دقیقه | --- | --- | --- | --- |
| صدا (به درخواست) | |||||||
| حداکثر تعداد از فایلهای صوتی ورودی | ۱ فایل | --- | ۱ فایل | --- | --- | --- | --- |
| حداکثر تعداد از فایلهای صوتی خروجی | --- | --- | --- | --- | --- | --- | --- |
| حداکثر طول از تمام صداهای ورودی | حدود ۸.۴ ساعت | --- | حدود ۸.۴ ساعت | --- | --- | --- | --- |
| حداکثر طول از تمام صداهای خروجی | --- | --- | --- | --- | --- | --- | --- |
* برای همه مدلهای Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل توکنها را در درخواستهای خود با استفاده countTokens تعیین کنید.
** فایلهای PDF به عنوان تصویر در نظر گرفته میشوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته میشود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل میتواند پشتیبانی کند.
*** مدلهای Gemini 2.5 Flash-Live مدلهای صوتی بومی هستند که از Gemini Live API پشتیبانی میکنند.
اطلاعات دقیق اضافی را پیدا کنید
سهمیهها و قیمتگذاری برای هر مدل متفاوت است. قیمتگذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما الزامات را برآورده میکنند و از بهترین شیوهها در فایلها و الزامات ورودی پشتیبانیشده پیروی میکنند، اطلاعات کسب کنید.
الگوهای نسخهبندی و نامگذاری مدل
مدلها در نسخههای پایدار ، پیشنمایش و آزمایشی ارائه میشوند. برای راحتی، از نامهای مستعار بدون مقادیر نسخه صریح پشتیبانی میشود.
برای یافتن نامهای مدل خاص برای استفاده در کد خود، به بخش «نامهای مدل موجود» در ادامه همین صفحه مراجعه کنید.
| نوع نسخه / مرحله انتشار | توضیحات | الگوی نام مدل | |
|---|---|---|---|
| پایدار | نسخههای پایدار از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی میشوند.
|
| |
| نام مستعار پایدار با بهروزرسانی خودکار (فقط مدلهای Gemini 2.0 ) | نامهای مستعار پایدار که به صورت خودکار بهروزرسانی میشوند، همیشه به آخرین نسخه پایدار آن مدل اشاره میکنند.
| فقط مدلهای Gemini 2.0 مثال: | |
| پیشنمایش | نسخههای پیشنمایش دارای قابلیتهای جدیدی هستند و پایدار محسوب نمیشوند .
| نام مدلهای نسخههای پیشنمایش به همراه ... پیوست شدهاند. مثالها: | |
| تجربی | نسخههای آزمایشی قابلیتهای جدیدی دارند و پایدار تلقی نمیشوند .
| نام مدلهای نسخههای آزمایشی به همراه ... پیوست شده است. مثال: | |
| بازنشسته | نسخههای از رده خارج شده، تاریخ انقضایشان گذشته و برای همیشه غیرفعال شدهاند.
| --- | |
نام مدلهای موجود
نامهای مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار میدهید.
پرش به نام مدلهای پرش به نام مدلهای Imagen
لیست کردن تمام مدلهای موجود به صورت برنامهنویسی شده
شما میتوانید با استفاده از REST API، نام تمام مدلهای موجود را فهرست کنید:
رابط برنامهنویسی کاربردی توسعهدهندگان Gemini : فراخوانی نقطه پایانی
models.listرابط برنامهنویسی کاربردی Vertex AI Gemini : فراخوانی نقطه پایانی
publishers.models.list
توجه داشته باشید که این لیست برگشتی شامل تمام مدلهای پشتیبانیشده توسط ارائهدهندگان API خواهد بود، اما Firebase AI Logic فقط از مدلهای Gemini و Imagen که در این صفحه توضیح داده شدهاند، پشتیبانی میکند. همچنین توجه داشته باشید که نامهای مستعار بهروزرسانیشده خودکار (به عنوان مثال، gemini-2.0-flash ) در فهرست قرار نگرفتهاند زیرا آنها یک نام مستعار برای مدل پایه هستند.
نام مدلهای جمینی
برای مثالهای مقداردهی اولیه برای پلتفرم خود، به راهنمای شروع به کار مراجعه کنید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخهبندی و نامگذاری مدل مراجعه کنید.
نام مدلهای جمینی ۳ پرو
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-3-pro-preview | نسخه پیشنمایش Gemini 3 Pro | پیشنمایش | ۲۰۲۵-۱۱-۱۸ | تعیین خواهد شد |
نام مدلهای Gemini 3 Pro Image (معروف به "nano banana pro")
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-3-pro-image-preview | نسخه پیشنمایش تصویر Gemini 3 Pro (معروف به "نانو موز پرو") | پیشنمایش | ۲۰۲۵-۱۱-۲۰ | تعیین خواهد شد |
نام مدلهای Gemini 2.5 Pro
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.5-pro | نسخه پایدار Gemini 2.5 Pro | پایدار | ۲۰۲۵-۰۶-۱۷ | نه زودتر از ۲۰۲۶-۰۶-۱۷ |
نام مدلهای Gemini 2.5 Flash
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.5-flash | نسخه پایدار Gemini 2.5 Flash | پایدار | ۲۰۲۵-۰۶-۱۷ | نه زودتر از ۲۰۲۶-۰۶-۱۷ |
نام مدلهای Gemini 2.5 Flash‑Lite
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.5-flash-lite | نسخه پایدار Gemini 2.5 Flash‑Lite | پایدار | ۲۰۲۵-۰۷-۲۲ | نه زودتر از ۲۰۲۶-۰۷-۲۲ |
نام مدلهای تصویر فلش Gemini 2.5 (معروف به "نانو موز")
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.5-flash-image | نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز") | پایدار | ۲۰۲۵-۱۰-۰۲ | نه زودتر از ۲۰۲۶-۱۰-۰۲ |
نام مدلهای Gemini 2.5 Flash Live
مدلهای Gemini 2.5 Flash Live مدلهای صوتی بومی هستند که از Gemini Live API پشتیبانی میکنند. اگرچه این مدل بسته به ارائهدهنده Gemini API نامهای مختلفی دارد، اما رفتار و ویژگیهای مدل یکسان است.
| رابط برنامهنویسی کاربردی (API) توسعهدهندگان جمینی نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 ۱ | آخرین نسخه پیشنمایش برای Live API در Gemini Developer API | پیشنمایش | ۲۰۲۵-۱۲-۱۲ | تعیین خواهد شد |
gemini-2.5-flash-native-audio-preview-09-2025 ۱ | نسخه پیشنمایش اولیه برای Live API در Gemini Developer API | پیشنمایش | ۲۰۲۵-۰۹-۱۸ | تعیین خواهد شد |
| Vertex AI Gemini API نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio شدهاند | نسخه پایدار برای Live API روی API Vertex AI Gemini | پایدار | ۲۰۲۵-۱۲-۱۲ | نه زودتر از ۲۰۲۶-۱۲-۱۲ |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 | نسخه پیشنمایش برای Live API در Vertex AI Gemini API | پیشنمایش | ۲۰۲۵-۰۹-۱۸ | تعیین خواهد شد |
۱ فقط توسط رابط برنامهنویسی نرمافزار Gemini Developer پشتیبانی میشود. همچنین، اگرچه اینها مدلهای پیشنمایش هستند، اما در «ردیف رایگان» رابط برنامهنویسی نرمافزار Gemini Developer در دسترس هستند.
۲ فقط توسط Vertex AI Gemini API پشتیبانی میشود. همچنین، این مدلها در موقعیت global پشتیبانی نمیشوند.
نام مدلهای ایمیجن
برای مثالهای مقداردهی اولیه برای پلتفرم خود، به راهنمای تولید تصاویر با Imagen مراجعه کنید.
برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخهبندی و نامگذاری مدل مراجعه کنید.
نام مدلهای ایمیجن ۴
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-4.0-generate-001 | نسخه پایدار Imagen 4 | پایدار | ۱۴-۰۸-۲۰۲۵ | زودتر از 2026-08-14 مجاز نیست |
نام مدلهای Imagen 4 Fast
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 | نسخه پایدار Imagen 4 Fast | پایدار | ۱۴-۰۸-۲۰۲۵ | زودتر از 2026-08-14 مجاز نیست |
نام مدلهای ایمیجن ۴ اولترا
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 | نسخه پایدار Imagen 4 Ultra | پایدار | ۱۴-۰۸-۲۰۲۵ | زودتر از 2026-08-14 مجاز نیست |
نام مدلهای قابلیت Imagen 3
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-3.0-capability-001 2 | نسخه پایدار اولیه قابلیت Imagen 3 | پایدار | ۲۰۲۴-۱۲-۱۰ | زودتر از 2025-12-10 |
۲- صرف نظر از نحوه دسترسی شما، توسط رابط برنامهنویسی کاربردی توسعهدهندگان Gemini پشتیبانی نمیشود.
زبانهای پشتیبانیشده
جوزا
تمام مدلهای Gemini میتوانند زبانهای زیر را درک کرده و به آنها پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی سادهشده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، کرهای (ko)، لتونیایی (lv)، لیتوانیایی (lt)، نروژی (no)، لهستانی (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (uk)، ویتنامی (vi)
مدلهای Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند زبانهای اضافی زیر را درک کرده و به آنها پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مقدونی، مالاگاسی (mk)، مالایالام (ml)، مغولی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (Pa), Pashtoinhales (Pashto) (si)، ساموآیی (sm)، شونا (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغور (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
ایمیجِن
دسترسی عمومی : انگلیسی
پیشنمایش : چینی (سادهشده)، چینی (سنتی)، هندی، ژاپنی، کرهای، پرتغالی، اسپانیایی
اطلاعات مربوط به مدلهای قبلی
مدلهای زیر فعال هستند، اما از نسل قبلی میباشند. توصیه میکنیم در صورت امکان از جدیدترین مدلها استفاده کنید.
مدلهای جمینی
-
gemini-2.0-flash-001(و نام مستعار بهروزرسانیشده خودکار آنgemini-2.0-flash) -
gemini-2.0-flash-lite-001(و نام مستعار بهروزرسانیشده خودکار آنgemini-2.0-flash-lite)
برای اطلاعات بیشتر در مورد مدلهای قدیمیتر Gemini Live API ، به مستندات ارائهدهنده Gemini API مراجعه کنید:
مدلهای ایمیجن
-
imagen-3.0-generate-002 -
imagen-3.0-fast-generate-001
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Firebase AI Logic هستند:
| جوزا فلش ۲.۰ | جوزا فلش ۲.۰ لایت | |
|---|---|---|
| انواع ورودی | ||
| متن | ||
| متن (پخش) | ||
| کد | ||
| اسناد (پیدیاف یا متن ساده) | ||
| تصاویر | ||
| ویدئو | ||
| صوتی | ||
| صدا (پخش جریانی) | ||
| انواع خروجی | ||
| متن | ||
| متن (پخش) | ||
| کد | ||
| خروجی ساختاریافته (مثل جیسون) | ||
| تصاویر | ||
| صوتی | ||
| صدا (پخش جریانی) | ||
این قابلیتها و ویژگیها هنگام استفاده از هر مدل با Firebase AI Logic وجود دارد:
| جوزا فلش ۲.۰ | جوزا فلش ۲.۰ لایت | |
|---|---|---|
| تفکر | ||
| تولید متن از ورودیهای فقط متنی یا چندوجهی | ||
| تولید تصاویر ( جوزا یا ایمیجن ) | ||
| ویرایش تصاویر ( جوزا یا ایمیجن ) | ||
| تولید صدا | ||
| تولید خروجی ساختاریافته (مثل جیسون) | ||
| اسناد را تجزیه و تحلیل کنید (پیدیاف یا متن ساده) | ||
| تحلیل تصاویر (بینایی) | ||
| تجزیه و تحلیل ویدیو (بینایی) | ||
| تجزیه و تحلیل صدا | ||
| چت چند نوبتی | ||
| جریانسازی چندوجهی دوطرفه | ||
| فراخوانی تابع | ||
| اجرای کد | ||
| اتصال به زمین با جستجوی گوگل | ||
| دستورالعملهای سیستم | ||
| تعداد توکنها |
مشخصات و محدودیتهای استفاده از هر مدل با Firebase AI Logic به شرح زیر است:
| ملک | جوزا فلش ۲.۰ | جوزا فلش ۲.۰ لایت |
|---|---|---|
| پنجره زمینه * محدودیت کل توکن (ورودی + خروجی ترکیبی) | ۱,۰۴۸,۵۷۶ توکن | ۱,۰۴۸,۵۷۶ توکن |
| محدودیت توکن خروجی * | ۸,۱۹۲ توکن | ۸,۱۹۲ توکن |
| تاریخ پایان دانش | ژوئن ۲۰۲۴ | ژوئن ۲۰۲۴ |
| فایلهای PDF (بنا به درخواست) | ||
| حداکثر تعداد از فایلهای PDF ورودی ** | ۳۰۰۰ فایل | ۳۰۰۰ فایل |
| حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی ** | ۱۰۰۰ صفحه | ۱۰۰۰ صفحه |
| حداکثر اندازه به ازای هر فایل PDF ورودی | ۵۰ مگابایت | ۵۰ مگابایت |
| تصاویر (بنا به درخواست) | ||
| حداکثر تعداد از تصاویر ورودی | ۳۰۰۰ تصویر | ۳۰۰۰ تصویر |
| حداکثر تعداد از تصاویر خروجی | --- | --- |
| حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی | ۷ مگابایت | ۷ مگابایت |
| ویدئو (به درخواست) | ||
| حداکثر تعداد از فایلهای ویدیویی ورودی | ۱۰ فایل | ۱۰ فایل |
| حداکثر طول از تمام ویدیوهای ورودی (فقط قابها) | حدود ۶۰ دقیقه | حدود ۶۰ دقیقه |
| حداکثر طول از تمام ویدیوهای ورودی (فریمها + صدا) | حدود ۴۵ دقیقه | حدود ۴۵ دقیقه |
| صدا (به درخواست) | ||
| حداکثر تعداد از فایلهای صوتی ورودی | ۱ فایل | ۱ فایل |
| حداکثر تعداد از فایلهای صوتی خروجی | --- | --- |
| حداکثر طول از تمام صداهای ورودی | حدود ۸.۴ ساعت | حدود ۸.۴ ساعت |
| حداکثر طول از تمام صداهای خروجی | --- | --- |
* برای همه مدلهای Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل توکنها را در درخواستهای خود با استفاده countTokens تعیین کنید.
** فایلهای PDF به عنوان تصویر در نظر گرفته میشوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته میشود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل میتواند پشتیبانی کند.
نامهای مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار میدهید.
مدلهای جمینی
نام مدلهای Gemini 2.0 Flash
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | پایدار | ۲۰۲۵-۰۲-۰۵ | نه زودتر از ۲۰۲۶-۰۲-۰۵ |
gemini-2.0-flash | نام مستعار بهروزرسانیشده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash اشاره دارد (در حال حاضر gemini-2.0-flash-001 ) | پایدار | ۲۰۲۵-۰۲-۱۰ | --- |
نام مدلهای Gemini 2.0 Flash‑Lite
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
gemini-2.0-flash-lite-001 | آخرین نسخه پایدار Gemini 2.0 Flash‑Lite | پایدار | 2025-02-25 | نه زودتر از ۲۰۲۶-۰۲-۲۵ |
gemini-2.0-flash-lite | نام مستعار بهروزرسانیشده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash‑Lite اشاره دارد (در حال حاضر gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
مدلهای ایمیجن
نام مدلهای ایمیجن ۳
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-3.0-generate-002 | آخرین نسخه پایدار Imagen 3 | پایدار | ۲۰۲۵-۰۱-۲۳ | زودتر از 2026-01-23 مجاز نیست |
imagen-3.0-generate-001 3 | نسخه پایدار اولیه Imagen 3 | پایدار | ۲۰۲۴-۰۷-۳۱ | زودتر از 2025-07-31 مجاز نیست |
نام مدلهای سریع Imagen 3
| نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار | تاریخ بازنشستگی |
|---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | نسخه پایدار اولیه Imagen 3 Fast | پایدار | ۲۰۲۴-۰۷-۳۱ | زودتر از 2025-07-31 مجاز نیست |
۳ صرف نظر از نحوه دسترسی شما، توسط رابط برنامهنویسی کاربردی توسعهدهندگان Gemini پشتیبانی نمیشود.
مراحل بعدی
قابلیتهای رابط برنامهنویسی Gemini را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- تولید متن از درخواستهای فقط متنی .
- با استفاده از انواع فایلهای مختلف، مانند تصاویر ، فایلهای PDF ، ویدیو و صدا ، متن را با پرسوجو تولید کنید.
- خروجی ساختاریافته (مانند JSON) را از هر دو حالت متنی و چندوجهی تولید کنید.
- تصاویر را از متنهای پیشنهادی ( Gemini یا Imagen ) تولید کنید.
- ورودی و خروجی (از جمله صدا) را با استفاده از Gemini Live API استریم کنید.
- از ابزارهایی (مانند فراخوانی تابع و اتصال به زمین با جستجوی گوگل ) برای اتصال یک مدل Gemini به سایر بخشهای برنامه و سیستمها و اطلاعات خارجی خود استفاده کنید.
برای برنامههای موبایل و وب، کیتهای توسعه نرمافزار Firebase AI Logic به شما امکان میدهند مستقیماً از طریق برنامه خود با مدلهای Gemini و Imagen پشتیبانیشده تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدلهای Imagen را میتوان با متن برای تولید تصاویر تحریک کرد.
همچنین، سوالات متداول ما را در مورد تمام مدلهایی که Firebase AI Logic پشتیبانی میکند و پشتیبانی نمیکند، بررسی کنید.
مدلهای عمومی
جمینی ۳ پرو
gemini-3-pro-preview
بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنیتر و تعامل عمیقتری را ارائه میدهد، و همگی بر پایه استدلال پیشرفته ساخته شدهاند. (ارائه صورتحساب الزامی است)
جمینی ۲.۵ پرو
gemini-2.5-pro
مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه دادههای بزرگ، پایگاههای کد و اسناد با استفاده از متن طولانی.
فلش جمینی ۲.۵
gemini-2.5-flash
بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیتهای جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است.
جمینی ۲.۵ فلش-لایت
gemini-2.5-flash-lite
سریعترین مدل فلش ما برای صرفهجویی در هزینه و توان عملیاتی بالا بهینه شده است.
مدلهای تولید تصویر
شما میتوانید تصاویر را با مدلهای Gemini یا Imagen تولید کنید.
جوزا
تصویر Gemini 3 Pro (معروف به نانو موز پرو )
gemini-3-pro-image-preview
طراحی شده برای تولید حرفهای داراییها و دستورالعملهای پیچیده. این نرمافزار با استفاده از جستجوی گوگل، یک فرآیند پیشفرض «تفکر» که ترکیببندی را قبل از تولید اصلاح میکند، زمینهسازی در دنیای واقعی را ارائه میدهد و میتواند تصاویری با وضوح حداکثر 4K تولید کند. (نیازمند پرداخت صورتحساب)
ایمیج فلش Gemini 2.5 (معروف به نانو موز )
gemini-2.5-flash-image
طراحی شده برای سرعت و کارایی. برای کارهای با حجم بالا و تأخیر کم بهینه شده و تصاویر را با وضوح 1024 پیکسل تولید میکند. (نیاز به پرداخت صورتحساب)
ایمیجِن
تصویر ۴
imagen-4.0-generate-001
تصاویر واقعی و با کیفیت بالا را از متنهای زبان طبیعی تولید میکند. (نیاز به پرداخت هزینه دارد)
ایمجین ۴ سریع
imagen-4.0-fast-generate-001
تصاویر را برای نمونهسازی اولیه یا موارد استفاده با تأخیر کم تولید میکند. (نیاز به پرداخت صورتحساب)
ایمیجن ۴ اولترا
imagen-4.0-ultra-generate-001
تصاویر واقعی و با کیفیت بالا را از متنهای زبان طبیعی تولید میکند. (نیاز به پرداخت هزینه دارد)
مدلهای تولید صدا
شما میتوانید با مدلهایی که از Gemini Live API پشتیبانی میکنند، صدای استریم شده تولید کنید.
فلش Gemini 2.5 با صدای بومی Gemini Live API
رابط برنامهنویسی کاربردی توسعهدهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025
رابط برنامهنویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio
تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکانپذیر میکند.
مدلهای نسل قبلی
مدلهای زیر فعال هستند، اما از نسل قبلی میباشند. توصیه میکنیم در صورت امکان از جدیدترین مدلها استفاده کنید.
مدلهای جمینی
فلش جمینی ۲.۰
gemini-2.0-flash-001
مدل نسل دوم و قدرتمند ما، با پنجرهی زمینهی ۱ میلیون توکن. ویژگیهای نسل بعدی و قابلیتهای بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه میدهد.
جمینی ۲.۰ فلش-لایت
gemini-2.0-flash-lite-001
مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهرهوری هزینه و تأخیر کم.
ادامهی این صفحه اطلاعات دقیقی در مورد مدلهای پشتیبانیشده توسط Firebase AI Logic ارائه میدهد.
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیتهای پشتیبانیشده
- مشخصات و محدودیتها، برای مثال حداکثر توکنهای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوهی نسخهبندی مدلها ، به ویژه نسخههای پایدار ، بهروزرسانی خودکار ، پیشنمایش و آزمایشی آنها
فهرست نام مدلهای موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبانهای پشتیبانیشده برای مدلها
در پایین این صفحه، میتوانید اطلاعات دقیقی در مورد مدلهای نسل قبلی مشاهده کنید .
مقایسه مدلها
هر مدل قابلیتهای متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح میدهند. هر مدل ممکن است قابلیتهای اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.
اگر اطلاعات مورد نظر خود را در زیربخشهای زیر پیدا نکردید، میتوانید اطلاعات بیشتری را در مستندات ارائهدهنده API انتخابی خود بیابید:
رابط برنامهنویسی کاربردی توسعهدهندگان Gemini : مدلهای Gemini و مدلهای Imagen
Vertex AI Gemini API : مدلهای Gemini و مدلهای Imagen
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
| جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) | |
|---|---|---|---|---|---|---|---|
| انواع ورودی | |||||||
| متن | (پخش جریانی) | ||||||
| کد | |||||||
| اسناد (پیدیاف یا متن ساده) | |||||||
| تصاویر | |||||||
| ویدئو | (پخش جریانی) | ||||||
| صوتی | (پخش جریانی) | ||||||
| انواع خروجی | |||||||
| متن | |||||||
| متن (پخش) | (رونویسی) | ||||||
| کد | |||||||
| خروجی ساختاریافته (مثل جیسون) | |||||||
| تصاویر | |||||||
| صوتی | (پخش جریانی) | ||||||
برای آشنایی با انواع فایلهای پشتیبانیشده، به بخش فایلهای ورودی پشتیبانیشده و الزامات مراجعه کنید.
قابلیتها و ویژگیهای پشتیبانیشده
این قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Firebase AI Logic هستند:
| جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) | |
|---|---|---|---|---|---|---|---|
| تفکر | |||||||
| تولید متن از ورودیهای فقط متنی یا چندوجهی | به صورت لایه لایه یا به عنوان بخشی از تصویر | به صورت لایه لایه یا به عنوان بخشی از تصویر | فقط رونویسی | ||||
| تولید تصاویر ( جوزا یا ایمیجن ) | |||||||
| ویرایش تصاویر ( جوزا یا ایمیجن ) | |||||||
| تولید صدا | فقط پخش جریانی | ||||||
| تولید خروجی ساختاریافته (مثل جیسون) | |||||||
| اسناد را تجزیه و تحلیل کنید (پیدیاف یا متن ساده) | |||||||
| تحلیل تصاویر (بینایی) | |||||||
| تجزیه و تحلیل ویدیو (بینایی) | فقط پخش جریانی | ||||||
| تجزیه و تحلیل صدا | فقط پخش جریانی | ||||||
| چت چند نوبتی | فقط پخش جریانی | ||||||
| جریانسازی چندوجهی دوطرفه | |||||||
| فراخوانی تابع | |||||||
| اجرای کد | |||||||
| اتصال به زمین با جستجوی گوگل | |||||||
| دستورالعملهای سیستم | |||||||
| تعداد توکنها |
مشخصات و محدودیتها
مشخصات و محدودیتهای استفاده از هر مدل با Firebase AI Logic به شرح زیر است:
| ملک | جوزا ۳ پرو | جوزا ۳ پرو تصویر | جوزا ۲.۵ پرو، فلش، فلش-لایت | جوزا ۲.۵ فلش تصویر | جوزا ۲.۵ فلش- زنده *** | تصویر (تولید) | تصویر (قابلیت) |
|---|---|---|---|---|---|---|---|
| محدودیت توکن ورودی * | ۱,۰۴۸,۵۷۶ توکن | ۶۵,۵۳۶ توکن | ۱,۰۴۸,۵۷۶ توکن | ۳۲۷۶۸ توکن | ۳۲ هزار توکن (پیشفرض؛ قابل ارتقا به ۱۲۸ هزار) | ۴۸۰ توکن | ۴۸۰ توکن |
| محدودیت توکن خروجی * | ۶۵,۵۳۶ توکن | ۳۲۷۶۸ توکن | ۶۵,۵۳۶ توکن | ۸,۱۹۲ توکن | ۶۴ هزار توکن | --- | --- |
| تاریخ پایان دانش | ژانویه ۲۰۲۵ | ژانویه ۲۰۲۵ | ژانویه ۲۰۲۵ | ژوئن ۲۰۲۵ | ژانویه ۲۰۲۵ | --- | --- |
| فایلهای PDF (بنا به درخواست) | |||||||
| حداکثر تعداد از فایلهای PDF ورودی ** | ۹۰۰ فایل | ۱۴ فایل | ۳۰۰۰ فایل | ۳ فایل | --- | --- | --- |
| حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی ** | ۹۰۰ صفحه | ۱۴ صفحه | ۱۰۰۰ صفحه | ۳ صفحه | --- | --- | --- |
| حداکثر اندازه به ازای هر فایل PDF ورودی | ۵۰ مگابایت | ۵۰ مگابایت | ۵۰ مگابایت | ۵۰ مگابایت | --- | --- | --- |
| تصاویر (بنا به درخواست) | |||||||
| حداکثر تعداد از تصاویر ورودی | ۱۰۰۰ تصویر | ۱۴ تصویر | ۳۰۰۰ تصویر | ۳ تصویر | --- | --- | ۴ تصویر |
| حداکثر تعداد از تصاویر خروجی | --- | ۱۰ تصویر | --- | ۱۰ تصویر | --- | ۴ تصویر | ۴ تصویر |
| حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی | ۷ مگابایت | ۷ مگابایت | ۷ مگابایت | ۷ مگابایت | --- | --- | --- |
| ویدئو (به درخواست) | |||||||
| حداکثر تعداد از فایلهای ویدیویی ورودی | ۱۰ فایل | --- | ۱۰ فایل | --- | --- | --- | --- |
| حداکثر طول از تمام ویدیوهای ورودی (فقط قابها) | حدود ۶۰ دقیقه | --- | حدود ۶۰ دقیقه | --- | --- | --- | --- |
| حداکثر طول از تمام ویدیوهای ورودی (فریمها + صدا) | حدود ۴۵ دقیقه | --- | حدود ۴۵ دقیقه | --- | --- | --- | --- |
| صدا (به درخواست) | |||||||
| حداکثر تعداد از فایلهای صوتی ورودی | ۱ فایل | --- | ۱ فایل | --- | --- | --- | --- |
| حداکثر تعداد از فایلهای صوتی خروجی | --- | --- | --- | --- | --- | --- | --- |
| حداکثر طول از تمام صداهای ورودی | حدود ۸.۴ ساعت | --- | حدود ۸.۴ ساعت | --- | --- | --- | --- |
| حداکثر طول از تمام صداهای خروجی | --- | --- | --- | --- | --- | --- | --- |
* برای همه مدلهای Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل توکنها را در درخواستهای خود با استفاده countTokens تعیین کنید.
** فایلهای PDF به عنوان تصویر در نظر گرفته میشوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته میشود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل میتواند پشتیبانی کند.
*** مدلهای Gemini 2.5 Flash-Live مدلهای صوتی بومی هستند که از Gemini Live API پشتیبانی میکنند.
اطلاعات دقیق اضافی را پیدا کنید
سهمیهها و قیمتگذاری برای هر مدل متفاوت است. قیمتگذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما الزامات را برآورده میکنند و از بهترین شیوهها در فایلها و الزامات ورودی پشتیبانیشده پیروی میکنند، اطلاعات کسب کنید.
الگوهای نسخهبندی و نامگذاری مدل
مدلها در نسخههای پایدار ، پیشنمایش و آزمایشی ارائه میشوند. برای راحتی، از نامهای مستعار بدون مقادیر نسخه صریح پشتیبانی میشود.
برای یافتن نامهای مدل خاص برای استفاده در کد خود، به بخش «نامهای مدل موجود» در ادامه همین صفحه مراجعه کنید.
| نوع نسخه / مرحله انتشار | توضیحات | الگوی نام مدل | |
|---|---|---|---|
| پایدار | نسخههای پایدار از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی میشوند.
|
| |
| نام مستعار پایدار با بهروزرسانی خودکار (فقط مدلهای Gemini 2.0 ) | نامهای مستعار پایدار که به صورت خودکار بهروزرسانی میشوند، همیشه به آخرین نسخه پایدار آن مدل اشاره میکنند.
| فقط مدلهای Gemini 2.0 مثال: | |
| پیشنمایش | نسخههای پیشنمایش دارای قابلیتهای جدیدی هستند و پایدار محسوب نمیشوند .
| Model names of preview versions are appended with مثالها: | |
| تجربی | Experimental versions have new capabilities and are considered not stable .
| Model names of experimental versions are appended with مثال: | |
| بازنشسته | Retired versions are past their retirement date and have been permanently deactivated.
| --- | |
Available model names
Model names are the explicit values that you include in your code during initialization of the model.
Jump to Gemini model names Jump to Imagen model names
Programmatically list all available models
You can list all available models names using the REST API:
Gemini Developer API : Call the
models.listendpointVertex AI Gemini API : Call the
publishers.models.listendpoint
Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash ) aren't listed because they're a convenience alias for the base model.
Gemini model names
For initialization examples for your platform, see the getting started guide .
For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .
Gemini 3 Pro model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-3-pro-preview | Preview version of Gemini 3 Pro | پیشنمایش | ۲۰۲۵-۱۱-۱۸ | تعیین خواهد شد |
Gemini 3 Pro Image model names (aka "nano banana pro")
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-3-pro-image-preview | Preview version of Gemini 3 Pro Image (aka "nano banana pro") | پیشنمایش | ۲۰۲۵-۱۱-۲۰ | تعیین خواهد شد |
Gemini 2.5 Pro model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.5-pro | Stable version of Gemini 2.5 Pro | پایدار | ۲۰۲۵-۰۶-۱۷ | No earlier than 2026-06-17 |
Gemini 2.5 Flash model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash | Stable version of Gemini 2.5 Flash | پایدار | ۲۰۲۵-۰۶-۱۷ | No earlier than 2026-06-17 |
Gemini 2.5 Flash‑Lite model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-lite | Stable version of Gemini 2.5 Flash‑Lite | پایدار | ۲۰۲۵-۰۷-۲۲ | No earlier than 2026-07-22 |
Gemini 2.5 Flash Image model names (aka "nano banana")
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-image | Stable version for Gemini 2.5 Flash Image (aka "nano banana") | پایدار | ۲۰۲۵-۱۰-۰۲ | No earlier than 2026-10-02 |
Gemini 2.5 Flash Live model names
Gemini 2.5 Flash Live models are the native audio models that support the Gemini Live API . Even though the model has different model names depending on the Gemini API provider, the behavior and features of the model are the same.
| رابط برنامهنویسی کاربردی (API) توسعهدهندگان جمینی نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 | Latest preview version for the Live API on the Gemini Developer API | پیشنمایش | ۲۰۲۵-۱۲-۱۲ | تعیین خواهد شد |
gemini-2.5-flash-native-audio-preview-09-2025 1 | Initial preview version for the Live API on the Gemini Developer API | پیشنمایش | ۲۰۲۵-۰۹-۱۸ | تعیین خواهد شد |
| Vertex AI Gemini API نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 | Stable version for the Live API on the Vertex AI Gemini API | پایدار | ۲۰۲۵-۱۲-۱۲ | No earlier than 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 | Preview version for the Live API on the Vertex AI Gemini API | پیشنمایش | ۲۰۲۵-۰۹-۱۸ | تعیین خواهد شد |
1 Only supported by the Gemini Developer API . Also, even though these are preview models, they're available on the "free tier" of the Gemini Developer API .
2 Only supported by the Vertex AI Gemini API . Also, these models are not supported in the global location.
Imagen model names
For initialization examples for your platform, see the generate images with Imagen guide .
For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .
Imagen 4 model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-4.0-generate-001 | Stable version of Imagen 4 | پایدار | ۱۴-۰۸-۲۰۲۵ | No earlier than 2026-08-14 |
Imagen 4 Fast model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 | Stable version of Imagen 4 Fast | پایدار | ۱۴-۰۸-۲۰۲۵ | No earlier than 2026-08-14 |
Imagen 4 Ultra model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 | Stable version of Imagen 4 Ultra | پایدار | ۱۴-۰۸-۲۰۲۵ | No earlier than 2026-08-14 |
Imagen 3 Capability model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-3.0-capability-001 2 | Initial stable version of Imagen 3 Capability | پایدار | ۲۰۲۴-۱۲-۱۰ | No earlier than 2025-12-10 |
2 Not supported by the Gemini Developer API no matter how you access it.
زبانهای پشتیبانیشده
جوزا
All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
ایمیجِن
General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish
Information about previous models
The following are active, but previous generation models. We recommend using one of the latest models instead when possible.
مدلهای جمینی
-
gemini-2.0-flash-001(and its auto-updated aliasgemini-2.0-flash) -
gemini-2.0-flash-lite-001(and its auto-updated aliasgemini-2.0-flash-lite)
For information about older Gemini Live API models, see the Gemini API provider documentation:
Imagen models
-
imagen-3.0-generate-002 -
imagen-3.0-fast-generate-001
These are the input and output types when using each model with Firebase AI Logic :
| جوزا 2.0 Flash | جوزا 2.0 Flash- لایت | |
|---|---|---|
| Input types | ||
| متن | ||
| Text (streaming) | ||
| کد | ||
| اسناد (PDFs or plain-text) | ||
| تصاویر | ||
| ویدئو | ||
| صوتی | ||
| Audio (streaming) | ||
| انواع خروجی | ||
| متن | ||
| Text (streaming) | ||
| کد | ||
| خروجی ساختاریافته (like JSON) | ||
| تصاویر | ||
| صوتی | ||
| Audio (streaming) | ||
These are the capabilities and features when using each model with Firebase AI Logic :
| جوزا 2.0 Flash | جوزا 2.0 Flash- لایت | |
|---|---|---|
| تفکر | ||
| Generate text from text-only or multimodal inputs | ||
| تولید تصاویر ( Gemini or Imagen ) | ||
| Edit images ( Gemini or Imagen ) | ||
| تولید صدا | ||
| Generate structured output (like JSON) | ||
| Analyze documents (PDFs or plain-text) | ||
| Analyze images (vision) | ||
| Analyze video (vision) | ||
| تجزیه و تحلیل صدا | ||
| Multi-turn chat | ||
| Bidirectional multimodal streaming | ||
| فراخوانی تابع | ||
| اجرای کد | ||
| اتصال به زمین با جستجوی گوگل | ||
| دستورالعملهای سیستم | ||
| تعداد توکنها |
These are the specifications and limitations when using each model with Firebase AI Logic :
| ملک | جوزا 2.0 Flash | جوزا 2.0 Flash- لایت |
|---|---|---|
| Context window * Total token limit (combined input+output) | 1,048,576 tokens | 1,048,576 tokens |
| Output token limit * | 8,192 tokens | 8,192 tokens |
| Knowledge cutoff date | ژوئن ۲۰۲۴ | ژوئن ۲۰۲۴ |
| PDFs (per request) | ||
| Max number of input PDF files ** | 3,000 files | 3,000 files |
| Max number of pages per input PDF file ** | 1,000 pages | 1,000 pages |
| حداکثر اندازه per input PDF file | ۵۰ مگابایت | ۵۰ مگابایت |
| Images (per request) | ||
| Max number of input images | 3,000 images | 3,000 images |
| Max number of output images | --- | --- |
| حداکثر اندازه per input base64-encoded image | ۷ مگابایت | ۷ مگابایت |
| Video (per request) | ||
| Max number of input video files | ۱۰ فایل | ۱۰ فایل |
| حداکثر طول of all input video (frames only) | ~60 minutes | ~60 minutes |
| حداکثر طول of all input video (frames+audio) | ~45 minutes | ~45 minutes |
| Audio (per request) | ||
| Max number of input audio files | ۱ فایل | ۱ فایل |
| Max number of output audio files | --- | --- |
| حداکثر طول of all input audio | ~8.4 hours | ~8.4 hours |
| حداکثر طول of all output audio | --- | --- |
* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens .
** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.
Model names are the explicit values that you include in your code during initialization of the model.
مدلهای جمینی
Gemini 2.0 Flash model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.0-flash-001 | Latest stable version of Gemini 2.0 Flash | پایدار | ۲۰۲۵-۰۲-۰۵ | No earlier than 2026-02-05 |
gemini-2.0-flash | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (currently gemini-2.0-flash-001 ) | پایدار | ۲۰۲۵-۰۲-۱۰ | --- |
Gemini 2.0 Flash‑Lite model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
gemini-2.0-flash-lite-001 | Latest stable version of Gemini 2.0 Flash‑Lite | پایدار | 2025-02-25 | No earlier than 2026-02-25 |
gemini-2.0-flash-lite | Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (currently gemini-2.0-flash-lite-001 ) | پایدار | 2025-02-25 | --- |
Imagen models
Imagen 3 model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-3.0-generate-002 | Latest stable version of Imagen 3 | پایدار | ۲۰۲۵-۰۱-۲۳ | No earlier than 2026-01-23 |
imagen-3.0-generate-001 3 | Initial stable version of Imagen 3 | پایدار | ۲۰۲۴-۰۷-۳۱ | No earlier than 2025-07-31 |
Imagen 3 Fast model names
| نام مدل | توضیحات | Release stage | تاریخ انتشار | Retirement date |
|---|---|---|---|---|
imagen-3.0-fast-generate-001 3 | Initial stable version of Imagen 3 Fast | پایدار | ۲۰۲۴-۰۷-۳۱ | No earlier than 2025-07-31 |
3 Not supported by the Gemini Developer API no matter how you access it.
مراحل بعدی
Try out the capabilities of the Gemini API
- Build multi-turn conversations (chat) .
- Generate text from text-only prompts .
- Generate text by prompting with various file types, like images , PDFs , video , and audio .
- Generate structured output (like JSON) from both text and multimodal prompts.
- Generate images from text prompts ( Gemini or Imagen ).
- Stream input and output (including audio) using the Gemini Live API .
- Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.