با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، Vertex AI در Firebase SDK به شما امکان می‌دهد با مدل‌های پشتیبانی‌شده Gemini و مدل‌های Imagen 3 مستقیماً از برنامه خود تعامل داشته باشید.

مدل‌های جمینی چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایل‌های PDF، تصاویر، ویدئو و صدا هستند. از مدل های Imagen 3 می توان با متن برای تولید تصاویر درخواست کرد.

جدول زیر مروری کوتاه بر مدل های پشتیبانی شده برای Vertex AI در Firebase و آخرین نام مدل های پایدار آنها است. این جدول همچنین مدل‌های پیش‌نمایش و آزمایشی را که برای نمونه‌سازی موارد استفاده در دسترس هستند، فهرست می‌کند.

مدل ورودی خروجی توضیحات
مدل های جمینی با نسخه های پایدار
فلش جمینی 2.0
gemini-2.0-flash-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON
(تصاویر و صدا به زودی!)
ویژگی ها و سرعت نسل بعدی را برای انواع مختلفی از وظایف فراهم می کند
(نسل چند وجهی به زودی!)
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد مقرون به صرفه و تاخیر کم را ارائه می دهد. از توان عملیاتی بالا پشتیبانی می کند
جمینی 1.5 پرو
gemini-1.5-pro-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON پشتیبانی از وظایف استدلالی پیچیده که نیاز به هوش بیشتری دارند. زمینه طولانی 2M
فلش جمینی 1.5
gemini-1.5-flash-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد سریع و همه کاره را در انواع مختلف وظایف ارائه می دهد
مدل‌های Gemini فقط با نسخه‌های پیش‌نمایش و آزمایشی (فقط برای نمونه‌سازی موارد استفاده توصیه می‌شود)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON قوی ترین کیفیت مدل را به خصوص برای کد و دانش جهانی ارائه می دهد. زمینه طولانی 2M
Gemini 2.0 Flash-Thinking
gemini-2.0-flash-thinking-exp-01-21
متن، کد، فایل های PDF، تصاویر متن، کد، JSON قابلیت‌های استدلال قوی‌تری ارائه می‌دهد و فرآیند تفکر را در پاسخ‌ها شامل می‌شود
مدل های Imagen 3 (هنگام استفاده با Vertex AI در Firebase )
تصویر 3
imagen-3.0-generate-002
متن تصاویر تصاویر واقعی و باکیفیت را از پیام‌های متنی به زبان طبیعی ایجاد می‌کند
Imagen 3 سریع
imagen-3.0-fast-generate-001
متن تصاویر تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند


بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI در Firebase ارائه می دهد:

در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .



مقایسه مدل ها

هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI در Firebase توصیف می کند. هر مدل ممکن است قابلیت‌های بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.

اگر نمی‌توانید اطلاعات مورد نظر خود را در بخش‌های فرعی زیر پیدا کنید، می‌توانید اطلاعات بیشتری درباره مدل‌های Gemini و مدل‌های Imagen 3 در اسناد Google Cloud پیدا کنید.

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI در Firebase هستند:

جوزا
2.0 Pro
جوزا
2.0 فلش
جوزا
2.0 Flash-
ساده
جوزا
2.0 Flash-
فکر کردن
جوزا
1.5 حرفه ای
جوزا
1.5 فلش
تصویر 3 /
Imagen 3 سریع
انواع ورودی
متن
کد
اسناد
(PDF یا متن ساده)
تصاویر
ویدئو
صوتی
صوتی (استریم) به زودی!
انواع خروجی
متن
کد
خروجی ساختاریافته
(مانند JSON)
تصاویر به زودی!
صوتی به زودی!
صوتی (استریم) به زودی!

برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.

قابلیت ها و ویژگی های پشتیبانی شده

اینها قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Vertex AI در Firebase هستند:

جوزا
2.0 Pro
جوزا
2.0 فلش
جوزا
2.0 Flash-
ساده
جوزا
2.0 Flash-
فکر کردن
جوزا
1.5 حرفه ای
جوزا
1.5 فلش
تصویر 3 /
Imagen 3 سریع
تولید متن از متن یا ورودی های چند وجهی
تولید تصاویر
( تصویر 3 )
به زودی!
تولید صدا به زودی!
تولید خروجی ساختار یافته
(مانند JSON)
اسناد را تجزیه و تحلیل کنید
(PDF یا متن ساده)
تجزیه و تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدئو (دید)
آنالیز صدا
چت چند نوبتی
فراخوانی تابع (ابزار)
توکن ها و کاراکترهای قابل پرداخت را بشمارید
دستورالعمل های سیستم
Multimodal Live API
(جریان دو طرفه)
به زودی!

مشخصات و محدودیت ها

در هنگام استفاده از هر مدل با Vertex AI در Firebase ، اینها مشخصات و محدودیت‌ها هستند:

اموال جوزا
2.0 Pro
جوزا
2.0 فلش
جوزا
2.0 Flash-
ساده
جوزا
2.0 Flash-
فکر کردن
جوزا
1.5 حرفه ای
جوزا
1.5 فلش
تصویر 3 /
Imagen 3 سریع
پنجره زمینه *
حد توکن کل
(ورودی + خروجی ترکیبی)
2,097,152 توکن 1,048,576 توکن 1,048,576 توکن 1,048,576 توکن 2,097,152 توکن 1,048,576 توکن 480 توکن
محدودیت رمز خروجی * 8192 توکن 8192 توکن 8192 توکن 8192 توکن 8192 توکن 8192 توکن ---
تاریخ قطع دانش ژوئن 2024 ژوئن 2024 ژوئن 2024 ژوئن 2024 می 2024 می 2024 ---
فایل های PDF (در هر درخواست)
حداکثر تعداد
فایل های PDF ورودی **
3000 فایل 3000 فایل 3000 فایل 3000 فایل 3000 فایل 3000 فایل ---
حداکثر تعداد
تعداد صفحات در هر فایل PDF ورودی **
1000 صفحه 1000 صفحه 1000 صفحه 1000 صفحه 1000 صفحه 1000 صفحه ---
حداکثر اندازه
در هر فایل PDF ورودی
50 مگابایت 50 مگابایت 50 مگابایت 50 مگابایت 50 مگابایت 50 مگابایت ---
تصاویر (در هر درخواست)
حداکثر تعداد
از تصاویر ورودی
3000 عکس 3000 عکس 3000 عکس 3000 عکس 3000 عکس 3000 عکس ---
حداکثر تعداد
از تصاویر خروجی
--- به زودی! --- --- --- --- 4 تصویر
حداکثر اندازه
به ازای هر تصویر کدگذاری شده با پایه 64 ورودی
7 مگابایت 7 مگابایت 7 مگابایت 7 مگابایت 7 مگابایت 7 مگابایت ---
ویدئو (به ازای درخواست)
حداکثر تعداد
فایل های ویدئویی ورودی
10 فایل 10 فایل 10 فایل --- 10 فایل 10 فایل ---
حداکثر طول
از تمام ویدیوهای ورودی
(فقط قاب)
~60 دقیقه ~60 دقیقه ~60 دقیقه --- ~60 دقیقه ~60 دقیقه ---
حداکثر طول
از تمام ویدیوهای ورودی
(قاب + صدا)
~45 دقیقه ~45 دقیقه ~45 دقیقه --- ~45 دقیقه ~45 دقیقه ---
صوتی (به ازای درخواست)
حداکثر تعداد
فایل های صوتی ورودی
1 فایل 1 فایل 1 فایل --- 1 فایل 1 فایل ---
حداکثر تعداد
از فایل های صوتی خروجی
--- به زودی! --- --- --- --- ---
حداکثر طول
از تمام صدای ورودی
8.4 ساعت 8.4 ساعت 8.4 ساعت --- 8.4 ساعت 8.4 ساعت ---
حداکثر طول
از تمام صدای خروجی
--- به زودی! --- --- --- --- ---

* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل نشانه‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.

** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.

اطلاعات دقیق اضافی را بیابید

  • سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.

  • درباره انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما شرایط را برآورده می‌کنند و بهترین روش‌ها را در فایل‌های ورودی پشتیبانی‌شده و الزامات Vertex AI Gemini API دنبال می‌کنند، بیاموزید.



مدل سازی و الگوهای نامگذاری

مدل ها در نسخه های پایدار ، پیش نمایش و آزمایشی ارائه می شوند. برای راحتی، نام مستعار بدون مقادیر نسخه صریح پشتیبانی می شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، بخش «نام مدل‌های موجود» را در ادامه این صفحه ببینید.

نوع نسخه توضیحات الگوی نام مدل
پایدار نسخه های پایدار به طور کلی در دسترس هستند.

نام مدل های نسخه های پایدار با یک شماره نسخه سه رقمی خاص اضافه شده است

مثال: gemini-2.0-flash-001
مثال:
imagen-3.0-generate-002

نام مستعار پایدار به‌روزرسانی خودکار نام مستعار پایدار با به روز رسانی خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کند. اگر یک نسخه پایدار جدید منتشر شود، نام مستعار به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.

نام مدل های مستعار هیچ ضمیمه ای ندارد

مثال: gemini-2.0-flash

پیش نمایش نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند .

نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر یک نسخه پیش‌نمایش جدید منتشر شود، هر نسخه پیش‌نمایش موجود به‌طور خودکار به آن نسخه پیش‌نمایش جدید اشاره می‌کند.

نام مدل های نسخه های پیش نمایش به ضمیمه شده است -preview همراه با تاریخ عرضه اولیه مدل ( -MMDD )

مثال: gemini-2.0-flash-lite-preview-02-05
(عرضه شده در 5 فوریه 2025)

تجربی نسخه‌های آزمایشی قابلیت‌های جدیدی دارند و پایدار نیستند و از طرح چرخه عمر مدل استاندارد Google و طرح نسخه‌سازی پیروی نمی‌کنند.

درباره مدل های آزمایشی بیشتر بدانید.

نام مدل های نسخه های آزمایشی به ضمیمه می شود -exp به همراه تاریخ عرضه اولیه مدل ( -MMDD )

مثال: gemini-2.0-pro-exp-02-05
(عرضه شده در 5 فوریه 2025)

درباره نسخه‌های مدل موجود و چرخه عمر آنها ( Gemini ) یا Imagen در اسناد Google Cloud بیشتر بیاموزید.



نام مدل های موجود

نام مدل ها مقادیر صریحی هستند که در کد خود در هنگام شروع اولیه مدل وارد می کنید.

می‌توانید از نقطه پایانی publishers.models.list برای فهرست کردن همه نام‌های مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل‌هایی است که Vertex AI پشتیبانی می‌کند، اما Vertex AI در Firebase فقط از مدل‌های Gemini و Imagen که در این صفحه توضیح داده شده‌اند، پشتیبانی می‌کند. همچنین توجه داشته باشید که نام مستعار به روز شده خودکار (به عنوان مثال، gemini-2.0-flash ) در فهرست قرار نگرفته اند زیرا آنها نام مستعار راحتی برای مدل پایه هستند.

نام مدل های جمینی

برای مثال‌های اولیه برای زبان خود، راهنمای شروع را ببینید.

نام مدل های Gemini 2.0 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
هیچ نسخه پایدار موجود نیست --- --- --- ---
نام مستعار پایدار به‌روزرسانی خودکار
نام مستعار پایدار به‌روزرسانی خودکار موجود نیست --- --- --- ---
نسخه های پیش نمایش
هیچ نسخه پیش نمایشی موجود نیست --- --- --- ---
نسخه های آزمایشی
gemini-2.0-pro-exp-02-05 نسخه آزمایشی Gemini 2.0 Pro تجربی 05-02-2025 تعیین شود

نام مدل های فلش Gemini 2.0

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-001 آخرین نسخه پایدار Gemini 2.0 Flash در دسترس بودن عمومی 05-02-2025 نه زودتر از
05-02-2026
نام مستعار پایدار به‌روزرسانی خودکار
gemini-2.0-flash به آخرین نسخه پایدار 2.0 Flash اشاره می کند
(در حال حاضر gemini-2.0-flash-001 )
در دسترس بودن عمومی 10-02-2025 ---
نسخه های پیش نمایش
هیچ نسخه پیش نمایشی موجود نیست --- --- --- ---
نسخه های آزمایشی
هیچ نسخه آزمایشی موجود نیست --- --- --- ---

نام مدل های Gemini 2.0 Flash-Lite

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-lite-001 آخرین نسخه پایدار Gemini 2.0 Flash-Lite در دسترس بودن عمومی 2025-02-25 نه زودتر از
2026-02-25
نام مستعار پایدار به‌روزرسانی خودکار
gemini-2.0-flash-lite به آخرین نسخه پایدار 2.0 Flash-Lite اشاره می کند
(در حال حاضر gemini-2.0-flash-lite-001 )
در دسترس بودن عمومی 2025-02-25 ---
نسخه های پیش نمایش
gemini-2.0-flash-lite-preview-02-05 نسخه پیش نمایش Gemini 2.0 Flash-Lite پیش نمایش 05-02-2025 تعیین شود
نسخه های آزمایشی
هیچ نسخه آزمایشی موجود نیست --- --- --- ---

نام مدل های Gemini 2.0 Flash-Thinking

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
هیچ نسخه پایدار موجود نیست --- --- --- ---
نام مستعار پایدار به‌روزرسانی خودکار
نام مستعار پایدار به‌روزرسانی خودکار موجود نیست --- --- --- ---
نسخه های پیش نمایش
هیچ نسخه پیش نمایشی موجود نیست --- --- --- ---
نسخه های آزمایشی
gemini-2.0-flash-thinking-exp-01-21 نسخه آزمایشی Gemini 2.0 Flash-Thinking تجربی 2025-01-21 تعیین شود

نام مدل های Gemini 1.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-pro-002 آخرین نسخه پایدار Gemini 1.5 Pro در دسترس بودن عمومی 2024-09-24 نه زودتر از 2025-09-24
gemini-1.5-pro-001 نسخه پایدار اولیه Gemini 1.5 Pro در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نام مستعار پایدار به‌روزرسانی خودکار
gemini-1.5-pro به آخرین نسخه پایدار 1.5 Pro اشاره می کند
(در حال حاضر gemini-1.5-pro-002 )
در دسترس بودن عمومی 2024-09-24 ---
نسخه های پیش نمایش
هیچ نسخه پیش نمایشی موجود نیست --- --- --- ---
نسخه های آزمایشی
هیچ نسخه آزمایشی موجود نیست --- --- --- ---

نام مدل های فلش Gemini 1.5

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-flash-002 آخرین نسخه پایدار Gemini 1.5 Flash در دسترس بودن عمومی 2024-09-24 نه زودتر از 2025-09-24
gemini-1.5-flash-001 نسخه پایدار اولیه Gemini 1.5 Flash در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نام مستعار پایدار به‌روزرسانی خودکار
gemini-1.5-flash به آخرین نسخه پایدار 1.5 Flash اشاره می کند
(در حال حاضر gemini-1.5-flash-002 )
در دسترس بودن عمومی 2024-09-24 ---
نسخه های پیش نمایش
هیچ نسخه پیش نمایشی موجود نیست --- --- --- ---
نسخه های آزمایشی
هیچ نسخه آزمایشی موجود نیست --- --- --- ---

نام مدل های Imagen

برای نمونه های اولیه برای زبان خود، به تولید تصاویر با راهنمای Imagen مراجعه کنید.

در حال حاضر، هیچ یک از مدل های Imagen 3 دارای نسخه پیش نمایش یا آزمایشی نیستند.

ایمیج 3 نام مدل

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
imagen-3.0-generate-002 آخرین نسخه پایدار Imagen 3 در دسترس بودن عمومی 2025-01-23 نه زودتر از 23/01/2026
imagen-3.0-generate-001 نسخه پایدار اولیه Imagen 3 در دسترس بودن عمومی 2024-07-31 نه زودتر از 31/07/2025

Imagen 3 نام مدل های سریع

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
imagen-3.0-fast-generate-001 نسخه پایدار اولیه Imagen 3 Fast در دسترس بودن عمومی 2024-07-31 نه زودتر از 31/07/2025



زبان های پشتیبانی شده

جوزا

  • همه مدل‌های Gemini می‌توانند به زبان‌های زیر بفهمند و پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)

  • مدل‌های Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند به زبان‌های اضافی زیر بفهمند و پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)

Imagen

  • در دسترس بودن عمومی : انگلیسی

  • پیش نمایش : چینی (ساده شده)، چینی (سنتی)، هندی، ژاپنی، کره ای، پرتغالی، اسپانیایی



اطلاعاتی در مورد مدل های قدیمی تر

Vertex AI در Firebase از همه مدل‌های Gemini ، از جمله مدل‌های قدیمی‌تر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی می‌کند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدل‌های قدیمی‌تر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیت‌های مدل‌های جدیدتر را ارائه نمی‌دهند.

Vertex AI در Firebase فقط از مدل های Imagen 3 پشتیبانی می کند. از مدل های قدیمی Imagen (مانند Imagen 2 ) پشتیبانی نمی کند.



مراحل بعدی

قابلیت های Gemini API را امتحان کنید