با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، Vertex AI in Firebase SDK به شما امکان می‌دهد مستقیماً از برنامه خود با مدل‌های پشتیبانی‌شده Gemini تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایل‌های PDF، تصاویر، ویدئو و صدا هستند.

در اینجا مروری کوتاه بر مدل‌های پشتیبانی‌شده برای Vertex AI in Firebase و آخرین نسخه‌های پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.

مدل ورودی خروجی بهینه شده برای
مدل های Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON
(تصاویر و صدا به زودی!)
ویژگی‌های نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف
Gemini 1.5 Pro
gemini-1.5-pro-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
Gemini 1.5 Flash
gemini-1.5-flash-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد سریع و همه کاره در انواع مختلف وظایف


بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:

در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .



مقایسه مدل ها

هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیت‌های بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.

می‌توانید درباره هر یک از مدل‌های Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
انواع ورودی
متن
کد
اسناد (PDF یا متن ساده)
تصاویر، ویدئو و صدا
صوتی (استریم) به زودی!
انواع خروجی
متن
خروجی ساختاریافته (مانند JSON)
کد
تصاویر به زودی!
صوتی به زودی!
صوتی (استریم) به زودی!

برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.

قابلیت ها و ویژگی های پشتیبانی شده

اینها قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
تولید متن از متن یا ورودی های چند وجهی
تولید تصاویر به زودی!
تولید صدا به زودی!
تولید خروجی ساختاریافته (مانند JSON)
تجزیه و تحلیل تصاویر و ویدئو (دید)
آنالیز صدا
تجزیه و تحلیل اسناد (PDF یا متن ساده)
چت چند نوبتی
فراخوانی تابع (ابزار)
فراخوانی تابع اصلی
فراخوانی تابع موازی
عملکرد حالت تماس
توکن ها و کاراکترهای قابل پرداخت را بشمارید
دستورالعمل های سیستم
Multimodal Live API (جریان‌های دوطرفه) به زودی!

مشخصات و محدودیت ها

در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیت‌ها هستند:

اموال Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
پنجره زمینه *
محدودیت کل رمز (ورودی + خروجی ترکیبی)
1,048,576 توکن 2,097,152 توکن 1,048,576 توکن
محدودیت رمز خروجی * 8192 توکن 8192 توکن 8192 توکن
تاریخ قطع دانش ژوئن 2024 می 2024 می 2024
تصاویر (به ازای درخواست)
حداکثر تعداد تصاویر ورودی 3000 عکس 3000 عکس 3000 عکس
حداکثر تعداد تصاویر خروجی به زودی! --- ---
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی 7 مگابایت 7 مگابایت 7 مگابایت
فایل های PDF (در هر درخواست)
حداکثر تعداد فایل های PDF ورودی ** 3000 فایل 3000 فایل 3000 فایل
حداکثر تعداد صفحات در هر فایل PDF ورودی ** 1000 صفحه 1000 صفحه 1000 صفحه
حداکثر اندازه در هر فایل PDF ورودی 50 مگابایت 50 مگابایت 50 مگابایت
ویدیو (به ازای درخواست)
حداکثر تعداد فایل های ویدئویی ورودی 10 فایل 10 فایل 10 فایل
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) ~60 دقیقه ~60 دقیقه ~60 دقیقه
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) ~45 دقیقه ~45 دقیقه ~45 دقیقه
صوتی (به ازای درخواست)
حداکثر تعداد فایل های صوتی ورودی 1 فایل 1 فایل 1 فایل
حداکثر تعداد فایل های صوتی خروجی به زودی! --- ---
حداکثر طول تمام صدای ورودی 8.4 ساعت 8.4 ساعت 8.4 ساعت
حداکثر طول صدای خروجی به زودی! --- ---

* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدل‌های Gemini، می‌توانید تعداد کل نشانه‌ها را در درخواست‌های خود با استفاده از countTokens تعیین کنید.

** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.

اطلاعات دقیق اضافی را بیابید

  • سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.

  • درباره انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما شرایط را برآورده می‌کنند و بهترین روش‌ها را در فایل‌های ورودی پشتیبانی‌شده و الزامات Vertex AI Gemini API دنبال می‌کنند، بیاموزید.



مدل سازی و الگوهای نامگذاری

مدل‌ها در نسخه‌های پایدار ، به‌روزرسانی خودکار و پیش‌نمایش ارائه می‌شوند.

  • نسخه های پایدار به طور کلی در دسترس هستند.

    • به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است gemini-2.0-flash-001 .
  • نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.

    • به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند gemini-2.0-flash .
  • نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیش‌نمایش جدیدی منتشر شود، هر نسخه پیش‌نمایش موجود به‌طور خودکار به آن نسخه پیش‌نمایش جدید اشاره می‌کند.

    • نسخه‌های پیش‌نمایش دارای نام مدل‌ها هستند -preview همراه با تاریخ عرضه اولیه مدل ( -MMDD )، به عنوان مثال gemini-1.5-pro-preview-0409 (منتشر شده در 9 آوریل 2024).

در اسناد Google Cloud درباره نسخه‌های مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.



نام مدل های موجود

نام مدل‌ها مقادیر صریحی هستند که در کد خود در طول اولیه‌سازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد می‌کنید.

می‌توانید از نقطه پایانی publishers.models.list برای فهرست کردن همه نام‌های مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخه‌های به‌روزرسانی خودکار (مثلاً gemini-2.0-flash ) فهرست نشده‌اند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.

نام مدل های Gemini

برای مثال‌های اولیه برای زبان خود، راهنمای شروع را ببینید.

نام مدل های Gemini 2.0 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-001 آخرین نسخه پایدار Gemini 2.0 Flash در دسترس بودن عمومی 05-02-2025 تعیین شود
نسخه به روز رسانی خودکار
gemini-2.0-flash به آخرین نسخه پایدار 2.0 Flash اشاره می کند
(در حال حاضر gemini-2.0-flash-001 )
در دسترس بودن عمومی 10-02-2025 ---

نام مدل های Gemini 1.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-pro-002 آخرین نسخه پایدار Gemini 1.5 Pro در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-pro-001 نسخه پایدار اولیه Gemini 1.5 Pro در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-pro به آخرین نسخه پایدار 1.5 Pro اشاره می کند
(در حال حاضر gemini-1.5-pro-002 )
در دسترس بودن عمومی 2024-09-24 ---

اسم مدل های Gemini 1.5 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-flash-002 آخرین نسخه پایدار Gemini 1.5 Flash در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-flash-001 نسخه پایدار اولیه Gemini 1.5 Flash در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-flash به آخرین نسخه پایدار 1.5 Flash اشاره می کند
(در حال حاضر gemini-1.5-flash-002 )
در دسترس بودن عمومی 2024-09-24 ---



زبان های پشتیبانی شده

Gemini

  • همه مدل‌های Gemini می‌توانند به زبان‌های زیر بفهمند و پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)

  • مدل‌های Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند به زبان‌های اضافی زیر بفهمند و پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)



اطلاعاتی در مورد مدل های قدیمی تر

Vertex AI in Firebase از همه مدل‌های Gemini ، از جمله مدل‌های قدیمی‌تر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی می‌کند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدل‌های قدیمی‌تر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیت‌های مدل‌های جدیدتر را ارائه نمی‌دهند.



مراحل بعدی

قابلیت های Gemini API را امتحان کنید

،

برای برنامه‌های موبایل و وب، Vertex AI in Firebase SDK به شما امکان می‌دهد مستقیماً از برنامه خود با مدل‌های پشتیبانی‌شده Gemini تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایل‌های PDF، تصاویر، ویدئو و صدا هستند.

در اینجا مروری کوتاه بر مدل‌های پشتیبانی‌شده برای Vertex AI in Firebase و آخرین نسخه‌های پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.

مدل ورودی خروجی بهینه شده برای
مدل های Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON
(تصاویر و صدا به زودی!)
ویژگی‌های نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف
Gemini 1.5 Pro
gemini-1.5-pro-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
Gemini 1.5 Flash
gemini-1.5-flash-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد سریع و همه کاره در انواع مختلف وظایف


بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:

در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .



مقایسه مدل ها

هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیت‌های بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.

می‌توانید درباره هر یک از مدل‌های Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
انواع ورودی
متن
کد
اسناد (PDF یا متن ساده)
تصاویر، ویدئو و صدا
صوتی (استریم) به زودی!
انواع خروجی
متن
خروجی ساختاریافته (مانند JSON)
کد
تصاویر به زودی!
صوتی به زودی!
صوتی (استریم) به زودی!

برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.

قابلیت ها و ویژگی های پشتیبانی شده

اینها قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
تولید متن از متن یا ورودی های چند وجهی
تولید تصاویر به زودی!
تولید صدا به زودی!
تولید خروجی ساختاریافته (مانند JSON)
تجزیه و تحلیل تصاویر و ویدئو (دید)
آنالیز صدا
تجزیه و تحلیل اسناد (PDF یا متن ساده)
چت چند نوبتی
فراخوانی تابع (ابزار)
فراخوانی تابع اصلی
فراخوانی تابع موازی
عملکرد حالت تماس
توکن ها و کاراکترهای قابل پرداخت را بشمارید
دستورالعمل های سیستم
Multimodal Live API (جریان‌های دوطرفه) به زودی!

مشخصات و محدودیت ها

در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیت‌ها هستند:

اموال Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
پنجره زمینه *
محدودیت کل رمز (ورودی + خروجی ترکیبی)
1,048,576 توکن 2,097,152 توکن 1,048,576 توکن
محدودیت رمز خروجی * 8192 توکن 8192 توکن 8192 توکن
تاریخ قطع دانش ژوئن 2024 می 2024 می 2024
تصاویر (به ازای درخواست)
حداکثر تعداد تصاویر ورودی 3000 عکس 3000 عکس 3000 عکس
حداکثر تعداد تصاویر خروجی به زودی! --- ---
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی 7 مگابایت 7 مگابایت 7 مگابایت
فایل های PDF (در هر درخواست)
حداکثر تعداد فایل های PDF ورودی ** 3000 فایل 3000 فایل 3000 فایل
حداکثر تعداد صفحات در هر فایل PDF ورودی ** 1000 صفحه 1000 صفحه 1000 صفحه
حداکثر اندازه در هر فایل PDF ورودی 50 مگابایت 50 مگابایت 50 مگابایت
ویدیو (به ازای درخواست)
حداکثر تعداد فایل های ویدئویی ورودی 10 فایل 10 فایل 10 فایل
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) ~60 دقیقه ~60 دقیقه ~60 دقیقه
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) ~45 دقیقه ~45 دقیقه ~45 دقیقه
صوتی (به ازای درخواست)
حداکثر تعداد فایل های صوتی ورودی 1 فایل 1 فایل 1 فایل
حداکثر تعداد فایل های صوتی خروجی به زودی! --- ---
حداکثر طول تمام صدای ورودی 8.4 ساعت 8.4 ساعت 8.4 ساعت
حداکثر طول صدای خروجی به زودی! --- ---

* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدل‌های Gemini، می‌توانید تعداد کل نشانه‌ها را در درخواست‌های خود با استفاده از countTokens تعیین کنید.

** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.

اطلاعات دقیق اضافی را بیابید

  • سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.

  • درباره انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما شرایط را برآورده می‌کنند و بهترین روش‌ها را در فایل‌های ورودی پشتیبانی‌شده و الزامات Vertex AI Gemini API دنبال می‌کنند، بیاموزید.



مدل سازی و الگوهای نامگذاری

مدل‌ها در نسخه‌های پایدار ، به‌روزرسانی خودکار و پیش‌نمایش ارائه می‌شوند.

  • نسخه های پایدار به طور کلی در دسترس هستند.

    • به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است gemini-2.0-flash-001 .
  • نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.

    • به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند gemini-2.0-flash .
  • نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیش‌نمایش جدیدی منتشر شود، هر نسخه پیش‌نمایش موجود به‌طور خودکار به آن نسخه پیش‌نمایش جدید اشاره می‌کند.

    • نسخه‌های پیش‌نمایش دارای نام مدل‌ها هستند -preview همراه با تاریخ عرضه اولیه مدل ( -MMDD )، به عنوان مثال gemini-1.5-pro-preview-0409 (منتشر شده در 9 آوریل 2024).

در اسناد Google Cloud درباره نسخه‌های مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.



نام مدل های موجود

نام مدل‌ها مقادیر صریحی هستند که در کد خود در طول اولیه‌سازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد می‌کنید.

می‌توانید از نقطه پایانی publishers.models.list برای فهرست کردن همه نام‌های مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخه‌های به‌روزرسانی خودکار (مثلاً gemini-2.0-flash ) فهرست نشده‌اند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.

نام مدل های Gemini

برای مثال‌های اولیه برای زبان خود، راهنمای شروع را ببینید.

نام مدل های Gemini 2.0 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-001 آخرین نسخه پایدار Gemini 2.0 Flash در دسترس بودن عمومی 05-02-2025 تعیین شود
نسخه به روز رسانی خودکار
gemini-2.0-flash به آخرین نسخه پایدار 2.0 Flash اشاره می کند
(در حال حاضر gemini-2.0-flash-001 )
در دسترس بودن عمومی 10-02-2025 ---

نام مدل های Gemini 1.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-pro-002 آخرین نسخه پایدار Gemini 1.5 Pro در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-pro-001 نسخه پایدار اولیه Gemini 1.5 Pro در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-pro به آخرین نسخه پایدار 1.5 Pro اشاره می کند
(در حال حاضر gemini-1.5-pro-002 )
در دسترس بودن عمومی 2024-09-24 ---

اسم مدل های Gemini 1.5 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-flash-002 آخرین نسخه پایدار Gemini 1.5 Flash در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-flash-001 نسخه پایدار اولیه Gemini 1.5 Flash در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-flash به آخرین نسخه پایدار 1.5 Flash اشاره می کند
(در حال حاضر gemini-1.5-flash-002 )
در دسترس بودن عمومی 2024-09-24 ---



زبان های پشتیبانی شده

Gemini

  • همه مدل‌های Gemini می‌توانند به زبان‌های زیر بفهمند و پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)

  • مدل‌های Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند به زبان‌های اضافی زیر بفهمند و پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)



اطلاعاتی در مورد مدل های قدیمی تر

Vertex AI in Firebase از همه مدل‌های Gemini ، از جمله مدل‌های قدیمی‌تر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی می‌کند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدل‌های قدیمی‌تر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیت‌های مدل‌های جدیدتر را ارائه نمی‌دهند.



مراحل بعدی

قابلیت های Gemini API را امتحان کنید

،

برای برنامه‌های موبایل و وب، Vertex AI in Firebase SDK به شما امکان می‌دهد مستقیماً از برنامه خود با مدل‌های پشتیبانی‌شده Gemini تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایل‌های PDF، تصاویر، ویدئو و صدا هستند.

در اینجا مروری کوتاه بر مدل‌های پشتیبانی‌شده برای Vertex AI in Firebase و آخرین نسخه‌های پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.

مدل ورودی خروجی بهینه شده برای
مدل های Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON
(تصاویر و صدا به زودی!)
ویژگی‌های نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف
Gemini 1.5 Pro
gemini-1.5-pro-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
Gemini 1.5 Flash
gemini-1.5-flash-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد سریع و همه کاره در انواع مختلف وظایف


بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:

در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .



مقایسه مدل ها

هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیت‌های بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.

می‌توانید درباره هر یک از مدل‌های Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
انواع ورودی
متن
کد
اسناد (PDF یا متن ساده)
تصاویر، ویدئو و صدا
صوتی (استریم) به زودی!
انواع خروجی
متن
خروجی ساختاریافته (مانند JSON)
کد
تصاویر به زودی!
صوتی به زودی!
صوتی (استریم) به زودی!

برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.

قابلیت ها و ویژگی های پشتیبانی شده

اینها قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
تولید متن از متن یا ورودی های چند وجهی
تولید تصاویر به زودی!
تولید صدا به زودی!
تولید خروجی ساختاریافته (مانند JSON)
تجزیه و تحلیل تصاویر و ویدئو (دید)
آنالیز صدا
تجزیه و تحلیل اسناد (PDF یا متن ساده)
چت چند نوبتی
فراخوانی تابع (ابزار)
فراخوانی تابع اصلی
فراخوانی تابع موازی
عملکرد حالت تماس
توکن ها و کاراکترهای قابل پرداخت را بشمارید
دستورالعمل های سیستم
Multimodal Live API (جریان‌های دوطرفه) به زودی!

مشخصات و محدودیت ها

در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیت‌ها هستند:

اموال Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
پنجره زمینه *
محدودیت کل رمز (ورودی + خروجی ترکیبی)
1,048,576 توکن 2,097,152 توکن 1,048,576 توکن
محدودیت رمز خروجی * 8192 توکن 8192 توکن 8192 توکن
تاریخ قطع دانش ژوئن 2024 می 2024 می 2024
تصاویر (به ازای درخواست)
حداکثر تعداد تصاویر ورودی 3000 عکس 3000 عکس 3000 عکس
حداکثر تعداد تصاویر خروجی به زودی! --- ---
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی 7 مگابایت 7 مگابایت 7 مگابایت
فایل های PDF (در هر درخواست)
حداکثر تعداد فایل های PDF ورودی ** 3000 فایل 3000 فایل 3000 فایل
حداکثر تعداد صفحات در هر فایل PDF ورودی ** 1000 صفحه 1000 صفحه 1000 صفحه
حداکثر اندازه در هر فایل PDF ورودی 50 مگابایت 50 مگابایت 50 مگابایت
ویدیو (به ازای درخواست)
حداکثر تعداد فایل های ویدئویی ورودی 10 فایل 10 فایل 10 فایل
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) ~60 دقیقه ~60 دقیقه ~60 دقیقه
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) ~45 دقیقه ~45 دقیقه ~45 دقیقه
صوتی (به ازای درخواست)
حداکثر تعداد فایل های صوتی ورودی 1 فایل 1 فایل 1 فایل
حداکثر تعداد فایل های صوتی خروجی به زودی! --- ---
حداکثر طول تمام صدای ورودی 8.4 ساعت 8.4 ساعت 8.4 ساعت
حداکثر طول صدای خروجی به زودی! --- ---

* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدل‌های Gemini، می‌توانید تعداد کل نشانه‌ها را در درخواست‌های خود با استفاده از countTokens تعیین کنید.

** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.

اطلاعات دقیق اضافی را بیابید

  • سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.

  • درباره انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما شرایط را برآورده می‌کنند و بهترین روش‌ها را در فایل‌های ورودی پشتیبانی‌شده و الزامات Vertex AI Gemini API دنبال می‌کنند، بیاموزید.



مدل سازی و الگوهای نامگذاری

مدل‌ها در نسخه‌های پایدار ، به‌روزرسانی خودکار و پیش‌نمایش ارائه می‌شوند.

  • نسخه های پایدار به طور کلی در دسترس هستند.

    • به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است gemini-2.0-flash-001 .
  • نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.

    • به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند gemini-2.0-flash .
  • نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیش‌نمایش جدیدی منتشر شود، هر نسخه پیش‌نمایش موجود به‌طور خودکار به آن نسخه پیش‌نمایش جدید اشاره می‌کند.

    • نسخه‌های پیش‌نمایش دارای نام مدل‌ها هستند -preview همراه با تاریخ عرضه اولیه مدل ( -MMDD )، به عنوان مثال gemini-1.5-pro-preview-0409 (منتشر شده در 9 آوریل 2024).

در اسناد Google Cloud درباره نسخه‌های مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.



نام مدل های موجود

نام مدل‌ها مقادیر صریحی هستند که در کد خود در طول اولیه‌سازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد می‌کنید.

می‌توانید از نقطه پایانی publishers.models.list برای فهرست کردن همه نام‌های مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخه‌های به‌روزرسانی خودکار (مثلاً gemini-2.0-flash ) فهرست نشده‌اند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.

نام مدل های Gemini

برای مثال‌های اولیه برای زبان خود، راهنمای شروع را ببینید.

نام مدل های Gemini 2.0 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-001 آخرین نسخه پایدار Gemini 2.0 Flash در دسترس بودن عمومی 05-02-2025 تعیین شود
نسخه به روز رسانی خودکار
gemini-2.0-flash به آخرین نسخه پایدار 2.0 Flash اشاره می کند
(در حال حاضر gemini-2.0-flash-001 )
در دسترس بودن عمومی 10-02-2025 ---

نام مدل های Gemini 1.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-pro-002 آخرین نسخه پایدار Gemini 1.5 Pro در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-pro-001 نسخه پایدار اولیه Gemini 1.5 Pro در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-pro به آخرین نسخه پایدار 1.5 Pro اشاره می کند
(در حال حاضر gemini-1.5-pro-002 )
در دسترس بودن عمومی 2024-09-24 ---

اسم مدل های Gemini 1.5 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-flash-002 آخرین نسخه پایدار Gemini 1.5 Flash در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-flash-001 نسخه پایدار اولیه Gemini 1.5 Flash در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-flash به آخرین نسخه پایدار 1.5 Flash اشاره می کند
(در حال حاضر gemini-1.5-flash-002 )
در دسترس بودن عمومی 2024-09-24 ---



زبان های پشتیبانی شده

Gemini

  • همه مدل‌های Gemini می‌توانند به زبان‌های زیر بفهمند و پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)

  • مدل‌های Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند به زبان‌های اضافی زیر بفهمند و پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)



اطلاعاتی در مورد مدل های قدیمی تر

Vertex AI in Firebase از همه مدل‌های Gemini ، از جمله مدل‌های قدیمی‌تر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی می‌کند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدل‌های قدیمی‌تر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیت‌های مدل‌های جدیدتر را ارائه نمی‌دهند.



مراحل بعدی

قابلیت های Gemini API را امتحان کنید

،

برای برنامه‌های موبایل و وب، Vertex AI in Firebase SDK به شما امکان می‌دهد مستقیماً از برنامه خود با مدل‌های پشتیبانی‌شده Gemini تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایل‌های PDF، تصاویر، ویدئو و صدا هستند.

در اینجا مروری کوتاه بر مدل‌های پشتیبانی‌شده برای Vertex AI in Firebase و آخرین نسخه‌های پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.

مدل ورودی خروجی بهینه شده برای
مدل های Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON
(تصاویر و صدا به زودی!)
ویژگی‌های نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف
Gemini 1.5 Pro
gemini-1.5-pro-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
Gemini 1.5 Flash
gemini-1.5-flash-002
متن، کد، فایل های PDF، تصاویر، ویدئو، صدا متن، کد، JSON عملکرد سریع و همه کاره در انواع مختلف وظایف


بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:

در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .



مقایسه مدل ها

هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیت‌های بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.

می‌توانید درباره هر یک از مدل‌های Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
انواع ورودی
متن
کد
اسناد (PDF یا متن ساده)
تصاویر، ویدئو و صدا
صوتی (استریم) به زودی!
انواع خروجی
متن
خروجی ساختاریافته (مانند JSON)
کد
تصاویر به زودی!
صوتی به زودی!
صوتی (استریم) به زودی!

برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.

قابلیت ها و ویژگی های پشتیبانی شده

اینها قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
تولید متن از متن یا ورودی های چند وجهی
تولید تصاویر به زودی!
تولید صدا به زودی!
تولید خروجی ساختاریافته (مانند JSON)
تجزیه و تحلیل تصاویر و ویدئو (دید)
آنالیز صدا
تجزیه و تحلیل اسناد (PDF یا متن ساده)
چت چند نوبتی
فراخوانی تابع (ابزار)
فراخوانی تابع اصلی
فراخوانی تابع موازی
عملکرد حالت تماس
توکن ها و کاراکترهای قابل پرداخت را بشمارید
دستورالعمل های سیستم
Multimodal Live API (جریان‌های دوطرفه) به زودی!

مشخصات و محدودیت ها

در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیت‌ها هستند:

اموال Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
پنجره زمینه *
محدودیت کل رمز (ورودی + خروجی ترکیبی)
1,048,576 توکن 2,097,152 توکن 1,048,576 توکن
محدودیت رمز خروجی * 8192 توکن 8192 توکن 8192 توکن
تاریخ قطع دانش ژوئن 2024 می 2024 می 2024
تصاویر (به ازای درخواست)
حداکثر تعداد تصاویر ورودی 3000 عکس 3000 عکس 3000 عکس
حداکثر تعداد تصاویر خروجی به زودی! --- ---
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی 7 مگابایت 7 مگابایت 7 مگابایت
فایل های PDF (در هر درخواست)
حداکثر تعداد فایل های PDF ورودی ** 3000 فایل 3000 فایل 3000 فایل
حداکثر تعداد صفحات در هر فایل PDF ورودی ** 1000 صفحه 1000 صفحه 1000 صفحه
حداکثر اندازه در هر فایل PDF ورودی 50 مگابایت 50 مگابایت 50 مگابایت
ویدیو (به ازای درخواست)
حداکثر تعداد فایل های ویدئویی ورودی 10 فایل 10 فایل 10 فایل
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) ~60 دقیقه ~60 دقیقه ~60 دقیقه
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) ~45 دقیقه ~45 دقیقه ~45 دقیقه
صوتی (به ازای درخواست)
حداکثر تعداد فایل های صوتی ورودی 1 فایل 1 فایل 1 فایل
حداکثر تعداد فایل های صوتی خروجی به زودی! --- ---
حداکثر طول تمام صدای ورودی 8.4 ساعت 8.4 ساعت 8.4 ساعت
حداکثر طول صدای خروجی به زودی! --- ---

* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدل‌های Gemini، می‌توانید تعداد کل نشانه‌ها را در درخواست‌های خود با استفاده از countTokens تعیین کنید.

** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.

اطلاعات دقیق اضافی را بیابید

  • سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.

  • درباره انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما شرایط را برآورده می‌کنند و بهترین روش‌ها را در فایل‌های ورودی پشتیبانی‌شده و الزامات Vertex AI Gemini API دنبال می‌کنند، بیاموزید.



مدل سازی و الگوهای نامگذاری

مدل‌ها در نسخه‌های پایدار ، به‌روزرسانی خودکار و پیش‌نمایش ارائه می‌شوند.

  • نسخه های پایدار به طور کلی در دسترس هستند.

    • به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است gemini-2.0-flash-001 .
  • نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.

    • به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند gemini-2.0-flash .
  • نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیش‌نمایش جدیدی منتشر شود، هر نسخه پیش‌نمایش موجود به‌طور خودکار به آن نسخه پیش‌نمایش جدید اشاره می‌کند.

    • نسخه‌های پیش‌نمایش دارای نام مدل‌ها هستند -preview همراه با تاریخ عرضه اولیه مدل ( -MMDD )، به عنوان مثال gemini-1.5-pro-preview-0409 (منتشر شده در 9 آوریل 2024).

در اسناد Google Cloud درباره نسخه‌های مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.



نام مدل های موجود

نام مدل‌ها مقادیر صریحی هستند که در کد خود در طول اولیه‌سازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد می‌کنید.

می‌توانید از نقطه پایانی publishers.models.list برای فهرست کردن همه نام‌های مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخه‌های به‌روزرسانی خودکار (مثلاً gemini-2.0-flash ) فهرست نشده‌اند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.

نام مدل های Gemini

برای مثال‌های اولیه برای زبان خود، راهنمای شروع را ببینید.

نام مدل های Gemini 2.0 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-2.0-flash-001 آخرین نسخه پایدار Gemini 2.0 Flash در دسترس بودن عمومی 05-02-2025 تعیین شود
نسخه به روز رسانی خودکار
gemini-2.0-flash به آخرین نسخه پایدار 2.0 Flash اشاره می کند
(در حال حاضر gemini-2.0-flash-001 )
در دسترس بودن عمومی 10-02-2025 ---

نام مدل های Gemini 1.5 Pro

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-pro-002 آخرین نسخه پایدار Gemini 1.5 Pro در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-pro-001 نسخه پایدار اولیه Gemini 1.5 Pro در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-pro به آخرین نسخه پایدار 1.5 Pro اشاره می کند
(در حال حاضر gemini-1.5-pro-002 )
در دسترس بودن عمومی 2024-09-24 ---

اسم مدل های Gemini 1.5 Flash

نام مدل توضیحات مرحله انتشار تاریخ انتشار اولیه تاریخ توقف
نسخه های پایدار
gemini-1.5-flash-002 آخرین نسخه پایدار Gemini 1.5 Flash در دسترس بودن عمومی 2024-09-24 نه زودتر از 24/09/2025
gemini-1.5-flash-001 نسخه پایدار اولیه Gemini 1.5 Flash در دسترس بودن عمومی 24-05-2024 نه زودتر از 24/05/2025
نسخه به روز رسانی خودکار
gemini-1.5-flash به آخرین نسخه پایدار 1.5 Flash اشاره می کند
(در حال حاضر gemini-1.5-flash-002 )
در دسترس بودن عمومی 2024-09-24 ---



زبان های پشتیبانی شده

Gemini

  • همه مدل‌های Gemini می‌توانند به زبان‌های زیر بفهمند و پاسخ دهند:

    عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)

  • مدل‌های Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند به زبان‌های اضافی زیر بفهمند و پاسخ دهند:

    آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)



اطلاعاتی در مورد مدل های قدیمی تر

Vertex AI in Firebase از همه مدل‌های Gemini ، از جمله مدل‌های قدیمی‌تر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی می‌کند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدل‌های قدیمی‌تر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیت‌های مدل‌های جدیدتر را ارائه نمی‌دهند.



مراحل بعدی

قابلیت های Gemini API را امتحان کنید