برای برنامههای موبایل و وب، Vertex AI in Firebase SDK به شما امکان میدهد مستقیماً از برنامه خود با مدلهای پشتیبانیشده Gemini تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند.
در اینجا مروری کوتاه بر مدلهای پشتیبانیشده برای Vertex AI in Firebase و آخرین نسخههای پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
مدل های Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON (تصاویر و صدا به زودی!) | ویژگیهای نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف |
Gemini 1.5 Progemini-1.5-pro-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد |
Gemini 1.5 Flashgemini-1.5-flash-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد سریع و همه کاره در انواع مختلف وظایف |
بله، Vertex AI in Firebase از تمام مدلهای Gemini ، از جمله مدلهای قدیمیتر، پشتیبانی میکند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001 | متن، کد، فایلهای PDF، تصاویر، ویدئو (فقط فریم) | متن، کد | برای پاسخهای متن یا کد، متن، تصاویر و ویدیو را مدیریت میکند. نمی توان برای چت استفاده کرد. |
Gemini 1.0 Progemini-1.0-pro-002 | متن، کد | متن، کد | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید . سؤالات متداول ما را درباره همه مدلهایی که Vertex AI in Firebase پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
میتوانید درباره هر یک از مدلهای Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
اسناد (PDF یا متن ساده) | ||||
تصاویر، ویدئو و صدا | ||||
صوتی (استریم) | به زودی! | |||
انواع خروجی | ||||
متن | ||||
خروجی ساختاریافته (مانند JSON) | ||||
کد | ||||
تصاویر | به زودی! | |||
صوتی | به زودی! | |||
صوتی (استریم) | به زودی! |
برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
تولید متن از متن یا ورودی های چند وجهی | ||||
تولید تصاویر | به زودی! | |||
تولید صدا | به زودی! | |||
تولید خروجی ساختاریافته (مانند JSON) | ||||
تجزیه و تحلیل تصاویر و ویدئو (دید) | ||||
آنالیز صدا | ||||
تجزیه و تحلیل اسناد (PDF یا متن ساده) | ||||
چت چند نوبتی | ||||
فراخوانی تابع (ابزار) | ||||
فراخوانی تابع اصلی | ||||
فراخوانی تابع موازی | ||||
عملکرد حالت تماس | ||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
Multimodal Live API (جریانهای دوطرفه) | به زودی! |
مشخصات و محدودیت ها
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 2,097,152 توکن | 1,048,576 توکن |
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 8192 توکن |
تاریخ قطع دانش | ژوئن 2024 | می 2024 | می 2024 |
تصاویر (به ازای درخواست) | |||
حداکثر تعداد تصاویر ورودی | 3000 عکس | 3000 عکس | 3000 عکس |
حداکثر تعداد تصاویر خروجی | به زودی! | --- | --- |
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت |
فایل های PDF (در هر درخواست) | |||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 3000 فایل |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 1000 صفحه |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت |
ویدیو (به ازای درخواست) | |||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 10 فایل |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | ~60 دقیقه | ~60 دقیقه | ~60 دقیقه |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | ~45 دقیقه | ~45 دقیقه | ~45 دقیقه |
صوتی (به ازای درخواست) | |||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | 1 فایل |
حداکثر تعداد فایل های صوتی خروجی | به زودی! | --- | --- |
حداکثر طول تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت |
حداکثر طول صدای خروجی | به زودی! | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما شرایط را برآورده میکنند و بهترین روشها را در فایلهای ورودی پشتیبانیشده و الزامات Vertex AI Gemini API دنبال میکنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدلها در نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش ارائه میشوند.
نسخه های پایدار به طور کلی در دسترس هستند.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
gemini-2.0-flash-001
.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
gemini-2.0-flash
.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیشنمایش جدیدی منتشر شود، هر نسخه پیشنمایش موجود بهطور خودکار به آن نسخه پیشنمایش جدید اشاره میکند.
- نسخههای پیشنمایش دارای نام مدلها هستند
-preview
همراه با تاریخ عرضه اولیه مدل (-MMDD
)، به عنوان مثالgemini-1.5-pro-preview-0409
(منتشر شده در 9 آوریل 2024).
- نسخههای پیشنمایش دارای نام مدلها هستند
در اسناد Google Cloud درباره نسخههای مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.
نام مدل های موجود
نام مدلها مقادیر صریحی هستند که در کد خود در طول اولیهسازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد میکنید.
میتوانید از نقطه پایانی publishers.models.list
برای فهرست کردن همه نامهای مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخههای بهروزرسانی خودکار (مثلاً gemini-2.0-flash
) فهرست نشدهاند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.
نام مدل های Gemini
برای مثالهای اولیه برای زبان خود، راهنمای شروع را ببینید.
نام مدل های Gemini 2.0 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | در دسترس بودن عمومی | 05-02-2025 | تعیین شود |
نسخه به روز رسانی خودکار | ||||
gemini-2.0-flash | به آخرین نسخه پایدار 2.0 Flash اشاره می کند (در حال حاضر gemini-2.0-flash-001 ) | در دسترس بودن عمومی | 10-02-2025 | --- |
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
اسم مدل های Gemini 1.5 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
زبان های پشتیبانی شده
Gemini
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
اطلاعاتی در مورد مدل های قدیمی تر
Vertex AI in Firebase از همه مدلهای Gemini ، از جمله مدلهای قدیمیتر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی میکند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدلهای قدیمیتر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیتهای مدلهای جدیدتر را ارائه نمیدهند.
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
تصویر | ||||
اسناد (PDF یا متن ساده) | ||||
ویدئو (فقط فریم) | ||||
ویدئو (قاب + صدا) | ||||
صوتی | ||||
انواع خروجی | ||||
متن | ||||
کد | ||||
تصاویر، ویدئو و صدا |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها قابلیتها و ویژگیهایی هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | |||
تولید متن از ورودی چند وجهی | |||
تولید تصاویر، ویدئو یا صدا | |||
با استفاده از طرح پاسخ، خروجی ساختاریافته (مانند JSON) تولید کنید | |||
چت چند نوبتی | |||
فراخوانی تابع (ابزار) | |||
فراخوانی تابع اصلی | |||
فراخوانی تابع موازی | |||
عملکرد حالت تماس | |||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||
دستورالعمل های سیستم |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 16384 توکن | 32760 توکن |
محدودیت رمز خروجی * | 2048 توکن | 8192 توکن |
تاریخ قطع دانش | فوریه 2023 | فوریه 2023 |
تصاویر (به ازای درخواست) | ||
حداکثر تعداد تصاویر ورودی | 16 تصویر | --- |
حداکثر اندازه در هر تصویر ورودی با کدگذاری پایه 64 | 7 مگابایت | --- |
فایل های PDF (در هر درخواست) | ||
حداکثر تعداد فایل های PDF ورودی ** | 16 فایل | --- |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 16 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | --- |
ویدیو (به ازای درخواست) | ||
حداکثر تعداد فایل های ویدئویی ورودی | 1 فایل | --- |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | 2 دقیقه | --- |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | --- | --- |
صوتی (به ازای درخواست) | ||
حداکثر تعداد فایل های صوتی ورودی | --- | --- |
حداکثر طول تمام صدای ورودی | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | در دسترس بودن عمومی | 04-01-2024 | --- |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 09-04-2024 | نه زودتر از 09-04-2025 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | در دسترس بودن عمومی | 15-02-2024 | --- |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- متن را از اعلانهای چندوجهی (شامل متن، تصاویر، PDF، ویدئو و صدا) تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- از فراخوانی تابع برای اتصال مدل های مولد به سیستم ها و اطلاعات خارجی استفاده کنید.
برای برنامههای موبایل و وب، Vertex AI in Firebase SDK به شما امکان میدهد مستقیماً از برنامه خود با مدلهای پشتیبانیشده Gemini تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند.
در اینجا مروری کوتاه بر مدلهای پشتیبانیشده برای Vertex AI in Firebase و آخرین نسخههای پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
مدل های Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON (تصاویر و صدا به زودی!) | ویژگیهای نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف |
Gemini 1.5 Progemini-1.5-pro-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد |
Gemini 1.5 Flashgemini-1.5-flash-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد سریع و همه کاره در انواع مختلف وظایف |
بله، Vertex AI in Firebase از تمام مدلهای Gemini ، از جمله مدلهای قدیمیتر، پشتیبانی میکند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001 | متن، کد، فایلهای PDF، تصاویر، ویدئو (فقط فریم) | متن، کد | برای پاسخهای متن یا کد، متن، تصاویر و ویدیو را مدیریت میکند. نمی توان برای چت استفاده کرد. |
Gemini 1.0 Progemini-1.0-pro-002 | متن، کد | متن، کد | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید . سؤالات متداول ما را درباره همه مدلهایی که Vertex AI in Firebase پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
میتوانید درباره هر یک از مدلهای Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
اسناد (PDF یا متن ساده) | ||||
تصاویر، ویدئو و صدا | ||||
صوتی (استریم) | به زودی! | |||
انواع خروجی | ||||
متن | ||||
خروجی ساختاریافته (مانند JSON) | ||||
کد | ||||
تصاویر | به زودی! | |||
صوتی | به زودی! | |||
صوتی (استریم) | به زودی! |
برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
تولید متن از متن یا ورودی های چند وجهی | ||||
تولید تصاویر | به زودی! | |||
تولید صدا | به زودی! | |||
تولید خروجی ساختاریافته (مانند JSON) | ||||
تجزیه و تحلیل تصاویر و ویدئو (دید) | ||||
آنالیز صدا | ||||
تجزیه و تحلیل اسناد (PDF یا متن ساده) | ||||
چت چند نوبتی | ||||
فراخوانی تابع (ابزار) | ||||
فراخوانی تابع اصلی | ||||
فراخوانی تابع موازی | ||||
عملکرد حالت تماس | ||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
Multimodal Live API (جریانهای دوطرفه) | به زودی! |
مشخصات و محدودیت ها
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 2,097,152 توکن | 1,048,576 توکن |
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 8192 توکن |
تاریخ قطع دانش | ژوئن 2024 | می 2024 | می 2024 |
تصاویر (به ازای درخواست) | |||
حداکثر تعداد تصاویر ورودی | 3000 عکس | 3000 عکس | 3000 عکس |
حداکثر تعداد تصاویر خروجی | به زودی! | --- | --- |
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت |
فایل های PDF (در هر درخواست) | |||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 3000 فایل |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 1000 صفحه |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت |
ویدیو (به ازای درخواست) | |||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 10 فایل |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | ~60 دقیقه | ~60 دقیقه | ~60 دقیقه |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | ~45 دقیقه | ~45 دقیقه | ~45 دقیقه |
صوتی (به ازای درخواست) | |||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | 1 فایل |
حداکثر تعداد فایل های صوتی خروجی | به زودی! | --- | --- |
حداکثر طول تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت |
حداکثر طول صدای خروجی | به زودی! | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما شرایط را برآورده میکنند و بهترین روشها را در فایلهای ورودی پشتیبانیشده و الزامات Vertex AI Gemini API دنبال میکنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدلها در نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش ارائه میشوند.
نسخه های پایدار به طور کلی در دسترس هستند.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
gemini-2.0-flash-001
.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
gemini-2.0-flash
.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیشنمایش جدیدی منتشر شود، هر نسخه پیشنمایش موجود بهطور خودکار به آن نسخه پیشنمایش جدید اشاره میکند.
- نسخههای پیشنمایش دارای نام مدلها هستند
-preview
همراه با تاریخ عرضه اولیه مدل (-MMDD
)، به عنوان مثالgemini-1.5-pro-preview-0409
(منتشر شده در 9 آوریل 2024).
- نسخههای پیشنمایش دارای نام مدلها هستند
در اسناد Google Cloud درباره نسخههای مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.
نام مدل های موجود
نام مدلها مقادیر صریحی هستند که در کد خود در طول اولیهسازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد میکنید.
میتوانید از نقطه پایانی publishers.models.list
برای فهرست کردن همه نامهای مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخههای بهروزرسانی خودکار (مثلاً gemini-2.0-flash
) فهرست نشدهاند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.
نام مدل های Gemini
برای مثالهای اولیه برای زبان خود، راهنمای شروع را ببینید.
نام مدل های Gemini 2.0 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | در دسترس بودن عمومی | 05-02-2025 | تعیین شود |
نسخه به روز رسانی خودکار | ||||
gemini-2.0-flash | به آخرین نسخه پایدار 2.0 Flash اشاره می کند (در حال حاضر gemini-2.0-flash-001 ) | در دسترس بودن عمومی | 10-02-2025 | --- |
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
اسم مدل های Gemini 1.5 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
زبان های پشتیبانی شده
Gemini
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
اطلاعاتی در مورد مدل های قدیمی تر
Vertex AI in Firebase از همه مدلهای Gemini ، از جمله مدلهای قدیمیتر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی میکند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدلهای قدیمیتر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیتهای مدلهای جدیدتر را ارائه نمیدهند.
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
تصویر | ||||
اسناد (PDF یا متن ساده) | ||||
ویدئو (فقط فریم) | ||||
ویدئو (قاب + صدا) | ||||
صوتی | ||||
انواع خروجی | ||||
متن | ||||
کد | ||||
تصاویر، ویدئو و صدا |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها قابلیتها و ویژگیهایی هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | |||
تولید متن از ورودی چند وجهی | |||
تولید تصاویر، ویدئو یا صدا | |||
با استفاده از طرح پاسخ، خروجی ساختاریافته (مانند JSON) تولید کنید | |||
چت چند نوبتی | |||
فراخوانی تابع (ابزار) | |||
فراخوانی تابع اصلی | |||
فراخوانی تابع موازی | |||
عملکرد حالت تماس | |||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||
دستورالعمل های سیستم |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 16384 توکن | 32760 توکن |
محدودیت رمز خروجی * | 2048 توکن | 8192 توکن |
تاریخ قطع دانش | فوریه 2023 | فوریه 2023 |
تصاویر (به ازای درخواست) | ||
حداکثر تعداد تصاویر ورودی | 16 تصویر | --- |
حداکثر اندازه در هر تصویر ورودی با کدگذاری پایه 64 | 7 مگابایت | --- |
فایل های PDF (در هر درخواست) | ||
حداکثر تعداد فایل های PDF ورودی ** | 16 فایل | --- |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 16 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | --- |
ویدیو (به ازای درخواست) | ||
حداکثر تعداد فایل های ویدئویی ورودی | 1 فایل | --- |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | 2 دقیقه | --- |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | --- | --- |
صوتی (به ازای درخواست) | ||
حداکثر تعداد فایل های صوتی ورودی | --- | --- |
حداکثر طول تمام صدای ورودی | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | در دسترس بودن عمومی | 04-01-2024 | --- |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 09-04-2024 | نه زودتر از 09-04-2025 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | در دسترس بودن عمومی | 15-02-2024 | --- |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- متن را از اعلانهای چندوجهی (شامل متن، تصاویر، PDF، ویدئو و صدا) تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- از فراخوانی تابع برای اتصال مدل های مولد به سیستم ها و اطلاعات خارجی استفاده کنید.
برای برنامههای موبایل و وب، Vertex AI in Firebase SDK به شما امکان میدهد مستقیماً از برنامه خود با مدلهای پشتیبانیشده Gemini تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند.
در اینجا مروری کوتاه بر مدلهای پشتیبانیشده برای Vertex AI in Firebase و آخرین نسخههای پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
مدل های Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON (تصاویر و صدا به زودی!) | ویژگیهای نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف |
Gemini 1.5 Progemini-1.5-pro-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد |
Gemini 1.5 Flashgemini-1.5-flash-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد سریع و همه کاره در انواع مختلف وظایف |
بله، Vertex AI in Firebase از تمام مدلهای Gemini ، از جمله مدلهای قدیمیتر، پشتیبانی میکند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001 | متن، کد، فایلهای PDF، تصاویر، ویدئو (فقط فریم) | متن، کد | برای پاسخهای متن یا کد، متن، تصاویر و ویدیو را مدیریت میکند. نمی توان برای چت استفاده کرد. |
Gemini 1.0 Progemini-1.0-pro-002 | متن، کد | متن، کد | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید . سؤالات متداول ما را درباره همه مدلهایی که Vertex AI in Firebase پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
میتوانید درباره هر یک از مدلهای Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
اسناد (PDF یا متن ساده) | ||||
تصاویر، ویدئو و صدا | ||||
صوتی (استریم) | به زودی! | |||
انواع خروجی | ||||
متن | ||||
خروجی ساختاریافته (مانند JSON) | ||||
کد | ||||
تصاویر | به زودی! | |||
صوتی | به زودی! | |||
صوتی (استریم) | به زودی! |
برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
تولید متن از متن یا ورودی های چند وجهی | ||||
تولید تصاویر | به زودی! | |||
تولید صدا | به زودی! | |||
تولید خروجی ساختاریافته (مانند JSON) | ||||
تجزیه و تحلیل تصاویر و ویدئو (دید) | ||||
آنالیز صدا | ||||
تجزیه و تحلیل اسناد (PDF یا متن ساده) | ||||
چت چند نوبتی | ||||
فراخوانی تابع (ابزار) | ||||
فراخوانی تابع اصلی | ||||
فراخوانی تابع موازی | ||||
عملکرد حالت تماس | ||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
Multimodal Live API (جریانهای دوطرفه) | به زودی! |
مشخصات و محدودیت ها
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 2,097,152 توکن | 1,048,576 توکن |
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 8192 توکن |
تاریخ قطع دانش | ژوئن 2024 | می 2024 | می 2024 |
تصاویر (به ازای درخواست) | |||
حداکثر تعداد تصاویر ورودی | 3000 عکس | 3000 عکس | 3000 عکس |
حداکثر تعداد تصاویر خروجی | به زودی! | --- | --- |
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت |
فایل های PDF (در هر درخواست) | |||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 3000 فایل |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 1000 صفحه |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت |
ویدیو (به ازای درخواست) | |||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 10 فایل |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | ~60 دقیقه | ~60 دقیقه | ~60 دقیقه |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | ~45 دقیقه | ~45 دقیقه | ~45 دقیقه |
صوتی (به ازای درخواست) | |||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | 1 فایل |
حداکثر تعداد فایل های صوتی خروجی | به زودی! | --- | --- |
حداکثر طول تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت |
حداکثر طول صدای خروجی | به زودی! | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما شرایط را برآورده میکنند و بهترین روشها را در فایلهای ورودی پشتیبانیشده و الزامات Vertex AI Gemini API دنبال میکنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدلها در نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش ارائه میشوند.
نسخه های پایدار به طور کلی در دسترس هستند.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
gemini-2.0-flash-001
.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
gemini-2.0-flash
.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیشنمایش جدیدی منتشر شود، هر نسخه پیشنمایش موجود بهطور خودکار به آن نسخه پیشنمایش جدید اشاره میکند.
- نسخههای پیشنمایش دارای نام مدلها هستند
-preview
همراه با تاریخ عرضه اولیه مدل (-MMDD
)، به عنوان مثالgemini-1.5-pro-preview-0409
(منتشر شده در 9 آوریل 2024).
- نسخههای پیشنمایش دارای نام مدلها هستند
در اسناد Google Cloud درباره نسخههای مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.
نام مدل های موجود
نام مدلها مقادیر صریحی هستند که در کد خود در طول اولیهسازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد میکنید.
میتوانید از نقطه پایانی publishers.models.list
برای فهرست کردن همه نامهای مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخههای بهروزرسانی خودکار (مثلاً gemini-2.0-flash
) فهرست نشدهاند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.
نام مدل های Gemini
برای مثالهای اولیه برای زبان خود، راهنمای شروع را ببینید.
نام مدل های Gemini 2.0 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | در دسترس بودن عمومی | 05-02-2025 | تعیین شود |
نسخه به روز رسانی خودکار | ||||
gemini-2.0-flash | به آخرین نسخه پایدار 2.0 Flash اشاره می کند (در حال حاضر gemini-2.0-flash-001 ) | در دسترس بودن عمومی | 10-02-2025 | --- |
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
اسم مدل های Gemini 1.5 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
زبان های پشتیبانی شده
Gemini
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
اطلاعاتی در مورد مدل های قدیمی تر
Vertex AI in Firebase از همه مدلهای Gemini ، از جمله مدلهای قدیمیتر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی میکند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدلهای قدیمیتر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیتهای مدلهای جدیدتر را ارائه نمیدهند.
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
تصویر | ||||
اسناد (PDF یا متن ساده) | ||||
ویدئو (فقط فریم) | ||||
ویدئو (قاب + صدا) | ||||
صوتی | ||||
انواع خروجی | ||||
متن | ||||
کد | ||||
تصاویر، ویدئو و صدا |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها قابلیتها و ویژگیهایی هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | |||
تولید متن از ورودی چند وجهی | |||
تولید تصاویر، ویدئو یا صدا | |||
با استفاده از طرح پاسخ، خروجی ساختاریافته (مانند JSON) تولید کنید | |||
چت چند نوبتی | |||
فراخوانی تابع (ابزار) | |||
فراخوانی تابع اصلی | |||
فراخوانی تابع موازی | |||
عملکرد حالت تماس | |||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||
دستورالعمل های سیستم |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 16384 توکن | 32760 توکن |
محدودیت رمز خروجی * | 2048 توکن | 8192 توکن |
تاریخ قطع دانش | فوریه 2023 | فوریه 2023 |
تصاویر (به ازای درخواست) | ||
حداکثر تعداد تصاویر ورودی | 16 تصویر | --- |
حداکثر اندازه در هر تصویر ورودی با کدگذاری پایه 64 | 7 مگابایت | --- |
فایل های PDF (در هر درخواست) | ||
حداکثر تعداد فایل های PDF ورودی ** | 16 فایل | --- |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 16 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | --- |
ویدیو (به ازای درخواست) | ||
حداکثر تعداد فایل های ویدئویی ورودی | 1 فایل | --- |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | 2 دقیقه | --- |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | --- | --- |
صوتی (به ازای درخواست) | ||
حداکثر تعداد فایل های صوتی ورودی | --- | --- |
حداکثر طول تمام صدای ورودی | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | در دسترس بودن عمومی | 04-01-2024 | --- |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 09-04-2024 | نه زودتر از 09-04-2025 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | در دسترس بودن عمومی | 15-02-2024 | --- |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- متن را از اعلانهای چندوجهی (شامل متن، تصاویر، PDF، ویدئو و صدا) تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- از فراخوانی تابع برای اتصال مدل های مولد به سیستم ها و اطلاعات خارجی استفاده کنید.
برای برنامههای موبایل و وب، Vertex AI in Firebase SDK به شما امکان میدهد مستقیماً از برنامه خود با مدلهای پشتیبانیشده Gemini تعامل داشته باشید.
مدلهای Gemini چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند.
در اینجا مروری کوتاه بر مدلهای پشتیبانیشده برای Vertex AI in Firebase و آخرین نسخههای پایدار آنها است. بخش های بعدی در این صفحه مقایسه ها و اطلاعات دقیق تری را ارائه می دهند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
مدل های Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON (تصاویر و صدا به زودی!) | ویژگیهای نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف |
Gemini 1.5 Progemini-1.5-pro-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد |
Gemini 1.5 Flashgemini-1.5-flash-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد سریع و همه کاره در انواع مختلف وظایف |
بله، Vertex AI in Firebase از تمام مدلهای Gemini ، از جمله مدلهای قدیمیتر، پشتیبانی میکند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001 | متن، کد، فایلهای PDF، تصاویر، ویدئو (فقط فریم) | متن، کد | برای پاسخهای متن یا کد، متن، تصاویر و ویدیو را مدیریت میکند. نمی توان برای چت استفاده کرد. |
Gemini 1.0 Progemini-1.0-pro-002 | متن، کد | متن، کد | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید . سؤالات متداول ما را درباره همه مدلهایی که Vertex AI in Firebase پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI in Firebase ارائه می دهد:
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI in Firebase توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
میتوانید درباره هر یک از مدلهای Gemini در اسناد Google Cloud اطلاعات بیشتری کسب کنید.
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
اسناد (PDF یا متن ساده) | ||||
تصاویر، ویدئو و صدا | ||||
صوتی (استریم) | به زودی! | |||
انواع خروجی | ||||
متن | ||||
خروجی ساختاریافته (مانند JSON) | ||||
کد | ||||
تصاویر | به زودی! | |||
صوتی | به زودی! | |||
صوتی (استریم) | به زودی! |
برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
تولید متن از متن یا ورودی های چند وجهی | ||||
تولید تصاویر | به زودی! | |||
تولید صدا | به زودی! | |||
تولید خروجی ساختاریافته (مانند JSON) | ||||
تجزیه و تحلیل تصاویر و ویدئو (دید) | ||||
آنالیز صدا | ||||
تجزیه و تحلیل اسناد (PDF یا متن ساده) | ||||
چت چند نوبتی | ||||
فراخوانی تابع (ابزار) | ||||
فراخوانی تابع اصلی | ||||
فراخوانی تابع موازی | ||||
عملکرد حالت تماس | ||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | ||||
دستورالعمل های سیستم | ||||
Multimodal Live API (جریانهای دوطرفه) | به زودی! |
مشخصات و محدودیت ها
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 1,048,576 توکن | 2,097,152 توکن | 1,048,576 توکن |
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 8192 توکن |
تاریخ قطع دانش | ژوئن 2024 | می 2024 | می 2024 |
تصاویر (به ازای درخواست) | |||
حداکثر تعداد تصاویر ورودی | 3000 عکس | 3000 عکس | 3000 عکس |
حداکثر تعداد تصاویر خروجی | به زودی! | --- | --- |
حداکثر اندازه در هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت |
فایل های PDF (در هر درخواست) | |||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 3000 فایل |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 1000 صفحه |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت |
ویدیو (به ازای درخواست) | |||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 10 فایل |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | ~60 دقیقه | ~60 دقیقه | ~60 دقیقه |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | ~45 دقیقه | ~45 دقیقه | ~45 دقیقه |
صوتی (به ازای درخواست) | |||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | 1 فایل |
حداکثر تعداد فایل های صوتی خروجی | به زودی! | --- | --- |
حداکثر طول تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت |
حداکثر طول صدای خروجی | به زودی! | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما شرایط را برآورده میکنند و بهترین روشها را در فایلهای ورودی پشتیبانیشده و الزامات Vertex AI Gemini API دنبال میکنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدلها در نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش ارائه میشوند.
نسخه های پایدار به طور کلی در دسترس هستند.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
gemini-2.0-flash-001
.
- به عنوان مثال، نسخه های پایدار دارای نام مدل هایی هستند که به عنوان مثال، یک شماره نسخه سه رقمی خاص اضافه شده است
نسخه های به روز شده خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کنند. اگر یک نسخه پایدار جدید منتشر شود، نسخه به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
gemini-2.0-flash
.
- به عنوان مثال، نسخه های به روز شده خودکار دارای نام مدل بدون ضمیمه هستند
نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . توجه داشته باشید که نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر نسخه پیشنمایش جدیدی منتشر شود، هر نسخه پیشنمایش موجود بهطور خودکار به آن نسخه پیشنمایش جدید اشاره میکند.
- نسخههای پیشنمایش دارای نام مدلها هستند
-preview
همراه با تاریخ عرضه اولیه مدل (-MMDD
)، به عنوان مثالgemini-1.5-pro-preview-0409
(منتشر شده در 9 آوریل 2024).
- نسخههای پیشنمایش دارای نام مدلها هستند
در اسناد Google Cloud درباره نسخههای مدل موجود و چرخه عمر آنها ( Gemini ) بیشتر بیاموزید.
نام مدل های موجود
نام مدلها مقادیر صریحی هستند که در کد خود در طول اولیهسازی مدل تولیدی (که یک مرحله لازم برای فراخوانی Gemini API است) وارد میکنید.
میتوانید از نقطه پایانی publishers.models.list
برای فهرست کردن همه نامهای مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدل هایی است که Vertex AI پشتیبانی می کند، اما Vertex AI in Firebase فقط از مدل های Gemini که در این صفحه توضیح داده شده است پشتیبانی می کند. همچنین توجه داشته باشید که نسخههای بهروزرسانی خودکار (مثلاً gemini-2.0-flash
) فهرست نشدهاند، زیرا آنها یک نام مستعار راحت برای مدل پایه پایدار هستند.
نام مدل های Gemini
برای مثالهای اولیه برای زبان خود، راهنمای شروع را ببینید.
نام مدل های Gemini 2.0 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | در دسترس بودن عمومی | 05-02-2025 | تعیین شود |
نسخه به روز رسانی خودکار | ||||
gemini-2.0-flash | به آخرین نسخه پایدار 2.0 Flash اشاره می کند (در حال حاضر gemini-2.0-flash-001 ) | در دسترس بودن عمومی | 10-02-2025 | --- |
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
اسم مدل های Gemini 1.5 Flash
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 24/09/2025 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
زبان های پشتیبانی شده
Gemini
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
اطلاعاتی در مورد مدل های قدیمی تر
Vertex AI in Firebase از همه مدلهای Gemini ، از جمله مدلهای قدیمیتر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی میکند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدلهای قدیمیتر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیتهای مدلهای جدیدتر را ارائه نمیدهند.
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Vertex AI in Firebase هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
تصویر | ||||
اسناد (PDF یا متن ساده) | ||||
ویدئو (فقط فریم) | ||||
ویدئو (قاب + صدا) | ||||
صوتی | ||||
انواع خروجی | ||||
متن | ||||
کد | ||||
تصاویر، ویدئو و صدا |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها قابلیتها و ویژگیهایی هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | |||
تولید متن از ورودی چند وجهی | |||
تولید تصاویر، ویدئو یا صدا | |||
با استفاده از طرح پاسخ، خروجی ساختاریافته (مانند JSON) تولید کنید | |||
چت چند نوبتی | |||
فراخوانی تابع (ابزار) | |||
فراخوانی تابع اصلی | |||
فراخوانی تابع موازی | |||
عملکرد حالت تماس | |||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||
دستورالعمل های سیستم |
در هنگام استفاده از هر مدل با Vertex AI in Firebase اینها مشخصات و محدودیتها هستند:
اموال | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 16384 توکن | 32760 توکن |
محدودیت رمز خروجی * | 2048 توکن | 8192 توکن |
تاریخ قطع دانش | فوریه 2023 | فوریه 2023 |
تصاویر (به ازای درخواست) | ||
حداکثر تعداد تصاویر ورودی | 16 تصویر | --- |
حداکثر اندازه در هر تصویر ورودی با کدگذاری پایه 64 | 7 مگابایت | --- |
فایل های PDF (در هر درخواست) | ||
حداکثر تعداد فایل های PDF ورودی ** | 16 فایل | --- |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 16 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | --- |
ویدیو (به ازای درخواست) | ||
حداکثر تعداد فایل های ویدئویی ورودی | 1 فایل | --- |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | 2 دقیقه | --- |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | --- | --- |
صوتی (به ازای درخواست) | ||
حداکثر تعداد فایل های صوتی ورودی | --- | --- |
حداکثر طول تمام صدای ورودی | --- | --- |
* برای همه مدل ها، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده از countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | در دسترس بودن عمومی | 04-01-2024 | --- |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 09-04-2024 | نه زودتر از 09-04-2025 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نسخه به روز رسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | در دسترس بودن عمومی | 15-02-2024 | --- |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- متن را از اعلانهای چندوجهی (شامل متن، تصاویر، PDF، ویدئو و صدا) تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- از فراخوانی تابع برای اتصال مدل های مولد به سیستم ها و اطلاعات خارجی استفاده کنید.