برای برنامههای موبایل و وب، Vertex AI در Firebase SDK به شما امکان میدهد با مدلهای پشتیبانیشده Gemini و مدلهای Imagen 3 مستقیماً از برنامه خود تعامل داشته باشید.
مدلهای جمینی چندوجهی در نظر گرفته میشوند زیرا قادر به پردازش و حتی تولید چندین حالت از جمله متن، کد، فایلهای PDF، تصاویر، ویدئو و صدا هستند. از مدل های Imagen 3 می توان با متن برای تولید تصاویر درخواست کرد.
جدول زیر مروری کوتاه بر مدل های پشتیبانی شده برای Vertex AI در Firebase و آخرین نام مدل های پایدار آنها است. این جدول همچنین مدلهای پیشنمایش و آزمایشی را که برای نمونهسازی موارد استفاده در دسترس هستند، فهرست میکند.
مدل | ورودی | خروجی | توضیحات |
---|---|---|---|
مدل های جمینی با نسخه های پایدار | |||
فلش جمینی 2.0gemini-2.0-flash-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON (تصاویر و صدا به زودی!) | ویژگی ها و سرعت نسل بعدی را برای انواع مختلفی از وظایف فراهم می کند (نسل چند وجهی به زودی!) |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد مقرون به صرفه و تاخیر کم را ارائه می دهد. از توان عملیاتی بالا پشتیبانی می کند |
جمینی 1.5 پروgemini-1.5-pro-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | پشتیبانی از وظایف استدلالی پیچیده که نیاز به هوش بیشتری دارند. زمینه طولانی 2M |
فلش جمینی 1.5gemini-1.5-flash-002 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | عملکرد سریع و همه کاره را در انواع مختلف وظایف ارائه می دهد |
مدلهای Gemini فقط با نسخههای پیشنمایش و آزمایشی (فقط برای نمونهسازی موارد استفاده توصیه میشود) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05 | متن، کد، فایل های PDF، تصاویر، ویدئو، صدا | متن، کد، JSON | قوی ترین کیفیت مدل را به خصوص برای کد و دانش جهانی ارائه می دهد. زمینه طولانی 2M |
Gemini 2.0 Flash-Thinkinggemini-2.0-flash-thinking-exp-01-21 | متن، کد، فایل های PDF، تصاویر | متن، کد، JSON | قابلیتهای استدلال قویتری ارائه میدهد و فرآیند تفکر را در پاسخها شامل میشود |
مدل های Imagen 3 (هنگام استفاده با Vertex AI در Firebase ) | |||
تصویر 3imagen-3.0-generate-002 | متن | تصاویر | تصاویر واقعی و باکیفیت را از پیامهای متنی به زبان طبیعی ایجاد میکند |
Imagen 3 سریعimagen-3.0-fast-generate-001 | متن | تصاویر | تصاویر را برای نمونه سازی اولیه یا موارد استفاده با تأخیر کم تولید می کند |
بله، Vertex AI در Firebase از تمام مدلهای Gemini ، از جمله مدلهای قدیمیتر، پشتیبانی میکند.
مدل | ورودی | خروجی | بهینه شده برای |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001 | متن، کد، فایلهای PDF، تصاویر، ویدئو (فقط فریم) | متن، کد | برای پاسخهای متن یا کد، متن، تصاویر و ویدیو را مدیریت میکند. نمی توان برای چت استفاده کرد. |
Gemini 1.0 Progemini-1.0-pro-002 | متن، کد | متن، کد | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
Vertex AI در Firebase فقط از مدل های Imagen 3 پشتیبانی می کند. از مدل های قدیمی Imagen (مانند Imagen 2 ) پشتیبانی نمی کند.
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید . سؤالات متداول ما را درباره همه مدلهایی که Vertex AI در Firebase پشتیبانی میکند و پشتیبانی نمیکند، مرور کنید.
بقیه این صفحه اطلاعات دقیقی در مورد مدل های پشتیبانی شده توسط Vertex AI در Firebase ارائه می دهد:
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالایی از قابلیت های پشتیبانی شده
- مشخصات و محدودیتها، برای مثال حداکثر نشانههای ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه نسخهسازی مدلها ، بهویژه نسخههای پایدار ، بهروزرسانی خودکار و پیشنمایش آنها
لیستی از نام مدل های موجود برای گنجاندن در کد خود در هنگام شروع اولیه
لیست زبان های پشتیبانی شده برای مدل ها
در پایین این صفحه، می توانید اطلاعات دقیق در مورد مدل های قدیمی را مشاهده کنید .
مقایسه مدل ها
هر مدل قابلیت های مختلفی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول در این بخش هر مدل را در هنگام استفاده با Vertex AI در Firebase توصیف می کند. هر مدل ممکن است قابلیتهای بیشتری داشته باشد که هنگام استفاده از SDK ما در دسترس نباشد.
اگر نمیتوانید اطلاعات مورد نظر خود را در بخشهای فرعی زیر پیدا کنید، میتوانید اطلاعات بیشتری درباره مدلهای Gemini و مدلهای Imagen 3 در اسناد Google Cloud پیدا کنید.
ورودی و خروجی پشتیبانی شده
اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Vertex AI در Firebase هستند:
جوزا 2.0 Pro | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 Flash- فکر کردن | جوزا 1.5 حرفه ای | جوزا 1.5 فلش | تصویر 3 / Imagen 3 سریع | |
---|---|---|---|---|---|---|---|
انواع ورودی | |||||||
متن | |||||||
کد | |||||||
اسناد (PDF یا متن ساده) | |||||||
تصاویر | |||||||
ویدئو | |||||||
صوتی | |||||||
صوتی (استریم) | به زودی! | ||||||
انواع خروجی | |||||||
متن | |||||||
کد | |||||||
خروجی ساختاریافته (مانند JSON) | |||||||
تصاویر | به زودی! | ||||||
صوتی | به زودی! | ||||||
صوتی (استریم) | به زودی! |
برای آشنایی با انواع فایل های پشتیبانی شده، به فایل های ورودی پشتیبانی شده و الزامات برای Vertex AI Gemini API مراجعه کنید.
قابلیت ها و ویژگی های پشتیبانی شده
اینها قابلیتها و ویژگیهای پشتیبانیشده هنگام استفاده از هر مدل با Vertex AI در Firebase هستند:
جوزا 2.0 Pro | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 Flash- فکر کردن | جوزا 1.5 حرفه ای | جوزا 1.5 فلش | تصویر 3 / Imagen 3 سریع | |
---|---|---|---|---|---|---|---|
تولید متن از متن یا ورودی های چند وجهی | |||||||
تولید تصاویر ( تصویر 3 ) | به زودی! | ||||||
تولید صدا | به زودی! | ||||||
تولید خروجی ساختار یافته (مانند JSON) | |||||||
اسناد را تجزیه و تحلیل کنید (PDF یا متن ساده) | |||||||
تجزیه و تحلیل تصاویر (بینایی) | |||||||
تجزیه و تحلیل ویدئو (دید) | |||||||
آنالیز صدا | |||||||
چت چند نوبتی | |||||||
فراخوانی تابع (ابزار) | |||||||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||||||
دستورالعمل های سیستم | |||||||
Multimodal Live API (جریان دو طرفه) | به زودی! |
مشخصات و محدودیت ها
در هنگام استفاده از هر مدل با Vertex AI در Firebase ، اینها مشخصات و محدودیتها هستند:
اموال | جوزا 2.0 Pro | جوزا 2.0 فلش | جوزا 2.0 Flash- ساده | جوزا 2.0 Flash- فکر کردن | جوزا 1.5 حرفه ای | جوزا 1.5 فلش | تصویر 3 / Imagen 3 سریع |
---|---|---|---|---|---|---|---|
پنجره زمینه * حد توکن کل (ورودی + خروجی ترکیبی) | 2,097,152 توکن | 1,048,576 توکن | 1,048,576 توکن | 1,048,576 توکن | 2,097,152 توکن | 1,048,576 توکن | 480 توکن |
محدودیت رمز خروجی * | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | 8192 توکن | --- |
تاریخ قطع دانش | ژوئن 2024 | ژوئن 2024 | ژوئن 2024 | ژوئن 2024 | می 2024 | می 2024 | --- |
فایل های PDF (در هر درخواست) | |||||||
حداکثر تعداد فایل های PDF ورودی ** | 3000 فایل | 3000 فایل | 3000 فایل | 3000 فایل | 3000 فایل | 3000 فایل | --- |
حداکثر تعداد تعداد صفحات در هر فایل PDF ورودی ** | 1000 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | 1000 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | 50 مگابایت | --- |
تصاویر (در هر درخواست) | |||||||
حداکثر تعداد از تصاویر ورودی | 3000 عکس | 3000 عکس | 3000 عکس | 3000 عکس | 3000 عکس | 3000 عکس | --- |
حداکثر تعداد از تصاویر خروجی | --- | به زودی! | --- | --- | --- | --- | 4 تصویر |
حداکثر اندازه به ازای هر تصویر کدگذاری شده با پایه 64 ورودی | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | 7 مگابایت | --- |
ویدئو (به ازای درخواست) | |||||||
حداکثر تعداد فایل های ویدئویی ورودی | 10 فایل | 10 فایل | 10 فایل | --- | 10 فایل | 10 فایل | --- |
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب) | ~60 دقیقه | ~60 دقیقه | ~60 دقیقه | --- | ~60 دقیقه | ~60 دقیقه | --- |
حداکثر طول از تمام ویدیوهای ورودی (قاب + صدا) | ~45 دقیقه | ~45 دقیقه | ~45 دقیقه | --- | ~45 دقیقه | ~45 دقیقه | --- |
صوتی (به ازای درخواست) | |||||||
حداکثر تعداد فایل های صوتی ورودی | 1 فایل | 1 فایل | 1 فایل | --- | 1 فایل | 1 فایل | --- |
حداکثر تعداد از فایل های صوتی خروجی | --- | به زودی! | --- | --- | --- | --- | --- |
حداکثر طول از تمام صدای ورودی | 8.4 ساعت | 8.4 ساعت | 8.4 ساعت | --- | 8.4 ساعت | 8.4 ساعت | --- |
حداکثر طول از تمام صدای خروجی | --- | به زودی! | --- | --- | --- | --- | --- |
* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
اطلاعات دقیق اضافی را بیابید
سهمیه و قیمت برای هر مدل متفاوت است. قیمت گذاری نیز به ورودی و خروجی بستگی دارد.
درباره انواع فایلهای ورودی پشتیبانیشده، نحوه تعیین نوع MIME، و نحوه اطمینان از اینکه فایلهای ورودی و درخواستهای چندوجهی شما شرایط را برآورده میکنند و بهترین روشها را در فایلهای ورودی پشتیبانیشده و الزامات Vertex AI Gemini API دنبال میکنند، بیاموزید.
مدل سازی و الگوهای نامگذاری
مدل ها در نسخه های پایدار ، پیش نمایش و آزمایشی ارائه می شوند. برای راحتی، نام مستعار بدون مقادیر نسخه صریح پشتیبانی می شود.
برای یافتن نامهای مدل خاص برای استفاده در کد خود، بخش «نام مدلهای موجود» را در ادامه این صفحه ببینید.
نوع نسخه | توضیحات | الگوی نام مدل | |
---|---|---|---|
پایدار | نسخه های پایدار به طور کلی در دسترس هستند. | نام مدل های نسخه های پایدار با یک شماره نسخه سه رقمی خاص اضافه شده است مثال: | |
نام مستعار پایدار بهروزرسانی خودکار | نام مستعار پایدار با به روز رسانی خودکار همیشه به آخرین نسخه پایدار آن مدل اشاره می کند. اگر یک نسخه پایدار جدید منتشر شود، نام مستعار به روز شده خودکار به طور خودکار به آن نسخه پایدار جدید اشاره می کند. | نام مدل های مستعار هیچ ضمیمه ای ندارد مثال: | |
پیش نمایش | نسخه های پیش نمایش دارای قابلیت های جدیدی هستند و ثابت نیستند . نسخه های پیش نمایش همیشه به آخرین نسخه پیش نمایش آن مدل اشاره می کنند. اگر یک نسخه پیشنمایش جدید منتشر شود، هر نسخه پیشنمایش موجود بهطور خودکار به آن نسخه پیشنمایش جدید اشاره میکند. | نام مدل های نسخه های پیش نمایش به ضمیمه شده است مثال: | |
تجربی | نسخههای آزمایشی قابلیتهای جدیدی دارند و پایدار نیستند و از طرح چرخه عمر مدل استاندارد Google و طرح نسخهسازی پیروی نمیکنند. درباره مدل های آزمایشی بیشتر بدانید. | نام مدل های نسخه های آزمایشی به ضمیمه می شود مثال: |
درباره نسخههای مدل موجود و چرخه عمر آنها ( Gemini ) یا Imagen در اسناد Google Cloud بیشتر بیاموزید.
نام مدل های موجود
نام مدل ها مقادیر صریحی هستند که در کد خود در هنگام شروع اولیه مدل وارد می کنید.
میتوانید از نقطه پایانی publishers.models.list
برای فهرست کردن همه نامهای مدل موجود استفاده کنید. توجه داشته باشید که این لیست بازگشتی شامل تمام مدلهایی است که Vertex AI پشتیبانی میکند، اما Vertex AI در Firebase فقط از مدلهای Gemini و Imagen که در این صفحه توضیح داده شدهاند، پشتیبانی میکند. همچنین توجه داشته باشید که نام مستعار به روز شده خودکار (به عنوان مثال، gemini-2.0-flash
) در فهرست قرار نگرفته اند زیرا آنها نام مستعار راحتی برای مدل پایه هستند.
نام مدل های جمینی
برای مثالهای اولیه برای زبان خود، راهنمای شروع را ببینید.
نام مدل های Gemini 2.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
هیچ نسخه پایدار موجود نیست | --- | --- | --- | --- |
نام مستعار پایدار بهروزرسانی خودکار | ||||
نام مستعار پایدار بهروزرسانی خودکار موجود نیست | --- | --- | --- | --- |
نسخه های پیش نمایش | ||||
هیچ نسخه پیش نمایشی موجود نیست | --- | --- | --- | --- |
نسخه های آزمایشی | ||||
gemini-2.0-pro-exp-02-05 | نسخه آزمایشی Gemini 2.0 Pro | تجربی | 05-02-2025 | تعیین شود |
نام مدل های فلش Gemini 2.0
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-001 | آخرین نسخه پایدار Gemini 2.0 Flash | در دسترس بودن عمومی | 05-02-2025 | نه زودتر از 05-02-2026 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-2.0-flash | به آخرین نسخه پایدار 2.0 Flash اشاره می کند (در حال حاضر gemini-2.0-flash-001 ) | در دسترس بودن عمومی | 10-02-2025 | --- |
نسخه های پیش نمایش | ||||
هیچ نسخه پیش نمایشی موجود نیست | --- | --- | --- | --- |
نسخه های آزمایشی | ||||
هیچ نسخه آزمایشی موجود نیست | --- | --- | --- | --- |
نام مدل های Gemini 2.0 Flash-Lite
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-2.0-flash-lite-001 | آخرین نسخه پایدار Gemini 2.0 Flash-Lite | در دسترس بودن عمومی | 2025-02-25 | نه زودتر از 2026-02-25 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-2.0-flash-lite | به آخرین نسخه پایدار 2.0 Flash-Lite اشاره می کند (در حال حاضر gemini-2.0-flash-lite-001 ) | در دسترس بودن عمومی | 2025-02-25 | --- |
نسخه های پیش نمایش | ||||
gemini-2.0-flash-lite-preview-02-05 | نسخه پیش نمایش Gemini 2.0 Flash-Lite | پیش نمایش | 05-02-2025 | تعیین شود |
نسخه های آزمایشی | ||||
هیچ نسخه آزمایشی موجود نیست | --- | --- | --- | --- |
نام مدل های Gemini 2.0 Flash-Thinking
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
هیچ نسخه پایدار موجود نیست | --- | --- | --- | --- |
نام مستعار پایدار بهروزرسانی خودکار | ||||
نام مستعار پایدار بهروزرسانی خودکار موجود نیست | --- | --- | --- | --- |
نسخه های پیش نمایش | ||||
هیچ نسخه پیش نمایشی موجود نیست | --- | --- | --- | --- |
نسخه های آزمایشی | ||||
gemini-2.0-flash-thinking-exp-01-21 | نسخه آزمایشی Gemini 2.0 Flash-Thinking | تجربی | 2025-01-21 | تعیین شود |
نام مدل های Gemini 1.5 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-pro-002 | آخرین نسخه پایدار Gemini 1.5 Pro | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 2025-09-24 |
gemini-1.5-pro-001 | نسخه پایدار اولیه Gemini 1.5 Pro | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.5-pro | به آخرین نسخه پایدار 1.5 Pro اشاره می کند (در حال حاضر gemini-1.5-pro-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
نسخه های پیش نمایش | ||||
هیچ نسخه پیش نمایشی موجود نیست | --- | --- | --- | --- |
نسخه های آزمایشی | ||||
هیچ نسخه آزمایشی موجود نیست | --- | --- | --- | --- |
نام مدل های فلش Gemini 1.5
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.5-flash-002 | آخرین نسخه پایدار Gemini 1.5 Flash | در دسترس بودن عمومی | 2024-09-24 | نه زودتر از 2025-09-24 |
gemini-1.5-flash-001 | نسخه پایدار اولیه Gemini 1.5 Flash | در دسترس بودن عمومی | 24-05-2024 | نه زودتر از 24/05/2025 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.5-flash | به آخرین نسخه پایدار 1.5 Flash اشاره می کند (در حال حاضر gemini-1.5-flash-002 ) | در دسترس بودن عمومی | 2024-09-24 | --- |
نسخه های پیش نمایش | ||||
هیچ نسخه پیش نمایشی موجود نیست | --- | --- | --- | --- |
نسخه های آزمایشی | ||||
هیچ نسخه آزمایشی موجود نیست | --- | --- | --- | --- |
نام مدل های Imagen
برای نمونه های اولیه برای زبان خود، به تولید تصاویر با راهنمای Imagen مراجعه کنید.
در حال حاضر، هیچ یک از مدل های Imagen 3 دارای نسخه پیش نمایش یا آزمایشی نیستند.
ایمیج 3 نام مدل
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
imagen-3.0-generate-002 | آخرین نسخه پایدار Imagen 3 | در دسترس بودن عمومی | 2025-01-23 | نه زودتر از 23/01/2026 |
imagen-3.0-generate-001 | نسخه پایدار اولیه Imagen 3 | در دسترس بودن عمومی | 2024-07-31 | نه زودتر از 31/07/2025 |
Imagen 3 نام مدل های سریع
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
imagen-3.0-fast-generate-001 | نسخه پایدار اولیه Imagen 3 Fast | در دسترس بودن عمومی | 2024-07-31 | نه زودتر از 31/07/2025 |
زبان های پشتیبانی شده
جوزا
همه مدلهای Gemini میتوانند به زبانهای زیر بفهمند و پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، لهستانی (ja)، لیتوانیایی (ja) (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (UK)، ویتنامی (vi)
مدلهای Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash میتوانند به زبانهای اضافی زیر بفهمند و پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مالاگازی (ml)، مالاگاسی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (pa)، پشتو (ps)، Sindhieshalaa (Sd) (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغوری (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)
Imagen
در دسترس بودن عمومی : انگلیسی
پیش نمایش : چینی (ساده شده)، چینی (سنتی)، هندی، ژاپنی، کره ای، پرتغالی، اسپانیایی
اطلاعاتی در مورد مدل های قدیمی تر
Vertex AI در Firebase از همه مدلهای Gemini ، از جمله مدلهای قدیمیتر مانند Gemini 1.0 Pro و Gemini 1.0 Pro Vision پشتیبانی میکند. با این حال، ما قویاً توصیه می کنیم از مدل جدیدتری با SDK های خود استفاده کنید. این مدلهای قدیمیتر Gemini در حال نزدیک شدن به تاریخ توقف تولید خود هستند و تمام قابلیتهای مدلهای جدیدتر را ارائه نمیدهند.
Vertex AI در Firebase فقط از مدل های Imagen 3 پشتیبانی می کند. از مدل های قدیمی Imagen (مانند Imagen 2 ) پشتیبانی نمی کند.
اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Vertex AI در Firebase هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
انواع ورودی | ||||
متن | ||||
کد | ||||
اسناد (PDF یا متن ساده) | ||||
تصویر | ||||
ویدئو (فقط فریم) | ||||
ویدئو (قاب + صدا) | ||||
صوتی | ||||
انواع خروجی | ||||
متن | ||||
کد | ||||
تصاویر، ویدئو و صدا |
در هنگام استفاده از هر مدل با Vertex AI در Firebase ، اینها قابلیتها و ویژگیهایی هستند:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
متن را از ورودی فقط متنی تولید کنید | |||
تولید متن از ورودی چند وجهی | |||
تولید تصاویر، ویدئو یا صدا | |||
با استفاده از طرح پاسخ، خروجی ساختاریافته (مانند JSON) تولید کنید | |||
چت چند نوبتی | |||
فراخوانی تابع (ابزار) | |||
فراخوانی تابع اصلی | |||
فراخوانی تابع موازی | |||
عملکرد حالت تماس | |||
توکن ها و کاراکترهای قابل پرداخت را بشمارید | |||
دستورالعمل های سیستم |
در هنگام استفاده از هر مدل با Vertex AI در Firebase ، اینها مشخصات و محدودیتها هستند:
اموال | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
پنجره زمینه * محدودیت کل رمز (ورودی + خروجی ترکیبی) | 16384 توکن | 32760 توکن |
محدودیت رمز خروجی * | 2048 توکن | 8192 توکن |
تاریخ قطع دانش | فوریه 2023 | فوریه 2023 |
فایل های PDF (در هر درخواست) | ||
حداکثر تعداد فایل های PDF ورودی ** | 16 فایل | --- |
حداکثر تعداد صفحات در هر فایل PDF ورودی ** | 16 صفحه | --- |
حداکثر اندازه در هر فایل PDF ورودی | 50 مگابایت | --- |
تصاویر (در هر درخواست) | ||
حداکثر تعداد تصاویر ورودی | 16 تصویر | --- |
حداکثر اندازه در هر تصویر ورودی با کدگذاری پایه 64 | 7 مگابایت | --- |
ویدیو (به ازای درخواست) | ||
حداکثر تعداد فایل های ویدئویی ورودی | 1 فایل | --- |
حداکثر طول تمام ویدیوهای ورودی (فقط فریم) | 2 دقیقه | --- |
حداکثر طول تمام ویدیوهای ورودی (فریم + صدا) | --- | --- |
صوتی (به ازای درخواست) | ||
حداکثر تعداد فایل های صوتی ورودی | --- | --- |
حداکثر طول تمام صدای ورودی | --- | --- |
* برای تمام مدل های جمینی ، یک نشانه معادل حدود 4 کاراکتر است، بنابراین 100 توکن حدود 60-80 کلمه انگلیسی است. برای مدلهای Gemini ، میتوانید تعداد کل نشانهها را در درخواستهای خود با استفاده countTokens
تعیین کنید.
** فایل های PDF به عنوان تصویر در نظر گرفته می شوند، بنابراین یک صفحه از یک PDF به عنوان یک تصویر در نظر گرفته می شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می تواند پشتیبانی کند.
نام مدل های Gemini 1.0 Pro Vision
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-vision-001 | آخرین نسخه پایدار Gemini 1.0 Pro Vision | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.0-pro-vision | به آخرین نسخه پایدار 1.5 Pro Vision اشاره می کند (در حال حاضر gemini-1.5-pro-vision-001 ) | در دسترس بودن عمومی | 04-01-2024 | --- |
نام مدل های Gemini 1.0 Pro
نام مدل | توضیحات | مرحله انتشار | تاریخ انتشار اولیه | تاریخ توقف |
---|---|---|---|---|
نسخه های پایدار | ||||
gemini-1.0-pro-002 | آخرین نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 09-04-2024 | نه زودتر از 09-04-2025 |
gemini-1.0-pro-001 | نسخه پایدار Gemini 1.0 Pro | در دسترس بودن عمومی | 15-02-2024 | نه زودتر از 15/02/2025 |
نام مستعار پایدار بهروزرسانی خودکار | ||||
gemini-1.0-pro | به آخرین نسخه پایدار 1.0 Pro اشاره می کند (در حال حاضر gemini-1.0-pro-002 ) | در دسترس بودن عمومی | 15-02-2024 | --- |
مراحل بعدی
قابلیت های Gemini API را امتحان کنید
- مکالمات چند نوبتی (چت) بسازید.
- متن را از اعلانهای فقط متنی ایجاد کنید.
- متن را از اعلانهای چندوجهی (شامل متن، تصاویر، PDF، ویدئو و صدا) تولید کنید.
- خروجی ساختاریافته (مانند JSON) را هم از دستورات متنی و هم از چند وجهی ایجاد کنید.
- از فراخوانی تابع برای اتصال مدل های مولد به سیستم ها و اطلاعات خارجی استفاده کنید.