Vertex AI در Firebase SDK به شما امکان می دهد به مدل های Imagen 3 (از طریق Imagen API ) دسترسی داشته باشید تا بتوانید تصاویر را از یک درخواست متنی تولید کنید. با این قابلیت می توانید کارهایی مانند:
- ایجاد تصاویر از دستورات نوشته شده به زبان طبیعی
- تصاویر را در طیف گسترده ای از فرمت ها و سبک ها ایجاد کنید
- رندر متن در تصاویر
توجه داشته باشید که Vertex AI در Firebase هنوز از همه ویژگیهای موجود برای مدلهای Imagen پشتیبانی نمیکند. در ادامه این صفحه در مورد قابلیت ها و ویژگی های پشتیبانی شده بیشتر بیاموزید.
قبل از شروع
اگر قبلاً این کار را نکردهاید، راهنمای شروع کار را تکمیل کنید. این شامل راهاندازی پروژه Firebase، اتصال برنامهتان به Firebase، افزودن SDK، و مقداردهی اولیه سرویس Vertex AI میشود – اینها همه کارهای ضروری قبل از ارسال درخواست فوری به مدل Imagen با استفاده از Vertex AI در Firebase SDK هستند.
توجه داشته باشید که برای تولید تصاویر با استفاده از مدل های Imagen :
مطمئن شوید که حداقل از این نسخه های کتابخانه Firebase استفاده می کنید:
iOS+ : نسخه 11.9.1+ | اندروید : نسخه 16.2.0+ ( BoM : v33.10.0+) | وب سایت : v11.4.1+ | فلوتر : نسخه 1.4.0+ (BoM: نسخه 3.8.0+)راه اندازی یک
ImagenModel
( نه یکGenerativeModel
)درخواست خود را در یک فراخوانی به
generateImages()
بفرستید ( برایgenerateContent()
یاgenerateContentStream()
)
این مقداردهی اولیه یک ImagenModel
و استفاده از generateImages()
در مثال های این صفحه نشان داده شده است.
مدل هایی که از این قابلیت پشتیبانی می کنند
تولید تصویر توسط مدل های Imagen 3 پشتیبانی می شود. پشتیبانی از تولید تصویر توسط مدل های Gemini 2.0 به زودی ارائه می شود.
تصاویر را از ورودی فقط متنی تولید کنید
میتوانید از یک مدل Imagen بخواهید که با ارسال متن، تصاویر تولید کند. شما می توانید یک تصویر یا چندین تصویر ایجاد کنید.
یک تصویر از ورودی فقط متنی ایجاد کنید
قبل از امتحان کردن این نمونه، مطمئن شوید که بخش قبل از شروع این راهنما را تکمیل کرده اید.
میتوانید از یک مدل Imagen بخواهید که یک تصویر را با درخواست متن ایجاد کند.
نحوه انتخاب یک مدل و به صورت اختیاری مکان مناسب برای مورد استفاده و برنامه خود را بیاموزید.
چندین تصویر را از ورودی متنی ایجاد کنید
قبل از امتحان کردن این نمونه، مطمئن شوید که بخش قبل از شروع این راهنما را تکمیل کرده اید.
بهطور پیشفرض، مدلهای Imagen 3 در هر درخواست تنها یک تصویر تولید میکنند. با این حال، میتوانید از یک مدل Imagen بخواهید که در هر درخواست با ارائه یک generationConfig
در طول اولیهسازی مدل، چندین تصویر تولید کند.
نحوه انتخاب یک مدل و به صورت اختیاری مکان مناسب برای مورد استفاده و برنامه خود را بیاموزید.
ویژگی ها و الزامات پشتیبانی شده
مدل های ایمیجن 3 ویژگی های زیادی در رابطه با تولید تصویر ارائه می دهند. این بخش مواردی را که هنگام استفاده از مدلهای دارای هوش مصنوعی Vertex در Firebase پشتیبانی میشوند، توضیح میدهد.
قابلیت ها و ویژگی های پشتیبانی شده
Vertex AI در Firebase از این ویژگی های مدل های Imagen 3 پشتیبانی می کند.
ایجاد افراد و چهرهها (با توجه به اینکه پروژه Firebase شما تأییدیه Google Cloud را دارد)
تولید متن در تصاویر تولید شده
اضافه کردن واترمارک به تصاویر تولید شده
پیکربندی پارامترهای تولید تصویر ، مانند تعداد تصاویر تولید شده، نسبت ابعاد و واترمارک
پیکربندی تنظیمات ایمنی
Vertex AI در Firebase از این ویژگی های پیشرفته مدل های Imagen 3 پشتیبانی نمی کند.
توجه داشته باشید که بسیاری از این ویژگیها نیاز به قرار گرفتن در لیست تایید شده کاربران دارند، حتی در هنگام استفاده از مدلهای Imagen سمت سرور.
ویژگی های ویرایش یا دستکاری تصویر، که شامل ارتقاء مقیاس تصاویر می شود
شامل تصاویر در درخواست مدل (مانند آموزش چند شات)
تأیید واترمارک دیجیتال با استفاده از SDK
اگر میخواهید تأیید کنید که یک تصویر دارای واترمارک است، میتوانید تصویر را با استفاده از تب Media آن در Vertex AI Studio آپلود کنید.تولید "تصاویر زنده" از متن (تولید MP4)
تولید تصاویر با استفاده از یک سبک از پیش تعریف شده
فعال کردن
includeSafetyAttributes
، به این معنی کهsafetyAttributes.categories
وsafetyAttributes.scores
قابل بازگشت نیستند.غیرفعال کردن بهبود سریع (پارامتر
enhancePrompt
)، به این معنی که یک ابزار بازنویسی اعلان مبتنی بر LLM همیشه به طور خودکار جزئیات بیشتری را به درخواست ارائه شده اضافه می کند تا تصاویر با کیفیت بالاتری را ارائه دهد که اعلان ارائه شده را بهتر منعکس کند.نوشتن یک تصویر تولید شده مستقیماً در Google Cloud Storage به عنوان بخشی از پاسخ مدل (پارامتر
storageUri
). در عوض، تصاویر همیشه به عنوان بایت های تصویر کدگذاری شده با پایه 64 در پاسخ بازگردانده می شوند.
اگر میخواهید یک تصویر تولید شده را در Cloud Storage آپلود کنید، میتوانید از Cloud Storage for Firebase استفاده کنید.
مشخصات و محدودیت ها
محدودیت ها (در هر درخواست) | تصویر 3 | Imagen 3 سریع |
---|---|---|
حداکثر تعداد نشانه های ورودی | 480 توکن | 480 توکن |
حداکثر تعداد تصاویر خروجی | 4 تصویر | 4 تصویر |
وضوح تصویر خروجی پشتیبانی شده (پیکسل) |
|
|
چه کار دیگری می توانید انجام دهید؟
- به فکر آماده شدن برای تولید باشید، از جمله راهاندازی Firebase App Check برای محافظت از APIهایی که در برنامه خود استفاده میکنید در برابر سوءاستفاده توسط مشتریان غیرمجاز. همچنین، حتماً چک لیست تولید را مرور کنید.
یاد بگیرید چگونه تولید محتوا را کنترل کنید
- طراحی سریع، از جمله بهترین شیوهها، استراتژیها و درخواستهای نمونه را درک کنید .
- پارامترهای مدل Imagen مانند نسبت ابعاد، تولید شخص و واترمارک را پیکربندی کنید .
- از تنظیمات ایمنی برای تنظیم احتمال دریافت پاسخ هایی که ممکن است مضر تلقی شوند استفاده کنید .
درباره مدل های پشتیبانی شده بیشتر بدانید
در مورد مدل های موجود برای موارد استفاده مختلف و سهمیه ها و قیمت آنها اطلاعات کسب کنید.درباره تجربه خود با Vertex AI در Firebase بازخورد بدهید