با استفاده از Imagen تصاویر تولید کنید


Vertex AI در Firebase SDK به شما امکان می دهد به مدل های Imagen 3 (از طریق Imagen API ) دسترسی داشته باشید تا بتوانید تصاویر را از یک درخواست متنی تولید کنید. با این قابلیت می توانید کارهایی مانند:

  • ایجاد تصاویر از دستورات نوشته شده به زبان طبیعی
  • تصاویر را در طیف گسترده ای از فرمت ها و سبک ها ایجاد کنید
  • رندر متن در تصاویر

توجه داشته باشید که Vertex AI در Firebase هنوز از همه ویژگی‌های موجود برای مدل‌های Imagen پشتیبانی نمی‌کند. در ادامه این صفحه در مورد قابلیت ها و ویژگی های پشتیبانی شده بیشتر بیاموزید.

پرش به کد برای ورودی فقط متنی

قبل از شروع

اگر قبلاً این کار را نکرده‌اید، راهنمای شروع کار را تکمیل کنید. این شامل راه‌اندازی پروژه Firebase، اتصال برنامه‌تان به Firebase، افزودن SDK، و مقداردهی اولیه سرویس Vertex AI می‌شود – اینها همه کارهای ضروری قبل از ارسال درخواست فوری به مدل Imagen با استفاده از Vertex AI در Firebase SDK هستند.

توجه داشته باشید که برای تولید تصاویر با استفاده از مدل های Imagen :

  • مطمئن شوید که حداقل از این نسخه های کتابخانه Firebase استفاده می کنید:
    iOS+ : نسخه 11.9.1+ | اندروید : نسخه 16.2.0+ ( BoM : v33.10.0+) | وب سایت : v11.4.1+ | فلوتر : نسخه 1.4.0+ (BoM: نسخه 3.8.0+)

  • راه اندازی یک ImagenModel ( نه یک GenerativeModel )

  • درخواست خود را در یک فراخوانی به generateImages() بفرستید ( برای generateContent() یا generateContentStream() )

این مقداردهی اولیه یک ImagenModel و استفاده از generateImages() در مثال های این صفحه نشان داده شده است.

مدل هایی که از این قابلیت پشتیبانی می کنند

تولید تصویر توسط مدل های Imagen 3 پشتیبانی می شود. پشتیبانی از تولید تصویر توسط مدل های Gemini 2.0 به زودی ارائه می شود.

تصاویر را از ورودی فقط متنی تولید کنید

می‌توانید از یک مدل Imagen بخواهید که با ارسال متن، تصاویر تولید کند. شما می توانید یک تصویر یا چندین تصویر ایجاد کنید.

یک تصویر از ورودی فقط متنی ایجاد کنید

قبل از امتحان کردن این نمونه، مطمئن شوید که بخش قبل از شروع این راهنما را تکمیل کرده اید.

می‌توانید از یک مدل Imagen بخواهید که یک تصویر را با درخواست متن ایجاد کند.

نحوه انتخاب یک مدل و به صورت اختیاری مکان مناسب برای مورد استفاده و برنامه خود را بیاموزید.

چندین تصویر را از ورودی متنی ایجاد کنید

قبل از امتحان کردن این نمونه، مطمئن شوید که بخش قبل از شروع این راهنما را تکمیل کرده اید.

به‌طور پیش‌فرض، مدل‌های Imagen 3 در هر درخواست تنها یک تصویر تولید می‌کنند. با این حال، می‌توانید از یک مدل Imagen بخواهید که در هر درخواست با ارائه یک generationConfig در طول اولیه‌سازی مدل، چندین تصویر تولید کند.

نحوه انتخاب یک مدل و به صورت اختیاری مکان مناسب برای مورد استفاده و برنامه خود را بیاموزید.

ویژگی ها و الزامات پشتیبانی شده

مدل های ایمیجن 3 ویژگی های زیادی در رابطه با تولید تصویر ارائه می دهند. این بخش مواردی را که هنگام استفاده از مدل‌های دارای هوش مصنوعی Vertex در Firebase پشتیبانی می‌شوند، توضیح می‌دهد.

قابلیت ها و ویژگی های پشتیبانی شده

Vertex AI در Firebase از این ویژگی های مدل های Imagen 3 پشتیبانی می کند.

  • ایجاد افراد و چهره‌ها (با توجه به اینکه پروژه Firebase شما تأییدیه Google Cloud را دارد)

  • تولید متن در تصاویر تولید شده

  • اضافه کردن واترمارک به تصاویر تولید شده

  • پیکربندی پارامترهای تولید تصویر ، مانند تعداد تصاویر تولید شده، نسبت ابعاد و واترمارک

  • پیکربندی تنظیمات ایمنی

Vertex AI در Firebase از این ویژگی های پیشرفته مدل های Imagen 3 پشتیبانی نمی کند.

توجه داشته باشید که بسیاری از این ویژگی‌ها نیاز به قرار گرفتن در لیست تایید شده کاربران دارند، حتی در هنگام استفاده از مدل‌های Imagen سمت سرور.

  • ویژگی های ویرایش یا دستکاری تصویر، که شامل ارتقاء مقیاس تصاویر می شود

  • شامل تصاویر در درخواست مدل (مانند آموزش چند شات)

  • تأیید واترمارک دیجیتال با استفاده از SDK
    اگر می‌خواهید تأیید کنید که یک تصویر دارای واترمارک است، می‌توانید تصویر را با استفاده از تب Media آن در Vertex AI Studio آپلود کنید.

  • تولید "تصاویر زنده" از متن (تولید MP4)

  • تولید تصاویر با استفاده از یک سبک از پیش تعریف شده

  • تنظیم زبان متن ورودی

  • فعال کردن includeSafetyAttributes ، به این معنی که safetyAttributes.categories و safetyAttributes.scores قابل بازگشت نیستند.

  • غیرفعال کردن بهبود سریع (پارامتر enhancePrompt )، به این معنی که یک ابزار بازنویسی اعلان مبتنی بر LLM همیشه به طور خودکار جزئیات بیشتری را به درخواست ارائه شده اضافه می کند تا تصاویر با کیفیت بالاتری را ارائه دهد که اعلان ارائه شده را بهتر منعکس کند.

  • نوشتن یک تصویر تولید شده مستقیماً در Google Cloud Storage به عنوان بخشی از پاسخ مدل (پارامتر storageUri ). در عوض، تصاویر همیشه به عنوان بایت های تصویر کدگذاری شده با پایه 64 در پاسخ بازگردانده می شوند.
    اگر می‌خواهید یک تصویر تولید شده را در Cloud Storage آپلود کنید، می‌توانید از Cloud Storage for Firebase استفاده کنید.

مشخصات و محدودیت ها

محدودیت ها (در هر درخواست) تصویر 3 Imagen 3 سریع
حداکثر تعداد نشانه های ورودی 480 توکن 480 توکن
حداکثر تعداد تصاویر خروجی 4 تصویر 4 تصویر
وضوح تصویر خروجی پشتیبانی شده (پیکسل)
  • 1024x1024 پیکسل (نسبت تصویر 1:1)
  • 896x1280 (نسبت تصویر 3:4)
  • 1280x896 (نسبت تصویر 4:3)
  • 768x1408 (نسبت تصویر 9:16)
  • 1408x768 (نسبت تصویر 16:9)
  • 1024x1024 پیکسل (نسبت تصویر 1:1)
  • 896x1280 (نسبت تصویر 3:4)
  • 1280x896 (نسبت تصویر 4:3)
  • 768x1408 (نسبت تصویر 9:16)
  • 1408x768 (نسبت تصویر 16:9)

چه کار دیگری می توانید انجام دهید؟

  • به فکر آماده شدن برای تولید باشید، از جمله راه‌اندازی Firebase App Check برای محافظت از APIهایی که در برنامه خود استفاده می‌کنید در برابر سوءاستفاده توسط مشتریان غیرمجاز. همچنین، حتماً چک لیست تولید را مرور کنید.

یاد بگیرید چگونه تولید محتوا را کنترل کنید

درباره مدل های پشتیبانی شده بیشتر بدانید

در مورد مدل های موجود برای موارد استفاده مختلف و سهمیه ها و قیمت آنها اطلاعات کسب کنید.


درباره تجربه خود با Vertex AI در Firebase بازخورد بدهید