Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

דף זה תורגם על ידי Cloud Translation API.

יצירת תמונות באמצעות Imagen

ערכות ה-SDK‏ Firebase AI Logic מאפשרות לכם גישה למודלים Imagen (דרך Imagen API) כדי ליצור תמונות מהנחיית טקסט. בעזרת היכולת הזו, אתם יכולים:

יצירת תמונות מהנחיות שנכתבו בשפה טבעית
יצירת תמונות במגוון רחב של פורמטים וסגנונות
עיבוד טקסט בתמונות

במדריך הזה מוסבר איך ליצור תמונות באמצעות Imagen על ידי הזנת הנחיית טקסט בלבד.

עם זאת, חשוב לדעת ש-Imagen יכול גם ליצור תמונות על סמך תמונת הפניה באמצעות היכולת שלו להתאמה אישית (בשלב הזה רק ב-Android וב-Flutter). בבקשה, מציינים הנחיה טקסטואלית ותמונה לדוגמה שמנחה את המודל ליצור תמונה חדשה על סמך הסגנון, הנושא (כמו מוצר, אדם או בעל חיים) או אמצעי הבקרה שצוינו. לדוגמה, אתם יכולים ליצור תמונה חדשה מתוך תמונה של חתול או מתוך ציור של טיל וירח.

מעבר לקוד של קלט טקסט בלבד

בחירה בין מודלים של Gemini ו-Imagen

ערכות ה-SDK של Firebase AI Logic תומכות ביצירה ובעריכה של תמונות באמצעות מודל Gemini או מודל Imagen.

ברוב המקרים, כדאי להתחיל עם Gemini ואז לבחור באפשרות Imagen רק למשימות מיוחדות שבהן איכות התמונה היא קריטית.

בוחרים באפשרות Gemini אם רוצים:

כדי להשתמש בידע על העולם ובהיגיון כדי ליצור תמונות רלוונטיות להקשר.
כדי לשלב בצורה חלקה בין טקסט ותמונות, או כדי לשלב בין טקסט ותמונות בפלט.
להטמיע רכיבים חזותיים מדויקים ברצפים ארוכים של טקסט.
כדי לערוך תמונות בשיחה תוך שמירה על ההקשר.

בוחרים באפשרות Imagen אם רוצים:

כדי לתת עדיפות לאיכות התמונה, לריאליזם, לפרטים אומנותיים או לסגנונות ספציפיים (למשל, אימפרסיוניזם או אנימה).
כדי להוסיף מיתוג, סגנון או ליצור סמלי לוגו ועיצובים של מוצרים.
כדי לציין במפורש את יחס הגובה-רוחב או הפורמט של התמונות שנוצרו.

לפני שמתחילים

לוחצים על הספק Gemini API כדי לראות בדף הזה תוכן וקוד שספציפיים לספק.

אם עדיין לא עשיתם את זה, כדאי לעיין במדריך לתחילת העבודה. במדריך הזה מוסבר איך להגדיר את פרויקט Firebase, לקשר את האפליקציה ל-Firebase, להוסיף את ה-SDK, לאתחל את שירות ה-Backend של ספק ה-API שבחרתם וליצור מופע של ImagenModel.

מודלים שתומכים ביכולת הזו

‫Gemini Developer API תומך ביצירת תמונות באמצעות המודלים היציבים העדכניים ביותר של Imagen. המגבלה הזו של מודלים נתמכים של Imagen חלה ללא קשר לאופן הגישה אל Gemini Developer API.

imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002

יצירת תמונות מקלט טקסט בלבד

אתם יכולים לבקש ממודל Imagen ליצור תמונות באמצעות הנחיה שמורכבת מטקסט בלבד. אתם יכולים ליצור תמונה אחת או כמה תמונות.

אפשר גם להגדיר אפשרויות שונות ליצירת תמונות, כמו יחסי גובה-רוחב ופורמט תמונה.

יצירת תמונה אחת מטקסט בלבד

לפני שמנסים את הדוגמה הזו, צריך להשלים את השלבים שבקטע לפני שמתחילים במדריך הזה כדי להגדיר את הפרויקט והאפליקציה.
בקטע הזה, צריך גם ללחוץ על לחצן של ספק Gemini API שבחרתם כדי שיוצג בדף הזה תוכן שספציפי לספק.

אתם יכולים לבקש ממודל Imagen ליצור תמונה אחת באמצעות הנחיית טקסט בלבד.

חשוב ליצור מופע של ImagenModel ולהתקשר אל generateImages.

Swift


import FirebaseAILogic

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Create an `ImagenModel` instance with a model that supports your use case
let model = ai.imagenModel(modelName: "imagen-4.0-generate-001")

// Provide an image generation prompt
let prompt = "An astronaut riding a horse"

// To generate an image, call `generateImages` with the text prompt
let response = try await model.generateImages(prompt: prompt)

// Handle the generated image
guard let image = response.images.first else {
  fatalError("No image in the response.")
}
let uiImage = UIImage(data: image.data)

Kotlin


suspend fun generateImage() {
  // Initialize the Gemini Developer API backend service
  val ai = Firebase.ai(backend = GenerativeBackend.googleAI())

  // Create an `ImagenModel` instance with an Imagen model that supports your use case
  val model = ai.imagenModel("imagen-4.0-generate-001")

  // Provide an image generation prompt
  val prompt = "An astronaut riding a horse"

  // To generate an image, call `generateImages` with the text prompt
  val imageResponse = model.generateImages(prompt)

  // Handle the generated image
  val image = imageResponse.images.first()

  val bitmapImage = image.asBitmap()
}

Java


// Initialize the Gemini Developer API backend service
// Create an `ImagenModel` instance with an Imagen model that supports your use case
ImagenModel imagenModel = FirebaseAI.getInstance(GenerativeBackend.googleAI())
        .imagenModel(
                /* modelName */ "imagen-4.0-generate-001");

ImagenModelFutures model = ImagenModelFutures.from(imagenModel);

// Provide an image generation prompt
String prompt = "An astronaut riding a horse";

// To generate an image, call `generateImages` with the text prompt
Futures.addCallback(model.generateImages(prompt), new FutureCallback<ImagenGenerationResponse<ImagenInlineImage>>() {
    @Override
    public void onSuccess(ImagenGenerationResponse<ImagenInlineImage> result) {
        if (result.getImages().isEmpty()) {
            Log.d("TAG", "No images generated");
        }
        Bitmap bitmap = result.getImages().get(0).asBitmap();
        // Use the bitmap to display the image in your UI
    }

    @Override
    public void onFailure(Throwable t) {
        // ...
    }
}, Executors.newSingleThreadExecutor());

Web


import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create an `ImagenModel` instance with an Imagen model that supports your use case
const model = getImagenModel(ai, { model: "imagen-4.0-generate-001" });

// Provide an image generation prompt
const prompt = "An astronaut riding a horse.";

// To generate an image, call `generateImages` with the text prompt
const response = await model.generateImages(prompt)

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if (response.filteredReason) {
  console.log(response.filteredReason);
}

if (response.images.length == 0) {
  throw new Error("No images in the response.")
}

const image = response.images[0];

Dart

import 'package:firebase_ai/firebase_ai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';

// Initialize FirebaseApp
await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Gemini Developer API backend service
final model = FirebaseAI.googleAI();

// Create an `ImagenModel` instance with an Imagen model that supports your use case
final model = ai.imagenModel(model: 'imagen-4.0-generate-001');

// Provide an image generation prompt
const prompt = 'An astronaut riding a horse.';

// To generate an image, call `generateImages` with the text prompt
final response = await model.generateImages(prompt);

if (response.images.isNotEmpty) {
  final image = response.images[0];
  // Process the image
} else {
  // Handle the case where no images were generated
  print('Error: No images were generated.');
}

Unity


using Firebase.AI;

// Initialize the Gemini Developer API backend service
var ai = FirebaseAI.GetInstance(FirebaseAI.Backend.GoogleAI());

// Create an `ImagenModel` instance with a model that supports your use case
var model = ai.GetImagenModel(modelName: "imagen-4.0-generate-001");

// Provide an image generation prompt
var prompt = "An astronaut riding a horse";

// To generate an image, call `generateImages` with the text prompt
var response = await model.GenerateImagesAsync(prompt: prompt);

// Handle the generated image
if (response.Images.Count == 0) {
  throw new Exception("No image in the response.");
}
var image = response.Images[0].AsTexture2D();

איך בוחרים מודל שמתאימים לתרחיש השימוש ולאפליקציה שלכם.

יצירת כמה תמונות מטקסט בלבד

כברירת מחדל, מודלים של Imagen יוצרים רק תמונה אחת לכל בקשה. עם זאת, אפשר לבקש ממודל Imagen ליצור כמה תמונות בכל בקשה על ידי ציון ImagenGenerationConfig כשיוצרים את מופע ImagenModel.

חשוב ליצור מופע של ImagenModel ולהתקשר אל generateImages.

Swift


import FirebaseAILogic

// Initialize the Gemini Developer API backend service
let ai = FirebaseAI.firebaseAI(backend: .googleAI())

// Create an `ImagenModel` instance with a model that supports your use case
let model = ai.imagenModel(
  modelName: "imagen-4.0-generate-001",
  // Configure the model to generate multiple images for each request
  // See: https://firebase.google.com/docs/ai-logic/model-parameters
  generationConfig: ImagenGenerationConfig(numberOfImages: 4)
)

// Provide an image generation prompt
let prompt = "An astronaut riding a horse"

// To generate images, call `generateImages` with the text prompt
let response = try await model.generateImages(prompt: prompt)

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if let filteredReason = response.filteredReason {
  print(filteredReason)
}

// Handle the generated images
let uiImages =  response.images.compactMap { UIImage(data: $0.data) }

Kotlin


suspend fun generateImage() {
  // Initialize the Gemini Developer API backend service
  val ai = Firebase.ai(backend = GenerativeBackend.googleAI())

  // Create an `ImagenModel` instance with an Imagen model that supports your use case
  val model = ai.imagenModel(
    modelName = "imagen-4.0-generate-001",
    // Configure the model to generate multiple images for each request
    // See: https://firebase.google.com/docs/ai-logic/model-parameters
    generationConfig = ImagenGenerationConfig(numberOfImages = 4)
  )

  // Provide an image generation prompt
  val prompt = "An astronaut riding a horse"

  // To generate images, call `generateImages` with the text prompt
  val imageResponse = model.generateImages(prompt)

  // If fewer images were generated than were requested,
  // then `filteredReason` will describe the reason they were filtered out
  if (imageResponse.filteredReason != null) {
    Log.d(TAG, "FilteredReason: ${imageResponse.filteredReason}")
  }

  for (image in imageResponse.images) {
    val bitmap = image.asBitmap()
    // Use the bitmap to display the image in your UI
  }
}

Java


// Configure the model to generate multiple images for each request
// See: https://firebase.google.com/docs/ai-logic/model-parameters
ImagenGenerationConfig imagenGenerationConfig = new ImagenGenerationConfig.Builder()
        .setNumberOfImages(4)
        .build();

// Initialize the Gemini Developer API backend service
// Create an `ImagenModel` instance with an Imagen model that supports your use case
ImagenModel imagenModel = FirebaseAI.getInstance(GenerativeBackend.googleAI())
        .imagenModel(
                /* modelName */ "imagen-4.0-generate-001",
                /* imageGenerationConfig */ imagenGenerationConfig);

ImagenModelFutures model = ImagenModelFutures.from(imagenModel);

// Provide an image generation prompt
String prompt = "An astronaut riding a horse";

// To generate images, call `generateImages` with the text prompt
Futures.addCallback(model.generateImages(prompt), new FutureCallback<ImagenGenerationResponse<ImagenInlineImage>>() {
    @Override
    public void onSuccess(ImagenGenerationResponse<ImagenInlineImage> result) {
        // If fewer images were generated than were requested,
        // then `filteredReason` will describe the reason they were filtered out
        if (result.getFilteredReason() != null){
            Log.d("TAG", "FilteredReason: " + result.getFilteredReason());
        }

        // Handle the generated images
        List<ImagenInlineImage> images = result.getImages();
        for (ImagenInlineImage image : images) {
            Bitmap bitmap = image.asBitmap();
            // Use the bitmap to display the image in your UI
        }
    }

    @Override
    public void onFailure(Throwable t) {
        // ...
    }
}, Executors.newSingleThreadExecutor());

Web


import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create an `ImagenModel` instance with an Imagen model that supports your use case
const model = getImagenModel(
  ai,
  {
    model: "imagen-4.0-generate-001",
    // Configure the model to generate multiple images for each request
    // See: https://firebase.google.com/docs/ai-logic/model-parameters
    generationConfig: {
      numberOfImages: 4
    }
  }
);

// Provide an image generation prompt
const prompt = "An astronaut riding a horse.";

// To generate images, call `generateImages` with the text prompt
const response = await model.generateImages(prompt)

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if (response.filteredReason) {
  console.log(response.filteredReason);
}

if (response.images.length == 0) {
  throw new Error("No images in the response.")
}

const images = response.images[0];

Dart

import 'package:firebase_ai/firebase_ai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';

// Initialize FirebaseApp
await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Gemini Developer API backend service
final ai = FirebaseAI.googleAI();

// Create an `ImagenModel` instance with an Imagen model that supports your use case
final model = ai.imagenModel(
  model: 'imagen-4.0-generate-001',
  // Configure the model to generate multiple images for each request
  // See: https://firebase.google.com/docs/ai-logic/model-parameters
  generationConfig: ImagenGenerationConfig(numberOfImages: 4),
);

// Provide an image generation prompt
const prompt = 'An astronaut riding a horse.';

// To generate images, call `generateImages` with the text prompt
final response = await model.generateImages(prompt);

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if (response.filteredReason != null) {
  print(response.filteredReason);
}

if (response.images.isNotEmpty) {
  final images = response.images;
  for(var image in images) {
  // Process the image
  }
} else {
  // Handle the case where no images were generated
  print('Error: No images were generated.');
}

Unity


using Firebase.AI;

// Initialize the Gemini Developer API backend service
var ai = FirebaseAI.GetInstance(FirebaseAI.Backend.GoogleAI());

// Create an `ImagenModel` instance with a model that supports your use case
var model = ai.GetImagenModel(
  modelName: "imagen-4.0-generate-001",
  // Configure the model to generate multiple images for each request
  // See: https://firebase.google.com/docs/ai-logic/model-parameters
  generationConfig: new ImagenGenerationConfig(numberOfImages: 4)
);

// Provide an image generation prompt
var prompt = "An astronaut riding a horse";

// To generate an image, call `generateImages` with the text prompt
var response = await model.GenerateImagesAsync(prompt: prompt);

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if (!string.IsNullOrEmpty(response.FilteredReason)) {
  UnityEngine.Debug.Log("Filtered reason: " + response.FilteredReason);
}

// Handle the generated images
var images = response.Images.Select(image => image.AsTexture2D());

איך בוחרים מודל שמתאימים לתרחיש השימוש ולאפליקציה שלכם.

תכונות נתמכות ודרישות

מודלים של Imagen מציעים הרבה תכונות שקשורות ליצירת תמונות. בקטע הזה מוסבר מה נתמך כשמשתמשים במודלים עם Firebase AI Logic.

יכולות ותכונות נתמכות

‫ ‫Firebase AI Logic תומך בתכונות הבאות של מודלים של Imagen:

יצירת אנשים, פנים וטקסט בתמונות שנוצרו
עריכת תמונות או הכללת תמונות בבקשה כשמשתמשים ב-Vertex AI Gemini API (נכון לעכשיו רק ב-Android וב-Flutter)
הוספת סימן מים לתמונות שנוצרו
אימות סימני מים דיגיטליים כשמשתמשים ב-Vertex AI Gemini API
אם רוצים לוודא שלתמונה יש סימן מים, אפשר להעלות את התמונה ל-Vertex AI Studio באמצעות הכרטיסייה מדיה.
הגדרת פרמטרים ליצירת תמונות, כמו מספר התמונות שנוצרו, יחס הגובה-רוחב וסימן מים
הגדרה של הגדרות בטיחות

‫ Firebase AI Logic לא תומך בתכונות המתקדמות הבאות של מודלים של Imagen:

הגדרת השפה של טקסט הקלט
השבתה של כלי השכתוב של ההנחיות (הפרמטר enhancePrompt). כלומר, כלי לשכתוב הנחיות שמבוסס על LLM תמיד יוסיף באופן אוטומטי פרטים נוספים להנחיה שסופקה, כדי לספק תמונות באיכות גבוהה יותר שמשקפות טוב יותר את ההנחיה שסופקה.
כתיבת תמונה שנוצרה ישירות לתוך Google Cloud Storage כחלק מהתשובה של המודל (הפרמטר storageUri). במקום זאת, התמונות תמיד מוחזרות בתשובה כבייטים של תמונות עם קידוד base64.
אם רוצים להעלות תמונה שנוצרה ל-Cloud Storage, אפשר להשתמש ב-Cloud Storage for Firebase.

מפרטים ומגבלות

נכס (לכל בקשה)	ערך
מספר מקסימלי של טוקנים לקלט	‫480 טוקנים
מספר מקסימלי של תמונות בפלט	‫4 תמונות
רזולוציות נתמכות של תמונות פלט (בפיקסלים)	‫‎1,024x1,024 פיקסלים (יחס גובה-רוחב של 1:1) ‫896x1280 (יחס גובה-רוחב 3:4) ‫1280x896 (יחס גובה-רוחב של 4:3) ‫768x1408 (יחס גובה-רוחב של 9:16) ‫1408x768 (יחס גובה-רוחב של 16:9)

מה עוד אפשר לעשות?

מתחילים לחשוב על הכנה לייצור (ראו את רשימת המשימות לייצור), כולל:
- הגדרת Firebase App Check כדי להגן על Gemini API מפני ניצול לרעה על ידי לקוחות לא מורשים.
- שילוב של Firebase Remote Config כדי לעדכן ערכים באפליקציה (כמו שם המודל) בלי לפרסם גרסה חדשה של האפליקציה.

איך שולטים ביצירת תוכן

הסבר על תכנון הנחיות, כולל שיטות מומלצות, אסטרטגיות ודוגמאות להנחיות.
הגדרת פרמטרים של מודל Imagen כמו יחס גובה-רוחב, יצירת דמויות וסימון מים.
שימוש בהגדרות בטיחות כדי לשנות את הסבירות לקבלת תשובות שעלולות להיחשב מזיקות.

מידע נוסף על המודלים הנתמכים

מידע על המודלים שזמינים לתרחישי שימוש שונים, על המיכסות ועל התמחור.

רוצה לספר לנו על חוויית השימוש ב-Firebase AI Logic?

יצירת תמונות באמצעות Imagen קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

בחירה בין מודלים של Gemini ו-Imagen

לפני שמתחילים

מודלים שתומכים ביכולת הזו

יצירת תמונות מקלט טקסט בלבד

יצירת תמונה אחת מטקסט בלבד

Swift

Kotlin

Java

Web

Dart

Unity

יצירת כמה תמונות מטקסט בלבד

Swift

Kotlin

Java

Web

Dart

Unity

תכונות נתמכות ודרישות

יכולות ותכונות נתמכות

מפרטים ומגבלות

מה עוד אפשר לעשות?

איך שולטים ביצירת תוכן

מידע נוסף על המודלים הנתמכים

יצירת תמונות באמצעות Imagen