Bilder mit Imagen generieren


Die Vertex AI in Firebase SDKs bieten Ihnen über Imagen API Zugriff auf die Imagen 3-Modelle, damit Sie Bilder aus einem Text-Prompt generieren können. Mit dieser Funktion haben Sie folgende Möglichkeiten:

  • Bilder aus Prompts in natürlicher Sprache generieren
  • Bilder in einer Vielzahl von Formaten und Stilen erstellen
  • Text in Bildern rendern

Hinweis: Vertex AI in Firebase unterstützt noch nicht alle Funktionen, die für die Imagen-Modelle verfügbar sind. Weitere Informationen finden Sie weiter unten auf dieser Seite unter Unterstützte Funktionen und Features.

 Code für die Eingabe von Nur-Text-Inhalten

Hinweis

Lesen Sie zuerst den Einstiegsleitfaden. Dazu gehört das Einrichten Ihres Firebase-Projekts, die Verknüpfung Ihrer App mit Firebase, das Hinzufügen des SDKs und die Initialisierung des Vertex AI-Dienstes. All diese Aufgaben sind erforderlich, bevor Sie mithilfe der Vertex AI in Firebase-SDKs eine Prompt-Anfrage an ein Imagen-Modell senden können.

Beachten Sie Folgendes, wenn Sie Bilder mit Imagen-Modellen generieren:

  • Verwenden Sie mindestens die folgenden Firebase-Bibliotheksversionen:
    iOS und höher: Version 11.9.1 und höher | Android: Version 16.2.0 und höher (BoM: Version 33.10.0 und höher) | Web: Version 11.4.1 und höher | Flutter: Version 1.4.0 und höher (BoM: Version 3.8.0 und höher)

  • ImagenModel initialisieren (nicht GenerativeModel)

  • Senden Sie den Prompt in einem Anruf an generateImages() (nicht an generateContent() oder generateContentStream()).

Diese Initialisierung einer ImagenModel und die Verwendung von generateImages() werden in den Beispielen auf dieser Seite veranschaulicht.

Modelle, die diese Funktion unterstützen

Die Bildgenerierung wird von den Imagen 3-Modellen unterstützt. Die Bildgenerierung mit Gemini 2.0-Modellen wird demnächst unterstützt.

Bilder aus reiner Texteingabe generieren

Sie können ein Imagen-Modell auffordern, Bilder zu generieren, indem Sie einen Text-Prompt eingeben. Sie können ein Bild oder mehrere Bilder generieren.

Ein Bild aus reiner Texteingabe generieren

Lesen Sie den Abschnitt Vorbereitung in dieser Anleitung, bevor Sie dieses Beispiel ausprobieren.

Sie können ein Imagen-Modell auffordern, ein einzelnes Bild zu generieren, indem Sie einen Text-Prompt eingeben.

Hier erfahren Sie, wie Sie ein Modell und optional einen Standort für Ihren Anwendungsfall und Ihre App auswählen.

Mehrere Bilder aus reiner Texteingabe generieren

Lesen Sie den Abschnitt Vorbereitung in dieser Anleitung, bevor Sie dieses Beispiel ausprobieren.

Standardmäßig generieren Imagen 3-Modelle nur ein Bild pro Anfrage. Sie können jedoch ein Imagen-Modell bitten, mehrere Bilder pro Anfrage zu generieren, indem Sie bei der Modellinitialisierung einen generationConfig angeben.

Hier erfahren Sie, wie Sie ein Modell und optional einen Standort für Ihren Anwendungsfall und Ihre App auswählen.

Unterstützte Funktionen und Anforderungen

Die Imagen 3-Modelle bieten viele Funktionen im Zusammenhang mit der Bildgenerierung. In diesem Abschnitt wird beschrieben, was bei der Verwendung der Modelle mit Vertex AI in Firebase unterstützt wird.

Unterstützte Funktionen

Vertex AI in Firebase unterstützt diese Funktionen von Imagen 3-Modellen.

Vertex AI in Firebase unterstützt diese erweiterten Funktionen von Imagen 3-Modellen nicht.

Für die meisten dieser Funktionen müssen Sie sich auf einer genehmigten Nutzerliste befinden, auch wenn Sie Imagen-Modelle serverseitig verwenden.

  • Bildbearbeitungs- oder -manipulationsfunktionen, einschließlich der Bildvergrößerung

  • Bilder in die Anfrage an das Modell aufnehmen (z. B. für Few-Shot-Lernen)

  • Digitale Wasserzeichen mit den SDKs prüfen
    Wenn Sie prüfen möchten, ob ein Bild ein Wasserzeichen hat, können Sie es über den Tab Media in Vertex AI Studio hochladen.

  • Live-Bilder aus Text generieren (MP4-Generierung)

  • Bilder mit einem vordefinierten Stil generieren

  • Sprache des Eingabetexts festlegen

  • includeSafetyAttributes aktivieren, was bedeutet, dass safetyAttributes.categories und safetyAttributes.scores nicht zurückgegeben werden können

  • Deaktivierung der Prompt-Optimierung (enhancePrompt-Parameter). Das bedeutet, dass ein LLM-basiertes Tool zum Umschreiben von Prompts dem bereitgestellten Prompt immer automatisch mehr Details hinzufügt, um Bilder mit höherer Qualität zu liefern, die den bereitgestellten Prompt besser widerspiegeln.

  • Ein generiertes Bild wird als Teil der Antwort des Modells (storageUri-Parameter) direkt in Google Cloud Storage geschrieben. Stattdessen werden Bilder in der Antwort immer als base64-codierte Bildbyte zurückgegeben.
    Wenn Sie ein generiertes Bild in Cloud Storage hochladen möchten, können Sie Cloud Storage for Firebase verwenden.

Spezifikationen und Einschränkungen

Limits (pro Anfrage) Imagen 3 Imagen 3 Fast
Maximale Anzahl von Eingabetokens 480 Tokens 480 Tokens
Maximale Anzahl von Ausgabebildern 4 Bilder 4 Bilder
Unterstützte Auflösungen von Ausgabebildern (Pixel)
  • 1.024 × 1.024 Pixel (Seitenverhältnis 1:1)
  • 896 × 1.280 (Seitenverhältnis 3:4)
  • 1280 x 896 (Seitenverhältnis 4:3)
  • 768 × 1408 (Seitenverhältnis 9:16)
  • 1408 × 768 (Seitenverhältnis 16:9)
  • 1.024 × 1.024 Pixel (Seitenverhältnis 1:1)
  • 896 × 1.280 (Seitenverhältnis 3:4)
  • 1280 x 896 (Seitenverhältnis 4:3)
  • 768 × 1408 (Seitenverhältnis 9:16)
  • 1408 × 768 (Seitenverhältnis 16:9)

Was können Sie sonst noch tun?

Inhaltserstellung steuern

Weitere Informationen zu den unterstützten Modellen

Hier finden Sie Informationen zu den Modellen, die für verschiedene Anwendungsfälle verfügbar sind, sowie zu ihren Kontingenten und Preisen.


Feedback zu Vertex AI in Firebase geben