Die Vertex AI in Firebase SDKs bieten Ihnen über Imagen API Zugriff auf die Imagen 3-Modelle, damit Sie Bilder aus einem Text-Prompt generieren können. Mit dieser Funktion haben Sie folgende Möglichkeiten:
- Bilder aus Prompts in natürlicher Sprache generieren
- Bilder in einer Vielzahl von Formaten und Stilen erstellen
- Text in Bildern rendern
Hinweis: Vertex AI in Firebase unterstützt noch nicht alle Funktionen, die für die Imagen-Modelle verfügbar sind. Weitere Informationen finden Sie weiter unten auf dieser Seite unter Unterstützte Funktionen und Features.
Code für die Eingabe von Nur-Text-Inhalten
Hinweis
Lesen Sie zuerst den Einstiegsleitfaden. Dazu gehört das Einrichten Ihres Firebase-Projekts, die Verknüpfung Ihrer App mit Firebase, das Hinzufügen des SDKs und die Initialisierung des Vertex AI-Dienstes. All diese Aufgaben sind erforderlich, bevor Sie mithilfe der Vertex AI in Firebase-SDKs eine Prompt-Anfrage an ein Imagen-Modell senden können.
Beachten Sie Folgendes, wenn Sie Bilder mit Imagen-Modellen generieren:
Verwenden Sie mindestens die folgenden Firebase-Bibliotheksversionen:
iOS und höher: Version 11.9.1 und höher | Android: Version 16.2.0 und höher (BoM: Version 33.10.0 und höher) | Web: Version 11.4.1 und höher | Flutter: Version 1.4.0 und höher (BoM: Version 3.8.0 und höher)ImagenModel
initialisieren (nichtGenerativeModel
)Senden Sie den Prompt in einem Anruf an
generateImages()
(nicht angenerateContent()
odergenerateContentStream()
).
Diese Initialisierung einer ImagenModel
und die Verwendung von generateImages()
werden in den Beispielen auf dieser Seite veranschaulicht.
Modelle, die diese Funktion unterstützen
Die Bildgenerierung wird von den Imagen 3-Modellen unterstützt. Die Bildgenerierung mit Gemini 2.0-Modellen wird demnächst unterstützt.
Bilder aus reiner Texteingabe generieren
Sie können ein Imagen-Modell auffordern, Bilder zu generieren, indem Sie einen Text-Prompt eingeben. Sie können ein Bild oder mehrere Bilder generieren.
Ein Bild aus reiner Texteingabe generieren
Lesen Sie den Abschnitt Vorbereitung in dieser Anleitung, bevor Sie dieses Beispiel ausprobieren.
Sie können ein Imagen-Modell auffordern, ein einzelnes Bild zu generieren, indem Sie einen Text-Prompt eingeben.
Hier erfahren Sie, wie Sie ein Modell und optional einen Standort für Ihren Anwendungsfall und Ihre App auswählen.
Mehrere Bilder aus reiner Texteingabe generieren
Lesen Sie den Abschnitt Vorbereitung in dieser Anleitung, bevor Sie dieses Beispiel ausprobieren.
Standardmäßig generieren Imagen 3-Modelle nur ein Bild pro Anfrage.
Sie können jedoch ein Imagen-Modell bitten, mehrere Bilder pro Anfrage zu generieren, indem Sie bei der Modellinitialisierung einen generationConfig
angeben.
Hier erfahren Sie, wie Sie ein Modell und optional einen Standort für Ihren Anwendungsfall und Ihre App auswählen.
Unterstützte Funktionen und Anforderungen
Die Imagen 3-Modelle bieten viele Funktionen im Zusammenhang mit der Bildgenerierung. In diesem Abschnitt wird beschrieben, was bei der Verwendung der Modelle mit Vertex AI in Firebase unterstützt wird.
Unterstützte Funktionen
Vertex AI in Firebase unterstützt diese Funktionen von Imagen 3-Modellen.
Personen und Gesichter generieren (vorausgesetzt, Ihr Firebase-Projekt hat die Genehmigung von Google Cloud erhalten)
Text in generierten Bildern generieren
Generierten Bildern ein Wasserzeichen hinzufügen
Parameter für die Bildgenerierung konfigurieren, z. B. Anzahl der generierten Bilder, Seitenverhältnis und Wasserzeichen
Vertex AI in Firebase unterstützt diese erweiterten Funktionen von Imagen 3-Modellen nicht.
Für die meisten dieser Funktionen müssen Sie sich auf einer genehmigten Nutzerliste befinden, auch wenn Sie Imagen-Modelle serverseitig verwenden.
Bildbearbeitungs- oder -manipulationsfunktionen, einschließlich der Bildvergrößerung
Bilder in die Anfrage an das Modell aufnehmen (z. B. für Few-Shot-Lernen)
Digitale Wasserzeichen mit den SDKs prüfen
Wenn Sie prüfen möchten, ob ein Bild ein Wasserzeichen hat, können Sie es über den Tab Media in Vertex AI Studio hochladen.Live-Bilder aus Text generieren (MP4-Generierung)
Bilder mit einem vordefinierten Stil generieren
includeSafetyAttributes
aktivieren, was bedeutet, dasssafetyAttributes.categories
undsafetyAttributes.scores
nicht zurückgegeben werden könnenDeaktivierung der Prompt-Optimierung (
enhancePrompt
-Parameter). Das bedeutet, dass ein LLM-basiertes Tool zum Umschreiben von Prompts dem bereitgestellten Prompt immer automatisch mehr Details hinzufügt, um Bilder mit höherer Qualität zu liefern, die den bereitgestellten Prompt besser widerspiegeln.Ein generiertes Bild wird als Teil der Antwort des Modells (
storageUri
-Parameter) direkt in Google Cloud Storage geschrieben. Stattdessen werden Bilder in der Antwort immer als base64-codierte Bildbyte zurückgegeben.
Wenn Sie ein generiertes Bild in Cloud Storage hochladen möchten, können Sie Cloud Storage for Firebase verwenden.
Spezifikationen und Einschränkungen
Limits (pro Anfrage) | Imagen 3 | Imagen 3 Fast |
---|---|---|
Maximale Anzahl von Eingabetokens | 480 Tokens | 480 Tokens |
Maximale Anzahl von Ausgabebildern | 4 Bilder | 4 Bilder |
Unterstützte Auflösungen von Ausgabebildern (Pixel) |
|
|
Was können Sie sonst noch tun?
- Denken Sie an die Vorbereitung auf die Produktion, einschließlich der Einrichtung von Firebase App Check, um die in Ihrer App verwendeten APIs vor Missbrauch durch nicht autorisierte Clients zu schützen. Sehen Sie sich auch die Produktionscheckliste an.
Inhaltserstellung steuern
- Informationen zum Prompt-Design, einschließlich Best Practices, Strategien und Beispiel-Prompts.
- Konfiguriere die Imagen-Modellparameter, z. B. Seitenverhältnis, Personengenerierung und Wasserzeichen.
- Mit den Sicherheitseinstellungen können Sie die Wahrscheinlichkeit anpassen, dass Sie Antworten erhalten, die als schädlich eingestuft werden könnten.
Weitere Informationen zu den unterstützten Modellen
Hier finden Sie Informationen zu den Modellen, die für verschiedene Anwendungsfälle verfügbar sind, sowie zu ihren Kontingenten und Preisen.Feedback zu Vertex AI in Firebase geben