Gli SDK Vertex AI in Firebase ti consentono di accedere ai modelli Imagen 3 (tramite Imagen API) in modo da poter generare immagini da un prompt di testo. Con questa funzionalità puoi, ad esempio:
- Genera immagini da prompt scritti in linguaggio naturale
- Genera immagini in una vasta gamma di formati e stili
- Eseguire il rendering del testo nelle immagini
Tieni presente che Vertex AI in Firebase non supporta ancora tutte le funzionalità disponibili per i modelli Imagen. Scopri di più nella sezione Funzionalità e capacità supportate di seguito in questa pagina.
Vai al codice per l'input di solo testo
Prima di iniziare
Se non l'hai ancora fatto, consulta la guida introduttiva. Sono incluse la configurazione del progetto Firebase, il collegamento dell'app a Firebase, l'aggiunta dell'SDK e l'inizializzazione del servizio Vertex AI. Queste sono tutte attività necessarie prima di poter inviare una richiesta di prompt a un modello Imagen utilizzando gli SDK Vertex AI in Firebase.
Tieni presente che per generare immagini utilizzando i modelli Imagen:
Assicurati di utilizzare almeno queste versioni delle librerie Firebase:
iOS e versioni successive: v11.9.1 e versioni successive | Android: v16.2.0 e versioni successive (BoM: v33.10.0 e versioni successive) | Web: v11.4.1 e versioni successive | Flutter: v1.4.0 e versioni successive (BoM: v3.8.0 e versioni successive)Inizializza un
ImagenModel
(non unGenerativeModel
)Invia il prompt in una chiamata a
generateImages()
(non agenerateContent()
ogenerateContentStream()
)
Questa inizializzazione di un ImagenModel
e l'utilizzo di generateImages()
sono mostrati negli esempi di questa pagina.
Modelli che supportano questa funzionalità
La generazione di immagini è supportata dai modelli Imagen 3. Il supporto per la generazione di immagini da parte dei modelli Gemini 2.0 sarà disponibile a breve.
Genera immagini da input di solo testo
Puoi chiedere a un modello Imagen di generare immagini tramite prompt di testo. Puoi generare una immagine o più immagini.
Generare un'immagine da un input di solo testo
Prima di provare questo esempio, assicurati di aver completato la sezione Prima di iniziare di questa guida.
Puoi chiedere a un modello Imagen di generare una singola immagine tramite prompt con testo.
Scopri come scegliere un modello e, facoltativamente, una località appropriata per il tuo caso d'uso e la tua app.
Generare più immagini da input di solo testo
Prima di provare questo esempio, assicurati di aver completato la sezione Prima di iniziare di questa guida.
Per impostazione predefinita, i modelli Imagen 3 generano una sola immagine per richiesta.
Tuttavia, puoi chiedere a un modello Imagen di generare più immagini
per richiesta fornendo un generationConfig
durante l'inizializzazione del modello.
Scopri come scegliere un modello e, facoltativamente, una località appropriata per il tuo caso d'uso e la tua app.
Funzionalità e requisiti supportati
I modelli Imagen 3 offrono molte funzionalità correlate alla generazione di immagini. Questa sezione descrive cosa è supportato quando si utilizzano i modelli con Vertex AI in Firebase.
Funzionalità e funzionalità supportate
Vertex AI in Firebase supporta queste funzionalità dei modelli Imagen 3.
Generazione di persone e volti (se il tuo progetto Firebase ha ricevuto l'approvazione di Google Cloud)
Generazione di testo all'interno delle immagini generate
Aggiunta di una filigrana alle immagini generate
Configurazione dei parametri di generazione delle immagini, come il numero di immagini generate, le proporzioni e il watermarking
Configurazione delle impostazioni di sicurezza
Vertex AI in Firebase non supporta queste funzionalità avanzate dei modelli Imagen 3.
Tieni presente che la maggior parte di queste funzionalità richiede l'inserimento in un elenco di utenti approvati anche quando utilizzi i modelli Imagen lato server.
Funzionalità di editing o manipolazione delle immagini, tra cui l'upscaling delle immagini
Inclusione di immagini nella richiesta al modello (ad esempio per l'apprendimento few-shot)
Verifica delle filigrane digitali utilizzando gli SDK
Se vuoi verificare che un'immagine contenga una filigrana, puoi caricarla in Vertex AI Studio utilizzando la scheda Media.Generazione di "immagini in tempo reale" da testo (generazione di MP4)
Generazione di immagini utilizzando uno stile predefinito
Attivare
includeSafetyAttributes
, il che significa chesafetyAttributes.categories
esafetyAttributes.scores
non possono essere restituitiDisattivazione del miglioramento del prompt (parametro
enhancePrompt
), il che significa che uno strumento di riscrittura del prompt basato su LLM aggiungerà sempre automaticamente più dettagli al prompt fornito per fornire immagini di qualità superiore che riflettano meglio il prompt fornitoScrivere un'immagine generata direttamente in Google Cloud Storage come parte della risposta del modello (parametro
storageUri
). Le immagini vengono invece sempre restituite come byte di immagini con codifica base64 nella risposta.
Se vuoi caricare un'immagine creata in Cloud Storage, puoi utilizzare Cloud Storage for Firebase.
Specifiche e limitazioni
Limiti (per richiesta) | Imagen 3 | Imagen 3 Fast |
---|---|---|
Numero massimo di token di input | 480 token | 480 token |
Numero massimo di immagini di output | 4 immagini | 4 immagini |
Risoluzioni delle immagini di output supportate (pixel) |
|
|
Cosa puoi fare ancora?
- Inizia a pensare alla preparazione per la produzione, inclusa la configurazione di Firebase App Check per proteggere le API utilizzate nella tua app da abusi da parte di client non autorizzati. Inoltre, assicurati di consultare l'elenco di controllo per la produzione.
Scopri come controllare la generazione di contenuti
- Comprendi la progettazione dei prompt, tra cui best practice, strategie e prompt di esempio.
- Configura i parametri del modello Imagen come le proporzioni, la generazione di persone e il watermarking.
- Utilizza le impostazioni di sicurezza per regolare la probabilità di ricevere risposte che potrebbero essere considerate dannose.
Scopri di più sui modelli supportati
Scopri i modelli disponibili per vari casi d'uso e le relative quote e prezzi.Inviare un feedback sulla tua esperienza con Vertex AI in Firebase