Generare immagini utilizzando Imagen


Gli SDK Vertex AI in Firebase ti consentono di accedere ai modelli Imagen 3 (tramite Imagen API) in modo da poter generare immagini da un prompt di testo. Con questa funzionalità puoi, ad esempio:

  • Genera immagini da prompt scritti in linguaggio naturale
  • Genera immagini in una vasta gamma di formati e stili
  • Eseguire il rendering del testo nelle immagini

Tieni presente che Vertex AI in Firebase non supporta ancora tutte le funzionalità disponibili per i modelli Imagen. Scopri di più nella sezione Funzionalità e capacità supportate di seguito in questa pagina.

Vai al codice per l'input di solo testo

Prima di iniziare

Se non l'hai ancora fatto, consulta la guida introduttiva. Sono incluse la configurazione del progetto Firebase, il collegamento dell'app a Firebase, l'aggiunta dell'SDK e l'inizializzazione del servizio Vertex AI. Queste sono tutte attività necessarie prima di poter inviare una richiesta di prompt a un modello Imagen utilizzando gli SDK Vertex AI in Firebase.

Tieni presente che per generare immagini utilizzando i modelli Imagen:

  • Assicurati di utilizzare almeno queste versioni delle librerie Firebase:
    iOS e versioni successive: v11.9.1 e versioni successive | Android: v16.2.0 e versioni successive (BoM: v33.10.0 e versioni successive) | Web: v11.4.1 e versioni successive | Flutter: v1.4.0 e versioni successive (BoM: v3.8.0 e versioni successive)

  • Inizializza un ImagenModel (non un GenerativeModel)

  • Invia il prompt in una chiamata a generateImages() (non a generateContent() o generateContentStream())

Questa inizializzazione di un ImagenModel e l'utilizzo di generateImages() sono mostrati negli esempi di questa pagina.

Modelli che supportano questa funzionalità

La generazione di immagini è supportata dai modelli Imagen 3. Il supporto per la generazione di immagini da parte dei modelli Gemini 2.0 sarà disponibile a breve.

Genera immagini da input di solo testo

Puoi chiedere a un modello Imagen di generare immagini tramite prompt di testo. Puoi generare una immagine o più immagini.

Generare un'immagine da un input di solo testo

Prima di provare questo esempio, assicurati di aver completato la sezione Prima di iniziare di questa guida.

Puoi chiedere a un modello Imagen di generare una singola immagine tramite prompt con testo.

Scopri come scegliere un modello e, facoltativamente, una località appropriata per il tuo caso d'uso e la tua app.

Generare più immagini da input di solo testo

Prima di provare questo esempio, assicurati di aver completato la sezione Prima di iniziare di questa guida.

Per impostazione predefinita, i modelli Imagen 3 generano una sola immagine per richiesta. Tuttavia, puoi chiedere a un modello Imagen di generare più immagini per richiesta fornendo un generationConfig durante l'inizializzazione del modello.

Scopri come scegliere un modello e, facoltativamente, una località appropriata per il tuo caso d'uso e la tua app.

Funzionalità e requisiti supportati

I modelli Imagen 3 offrono molte funzionalità correlate alla generazione di immagini. Questa sezione descrive cosa è supportato quando si utilizzano i modelli con Vertex AI in Firebase.

Funzionalità e funzionalità supportate

Vertex AI in Firebase supporta queste funzionalità dei modelli Imagen 3.

  • Generazione di persone e volti (se il tuo progetto Firebase ha ricevuto l'approvazione di Google Cloud)

  • Generazione di testo all'interno delle immagini generate

  • Aggiunta di una filigrana alle immagini generate

  • Configurazione dei parametri di generazione delle immagini, come il numero di immagini generate, le proporzioni e il watermarking

  • Configurazione delle impostazioni di sicurezza

Vertex AI in Firebase non supporta queste funzionalità avanzate dei modelli Imagen 3.

Tieni presente che la maggior parte di queste funzionalità richiede l'inserimento in un elenco di utenti approvati anche quando utilizzi i modelli Imagen lato server.

  • Funzionalità di editing o manipolazione delle immagini, tra cui l'upscaling delle immagini

  • Inclusione di immagini nella richiesta al modello (ad esempio per l'apprendimento few-shot)

  • Verifica delle filigrane digitali utilizzando gli SDK
    Se vuoi verificare che un'immagine contenga una filigrana, puoi caricarla in Vertex AI Studio utilizzando la scheda Media.

  • Generazione di "immagini in tempo reale" da testo (generazione di MP4)

  • Generazione di immagini utilizzando uno stile predefinito

  • Impostare la lingua del testo inserito

  • Attivare includeSafetyAttributes, il che significa che safetyAttributes.categories e safetyAttributes.scores non possono essere restituiti

  • Disattivazione del miglioramento del prompt (parametro enhancePrompt), il che significa che uno strumento di riscrittura del prompt basato su LLM aggiungerà sempre automaticamente più dettagli al prompt fornito per fornire immagini di qualità superiore che riflettano meglio il prompt fornito

  • Scrivere un'immagine generata direttamente in Google Cloud Storage come parte della risposta del modello (parametro storageUri). Le immagini vengono invece sempre restituite come byte di immagini con codifica base64 nella risposta.
    Se vuoi caricare un'immagine creata in Cloud Storage, puoi utilizzare Cloud Storage for Firebase.

Specifiche e limitazioni

Limiti (per richiesta) Imagen 3 Imagen 3 Fast
Numero massimo di token di input 480 token 480 token
Numero massimo di immagini di output 4 immagini 4 immagini
Risoluzioni delle immagini di output supportate (pixel)
  • 1024 x 1024 pixel (proporzioni 1:1)
  • 896 x 1280 (proporzioni 3:4)
  • 1280 x 896 (proporzioni 4:3)
  • 768 x 1408 (proporzioni 9:16)
  • 1408 x 768 (proporzioni 16:9)
  • 1024 x 1024 pixel (proporzioni 1:1)
  • 896 x 1280 (proporzioni 3:4)
  • 1280 x 896 (proporzioni 4:3)
  • 768 x 1408 (proporzioni 9:16)
  • 1408 x 768 (proporzioni 16:9)

Cosa puoi fare ancora?

Scopri come controllare la generazione di contenuti

Scopri di più sui modelli supportati

Scopri i modelli disponibili per vari casi d'uso e le relative quote e prezzi.


Inviare un feedback sulla tua esperienza con Vertex AI in Firebase