Genera imágenes con Imagen


Los SDK de Vertex AI in Firebase te brindan acceso a los modelos de Imagen 3 (a través de Imagen API) para que puedas generar imágenes a partir de una instrucción de texto. Con esta función, puedes hacer lo siguiente:

  • Genera imágenes a partir de instrucciones escritas en lenguaje natural
  • Genera imágenes en una amplia variedad de formatos y estilos
  • Renderiza texto en imágenes

Ten en cuenta que Vertex AI in Firebase aún no admite todas las funciones disponibles para los modelos Imagen. Obtén más información en Funciones y capacidades compatibles más adelante en esta página.

Ir al código para la entrada de solo texto

Antes de comenzar

Si aún no lo hiciste, completa la guía de introducción. Esto incluye configurar tu proyecto de Firebase, conectar tu app a Firebase, agregar el SDK y, luego, inicializar el servicio Vertex AI. Estas son tareas obligatorias antes de que puedas enviar una solicitud de consulta a un modelo Imagen con los SDKs de Vertex AI in Firebase.

Ten en cuenta que, para generar imágenes con modelos de Imagen, debes cumplir con los siguientes requisitos:

  • Asegúrate de usar como mínimo estas versiones de la biblioteca de Firebase:
    iOS+: v11.9.1 y versiones posteriores | Android: v16.2.0 y versiones posteriores (BoM: v33.10.0 y versiones posteriores) | Web: v11.4.1 y versiones posteriores | Flutter: v1.4.0 y versiones posteriores (BoM: v3.8.0 y versiones posteriores)

  • Inicializa un ImagenModel (no un GenerativeModel)

  • Envía tu instrucción en una llamada a generateImages() (no a generateContent() o generateContentStream()).

Esta inicialización de un ImagenModel y el uso de generateImages() se muestran en los ejemplos de esta página.

Modelos que admiten esta función

Los modelos Imagen 3 admiten la generación de imágenes. Pronto se admitirá la generación de imágenes con modelos Gemini 2.0.

Genera imágenes a partir de entradas de solo texto

Puedes pedirle a un modelo de Imagen que genere imágenes con instrucciones de texto. Puedes generar una imagen o varias imágenes.

Genera una imagen a partir de una entrada de solo texto

Asegúrate de haber completado la sección Antes de comenzar de esta guía antes de probar este ejemplo.

Puedes pedirle a un modelo Imagen que genere una sola imagen con una instrucción con texto.

Aprende a elegir un modelo y, de manera opcional, una ubicación adecuada para tu caso de uso y app.

Genera varias imágenes a partir de una entrada de solo texto

Asegúrate de haber completado la sección Antes de comenzar de esta guía antes de probar este ejemplo.

De forma predeterminada, los modelos de Imagen 3 solo generan una imagen por solicitud. Sin embargo, puedes pedirle a un modelo Imagen que genere varias imágenes por solicitud si proporcionas un generationConfig durante la inicialización del modelo.

Aprende a elegir un modelo y, de manera opcional, una ubicación adecuada para tu caso de uso y app.

Funciones y requisitos compatibles

Los modelos Imagen 3 ofrecen muchas funciones relacionadas con la generación de imágenes. En esta sección, se describe lo que se admite cuando se usan los modelos con Vertex AI in Firebase.

Funciones y capacidades compatibles

Vertex AI in Firebase admite estas funciones de los modelos Imagen 3.

  • Generar personas y rostros (siempre que tu proyecto de Firebase tenga aprobación de Google Cloud)

  • Generación de texto dentro de imágenes generadas

  • Cómo agregar una marca de agua a las imágenes generadas

  • Configura los parámetros de generación de imágenes, como la cantidad de imágenes generadas, la relación de aspecto y la marca de agua.

  • Configuración de la seguridad

Vertex AI in Firebase no admite estas funciones avanzadas de los modelos Imagen 3.

Ten en cuenta que la mayoría de estas funciones requieren estar en una lista de usuarios aprobados, incluso cuando se usan modelos Imagen del servidor.

  • Funciones de edición o manipulación de imágenes, lo que incluye el aumento de resolución de imágenes

  • Incluir imágenes en la solicitud al modelo (como en el aprendizaje con varios ejemplos)

  • Verifica las marcas de agua digitales con los SDKs
    Si quieres verificar que una imagen tenga una marca de agua, puedes subirla a Vertex AI Studio con la pestaña Media.

  • Generación de "imágenes en vivo" a partir de texto (generación de MP4)

  • Genera imágenes con un estilo predefinido

  • Cómo configurar el idioma del texto de entrada

  • Habilita includeSafetyAttributes, lo que significa que no se pueden mostrar safetyAttributes.categories ni safetyAttributes.scores.

  • Inhabilitar la mejora de instrucciones (el parámetro enhancePrompt), lo que significa que una herramienta de reescritura de instrucciones basada en LLM siempre agregará automáticamente más detalles a la instrucción proporcionada para entregar imágenes de mayor calidad que reflejen mejor la instrucción proporcionada

  • Escribir una imagen generada directamente en Google Cloud Storage como parte de la respuesta del modelo (el parámetro storageUri) En cambio, las imágenes siempre se muestran como bytes de imagen codificados en base64 en la respuesta.
    Si quieres subir una imagen generada a Cloud Storage, puedes usar Cloud Storage for Firebase.

Especificaciones y limitaciones

Límites (por solicitud) Imagen 3 Imagen 3 Fast
Cantidad máxima de tokens de entrada 480 tokens 480 tokens
Cantidad máxima de imágenes de salida 4 imágenes 4 imágenes
Resoluciones de imagen de salida compatibles (píxeles)
  • 1024x1024 píxeles (relación de aspecto de 1:1)
  • 896x1280 (relación de aspecto de 3:4)
  • 1280x896 (relación de aspecto de 4:3)
  • 768x1408 (relación de aspecto de 9:16)
  • 1408x768 (relación de aspecto de 16:9)
  • 1024x1024 píxeles (relación de aspecto de 1:1)
  • 896x1280 (relación de aspecto de 3:4)
  • 1280x896 (relación de aspecto de 4:3)
  • 768x1408 (relación de aspecto de 9:16)
  • 1408x768 (relación de aspecto de 16:9)

¿Qué más puedes hacer?

Aprende a controlar la generación de contenido

Más información sobre los modelos compatibles

Obtén información sobre los modelos disponibles para varios casos de uso y sus cuotas y precios.


Envía comentarios sobre tu experiencia con Vertex AI in Firebase