Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Se usó la API de Cloud Translation para traducir esta página.

Más información sobre los modelos compatibles

En el caso de las apps para dispositivos móviles y la Web, los SDKs de Firebase AI Logic te permiten interactuar con los modelos de Gemini y los modelos de Imagen compatibles directamente desde tu app.

Los modelos Gemini se consideran multimodales porque son capaces de procesar y hasta generar múltiples modalidades, como texto, código, PDFs, imágenes, video y audio. Se puede solicitar a los modelos Imagen que generen imágenes a partir de texto.

Además, consulta nuestras preguntas frecuentes sobre todos los modelos que Firebase AI Logic admite y no admite.

Modelos de uso general

Ir a las comparaciones de modelos

NUESTRO MODELO MÁS INTELIGENTE

Gemini 3 Pro

gemini-3-pro-preview

Nuestro mejor modelo para la comprensión multimodal y nuestro modelo de agente y vibe coding más potente hasta la fecha, que ofrece imágenes más enriquecidas y una interactividad más profunda, todo ello basado en un razonamiento de vanguardia. (se requiere facturación)

NUESTRO MODELO DE PENSAMIENTO AVANZADO

Gemini 2.5 Pro

gemini-2.5-pro

Nuestro modelo de pensamiento de vanguardia, capaz de razonar sobre problemas complejos en código, matemáticas y STEM, así como analizar grandes conjuntos de datos, bases de código y documentos con un contexto extenso.

RÁPIDO E INTELIGENTE

Gemini 2.5 Flash

gemini-2.5-flash

Nuestro mejor modelo en términos de relación precio-rendimiento, que ofrece capacidades integrales. 2.5 Flash es ideal para el procesamiento a gran escala, las tareas de baja latencia y gran volumen que requieren pensamiento, y los casos de uso de agentes.

ULTRA RÁPIDO

Gemini 2.5 Flash-Lite

gemini-2.5-flash-lite

Nuestro modelo flash más rápido, optimizado para la rentabilidad y la alta capacidad de procesamiento.

Modelos de generación de imágenes

Puedes generar imágenes con los modelos de Gemini o Imagen.

Ir a las comparaciones de modelos

Gemini

Imagen de Gemini 3 Pro (también conocida como nano banana pro)

gemini-3-pro-image-preview

Diseñado para la producción de recursos profesionales y las instrucciones complejas. Cuenta con una base en el mundo real gracias a la Búsqueda de Google, un proceso predeterminado de "Pensamiento" que refina la composición antes de la generación y puede generar imágenes con una resolución de hasta 4K. (se requiere facturación)

Gemini 2.5 Flash Image (también conocido como nano banana)

gemini-2.5-flash-image

Diseñado para brindar velocidad y eficiencia. Está optimizado para tareas de gran volumen y baja latencia, y genera imágenes con una resolución de 1,024 px. (se requiere facturación)

Imagen

Imagen 4

imagen-4.0-generate-001

Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural. (se requiere facturación)

Imagen 4 Fast

imagen-4.0-fast-generate-001

Genera imágenes para prototipos o casos de uso de baja latencia. (se requiere facturación)

Imagen 4 Ultra

imagen-4.0-ultra-generate-001

Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural. (se requiere facturación)

Modelos de generaciones anteriores

Los siguientes son modelos activos, pero de generaciones anteriores. Te recomendamos que uses uno de los modelos más recientes cuando sea posible.

Ir a las comparaciones de modelos

Modelos de Gemini

NUESTRO MODELO DE SEGUNDA GENERACIÓN PARA TAREAS PESADAS

Gemini 2.0 Flash

gemini-2.0-flash-001

Nuestro modelo de segunda generación más confiable, con una ventana de contexto de 1 millón de tokens. Ofrece funciones de nueva generación y capacidades mejoradas, como velocidad superior y uso de herramientas nativas.

NUESTRO MODELO RÁPIDO DE SEGUNDA GENERACIÓN

Gemini 2.0 Flash-Lite

gemini-2.0-flash-lite-001

Nuestro modelo de segunda generación, pequeño y confiable, con una ventana de contexto de 1 millón de tokens. Se optimizó para ser rentable y tener una baja latencia.

En el resto de esta página, se proporciona información detallada sobre los modelos compatibles con Firebase AI Logic.

Compara modelos:
- Entrada y salida admitidas
- Comparación general de las capacidades admitidas
- Especificaciones y limitaciones, por ejemplo, la cantidad máxima de tokens de entrada o la duración máxima del video de entrada
Descripción de cómo se versionan los modelos, específicamente sus versiones estable, actualizada automáticamente, preliminar y experimental
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de idiomas admitidos para los modelos

En la parte inferior de esta página, puedes ver información detallada sobre los modelos de generación anteriores.

Comparar modelos

Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Firebase AI Logic. Cada modelo puede tener capacidades adicionales que no están disponibles cuando se usan nuestros SDKs.

Si no encuentras la información que buscas en las siguientes subsecciones, puedes encontrar aún más información en la documentación del proveedor de la API que elijas:

Gemini Developer API: Modelos Gemini y modelos Imagen
Vertex AI Gemini API: Modelos Gemini y modelos Imagen

Entrada y salida admitidas

Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash y Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (generar)	Imagen (capacidad)
Tipos de entrada
Texto
Texto (transmisión)
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Texto (transmisión)
Código
Salida estructurada (como JSON)
Imágenes
Audio
Audio (transmisión)

Para obtener información sobre los tipos de archivos admitidos, consulta Archivos de entrada y requisitos admitidos.

Funciones y capacidades admitidas

Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Pensamiento
Generar texto a partir de entradas de solo texto o multimodales	Intercalada o como parte de la imagen	Intercalada o como parte de la imagen	Solo transmisión
Generar imágenes (Gemini o Imagen)
Edita imágenes (Gemini o Imagen)
Generar audio			Solo transmisión
Genera resultados estructurados (como JSON)
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analiza videos (visión)
Analiza el audio			Solo transmisión
Chat de varios turnos
Transmisión multimodal bidireccional
Llamada a función
Ejecución de código
Grounding with Google Search
Instrucciones del sistema
Contar tokens

Especificaciones y limitaciones

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Firebase AI Logic:

Propiedad	<span="notranslate">Gemini 3 Pro </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash y Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (generar)	Imagen (capacidad)
Límite de tokens de entrada *	1,048,576 tokens	65,536 tokens	1,048,576 tokens	32,768 tokens	32,768 tokens	480 tokens	480 tokens
Límite de tokens de salida *	65,536 tokens	32,768 tokens	65,536 tokens	8,192 tokens	8,192 tokens	---	---
Fecha límite de conocimiento	Enero de 2025	Enero de 2025	Enero de 2025	Junio de 2025	Agosto de 2024	---	---
PDFs (por solicitud)
Cantidad máxima de archivos PDF de entrada **	900 archivos	14 archivos	3,000 archivos	3 archivos	---	---	---
Cantidad máxima de páginas por archivo PDF de entrada **	900 páginas	14 páginas	1,000 páginas	3 páginas	---	---	---
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB	50 MB	50 MB	---	---	---
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	1,000 imágenes	14 imágenes	3,000 imágenes	3 imágenes	---	---	4 imágenes
Cantidad máxima de imágenes de salida	---	10 imágenes	---	10 imágenes	---	4 imágenes	4 imágenes
Tamaño máximo por imagen de entrada codificada en Base64	7 MB	7 MB	7 MB	7 MB	---	---	---
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	---	10 archivos	---	---	---	---
Duración máxima de todo el video de entrada (solo fotogramas)	60 minutos aprox.	---	60 minutos aprox.	---	---	---	---
Longitud máxima de todo el video de entrada (fotogramas y audio)	45 minutos aprox.	---	45 minutos aprox.	---	---	---	---
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	---	1 archivo	---	---	---	---
Cantidad máxima de archivos de audio de salida	---	---	---	---	---	---	---
Longitud máxima de todo el audio de entrada	Aprox. 8.4 horas	---	Aprox. 8.4 horas	---	---	---	---
Longitud máxima de todo el audio de salida	---	---	---	---	---	---	---

^{*
Para todos los modelos Gemini, un token equivale a alrededor de 4 caracteres,
por lo que 100 tokens equivalen a entre 60 y 80 palabras en inglés. En el caso de los modelos Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens.}

^{**
Los PDFs se tratan como imágenes, por lo que una sola página de un PDF se considera
una imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.}

Encuentra información detallada adicional

Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de la entrada y la salida.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas que se indican en Requisitos y tipos de archivos de entrada admitidos.

Importante: El límite de tamaño total de la solicitud es de 20 MB. Para enviar archivos grandes, revisa las opciones para proporcionar archivos en solicitudes multimodales.

Patrones de nomenclatura y control de versiones de modelos

Los modelos se ofrecen en versiones estables, de vista previa y experimentales. Para mayor comodidad, se admiten alias sin valores de versión explícitos.

Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "nombres de modelos disponibles" más adelante en esta página.

Tipo de versión / Etapa de lanzamiento		Descripción	Patrón del nombre del modelo
Estable		Las versiones *estables* están disponibles y se admiten para el uso en producción a partir de la fecha de lanzamiento. Por lo general, las versiones de modelos estables se lanzan con una fecha de retiro, que indica el último día en que el modelo está disponible. Después de esta fecha, Google ya no admitirá el modelo ni se podrá acceder a él.	Modelos Gemini 2.5 Los nombres de los modelos de versiones estables no tienen sufijo. Ejemplo: `gemini-2.5-pro` Modelos Gemini 2.0 y Imagen Los nombres de los modelos de versiones estables se agregan con un número de versión específico de tres dígitos. Ejemplo: `gemini-2.0-flash-001` Ejemplo: `imagen-3.0-generate-002`
	Alias estable actualizado automáticamente (solo modelos de Gemini 2.0)	Los alias estables *actualizados automáticamente* siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comenzará a hacer referencia automáticamente a esa nueva versión estable.	Solo modelos Gemini 2.0 Los nombres de los modelos de alias no tienen sufijo. Ejemplo: `gemini-2.0-flash`
Vista previa		Las versiones de *vista previa* tienen nuevas capacidades y se consideran inestables. No se recomienda usar estos modelos en producción, tienen límites de frecuencia más restrictivos y pueden tener requisitos de facturación. Estos modelos se retiran en un plazo de semanas o meses después del lanzamiento de su versión estable asociada. En el caso de Vertex AI Gemini API, los modelos de versión preliminar lanzados después de junio de 2025 suelen requerir que establezcas la ubicación del modelo en `global`.	Los nombres de los modelos de las versiones preliminares se complementan con `-preview` y, a menudo, con la fecha de lanzamiento del modelo (`-MM-DD` para los modelos más antiguos o `-MM-YYYY` para los modelos más nuevos). Ejemplos: `gemini-2.5-flash-preview-04-17` (se lanzó el 17 de abril de 2025) o `gemini-2.5-flash-preview-09-2025` (se lanzó en septiembre de 2025) o `gemini-3-pro-preview` (se lanzó en noviembre de 2025)
Experimental		Las versiones *experimentales* tienen nuevas capacidades y se consideran inestables. Estos modelos no se recomiendan para el uso en producción y tienen límites de frecuencia más restrictivos. Los modelos experimentales están diseñados para recopilar comentarios y permitir la experimentación con nuestras funciones más recientes. Estos modelos se retiran en un plazo de semanas o meses después del lanzamiento de su versión estable asociada. En el caso de Vertex AI Gemini API, los modelos experimentales lanzados después de junio de 2025 requieren que establezcas la ubicación del modelo en `global`.	Los nombres de los modelos de las versiones experimentales se agregan con `-exp` junto con la fecha de lanzamiento del modelo (`-MM-DD`). Ejemplo: `gemini-2.5-pro-exp-03-25` (se lanzó el 25 de marzo de 2025)
Jubilado		Las versiones *retiradas* ya pasaron su fecha de retiro y se desactivaron de forma permanente. Google ya no admite los modelos retirados ni se puede acceder a ellos, y una solicitud que use el nombre de un modelo retirado devuelve un error 404.	---

Nombres de modelos disponibles

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Ir a los nombres de los modelos Gemini Ir a los nombres de los modelos Imagen

Enumera todos los modelos disponibles de forma programática

Puedes enumerar todos los nombres de los modelos disponibles con la API de REST:

Gemini Developer API: Llama al extremo models.list.
Vertex AI Gemini API: Llama al extremo publishers.models.list.

Ten en cuenta que la lista que se devuelve incluirá todos los modelos compatibles con los proveedores de la API, pero Firebase AI Logic solo admite los modelos Gemini y Imagen que se describen en esta página. También ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash) no se incluyen en la lista porque son alias convenientes para el modelo base.

Nombres de modelos Gemini

Para ver ejemplos de inicialización para tu plataforma, consulta la guía de introducción.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso, la facturación y la baja), consulta los patrones de nomenclatura y versiones de modelos.

Importante: Los nombres de los modelos estables Gemini 2.5 no tienen un sufijo de tres dígitos ni un alias actualizado automáticamente.

Además, si usas Vertex AI Gemini API, todos los modelos de Gemini 3 y Gemini 2.5 de versión preliminar lanzados después de junio de 2025 solo estarán disponibles en la ubicación global.

Nombres de modelos Gemini 3 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-3-pro-preview`	Versión preliminar de Gemini 3 Pro	Vista previa	2025-11-18	Sin establecer

Nombres de los modelos de Gemini 3 Pro Image (también conocidos como "Nano Banana Pro")

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-3-pro-image-preview`	Versión preliminar de Gemini 3 Pro Image (también conocida como "nano banana pro")	Vista previa	2025-11-20	Sin establecer

Nombres de modelos Gemini 2.5 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-pro`	Versión estable de Gemini 2.5 Pro	Estable	2025-06-17	No antes del 2026-06-17

Nombres de modelos Gemini 2.5 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash`	Versión estable de Gemini 2.5 Flash	Estable	2025-06-17	No antes del 2026-06-17

Nombres de modelos Gemini 2.5 Flash‑Lite

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash-lite`	Versión estable de Gemini 2.5 Flash‑Lite	Estable	2025-07-22	A partir del 2026-07-22

Nombres de modelos de Gemini 2.5 Flash Image (también conocidos como "nano banana")

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash-image`	Versión estable para Gemini 2.5 Flash Image (también conocida como "nano banana")	Estable	2025-10-02	No anterior a 2026-10-02

Nombres de modelos Gemini 2.5 Flash Live

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-live-2.5-flash`	Versión estable de Gemini 2.5 Flash Live	Estable (DG privada) ¹	2025-06-01	A partir del 1/6/2026
`gemini-live-2.5-flash-preview` ²	Versión preliminar de Gemini 2.5 Flash Live	Vista previa	2025-06-01	Sin establecer

Firebase AI Logic aún no admite los modelos de audio nativos (como gemini-2.5-flash-native-audio-preview-09-2025).

^{1 Comunícate con el representante de tu equipo de cuentas de Google Cloud para solicitar acceso.} ^{2 No es compatible con Vertex AI Gemini API, sin importar cómo accedas a él.}

Nombres de modelos Gemini 2.0 Flash Live

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-live-001` ²	Versión estable de Gemini 2.0 Flash Live	Estable	2025-04-01	A partir del 2026-04-01
`gemini-2.0-flash-live-preview-04-09`	Versión preliminar de Gemini 2.0 Flash Live	Vista previa	2025-04-09	Sin establecer

^{2 No es compatible con Vertex AI Gemini API, sin importar cómo accedas a él.}

Nombres de modelos Imagen

Para ver ejemplos de inicialización para tu plataforma, consulta la guía para generar imágenes con Imagen.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso, la facturación y la baja), consulta los patrones de nomenclatura y versiones de modelos.

Nombres de modelos Imagen 4

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-generate-001`	Versión estable de Imagen 4	Estable	2025-08-14	A partir del 14 de agosto de 2026

Nombres de modelos Imagen 4 Fast

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-fast-generate-001`	Versión estable de Imagen 4 Fast	Estable	2025-08-14	A partir del 14 de agosto de 2026

Nombres de modelos Imagen 4 Ultra

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-ultra-generate-001`	Versión estable de Imagen 4 Ultra	Estable	2025-08-14	A partir del 14 de agosto de 2026

Nombres de modelos Imagen 3 Capability

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-capability-001` ³	Versión estable inicial de Imagen 3 Capability	Estable	2024-12-10	A partir del 2025-12-10

^{3 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

Idiomas compatibles

Gemini

Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:

Árabe (ar), bengalí (bn), búlgaro (bg), chino (simplificado y tradicional; zh), croata (hr), checo (cs), danés (da), neerlandés (nl), inglés (en), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), español (es), suajili (sw), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:

Afrikaans (af), amhárico (am), asamés (as), azerí (az), bielorruso (be), bosnio (bs), catalán (ca), cebuano (ceb), corso (co), galés (cy), dhivehi (dv), esperanto (eo), euskera (eu), persa (fa), filipino (tagalo) (fil), frisio (fy), irlandés (ga), gaélico escocés (gd), gallego (gl), guyaratí (gu), hausa (ha), hawaiano (haw), hmong (hmn), criollo haitiano (ht), armenio (hy), igbo (ig), islandés (is), javanés (jv), georgiano (ka), kazajo (kk), jemer (km), kannada (kn), krio (kri), kurdo (ku), kirguís (ky), latín (la), luxemburgués (lb), laosiano (lo), malgache (mg), maorí (mi), macedonio (mk), malayalam (ml), mongol (mn), meiteilon (manipuri) (mni-Mtei), maratí (mr), malayo (ms), maltés (mt), birmano (my), nepalí (ne), nyanja (chichewa) (ny), odia (oriya) (or), panyabí (pa), pastún (ps), sindhi (sd), cingalés (si), samoano (sm), shona (sn), somalí (so), albanés (sq), sesotho (st), sundanés (su), tamil (ta), telugu (te), tayiko (tg), uigur (ug), urdu (ur), uzbeko (uz), xhosa (xh), yidis (yi), yoruba (yo), zulú (zu)

Imagen

Disponibilidad general: Inglés
Vista previa: Chino (simplificado), chino (tradicional), hindi, japonés, coreano, portugués y español

Información sobre modelos anteriores

Los siguientes son modelos activos, pero de generaciones anteriores. Te recomendamos que uses uno de los modelos más recientes cuando sea posible.

Gemini modelos

Modelo	Entrada	Salida	Descripción
Gemini 2.0 Flash `gemini-2.0-flash-001`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo multimodal con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas integrado y una ventana de contexto de 1 millón de tokens
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo Flash más rápido y rentable. Es una ruta de actualización para los usuarios de 1.5 Flash que desean una mejor calidad por el mismo precio y velocidad.

Imagen modelos

Modelo	Entrada	Salida	Descripción
Imagen 3 `imagen-3.0-generate-002`	texto	imágenes	Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 3 Fast ² `imagen-3.0-fast-generate-001`	texto	imágenes	Genera imágenes para prototipos o casos de uso de baja latencia

^{2 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

Todos los modelos Gemini 1.0 y Gemini 1.5 se retiraron, y todas las solicitudes a estos modelos devuelven un error 404. Para evitar interrupciones en el servicio, actualiza a un modelo más nuevo (por ejemplo, gemini-2.5-flash-lite). Obtén más información.

Cuando comiences a desarrollar tu app en serio, te recomendamos que uses Firebase Remote Config para que puedas cambiar de forma remota el modelo y la versión en tu app sin lanzar una versión nueva de la app.

Consulta la entrada y salida compatibles de los modelos de generaciones anteriores

Estos son los tipos de entrada y salida cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Tipos de entrada
Texto
Texto (transmisión)
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Texto (transmisión)
Código
Salida estructurada (como JSON)
Imágenes
Audio
Audio (transmisión)

Funciones y capacidades compatibles de los modelos de generaciones anteriores

Estas son las capacidades y funciones cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Pensamiento
Generar texto a partir de entradas de solo texto o multimodales
Generar imágenes (Gemini o Imagen)
Edita imágenes (Gemini o Imagen)
Generar audio
Genera resultados estructurados (como JSON)
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analiza videos (visión)
Analiza el audio
Chat de varios turnos
Transmisión multimodal bidireccional
Llamada a función
Ejecución de código
Grounding with Google Search
Instrucciones del sistema
Contar tokens

Especificaciones y limitaciones de los modelos de generaciones anteriores

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Firebase AI Logic:

Propiedad	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	1,048,576 tokens	1,048,576 tokens
Límite de tokens de salida *	8,192 tokens	8,192 tokens
Fecha límite de conocimiento	Junio de 2024	Junio de 2024
PDFs (por solicitud)
Cantidad máxima de archivos PDF de entrada **	3,000 archivos	3,000 archivos
Cantidad máxima de páginas por archivo PDF de entrada **	1,000 páginas	1,000 páginas
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	3,000 imágenes	3,000 imágenes
Cantidad máxima de imágenes de salida	---	---
Tamaño máximo por imagen de entrada codificada en Base64	7 MB	7 MB
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	10 archivos
Duración máxima de todo el video de entrada (solo fotogramas)	60 minutos aprox.	60 minutos aprox.
Longitud máxima de todo el video de entrada (fotogramas y audio)	45 minutos aprox.	45 minutos aprox.
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	1 archivo
Cantidad máxima de archivos de audio de salida	---	---
Longitud máxima de todo el audio de entrada	Aprox. 8.4 horas	Aprox. 8.4 horas
Longitud máxima de todo el audio de salida	---	---

Nombres de los modelos disponibles de generaciones anteriores (incluidas las fechas de baja)

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Modelos de Gemini

Nombres de modelos Gemini 2.0 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-001`	Versión estable más reciente de Gemini 2.0 Flash	Estable	2025-02-05	No antes del 2026-02-05
`gemini-2.0-flash`	Alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash (actualmente `gemini-2.0-flash-001`)	Estable	2025-02-10	---

Nombres de modelos Gemini 2.0 Flash‑Lite

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-lite-001`	Versión estable más reciente de Gemini 2.0 Flash‑Lite	Estable	2025-02-25	A partir del 2026-02-25
`gemini-2.0-flash-lite`	Es un alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash‑Lite (actualmente `gemini-2.0-flash-lite-001`)	Estable	2025-02-25	---

Modelos de Imagen

Nombres de modelos Imagen 3

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-generate-002`	Versión estable más reciente de Imagen 3	Estable	2025-01-23	A partir del 23 de enero de 2026
`imagen-3.0-generate-001` ³	Versión estable inicial de Imagen 3	Estable	2024-07-31	A partir del 31 de julio de 2025

Nombres de modelos Imagen 3 Fast

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-fast-generate-001` ³	Versión estable inicial de Imagen 3 Fast	Estable	2024-07-31	A partir del 31 de julio de 2025

^{3 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

Próximos pasos

Prueba las capacidades de Gemini API

Crea conversaciones de varios turnos (chat).
Generar texto a partir de instrucciones solo de texto
Genera texto a partir de instrucciones con varios tipos de archivos, como imágenes, PDFs, videos y audios.
Genera resultados estructurados (como JSON) a partir de instrucciones tanto de texto como multimodales.
Generar imágenes a partir de instrucciones de texto (Gemini o Imagen).
Transmite entrada y salida (incluido el audio) con Gemini Live API.
Usa herramientas (como llamadas a funciones y fundamentación con la Búsqueda de Google) para conectar un modelo Gemini a otras partes de tu app y a sistemas e información externos.

Más información sobre los modelos compatibles Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Modelos de uso general

Gemini 3 Pro

Gemini 2.5 Pro

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

Modelos de generación de imágenes

Gemini

Imagen de Gemini 3 Pro (también conocida como nano banana pro)

Gemini 2.5 Flash Image (también conocido como nano banana)

Imagen

Imagen 4

Imagen 4 Fast

Imagen 4 Ultra

Modelos de generaciones anteriores

Modelos de Gemini

Gemini 2.0 Flash

Gemini 2.0 Flash-Lite

Comparar modelos

Entrada y salida admitidas

Funciones y capacidades admitidas

Especificaciones y limitaciones

Encuentra información detallada adicional

Patrones de nomenclatura y control de versiones de modelos

Nombres de modelos disponibles

Enumera todos los modelos disponibles de forma programática

Nombres de modelos Gemini

Nombres de modelos Gemini 3 Pro

Nombres de los modelos de Gemini 3 Pro Image (también conocidos como "Nano Banana Pro")

Nombres de modelos Gemini 2.5 Pro

Nombres de modelos Gemini 2.5 Flash

Nombres de modelos Gemini 2.5 Flash‑Lite

Nombres de modelos de Gemini 2.5 Flash Image (también conocidos como "nano banana")

Nombres de modelos Gemini 2.5 Flash Live

Nombres de modelos Gemini 2.0 Flash Live

Nombres de modelos Imagen

Nombres de modelos Imagen 4

Nombres de modelos Imagen 4 Fast

Nombres de modelos Imagen 4 Ultra

Nombres de modelos Imagen 3 Capability

Idiomas compatibles

Gemini

Imagen

Información sobre modelos anteriores

Gemini modelos

Imagen modelos

Modelos de Gemini

Nombres de modelos Gemini 2.0 Flash

Nombres de modelos Gemini 2.0 Flash‑Lite

Modelos de Imagen

Nombres de modelos Imagen 3

Nombres de modelos Imagen 3 Fast

Próximos pasos

Prueba las capacidades de Gemini API

Más información sobre los modelos compatibles