All Gemini 1.0 and Gemini 1.5 models are now retired.
To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite). Learn more.

Se usó la API de Cloud Translation para traducir esta página.

Más información sobre los modelos compatibles

En el caso de las apps para dispositivos móviles y la Web, los SDKs de Firebase AI Logic te permiten interactuar con los modelos de Gemini y los modelos de Imagen compatibles directamente desde tu app.

Los modelos Gemini se consideran multimodales porque son capaces de procesar y hasta generar múltiples modalidades, como texto, código, PDFs, imágenes, video y audio. Se puede solicitar a los modelos Imagen que generen imágenes a partir de texto.

En la siguiente tabla, se incluye una breve descripción general de los modelos compatibles con Firebase AI Logic y sus nombres de modelos estables más recientes. En esta tabla, también se enumeran los modelos experimentales y de vista previa que están disponibles para los casos de uso de creación de prototipos.

Además, consulta nuestras preguntas frecuentes sobre todos los modelos que Firebase AI Logic admite y no admite.

Gemini modelos

Modelo	Entrada	Salida	Descripción
Modelos Gemini con versiones estables
Gemini 2.5 Pro `gemini-2.5-pro`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo de razonamiento más avanzado, capaz de resolver problemas complejos.
Gemini 2.5 Flash `gemini-2.5-flash`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo de pensamiento que ofrece capacidades excelentes y completas. Está diseñado para ofrecer un equilibrio entre precio y rendimiento.
Gemini 2.5 Flash‑Lite `gemini-2.5-flash-lite`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo Gemini más equilibrado, optimizado para casos de uso de latencia baja y apps que tienen en cuenta los costos.
Gemini 2.0 Flash `gemini-2.0-flash-001`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo multimodal con funciones de nueva generación y capacidades mejoradas, como mayor velocidad, uso de herramientas integradas y una ventana de contexto de 1 millón de tokens
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Nuestro modelo Flash más rápido y rentable. Es una ruta de actualización para los usuarios de 1.5 Flash que desean una mejor calidad por el mismo precio y velocidad.
Modelos de Gemini con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado)
Gemini 2.5 Flash Image `gemini-2.5-flash-image-preview`	Texto, código, PDFs, imágenes	Imágenes, texto e imágenes	Nuestro modelo Flash estándar se actualizó para ofrecer flujos de trabajo creativos rápidos con capacidades de edición conversacional de varios turnos y generación de imágenes. (también conocida como "nano banana")
Gemini 2.0 Flash Image Generation `gemini-2.0-flash-preview-image-generation`	Texto, código, PDFs, imágenes	Imágenes, texto e imágenes	Nuestro modelo multimodal que admite entradas multimodales y salidas de imágenes.
Gemini 2.0 Flash Live ¹ `gemini-2.0-flash-live-preview-04-09`	texto (transmisión), audio (transmisión)	texto (transmisión), audio (transmisión)	Nuestro modelo multimodal que admite la transmisión en tiempo real de baja latencia de entradas y salidas multimodales.

^{1 Los nombres de modelos adicionales admiten Live API según el proveedor y el acceso de Gemini API que elijas (consulta la página de Live API).}

Imagen modelos

Modelo	Entrada	Salida	Descripción
Modelos Imagen con versiones estables
Imagen 4 `imagen-4.0-generate-001`	texto	imágenes	Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 4 Fast `imagen-4.0-fast-generate-001`	texto	imágenes	Genera imágenes para prototipos o casos de uso de baja latencia
Imagen 4 Ultra `imagen-4.0-ultra-generate-001`	texto	imágenes	Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 3 `imagen-3.0-generate-002`	texto	imágenes	Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 3 Fast ² `imagen-3.0-fast-generate-001`	texto	imágenes	Genera imágenes para prototipos o casos de uso de baja latencia
Imagen 3 Capability ² `imagen-3.0-capability-001`	texto, imágenes	imágenes	Edita y genera imágenes, admite la edición basada en máscaras y la personalización con imágenes de referencia
Modelos de Imagen con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado)
---	---	---	---

^{2 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

En el resto de esta página, se proporciona información detallada sobre los modelos compatibles con Firebase AI Logic.

Compara modelos:
- Entrada y salida admitidas
- Comparación general de las capacidades admitidas
- Especificaciones y limitaciones, por ejemplo, cantidad máxima de tokens de entrada o longitud máxima del video de entrada
Descripción de cómo se versionan los modelos, específicamente sus versiones estable, actualizada automáticamente, preliminar y experimental
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de idiomas admitidos para los modelos

En la parte inferior de esta página, puedes ver información detallada sobre los modelos anteriores.

Comparar modelos

Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Firebase AI Logic. Cada modelo puede tener capacidades adicionales que no están disponibles cuando se usan nuestros SDKs.

Si no encuentras la información que buscas en las siguientes subsecciones, puedes encontrar aún más información en la documentación del proveedor de la API que elijas:

Gemini Developer API: Modelos de Gemini y modelos de Imagen
Vertex AI Gemini API: Modelos de Gemini y modelos de Imagen

Entrada y salida admitidas

Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 2.5 Pro, Flash y Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (generar)	Imagen (capacidad)
Tipos de entrada
Texto
Texto (transmisión)
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Texto (transmisión)
Código
Salida estructurada (como JSON)
Imágenes
Audio
Audio (transmisión)

Para obtener información sobre los tipos de archivos admitidos, consulta Archivos de entrada y requisitos admitidos.

Funciones y capacidades admitidas

Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Pensamiento
Generar texto a partir de entradas de solo texto o multimodales	Intercalado o como parte de la imagen	Intercalado o como parte de la imagen	Solo transmisión
Genera imágenes (Gemini o Imagen)
Edita imágenes (Gemini o Imagen)
Generar audio			Solo transmisión
Genera resultados estructurados (como JSON)
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analiza videos (visión)
Analiza el audio			Solo transmisión
Chat de varios turnos
Transmisión multimodal bidireccional
Llamada a función
Ejecución de código
Grounding with Google Search
Instrucciones del sistema
Contar tokens

Especificaciones y limitaciones

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Firebase AI Logic:

Propiedad	<span="notranslate">Gemini 2.5 Pro, Flash y Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (generar)	Imagen (capacidad)
Ventana de contexto * Límite total de tokens (entrada y salida combinadas)	1,048,576 tokens	32,768 tokens	1,048,576 tokens	1,048,576 tokens	32,768 tokens	32,768 tokens	480 tokens	480 tokens
Límite de tokens de salida *	65,536 tokens	8,192 tokens	8,192 tokens	8,192 tokens	8,192 tokens	8,192 tokens	---	---
Fecha límite de conocimiento	Enero de 2025	Junio de 2025	Junio de 2024	Junio de 2024	Agosto de 2024	Agosto de 2024	---	---
PDFs (por solicitud)
Cantidad máxima de archivos PDF de entrada **	3,000 archivos	3 archivos	3,000 archivos	3,000 archivos	3,000 archivos	---	---	---
Cantidad máxima de páginas por archivo PDF de entrada **	1,000 páginas	3 páginas	1,000 páginas	1,000 páginas	1,000 páginas	---	---	---
Tamaño máximo por archivo PDF de entrada	50 MB	50 MB	50 MB	50 MB	50 MB	---	---	---
Imágenes (por solicitud)
Cantidad máxima de imágenes de entrada	3,000 imágenes	3 imágenes	3,000 imágenes	3,000 imágenes	3,000 imágenes	---	---	4 imágenes
Cantidad máxima de imágenes de salida	---	10 imágenes	---	---	10 imágenes	---	4 imágenes	4 imágenes
Tamaño máximo por imagen de entrada codificada en Base64	7 MB	7 MB	7 MB	7 MB	7 MB	---	---	---
Video (por solicitud)
Cantidad máxima de archivos de video de entrada	10 archivos	---	10 archivos	10 archivos	---	---	---	---
Longitud máxima de todo el video de entrada (solo fotogramas)	60 minutos aprox.	---	60 minutos aprox.	60 minutos aprox.	---	---	---	---
Longitud máxima de todo el video de entrada (fotogramas y audio)	45 minutos aprox.	---	45 minutos aprox.	45 minutos aprox.	---	---	---	---
Audio (por solicitud)
Cantidad máxima de archivos de audio de entrada	1 archivo	---	1 archivo	1 archivo	---	---	---	---
Cantidad máxima de archivos de audio de salida	---	---	---	---	---	---	---	---
Longitud máxima de todo el audio de entrada	Aprox. 8.4 horas	Aprox. 8.4 horas	Aprox. 8.4 horas	Aprox. 8.4 horas	---	---	---	---
Longitud máxima de todo el audio de salida	---	---	---	---	---	---	---	---

^{*
Para todos los modelos Gemini, un token equivale a alrededor de 4 caracteres,
por lo que 100 tokens equivalen a entre 60 y 80 palabras en inglés. En el caso de los modelos Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens.}

^{**
Los PDFs se tratan como imágenes, por lo que una sola página de un PDF se considera
una imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.}

Encuentra información detallada adicional

Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de la entrada y la salida.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas que se indican en Requisitos y tipos de archivos de entrada admitidos.

Importante: El límite de tamaño total de la solicitud es de 20 MB. Para enviar archivos grandes, revisa las opciones para proporcionar archivos en solicitudes multimodales.

Patrones de nomenclatura y control de versiones de modelos

Los modelos se ofrecen en versiones estables, de vista previa y experimentales. Para mayor comodidad, se admiten alias sin valores de versión explícitos.

Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "Nombres de modelos disponibles" más adelante en esta página.

Tipo de versión / Etapa de lanzamiento		Descripción	Patrón del nombre del modelo
Estable		Las versiones *estables* están disponibles y se admiten para el uso en producción a partir de la fecha de lanzamiento. Por lo general, las versiones de modelos estables se lanzan con una fecha de retiro, que indica el último día en que el modelo está disponible. Después de esta fecha, Google ya no admitirá el modelo ni se podrá acceder a él.	Modelos de Gemini 2.5 Los nombres de los modelos de versiones estables no tienen sufijo. Ejemplo: `gemini-2.5-pro` Modelos Gemini 2.0 y Imagen Los nombres de los modelos de versiones estables se agregan con un número de versión específico de tres dígitos. Ejemplo: `gemini-2.0-flash-001` Ejemplo: `imagen-3.0-generate-002`
	Alias estable actualizado automáticamente (solo modelos de Gemini 2.0)	Los alias estables *actualizados automáticamente* siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comienza a hacer referencia automáticamente a esa nueva versión estable.	Solo modelos Gemini 2.0 Los nombres de los modelos de alias no tienen sufijo Ejemplo: `gemini-2.0-flash`
Vista previa		Las versiones de *vista previa* tienen nuevas capacidades y se consideran inestables. No se recomienda usar estos modelos en producción, tienen límites de frecuencia más restrictivos y pueden tener requisitos de facturación. En el caso de Vertex AI Gemini API, los modelos de vista previa lanzados después de junio de 2025 suelen requerir que establezcas la ubicación del modelo en `global`.	Los nombres de los modelos de las versiones preliminares se complementan con `-preview` junto con la fecha de lanzamiento del modelo (`-MM-DD`). Ejemplo: `gemini-2.5-flash-preview-04-17` (lanzado el 17 de abril de 2025)
Experimental		Las versiones *experimentales* tienen nuevas capacidades y se consideran inestables. Estos modelos no se recomiendan para el uso en producción y tienen límites de frecuencia más restrictivos. Los modelos experimentales están diseñados para recopilar comentarios y permitir la experimentación con nuestras funciones más recientes. En el caso de Vertex AI Gemini API, los modelos experimentales lanzados después de junio de 2025 requieren que establezcas la ubicación del modelo en `global`.	Los nombres de los modelos de las versiones experimentales se agregan con `-exp` junto con la fecha de lanzamiento del modelo (`-MM-DD`). Ejemplo: `gemini-2.5-pro-exp-03-25` (se lanzó el 25 de marzo de 2025)
Jubilado		Las versiones *retiradas* superaron su fecha de retiro y se desactivaron de forma permanente. Google ya no admite ni permite el acceso a los modelos retirados, y las solicitudes que hacen referencia a un ID de modelo retirado suelen devolver un error 404.	---

Nombres de modelos disponibles

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Ir a los nombres de los modelos Gemini Ir a los nombres de los modelos Imagen

Enumera de forma programática todos los modelos disponibles

Puedes enumerar todos los nombres de los modelos disponibles con la API de REST:

Gemini Developer API: Llama al extremo models.list.
Vertex AI Gemini API: Llama al extremo publishers.models.list.

Ten en cuenta que la lista que se devuelve incluirá todos los modelos compatibles con los proveedores de la API, pero Firebase AI Logic solo admite los modelos Gemini y Imagen que se describen en esta página. También ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash) no se incluyen en la lista porque son alias convenientes para el modelo base.

Nombres de modelos Gemini

Para ver ejemplos de inicialización para tu plataforma, consulta la guía de introducción.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.

Importante: Los nombres de los modelos estables no tienen un sufijo de tres dígitos ni un alias actualizado automáticamente.Gemini 2.5 Además, si usas Vertex AI Gemini API, todos los modelos de Gemini 2.5 en versión preliminar lanzados después de junio de 2025 solo estarán disponibles en la ubicación global.

Nombres de modelos Gemini 2.5 Pro

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-pro`	Versión estable de Gemini 2.5 Pro	Estable	2025-06-17	No antes del 2026-06-17

Nombres de modelos Gemini 2.5 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash`	Versión estable de Gemini 2.5 Flash	Estable	2025-06-17	No antes del 2026-06-17

Nombres de modelos Gemini 2.5 Flash‑Lite

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash-lite`	Versión estable de Gemini 2.5 Flash‑Lite	Estable	2025-07-22	A partir del 2026-07-22

Nombres de modelos de Gemini 2.5 Flash Image (también conocidos como "nano banana")

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.5-flash-image-preview`	Versión preliminar de Gemini 2.5 Flash Image (también conocida como "nano banana")	Vista previa	2025-08-26	Sin establecer

Nombres de modelos Gemini 2.5 Flash Live

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-live-2.5-flash`	Versión estable de Gemini 2.5 Flash Live	Estable (DG privada) ¹	2025-06-01	A partir del 1/6/2026
`gemini-live-2.5-flash-preview` ²	Versión preliminar de Gemini 2.5 Flash Live	Vista previa	2025-06-01	Sin establecer

Ten en cuenta que, en los nombres de los modelos 2.5 para Live API, el segmento live sigue inmediatamente al segmento gemini.

Firebase AI Logic aún no admite los modelos de audio nativos (como gemini-2.5-flash-native-audio-preview-09-2025).

^{1 Comunícate con el representante de tu equipo de cuentas de Google Cloud para solicitar acceso.}

^{2 No es compatible con Vertex AI Gemini API, sin importar cómo accedas a él.}

Nombres de modelos Gemini 2.0 Flash

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-001`	Versión estable más reciente de Gemini 2.0 Flash	Estable	2025-02-05	No antes del 2026-02-05
`gemini-2.0-flash`	Alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash (actualmente `gemini-2.0-flash-001`)	Estable	2025-02-10	---

Nombres de modelos Gemini 2.0 Flash‑Lite

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-lite-001`	Versión estable más reciente de Gemini 2.0 Flash‑Lite	Estable	2025-02-25	A partir del 2026-02-25
`gemini-2.0-flash-lite`	Alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash‑Lite (actualmente `gemini-2.0-flash-lite-001`)	Estable	2025-02-25	---

Nombres de modelos Gemini 2.0 Flash Image Generation

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-preview-image-generation`	Versión preliminar de Gemini 2.0 Flash Image Generation	Vista previa	2025-05-06	Sin establecer

Nombres de modelos Gemini 2.0 Flash Live

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`gemini-2.0-flash-live-001` ²	Versión estable de Gemini 2.0 Flash Live	Estable	2025-04-01	A partir del 2026-04-01
`gemini-2.0-flash-live-preview-04-09`	Versión preliminar de Gemini 2.0 Flash Live	Vista previa	2025-04-09	Sin establecer

^{2 No es compatible con Vertex AI Gemini API, sin importar cómo accedas a él.}

Nombres de modelos Imagen

Para ver ejemplos de inicialización para tu plataforma, consulta la guía para generar imágenes con Imagen.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.

Nombres de modelos Imagen 4

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-generate-001`	Versión estable de Imagen 4	Estable	2025-08-14	A partir del 14 de agosto de 2026
`imagen-4.0-generate-preview-06-06`	Versión preliminar de Imagen 4	Vista previa	2025-06-06	A partir del 14-08-2025

Nombres de modelos Imagen 4 Fast

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-fast-generate-001`	Versión estable de Imagen 4 Fast	Estable	2025-08-14	A partir del 14 de agosto de 2026
`imagen-4.0-fast-generate-preview-06-06` ³	Versión preliminar de Imagen 4 Fast (próximamente dejará de estar disponible; no la uses)	Vista previa	2025-06-06	A partir del 14-08-2025

Nombres de modelos Imagen 4 Ultra

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-4.0-ultra-generate-001`	Versión estable de Imagen 4 Ultra	Estable	2025-08-14	A partir del 14 de agosto de 2026
`imagen-4.0-ultra-generate-preview-06-06`	Versión preliminar de Imagen 4 Ultra (próximamente dejará de estar disponible; no la uses)	Vista previa	2025-06-06	A partir del 14-08-2025

Nombres de modelos Imagen 3

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-generate-002`	Versión estable más reciente de Imagen 3	Estable	2025-01-23	A partir del 23 de enero de 2026
`imagen-3.0-generate-001` ³	Versión estable inicial de Imagen 3	Estable	2024-07-31	A partir del 31 de julio de 2025

Nombres de modelos Imagen 3 Fast

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-fast-generate-001` ³	Versión estable inicial de Imagen 3 Fast	Estable	2024-07-31	A partir del 31 de julio de 2025

^{3 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

Nombres de modelos Imagen 3 Capability

Nombre del modelo	Descripción	Etapa de lanzamiento	Fecha de lanzamiento	Fecha de baja
`imagen-3.0-capability-001` ³	Versión estable inicial de Imagen 3 Capability	Estable	2024-12-10	A partir del 2025-12-10

^{3 No es compatible con Gemini Developer API, sin importar cómo accedas a él.}

Idiomas compatibles

Gemini

Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:

Árabe (ar), bengalí (bn), búlgaro (bg), chino (simplificado y tradicional; zh), croata (hr), checo (cs), danés (da), neerlandés (nl), inglés (en), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), español (es), suajili (sw), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:

Afrikaans (af), amhárico (am), asamés (as), azerí (az), bielorruso (be), bosnio (bs), catalán (ca), cebuano (ceb), corso (co), galés (cy), dhivehi (dv), esperanto (eo), euskera (eu), persa (fa), filipino (tagalo) (fil), frisio (fy), irlandés (ga), gaélico escocés (gd), gallego (gl), guyaratí (gu), hausa (ha), hawaiano (haw), hmong (hmn), criollo haitiano (ht), armenio (hy), igbo (ig), islandés (is), javanés (jv), georgiano (ka), kazajo (kk), jemer (km), kannada (kn), krio (kri), kurdo (ku), kirguís (ky), latín (la), luxemburgués (lb), laosiano (lo), malgache (mg), maorí (mi), macedonio (mk), malayalam (ml), mongol (mn), meiteilon (manipuri) (mni-Mtei), maratí (mr), malayo (ms), maltés (mt), birmano (my), nepalí (ne), nyanja (chichewa) (ny), oriya (or), panyabí (pa), pastún (ps), sindhi (sd), cingalés (si), samoano (sm), shona (sn), somalí (so), albanés (sq), sesotho (st), sundanés (su), tamil (ta), telugu (te), tayiko (tg), uigur (ug), urdu (ur), uzbeko (uz), xhosa (xh), yidis (yi), yoruba (yo), zulú (zu)

Imagen

Disponibilidad general: Inglés
Vista previa: Chino (simplificado), chino (tradicional), hindi, japonés, coreano, portugués y español

Información sobre modelos anteriores

Firebase AI Logic admite los modelos Gemini activos anteriores (como los modelos Gemini 1.5).

Firebase AI Logic no admite los modelos Imagen más antiguos (como Imagen 2).

Modelo	Entrada	Salida	Optimizado para
Gemini 1.5 Pro `gemini-1.5-pro-002`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Admite tareas de razonamiento complejas que requieren más inteligencia. Contexto extenso de 2 millones
Gemini 1.5 Flash `gemini-1.5-flash-002`	texto, código, PDFs, imágenes, video y audio	Texto, código y JSON	Ofrece un rendimiento rápido y versátil en una amplia variedad de tareas
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	~~texto, código, PDFs, imágenes, video (solo fotogramas)~~	~~texto, código~~	~~Maneja texto, imágenes y video para respuestas de texto o código. No se puede usar para el chat.~~
Gemini 1.0 Pro `gemini-1.0-pro-002`	~~texto, código~~	~~texto, código~~	~~Tareas de lenguaje natural, chat de código y texto de varios turnos, y generación de código~~

Consulta la entrada y la salida compatibles de modelos anteriores

Estos son los tipos de entrada y salida cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Tipos de entrada
Texto
Código
Documentos (PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Código
Salida estructurada (como JSON)
Imágenes, video y audio

Funciones y capacidades compatibles de modelos anteriores

Estas son las capacidades y funciones cuando se usa cada modelo con Firebase AI Logic:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Genera texto a partir de la entrada de solo texto
Generar texto a partir de una entrada multimodal
Generar imágenes
Generar audio
Genera resultados estructurados (como JSON)
Analizar documentos (archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analizar video (visión)
Analiza el audio
Chat de varios turnos
Llamadas a función (herramientas)
Recuento de tokens y caracteres facturables
Instrucciones del sistema
Transmisión multimodal bidireccional

Especificaciones y limitaciones de modelos anteriores