En el caso de las apps para dispositivos móviles y la Web, los SDK de Vertex AI in Firebase te permiten interactuar con los modelos Gemini compatibles directamente desde tu app.
Los modelos Gemini se consideran multimodales porque son capaces de procesar e incluso generar varias modalidades, como texto, código, PDF, imágenes, video y audio.
En la siguiente tabla, se incluye una breve descripción general de los modelos compatibles para Vertex AI in Firebase y sus nombres de modelos estables más recientes. En esta tabla, también se enumeran los modelos experimentales y de vista previa que están disponibles para crear prototipos de casos de uso.
Modelo | Entrada | Salida | Descripción |
---|---|---|---|
Modelos Gemini con versiones estables | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDF, imágenes, video y audio | texto, código, JSON (próximamente imágenes y audio) |
Proporciona funciones y velocidad de nueva generación para una amplia variedad de tareas.
(próximamente, generación multimodal) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDF, imágenes, video y audio | texto, código, JSON | Proporciona un rendimiento rentable y de baja latencia, y admite una alta capacidad de procesamiento. |
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDF, imágenes, video y audio | texto, código, JSON | Admite tareas de razonamiento complejas que requieren más inteligencia. Contexto de 2 millones |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDF, imágenes, video y audio | texto, código, JSON | Ofrece un rendimiento rápido y versátil en una amplia variedad de tareas. |
Modelos Gemini con solo versiones experimentales y de vista previa (recomendado solo para casos de uso de prototipado) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
texto, código, PDF, imágenes, video y audio | texto, código, JSON | Ofrece la mejor calidad de modelo, en especial para el código y el conocimiento del mundo; 2 millones de contexto largo |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
texto, código, archivos PDF, imágenes | texto, código, JSON | Ofrece capacidades de razonamiento más sólidas y, además, incluye el proceso de pensamiento en las respuestas. |
En el resto de esta página, se proporciona información detallada sobre los modelos que admite Vertex AI in Firebase:
-
- Entradas y salidas compatibles
- Comparación de alto nivel de las funciones compatibles
- Especificaciones y limitaciones, por ejemplo, la cantidad máxima de tokens de entrada o la duración máxima del video de entrada
Descripción de cómo se crean versiones de los modelos, en particular, sus versiones estables, actualizadas automáticamente y preliminares
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de los idiomas admitidos para los modelos
En la parte inferior de esta página, puedes ver información detallada sobre los modelos más antiguos.
Compara modelos
Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Vertex AI in Firebase. Cada modelo puede tener funciones adicionales que no están disponibles cuando se usan nuestros SDKs.
Si no encuentras la información que buscas en las siguientes sub secciones, puedes encontrar aún más información sobre los modelos Gemini en la documentación de Google Cloud.
Entradas y salidas compatibles
Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensamiento rápido de Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Tipos de entrada | ||||||
Texto | ||||||
Código | ||||||
Documentos (PDF o texto sin formato) |
||||||
Imágenes | ||||||
Video | ||||||
Audio | ||||||
Audio (transmisión) | próximamente | |||||
Tipos de salida | ||||||
Texto | ||||||
Código | ||||||
Salida estructurada (como JSON) |
||||||
Imágenes | próximamente | |||||
Audio | próximamente | |||||
Audio (transmisión) | próximamente |
Para obtener información sobre los tipos de archivos compatibles, consulta Archivos de entrada y requisitos compatibles para Vertex AI Gemini API.
Funciones y capacidades compatibles
Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensamiento rápido de Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Genera texto a partir de entradas de texto o multimodal | ||||||
Generar imágenes | próximamente | |||||
Genera audio | próximamente | |||||
Genera un resultado estructurado
(como JSON). |
||||||
Analizar documentos
(archivos PDF o texto sin formato) |
||||||
Analiza imágenes (visión) | ||||||
Analizar videos (visión) | ||||||
Cómo analizar audio | ||||||
Chat de varios turnos | ||||||
Llamadas a función (herramientas) | ||||||
Recuento de tokens y caracteres facturables | ||||||
Instrucciones del sistema | ||||||
API de Multimodal Live (transmisión bidireccional) |
próximamente |
Especificaciones y limitaciones
Estas son las especificaciones y limitaciones cuando se usa cada modelo con Vertex AI in Firebase:
Propiedad |
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensamiento rápido de Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
---|---|---|---|---|---|---|
Ventana de contexto * Límite total de tokens (entrada y salida combinadas) |
2,097,152 tokens | 1,048,576 tokens | 1,048,576 tokens | 1,048,576 tokens | 2,097,152 tokens | 1,048,576 tokens |
Límite de tokens de salida * | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens |
Fecha de corte de Knowledge | Junio de 2024 | Junio de 2024 | Junio de 2024 | Junio de 2024 | Mayo de 2024 | Mayo de 2024 |
PDF (si se solicita) | ||||||
Cantidad máxima de archivos PDF de entrada ** |
3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos |
Cantidad máxima de páginas por archivo PDF de entrada ** |
1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas |
Tamaño máximo por archivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB |
Imágenes (por solicitud) | ||||||
Cantidad máxima de imágenes de entrada |
3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes |
Cantidad máxima de imágenes de salida |
--- | próximamente | --- | --- | --- | --- |
Tamaño máximo por imagen de entrada codificada en base64 |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB |
Video (por solicitud) | ||||||
Cantidad máxima de archivos de video de entrada |
10 archivos | 10 archivos | 10 archivos | --- | 10 archivos | 10 archivos |
Es la duración máxima de todo el video de entrada (solo fotogramas). |
Aproximadamente 60 minutos | Aproximadamente 60 minutos | Aproximadamente 60 minutos | --- | Aproximadamente 60 minutos | Aproximadamente 60 minutos |
Es la duración máxima de todo el video de entrada (fotogramas y audio). |
45 minutos aprox. | 45 minutos aprox. | 45 minutos aprox. | --- | 45 minutos aprox. | 45 minutos aprox. |
Audio (por solicitud) | ||||||
Cantidad máxima de archivos de audio de entrada |
1 archivo | 1 archivo | 1 archivo | --- | 1 archivo | 1 archivo |
Cantidad máxima de archivos de audio de salida |
--- | próximamente | --- | --- | --- | --- |
Es la longitud máxima de todo el audio de entrada. |
Aprox. 8.4 horas | Aprox. 8.4 horas | Aprox. 8.4 horas | --- | Aprox. 8.4 horas | Aprox. 8.4 horas |
Es la longitud máxima de todo el audio de salida. |
--- | próximamente | --- | --- | --- | --- |
*
En todos los modelos, un token equivale a alrededor de 4 caracteres,
así que 100 tokens son entre 60 y 80 palabras en inglés. En el caso de los modelos de Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens
.
** Los archivos PDF se tratan como imágenes, por lo que una sola página de un PDF se considera una sola imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.
Obtén información detallada adicional
Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de las entradas y salidas.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas en Requisitos y tipos de archivos de entrada admitidos para Vertex AI Gemini API.
Patrones de nombres y control de versiones de modelos
Los modelos se ofrecen en versiones estables, experimentales y de vista previa. Para mayor comodidad, se admiten alias sin valores de versión explícitos.
Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "Nombres de modelos disponibles" más adelante en esta página.
Tipo de versión | Descripción | Patrón de nombre del modelo | |
---|---|---|---|
Estable | Las versiones estables se consideran de disponibilidad general. |
Los nombres de los modelos de las versiones estables se agregan con un número de versión de tres dígitos específico.
Ejemplo: |
|
Alias estable actualizado automáticamente | Los alias estables actualizados automáticamente siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comienza a apuntar automáticamente a esa nueva versión estable. |
Los nombres de los modelos de los alias no tienen ningún apéndice.
Ejemplo: |
|
Vista previa |
Las versiones de vista previa tienen funciones nuevas y se consideran no estables.
Las versiones preliminares siempre apuntan a la versión más reciente de ese modelo. Si se lanza una nueva versión preliminar, cualquier versión preliminar existente comenzará a apuntar automáticamente a esa versión preliminar nueva. |
Los nombres de los modelos de las versiones preliminares se agregan con
Ejemplo: |
|
Experimental |
Las versiones experimentales tienen nuevas funciones y se consideran no estables, y no siguen el plan de ciclo de vida del modelo ni el esquema de control de versiones estándar de Google.
Obtén más información sobre los modelos experimentales. |
Los nombres de los modelos de las versiones experimentales se agregan con
Ejemplo: |
Obtén más información sobre las versiones de modelos disponibles y su ciclo de vida (Gemini) en la documentación de Google Cloud.
Nombres de modelos disponibles
Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo generativo (que es un paso obligatorio para llamar a Gemini API).
Puedes usar el
extremo publishers.models.list
para enumerar todos los nombres de modelos disponibles. Ten en cuenta que esta lista incluirá todos los modelos que admite Vertex AI, pero Vertex AI in Firebase solo admite los modelos Gemini que se describen en esta página.
Además, ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash
) no se enumeran porque son un alias conveniente para el modelo base.
Nombres de los modelos Gemini
Para ver ejemplos de inicialización en tu idioma, consulta la guía de introducción.
Nombres de los modelos Gemini 2.0 Pro
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
No hay versiones estables disponibles | --- | --- | --- | --- |
Alias estable actualizado automáticamente | ||||
No hay alias estables actualizados automáticamente disponibles | --- | --- | --- | --- |
Versiones preliminares | ||||
No hay versiones preliminares disponibles | --- | --- | --- | --- |
Versiones experimentales | ||||
gemini-2.0-pro-exp-02-05 |
Versión experimental de Gemini 2.0 Pro | Experimental | 2025-02-05 | Sin establecer |
Nombres de los modelos Gemini 2.0 Flash
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
gemini-2.0-flash-001 |
La versión estable más reciente de Gemini 2.0 Flash | Disponibilidad general | 2025-02-05 | No antes del 2026-02-05 |
Alias estable actualizado automáticamente | ||||
gemini-2.0-flash |
Hace referencia a la versión estable más reciente de Flash 2.0 (actualmente, gemini-2.0-flash-001 |
Disponibilidad general | 2025-02-10 | --- |
Versiones preliminares | ||||
No hay versiones preliminares disponibles | --- | --- | --- | --- |
Versiones experimentales | ||||
No hay versiones experimentales disponibles | --- | --- | --- | --- |
Nombres de los modelos Gemini 2.0 Flash‑Lite
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
gemini-2.0-flash-lite-001 |
La versión estable más reciente de Gemini 2.0 Flash‑Lite | Disponibilidad general | 2025-02-25 | No antes del 2026-02-25 |
Alias estable actualizado automáticamente | ||||
gemini-2.0-flash-lite |
Dirige a la versión estable más reciente de Flash-Lite 2.0 (actualmente, gemini-2.0-flash-lite-001 |
Disponibilidad general | 2025-02-25 | --- |
Versiones preliminares | ||||
gemini-2.0-flash-lite-preview-02-05 |
Versión preliminar de Gemini 2.0 Flash‑Lite | Vista previa | 2025-02-05 | Sin establecer |
Versiones experimentales | ||||
No hay versiones experimentales disponibles | --- | --- | --- | --- |
Nombres de los modelos Gemini 2.0 Flash‑Thinking
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
No hay versiones estables disponibles | --- | --- | --- | --- |
Alias estable actualizado automáticamente | ||||
No hay alias estables actualizados automáticamente disponibles | --- | --- | --- | --- |
Versiones preliminares | ||||
No hay versiones preliminares disponibles | --- | --- | --- | --- |
Versiones experimentales | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Versión experimental de Gemini 2.0 Flash‑Thinking | Experimental | 2025-01-21 | Sin establecer |
Nombres de los modelos Gemini 1.5 Pro
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
gemini-1.5-pro-002 |
La versión estable más reciente de Gemini 1.5 Pro | Disponibilidad general | 2024-09-24 | A partir del 24 de septiembre de 2025 |
gemini-1.5-pro-001 |
Versión estable inicial de Gemini 1.5 Pro | Disponibilidad general | 2024-05-24 | A partir del 24/05/2025 |
Alias estable actualizado automáticamente | ||||
gemini-1.5-pro |
Hace referencia a la versión estable más reciente de 1.5 Pro (actualmente, gemini-1.5-pro-002 |
Disponibilidad general | 2024-09-24 | --- |
Versiones preliminares | ||||
No hay versiones preliminares disponibles | --- | --- | --- | --- |
Versiones experimentales | ||||
No hay versiones experimentales disponibles | --- | --- | --- | --- |
Nombres de los modelos Gemini 1.5 Flash
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento inicial | Fecha de descontinuación |
---|---|---|---|---|
Versiones estables | ||||
gemini-1.5-flash-002 |
La versión estable más reciente de Gemini 1.5 Flash | Disponibilidad general | 2024-09-24 | A partir del 24 de septiembre de 2025 |
gemini-1.5-flash-001 |
Versión estable inicial de Gemini 1.5 Flash | Disponibilidad general | 2024-05-24 | A partir del 24/05/2025 |
Alias estable actualizado automáticamente | ||||
gemini-1.5-flash |
Hace referencia a la versión estable más reciente de Flash 1.5 (actualmente, gemini-1.5-flash-002 |
Disponibilidad general | 2024-09-24 | --- |
Versiones preliminares | ||||
No hay versiones preliminares disponibles | --- | --- | --- | --- |
Versiones experimentales | ||||
No hay versiones experimentales disponibles | --- | --- | --- | --- |
Idiomas admitidos
Gemini
Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:
Árabe (ar), bengalí (bn), búlgaro (bg), chino simplificado y tradicional (zh), croata (hr), checo (cs), danés (da), neerlandés (nl), español (es), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), suajili (sw), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Información sobre modelos más antiguos
Vertex AI in Firebase admite todos los modelos Gemini, incluidos los más antiguos, como Gemini 1.0 Pro y Gemini 1.0 Pro Vision. Sin embargo, te recomendamos que uses un modelo más reciente con nuestros SDKs. Estos modelos más antiguos de Gemini están próximos a su fecha de baja y no ofrecen todas las capacidades de los modelos más nuevos.
Próximos pasos
Prueba las funciones de Gemini API
- Crea conversaciones de varios turnos (chat).
- Generar texto a partir de instrucciones de solo texto
- Genera texto a partir de instrucciones multimodales (incluidos texto, imágenes, PDF, video y audio).
- Genera resultados estructurados (como JSON) a partir de instrucciones multimodales y de texto.
- Usa las llamadas a función para conectar los modelos generativos a sistemas y datos externos.