Esta página foi traduzida pela API Cloud Translation.

Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini e Imagen compatíveis diretamente do seu app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. É possível pedir aos modelos Imagen para gerar imagens com texto.

A tabela a seguir é uma visão geral breve dos modelos compatíveis com Firebase AI Logic e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos experimentais e de prévia disponíveis para prototipagem de casos de uso.

Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic oferece suporte e não oferece.

Gemini modelos

Modelo	Entrada	Saída	Descrição
Modelos Gemini com versões estáveis
Gemini 2.5 Pro `gemini-2.5-pro`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Nosso modelo de raciocínio mais avançado, capaz de resolver problemas complexos.
Gemini 2.5 Flash `gemini-2.5-flash`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Nosso modelo de pensamento que oferece recursos excelentes e abrangentes. Ele foi projetado para oferecer um equilíbrio entre preço e desempenho.
Gemini 2.0 Flash `gemini-2.0-flash-001`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Nosso modelo multimodal com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas integrado e uma janela de contexto de 1 milhão de tokens
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do 1.5 Flash que querem melhor qualidade pelo mesmo preço e velocidade.
*Modelos Gemini com versões somente* de prévia e experimentais** (recomendado apenas para casos de uso de prototipagem)
Gemini 2.5 Flash‑Lite `gemini-2.5-flash-lite-preview-06-17`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Nosso modelo de Gemini mais equilibrado, otimizado para casos de uso de baixa latência.
Gemini 2.0 Flash Image Generation `gemini-2.0-flash-preview-image-generation`	texto, código, PDFs, imagens, vídeo, áudio	imagens, texto e imagens	Nosso modelo multimodal que aceita entradas multimodais e gera imagens.
Gemini 2.0 Flash Live ¹ `gemini-2.0-flash-live-preview-04-09`	texto (streaming), áudio (streaming)	texto (streaming), áudio (streaming)	Nosso modelo multimodal que oferece suporte a streaming em tempo real de baixa latência de entradas e saídas multimodais.

^{1 Não há suporte ao usar o Gemini Developer API
com SDKs Firebase AI Logic.}

Imagen modelos

Modelo	Entrada	Saída	Descrição
Modelos Imagen com versões estáveis
Imagen 3 `imagen-3.0-generate-002`	texto	imagens	Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 3 Fast ² `imagen-3.0-fast-generate-001`	texto	imagens	Gera imagens para prototipagem ou casos de uso de baixa latência
*Modelos Imagen com versões somente* de prévia e experimentais** (recomendado apenas para casos de uso de prototipagem)
Imagen 4 ² `imagen-4.0-generate-preview-06-06`	texto	imagens	Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 4 Fast ² `imagen-4.0-fast-generate-preview-06-06`	texto	imagens	Gera imagens para prototipagem ou casos de uso de baixa latência
Imagen 4 Ultra ² `imagen-4.0-ultra-generate-preview-06-06`	texto	imagens	Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural

^{2 Este modelo Imagen não é compatível com o
Gemini Developer API, independente de como você acessa a API.}

O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.

Comparar modelos:
- Entrada e saída compatíveis
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, como o número máximo de tokens de entrada ou o comprimento máximo do vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas compatíveis para os modelos

Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos mais antigos.

Comparação de modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que procura nas subseções a seguir, consulte mais detalhes na documentação do provedor de API escolhido:

Gemini Developer API: modelos Gemini e modelos Imagen
Vertex AI Gemini API: modelos Gemini e modelos Imagen

Entrada e saída compatíveis

Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:

	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen
Tipos de entrada
Texto
Texto (streaming)
Código
Documentos (PDFs ou texto simples)
Imagens
Vídeo
Áudio
Áudio (streaming)
Tipos de saída
Texto
Texto (streaming)
Código
Saída estruturada (como JSON)
Imagens
Áudio
Áudio (streaming)

Para saber mais sobre os tipos de arquivo compatíveis, consulte Arquivos de entrada e requisitos compatíveis.

Recursos e funcionalidades compatíveis

Estas são as funcionalidades e os recursos compatíveis ao usar cada modelo com Firebase AI Logic:

	<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Gerar texto com base em entradas somente de texto ou multimodais	intercalado ou como parte da imagem	somente streaming
Gerar imagens (Gemini ou Imagen)
Gerar áudio		somente streaming
Gerar saída estruturada (como JSON)
Analisar documentos (PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão)
Analisar áudio		somente streaming
Chat multiturno
Chamada de função (ferramentas)
Contar tokens
Instruções do sistema
Streaming multimodal bidirecional

Especificações e limitações

Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:

Propriedade	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen
Janela de contexto * Limite total de tokens (entrada e saída combinadas)	1.048.576 tokens	1.048.576 tokens	1.048.576 tokens	1.048.576 tokens	1.048.576 tokens	32.768 tokens	32.768 tokens	480 tokens
Limite de token de saída *	65.536 tokens	65.536 tokens	65.536 tokens	8.192 tokens	8.192 tokens	8.192 tokens	8.192 tokens	---
Data de limite de conhecimento	Janeiro de 2025	Janeiro de 2025	Janeiro de 2025	Junho de 2024	Junho de 2024	Agosto de 2024	Agosto de 2024	---
PDFs (por solicitação)
Número máximo de arquivos PDF de entrada **	3.000 arquivos	3.000 arquivos	3.000 arquivos	3.000 arquivos	3.000 arquivos	3.000 arquivos	---	---
Número máximo de páginas por arquivo PDF de entrada **	1.000 páginas	1.000 páginas	1.000 páginas	1.000 páginas	1.000 páginas	1.000 páginas	---	---
Tamanho máximo por arquivo PDF de entrada	50 MB	50 MB	50 MB	50 MB	50 MB	50 MB	---	---
Imagens (por solicitação)
Número máximo de imagens de entrada	3.000 imagens	3.000 imagens	3.000 imagens	3.000 imagens	3.000 imagens	3.000 imagens	---	---
Número máximo de imagens de saída	---	---	---	---	---	10 imagens	---	4 imagens
Tamanho máximo por imagem codificada em base64 de entrada	7 MB	7 MB	7 MB	7 MB	7 MB	7 MB	---	---
Vídeo (por solicitação)
Número máximo de arquivos de vídeo de entrada	10 arquivos	10 arquivos	10 arquivos	10 arquivos	10 arquivos	10 arquivos	---	---
Duração máxima de todos os vídeos de entrada (somente frames)	Cerca de 60 minutos	Cerca de 60 minutos	Cerca de 60 minutos	Cerca de 60 minutos	Cerca de 60 minutos	Cerca de 60 minutos	---	---
Duração máxima de todos os vídeos de entrada (frames e áudio)	aproximadamente 45 minutos	aproximadamente 45 minutos	aproximadamente 45 minutos	aproximadamente 45 minutos	aproximadamente 45 minutos	aproximadamente 45 minutos	---	---
Áudio (por solicitação)
Número máximo de arquivos de áudio de entrada	1 arquivo	1 arquivo	1 arquivo	1 arquivo	1 arquivo	1 arquivo	---	---
Número máximo de arquivos de áudio de saída	---	---	---	---	---	---	---	---
Comprimento máximo de todo o áudio de entrada	Cerca de 8,4 horas	Cerca de 8,4 horas	Cerca de 8,4 horas	Cerca de 8,4 horas	Cerca de 8,4 horas	Cerca de 8,4 horas	---	---
Comprimento máximo de todo o áudio de saída	---	---	---	---	---	---	---	---

^{*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.}

^{**
Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como
uma imagem. O número de páginas permitido em uma solicitação é limitado ao número
de imagens que o modelo aceita.}

Encontrar mais informações detalhadas

As cotas e os preços são diferentes para cada modelo. O preço também depende da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada compatíveis, como especificar o tipo MIME e como garantir que seus arquivos de entrada e solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Requisitos e tipos de arquivos de entrada compatíveis.

Importante: o limite de tamanho total da solicitação é de 20 MB. Para enviar arquivos grandes, confira as opções de envio de arquivos em solicitações multimodais.

Controle de versões e padrões de nomenclatura de modelos

Os modelos são oferecidos em versões estável, prévia e experimental. Para facilitar, há suporte para aliases sem valores de versão explícitos.

Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão / Etapa da versão		Descrição	Padrão de nome do modelo
Estável		As versões *estáveis* estão disponíveis e têm suporte para uso em produção a partir da data de lançamento. Normalmente, uma versão estável de um modelo é lançada com uma data de desativação, que indica o último dia em que o modelo fica disponível. Depois dessa data, o modelo não estará mais acessível nem terá suporte do Google.	Modelos Gemini 2.5 Os nomes de modelos de versões estáveis não têm sufixo Exemplo: `gemini-2.5-pro` Modelos Gemini 2.0 e Imagen Os nomes de modelos de versões estáveis são anexados com um número de versão específico de três dígitos. Exemplo: `gemini-2.0-flash-001` Exemplo: `imagen-3.0-generate-002`
	Alias estável atualizado automaticamente (somente modelos Gemini 2.0)	Os aliases estáveis *atualizados automaticamente* sempre apontam para a versão mais recente estável desse modelo. Se uma nova versão estável for lançada, o alias atualizado automaticamente começará a apontar para essa nova versão estável.	Somente modelos Gemini 2.0 Os nomes de modelos de aliases não têm sufixo Exemplo: `gemini-2.0-flash`
Visualizar		As versões de *pré-lançamento* têm novos recursos e são consideradas instáveis. Esses modelos não são recomendados para uso em produção, vêm com limites de taxa mais restritivos e podem ter requisitos de faturamento. Para a Vertex AI Gemini API, os modelos de prévia lançados após junho de 2025 geralmente exigem que você defina o local do modelo como `global`.	Os nomes dos modelos de versões de pré-lançamento são anexados com `-preview` junto com a data de lançamento do modelo (`-MM-DD`). Exemplo: `gemini-2.5-flash-preview-04-17` (lançado em 17 de abril de 2025)
Experimental		As versões *experimentais* têm novos recursos e são consideradas instáveis. Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir testes com nossos recursos mais recentes. Para o Vertex AI Gemini API, os modelos experimentais lançados depois de junho de 2025 exigem que você defina o local do modelo como `global`.	Os nomes de modelos de versões experimentais são anexados com `-exp` junto com a data de lançamento do modelo (`-MM-DD`). Exemplo: `gemini-2.5-pro-exp-03-25` (lançado em 25 de março de 2025)
Aposentado		*Versões desativadas* já passaram da data de desativação e foram desativadas permanentemente. Os modelos desativados não estão mais acessíveis nem são compatíveis com o Google, e as solicitações que fazem referência a um ID de modelo desativado geralmente retornam um erro 404.	---

Nomes de modelos disponíveis

Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.

Listar todos os modelos disponíveis de maneira programática

É possível listar todos os nomes de modelos disponíveis usando a API REST:

Gemini Developer API: chame o endpoint models.list
Vertex AI Gemini API: chame o endpoint publishers.models.list

A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só é compatível com os modelos Gemini e Imagen descritos nesta página. Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo de base.

Gemini nomes de modelos

Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.

Gemini 2.5 Pro nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.5-pro`	A versão estável mais recente do Gemini 2.5 Pro	Estável	2025-06-17	A partir de 2026-06-17
`gemini-2.5-pro-preview-06-05`	Versão de pré-lançamento que aponta para a versão estável mais recente de Gemini 2.5 Pro (atualmente `gemini-2.5-pro`)	Visualizar	2025-06-05	A partir de 2025-07-15
`gemini-2.5-pro-preview-05-06`	Versão de pré-lançamento que aponta para a versão estável mais recente de Gemini 2.5 Pro^* (atualmente `gemini-2.5-pro`)	Visualizar	2025-05-06	A partir de 2025-07-15
`gemini-2.5-pro-preview-03-25`	Versão de pré-lançamento que aponta para a versão estável mais recente de Gemini 2.5 Pro^* (atualmente `gemini-2.5-pro`)	Visualizar	25/03/2025	A partir de 2025-07-15

^{* As versões de prévia atuais dos modelos Gemini 2.5 Pro
começarão a apontar para a versão estável em 19 de junho de 2025.}

Gemini 2.5 Flash nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.5-flash`	A versão estável mais recente do Gemini 2.5 Flash	Estável	2025-06-17	A partir de 2026-06-17
`gemini-2.5-flash-preview-05-20`	Versão de pré-lançamento que aponta para a versão estável mais recente de Gemini 2.5 Flash (atualmente `gemini-2.5-flash`)	Visualizar	2025-05-20	A partir de 2025-07-15
`gemini-2.5-flash-preview-04-17`	Versão de pré-lançamento que aponta para a versão estável mais recente de Gemini 2.5 Flash^* (atualmente `gemini-2.5-flash`)	Visualizar	2025-04-17	A partir de 2025-07-15

^{* As versões de prévia atuais dos modelos Gemini 2.5 Flash
começarão a apontar para a versão estável em 19 de junho de 2025.}

Gemini 2.5 Flash‑Lite nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.5-flash-lite-preview-06-17`	Versão de prévia inicial do Gemini 2.5 Flash‑Lite	Visualizar	2025-06-17	A ser determinado

Gemini 2.0 Flash nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.0-flash-001`	A versão estável mais recente do Gemini 2.0 Flash	Estável	2025-02-05	A partir de 2026-02-05
`gemini-2.0-flash`	Alias atualizado automaticamente que aponta para a versão estável mais recente do Gemini 2.0 Flash (atualmente `gemini-2.0-flash-001`)	Estável	2025-02-10	---

Gemini 2.0 Flash‑Lite nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.0-flash-lite-001`	A versão estável mais recente do Gemini 2.0 Flash‑Lite	Estável	2025-02-25	A partir de 2026-02-25
`gemini-2.0-flash-lite`	Alias atualizado automaticamente que aponta para a versão estável mais recente do Gemini 2.0 Flash‑Lite (atualmente `gemini-2.0-flash-lite-001`)	Estável	2025-02-25	---

Gemini 2.0 Flash Image Generation nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.0-flash-preview-image-generation` ¹	Versão de prévia para Gemini 2.0 Flash Image Generation	Visualizar	2025-05-06	A ser determinado

Gemini 2.0 Flash Live nomes de modelos

Disponível apenas quando você usa o Vertex AI Gemini API como seu provedor de API.

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`gemini-2.0-flash-live-preview-04-09` ¹	Versão de prévia para Gemini 2.0 Flash Live	Visualizar	2025-04-09	A ser determinado

^{1 Não há suporte ao usar o Gemini Developer API
com SDKs Firebase AI Logic.}

Imagen nomes de modelos

Para exemplos de inicialização da sua plataforma, consulte o guia de geração de imagens com Imagen.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.

Imagen 4 nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`imagen-4.0-generate-preview-06-06` ²	Versão de pré-lançamento de Imagen 4	Visualizar	2025-06-06	A ser determinado
`imagen-4.0-generate-preview-05-20` ²	Versão de pré-lançamento de Imagen 4	Visualizar	2025-05-20	A partir de 2025-07-07

Imagen 4 Fast nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`imagen-4.0-fast-generate-preview-06-06` ²	Versão de pré-lançamento de Imagen 4 Fast	Visualizar	2025-06-06	A ser determinado

Imagen 4 Ultra nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`imagen-4.0-ultra-generate-preview-06-06` ²	Versão de pré-lançamento de Imagen 4 Ultra	Visualizar	2025-06-06	A ser determinado
`imagen-4.0-ultra-generate-exp-05-20` ²	Versão experimental do Imagen 4 Ultra	Experimental	2025-05-20	A partir de 2025-07-07

Imagen 3 nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`imagen-3.0-generate-002`	A versão estável mais recente do Imagen 3	Estável	2025-01-23	A partir de 23 de janeiro de 2026
`imagen-3.0-generate-001` ²	Versão estável inicial do Imagen 3	Estável	2024-07-31	A partir de 31 de julho de 2025

Imagen 3 Fast nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
`imagen-3.0-fast-generate-001` ²	Versão estável inicial do Imagen 3 Fast	Estável	2024-07-31	A partir de 31 de julho de 2025

^{2 Não é compatível com o Gemini Developer API, independente
de como você acessa a API.}

Idiomas disponíveis

Gemini

Todos os modelos Gemini podem entender e responder nos seguintes idiomas:

Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes outros idiomas:

Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)

Imagen

Disponibilidade geral: inglês
Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol

Informações sobre modelos mais antigos

O Firebase AI Logic é compatível com os modelos ativos Gemini mais antigos (como os modelos Gemini 1.5).

Firebase AI Logic não é compatível com os modelos Imagen mais antigos (como Imagen 2).

Modelo	Entrada	Saída	Otimizado para
Gemini 1.5 Pro `gemini-1.5-pro-002`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Suporta tarefas de raciocínio complexas que exigem mais inteligência; Contexto longo de 2 milhões
Gemini 1.5 Flash `gemini-1.5-flash-002`	texto, código, PDFs, imagens, vídeo, áudio	texto, código, JSON	Oferece desempenho rápido e versátil em uma variedade de tarefas
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	~~texto, código, PDFs, imagens, vídeo (somente frames)~~	~~texto, código~~	~~Processa texto, imagens e vídeo para respostas de texto ou código. Não pode ser usado para chat.~~
Gemini 1.0 Pro `gemini-1.0-pro-002`	~~texto, código~~	~~texto, código~~	~~Tarefas de linguagem natural, chat de texto e código com várias interações e geração de código~~

Ver entradas e saídas compatíveis de modelos mais antigos

Estes são os tipos de entrada e saída ao usar cada modelo com Firebase AI Logic:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Tipos de entrada
Texto
Código
Documentos (PDFs ou texto simples)
Imagens
Vídeo
Áudio
Áudio (streaming)
Tipos de saída
Texto
Código
Saída estruturada (como JSON)
Imagens, vídeo e áudio

Recursos e funcionalidades compatíveis de modelos mais antigos

Estas são as funcionalidades e os recursos ao usar cada modelo com Firebase AI Logic:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Gerar texto com base em entradas somente de texto
Gerar texto com base em uma entrada multimodal
Gerar imagens
Gerar áudio
Gerar saída estruturada (como JSON)
Analisar documentos (PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão)
Analisar áudio
Chat multiturno
Chamada de função (ferramentas)
Contar tokens e caracteres faturáveis
Instruções do sistema
Streaming multimodal bidirecional

Especificações e limitações de modelos mais antigos

Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Janela de contexto * Limite total de tokens (entrada e saída combinadas)	2.097.152 tokens	1.048.576 tokens	16.384 tokens	32.760 tokens
Limite de token de saída *	8.192 tokens	8.192 tokens	2.048 tokens	8.192 tokens
Data de limite de conhecimento	Maio de 2024	Maio de 2024	Fevereiro de 2023	Fevereiro de 2023
PDFs (por solicitação)
Número máximo de arquivos PDF de entrada **	3.000 arquivos	3.000 arquivos	16 arquivos	---
Número máximo de páginas por arquivo PDF de entrada **	1.000 páginas	1.000 páginas	16 páginas	---
Tamanho máximo por arquivo PDF de entrada	50 MB	50 MB	50 MB	---
Imagens (por solicitação)
Número máximo de imagens de entrada	3.000 imagens	3.000 imagens	16 imagens	---
Número máximo de imagens de saída	---	---	---	---
Tamanho máximo por imagem codificada em base64 de entrada	7 MB	7 MB	7 MB	---
Vídeo (por solicitação)
Número máximo de arquivos de vídeo de entrada	10 arquivos	10 arquivos	1 arquivo	---
Duração máxima de todos os vídeos de entrada (somente frames)	Cerca de 60 minutos	Cerca de 60 minutos	2 minutos	---
Duração máxima de todos os vídeos de entrada (frames e áudio)	aproximadamente 45 minutos	aproximadamente 45 minutos	---	---
Áudio (por solicitação)
Número máximo de arquivos de áudio de entrada	1 arquivo	1 arquivo	---	---
Número máximo de arquivos de áudio de saída	---	---	---	---
Comprimento máximo de todo o áudio de entrada	Cerca de 8,4 horas	Cerca de 8,4 horas	---	---
Comprimento máximo de todo o áudio de saída	---	---	---	---

Nomes de modelos mais antigos disponíveis (incluindo datas de desativação)

Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.

Nomes dos modelos do Gemini 1.5 Pro

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
Versões estáveis
`gemini-1.5-pro-002`	A versão estável mais recente do Gemini 1.5 Pro	Próxima desativação	2024-09-24	2025-09-24
`gemini-1.5-pro-001`	Versão estável inicial do Gemini 1.5 Pro	Próxima desativação	2024-05-24	2025-05-24
Alias estável atualizado automaticamente
`gemini-1.5-pro`	Aponta para a versão estável mais recente do 1.5 Pro (atualmente `gemini-1.5-pro-002`)	Próxima desativação	2024-09-24	2025-09-24

Gemini 1.5 Flash nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
Versões estáveis
`gemini-1.5-flash-002`	A versão estável mais recente do Gemini 1.5 Flash	Próxima desativação	2024-09-24	2025-09-24
`gemini-1.5-flash-001`	Versão estável inicial do Gemini 1.5 Flash	Próxima desativação	2024-05-24	2025-05-24
Alias estável atualizado automaticamente
`gemini-1.5-flash`	Aponta para a versão estável mais recente do 1.5 Flash (atualmente `gemini-1.5-flash-002`)	Próxima desativação	2024-09-24	2025-09-24

Gemini 1.0 Pro Vision nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
Versões estáveis
`gemini-1.0-pro-vision-001`	A versão estável mais recente do Gemini 1.0 Pro Vision	Desativado	2024-02-15	2025-04-21
Alias estável atualizado automaticamente
`gemini-1.0-pro-vision`	Aponta para a versão estável mais recente do 1.5 Pro Vision (atualmente `gemini-1.5-pro-vision-001`)	Desativado	2024-01-04	2025-04-21

Gemini 1.0 Pro nomes de modelos

Nome do modelo	Descrição	Etapa de lançamento	Data da versão	Data de desativação
Versões estáveis
`gemini-1.0-pro-002`	A versão estável mais recente do Gemini 1.0 Pro	Desativado	2024-04-09	2025-04-21
`gemini-1.0-pro-001`	Versão estável do Gemini 1.0 Pro	Desativado	2024-02-15	2025-04-21
Alias estável atualizado automaticamente
`gemini-1.0-pro`	Aponta para a versão estável mais recente do 1.0 Pro (atualmente `gemini-1.0-pro-002`)	Desativado	2024-02-15	2025-04-21

Próximas etapas

Teste os recursos do Gemini API

Crie conversas multiturno (chat).
Gerar texto com base em comandos somente de texto.
Gere texto usando comandos com vários tipos de arquivos, como imagens, PDFs, vídeos e áudios.
Gerar saída estruturada (como JSON) com base em comandos de texto e multimodais.
Gerar imagens com base em comandos de texto (Gemini ou Imagen).
Entrada e saída de stream (incluindo áudio) usando o Gemini Live API.
Use a chamada de função para conectar modelos generativos a sistemas e informações externas.