The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini compatíveis diretamente do app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio.

Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic aceita e não aceita.

Modelos de uso geral

Acessar tabelas com detalhes do modelo

Gemini 3.x modelos de uso geral

NOSSO MODELO DE RACIOCÍNIO AVANÇADO

Gemini 3.1 Pro

gemini-3.1-pro-preview

Inteligência avançada, habilidades complexas de resolução de problemas e recursos avançados de codificação de agentes e de vibe. (faturamento obrigatório)

RÁPIDO E INTELIGENTE

Gemini 3.5 Flash

gemini-3.5-flash

Desempenho de classe Frontier rivalizando com modelos maiores a uma fração do custo. (faturamento não obrigatório)

ULTRA FAST

Gemini 3.1 Flash-Lite

gemini-3.1-flash-lite

Modelo de alto volume e sensível a custos com o desempenho e a qualidade da série Gemini 3. (faturamento não obrigatório)

Gemini 2.5 modelos de uso geral

Gemini 2.5 Pro (gemini-2.5-pro): o modelo mais avançado para tarefas complexas da série Gemini 2.5, com recursos de programação e raciocínio avançados. (faturamento não obrigatório)
Gemini 2.5 Flash (gemini-2.5-flash): o melhor modelo de custo-benefício da série Gemini 2.5, especialmente para tarefas de baixa latência e alto volume que exigem raciocínio. (faturamento não obrigatório)
Gemini 2.5 Flash (gemini-2.5-flash-lite): o modelo multimodal mais rápido e econômico da série Gemini 2.5. (faturamento não obrigatório)

Modelos de geração de imagens

Acessar tabelas com detalhes do modelo

Modelos de geração de imagens do Gemini 3.x

Imagens no Gemini 3 Pro (Nano Banana Pro)

gemini-3-pro-image

Modelos de edição e geração de imagens de última geração para criação de imagens nativas altamente contextuais. (faturamento obrigatório)

Gemini 3.1 Flash Image (Nano Banana 2)

gemini-3.1-flash-image

Geração e edição de imagens eficientes e de alta qualidade, otimizadas para velocidade e casos de uso de alto volume. (faturamento obrigatório)

Imagem do Gemini 3.1 Flash-Lite (Nano Banana 2 Lite)

gemini-3.1-flash-lite-image

Geração e edição de imagens de custo-benefício e latência ultrabaixa, projetadas para casos de uso interativos de alto volume. (faturamento obrigatório)

Modelos de geração de imagens do Gemini 2.5

Gemini 2.5 Flash Image (gemini-2.5-flash-image, também conhecido como "Nano Banana"): projetado para velocidade e eficiência, otimizado para tarefas de alto volume e baixa latência. (faturamento obrigatório)

Modelos de geração de áudio

É possível gerar áudio transmitido por streaming com modelos que oferecem suporte ao Gemini Live API.

Acessar a página com detalhes do modelo

Gemini 2.5 Flash com áudio nativo da API Gemini Live

API Gemini Developer: gemini-2.5-flash-native-audio-preview-12-2025

API Gemini da Vertex AI: gemini-live-2.5-flash-native-audio

Permite interações de voz e vídeo em tempo real e de baixa latência com um modelo do Gemini bidirecional. (faturamento não obrigatório)

O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.

Comparar modelos:
- Entrada e saída compatíveis
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, por exemplo, número máximo de tokens de entrada ou duração máxima do vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas disponíveis para os modelos

Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos de geração anterior.

Para detalhes sobre os modelos Gemini Live API (como gemini-live-2.5-flash-native-audio), consulte Limites e especificações do Live API.

Comparação de modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que procura nas subseções a seguir, consulte a documentação do provedor de API escolhido: Gemini Developer API ou Vertex AI Gemini API.

Para detalhes sobre os modelos Gemini Live API (como gemini-live-2.5-flash-native-audio), consulte Limites e especificações do Live API.

Entrada e saída compatíveis

A tabela a seguir lista os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic.

Para saber mais sobre os tipos de arquivos compatíveis, consulte Arquivos de entrada e requisitos compatíveis.

	<span="notranslate">Gemini 3.x Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro Imagem </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite Imagem </span="notranslate">
Tipos de entrada
Texto
Código
Documentos (PDFs ou texto simples)
Imagens
Vídeo
Áudio
Tipos de saída
Texto
Texto (streaming)
Código
Saída estruturada (como JSON)
Imagens
Áudio

Entrada e saída compatíveis (modelos Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">		<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
Tipos de entrada
Texto
Código
Documentos (PDFs ou texto simples)
Imagens
Vídeo
Áudio
Tipos de saída
Texto
Texto (streaming)
Código
Saída estruturada (como JSON)
Imagens
Áudio

Recursos e funcionalidades compatíveis

A tabela a seguir lista os recursos e funcionalidades compatíveis ao usar cada modelo com o Firebase AI Logic.

	<span="notranslate">Gemini 3.x Pro Imagem </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite Imagem </span="notranslate">
Pensamento
Gerar texto com base em entradas somente de texto ou multimodais	intercaladas ou como parte da imagem	intercaladas ou como parte da imagem	intercaladas ou como parte da imagem
Gerar imagens
Editar imagens
Gerar áudio
Gerar saída estruturada (como JSON)
Analisar documentos (PDFs ou texto simples) (text-output \| image-output)
Analisar imagens (text-output \| image-output)
Analisar vídeo (text-output \| image-output)
Analisar áudio
Conversa multiturno
Streaming multimodal bidirecional
Ferramentas compatíveis
Chamadas de função
Execução de código
Contexto do URL
Embasamento com Google Search
Embasamento com Google Maps

Recursos e funcionalidades compatíveis (modelos Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">		<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
Pensamento
Gerar texto com base em entradas somente de texto ou multimodais			intercaladas ou como parte da imagem
Gerar imagens
Editar imagens
Gerar áudio
Gerar saída estruturada (como JSON)
Analisar documentos (PDFs ou texto simples) (text-output \| image-output)
Analisar imagens (text-output \| image-output)
Analisar vídeo (text-output \| image-output)
Analisar áudio
Conversa multiturno
Streaming multimodal bidirecional
Ferramentas compatíveis
Chamadas de função
Execução de código
Contexto do URL
Embasamento com Google Search
Embasamento com Google Maps

Especificações e limitações

A tabela a seguir lista as especificações e limitações ao usar cada modelo com o Firebase AI Logic.

Propriedade	<span="notranslate">Gemini 3.x Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro Imagem </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite Imagem </span="notranslate">
Limite de token de entrada *	1.048.576 tokens	65.536 tokens	131.072 tokens	65.536 tokens
Limite de token de saída *	65.536 tokens	32.768 tokens	32.768 tokens	4.096 tokens
Data limite de conhecimento	Janeiro de 2025	Janeiro de 2025	Janeiro de 2025	Janeiro de 2025
PDFs (por solicitação)
Número máximo de arquivos PDF de entrada **	900 arquivos	14 arquivos	14 arquivos	14 arquivos
Número máximo de páginas por arquivo PDF de entrada **	900 páginas	14 páginas	14 páginas	14 páginas
Tamanho máximo por arquivo PDF de entrada	50 MB	50 MB	50 MB	50 MB
Imagens (por solicitação)
Número máximo de imagens de entrada	1.000 imagens	14 imagens	14 imagens	14 imagens
Tamanho máximo por imagem codificada em base64 de entrada	7 MB	7 MB	7 MB	7 MB
Número máximo de imagens de saída	---	Até o limite de tokens de saída	Até o limite de tokens de saída	Até o limite de tokens de saída
Vídeo (por solicitação)
Número máximo de arquivos de vídeo de entrada	10 arquivos	---	Até o limite de tokens de entrada	Até o limite de tokens de entrada
Duração máxima de todos os vídeos de entrada (somente frames)	aproximadamente 60 minutos	---	aproximadamente 25 minutos	~12 minutos
Duração máxima de todos os vídeos de entrada (frames e áudio)	aproximadamente 45 minutos	---	---	---
Áudio (por solicitação)
Número máximo de arquivos de áudio de entrada	1 arquivo	---	---	---
Duração máxima de todo o áudio de entrada	Cerca de 8,4 horas	---	---	---

Especificações e limitações (modelos Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
Limite de token de entrada *	1.048.576 tokens	32.768 tokens
Limite de token de saída *	65.536 tokens	8.192 tokens
Data limite de conhecimento	Janeiro de 2025	Junho de 2024
PDFs (por solicitação)
Número máximo de arquivos PDF de entrada **	3.000 arquivos	3 arquivos
Número máximo de páginas por arquivo PDF de entrada **	1.000 páginas	3 páginas
Tamanho máximo por arquivo PDF de entrada	50 MB	50 MB
Imagens (por solicitação)
Número máximo de imagens de entrada	3.000 imagens	3 imagens
Tamanho máximo por imagem codificada em base64 de entrada	7 MB	7 MB
Número máximo de imagens de saída	---	Até o limite de tokens de saída
Vídeo (por solicitação)
Número máximo de arquivos de vídeo de entrada	10 arquivos	---
Duração máxima de todos os vídeos de entrada (somente frames)	aproximadamente 60 minutos	---
Duração máxima de todos os vídeos de entrada (frames e áudio)	aproximadamente 45 minutos	---
Áudio (por solicitação)
Número máximo de arquivos de áudio de entrada	1 arquivo	---
Duração máxima de todo o áudio de entrada	Cerca de 8,4 horas	---

^{*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.}

^{**
Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como
uma imagem. O número de páginas permitido em uma solicitação é limitado ao número
de imagens que o modelo aceita.}

Encontrar mais informações detalhadas

As cotas e os preços são diferentes para cada modelo. Os preços também dependem da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada aceitos, como especificar o tipo MIME e como garantir que seus arquivos de entrada e solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Arquivos de entrada e requisitos aceitos.

Importante: o limite de tamanho total da solicitação é de 20 MB. Para enviar arquivos grandes, consulte as opções de envio de arquivos em solicitações multimodais.
Para detalhes sobre os modelos Gemini Live API, consulte Limites e especificações do Live API.

Controle de versões e padrões de nomenclatura de modelos

Os modelos são oferecidos em versões estável, prévia e experimental. Para facilidade, há suporte para aliases sem valores de versão explícitos.

Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão / Etapa de lançamento	Descrição	Padrão de nome do modelo
Estável	As versões *estáveis* estão disponíveis e têm suporte para uso em produção a partir da data de lançamento. Normalmente, uma versão estável de um modelo é lançada com uma data de desativação, que indica o último dia em que o modelo fica disponível. Depois dessa data, o modelo não estará mais acessível nem terá suporte do Google.	Modelos Gemini 2.5 e mais recentes Os nomes de modelos de versões estáveis não têm sufixo Exemplo: `gemini-3.5-flash`
Visualizar	As versões de *pré-lançamento* têm novos recursos e são consideradas instáveis. Esses modelos não são recomendados para uso em produção, vêm com limites de taxa mais restritivos e podem ter requisitos de faturamento. Esses modelos são desativados (descontinuados) algumas semanas ou meses após o lançamento da versão estável associada. Para a Vertex AI Gemini API, os modelos de prévia geralmente exigem que você defina o local de acesso ao modelo como `global`.	Os nomes dos modelos de versões de prévia são anexados com `-preview` e geralmente a data de lançamento do modelo (`-MM-DD` para modelos mais antigos ou `-MM-YYYY` para modelos mais recentes). Exemplos: `gemini-2.5-flash-preview-04-17` (lançado em 17 de abril de 2025) ou `gemini-2.5-flash-preview-09-2025` (lançado em setembro de 2025) ou `gemini-3-pro-preview` (lançado em novembro de 2025)
Experimental	As versões *experimentais* têm novos recursos e são consideradas instáveis. Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir testes com nossos recursos mais recentes. Esses modelos são desativados (descontinuados) algumas semanas ou meses após o lançamento da versão estável associada. Para o Vertex AI Gemini API, os modelos experimentais exigem que você defina o local de acesso ao modelo como `global`.	Os nomes de modelos de versões experimentais são anexados com `-exp` junto com a data de lançamento do modelo (`-MM-DD`). Exemplo: `gemini-2.5-pro-exp-03-25` (lançado em 25 de março de 2025)
Desligamento (desativado)	As versões *desativadas (descontinuadas)* já passaram da data de desativação (descontinuação) e foram desativadas permanentemente. Os modelos desativados não estão mais acessíveis nem têm suporte do Google, e uma solicitação usando o nome de um modelo desativado retorna um erro 404.	---

Nomes de modelos disponíveis

Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.

Modelos de uso geral (como o gemini-3.5-flash)
Modelos de geração de imagens (como o gemini-3.1-flash-image, também conhecido como modelos "Nano Banana")
Modelos de geração de áudio (como o gemini-live-2.5-flash-native-audio)

Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desligamento), consulte padrões de nomenclatura e controle de versões de modelos.

Listar todos os modelos disponíveis de maneira programática

É possível listar todos os nomes de modelos disponíveis usando a API REST:

Gemini Developer API: chame o endpoint models.list.
Vertex AI Gemini API: chame o endpoint publishers.models.list.

A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só aceita os modelos Gemini descritos nesta página.

Modelos de uso geral