Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini e Imagen compatíveis diretamente do seu app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. É possível pedir aos modelos Imagen para gerar imagens com texto.

Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic oferece suporte e não oferece.

Pular para comparações de modelos

NOSSO MODELO MAIS INTELIGENTE

gemini-3-pro-preview

Nosso melhor modelo para compreensão multimodal e nosso agente mais eficiente e modelo de codificação de vibe até agora, oferecendo recursos visuais mais ricos e interatividade mais profunda, tudo isso com base em um raciocínio de última geração. (faturamento obrigatório)


NOSSO MODELO DE RACIOCÍNIO AVANÇADO

gemini-2.5-pro

Nosso modelo de pensamento de última geração, capaz de raciocinar sobre problemas complexos em código, matemática e STEM, além de analisar grandes conjuntos de dados, bases de código e documentos usando contexto longo.

RÁPIDO E INTELIGENTE

gemini-2.5-flash

Nosso melhor modelo em termos de custo-benefício, com recursos completos. O 2.5 Flash é ideal para processamento em grande escala, tarefas de baixo volume e baixa latência que exigem pensamento e casos de uso de agentes.

ULTRA FAST

gemini-2.5-flash-lite

Nosso modelo flash mais rápido, otimizado para eficiência de custo e alta capacidade de processamento.

Modelos de geração de imagens

Você pode gerar imagens com os modelos Gemini ou Imagen.

Pular para comparações de modelos

Gemini

gemini-2.5-flash-image

Nosso modelo Flash padrão foi atualizado para fluxos de trabalho criativos rápidos com recursos de geração de imagens e edição conversacional em várias etapas. (faturamento obrigatório)

Imagen

imagen-4.0-generate-001

Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)

imagen-4.0-fast-generate-001

Gera imagens para prototipagem ou casos de uso de baixa latência. (faturamento obrigatório)

imagen-4.0-ultra-generate-001

Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)

Modelos de geração anterior

Os seguintes modelos estão ativos, mas são de geração anterior. Recomendamos usar um dos modelos mais recentes sempre que possível.

Pular para comparações de modelos

Modelos do Gemini

NOSSO MODELO DE TRABALHO DE SEGUNDA GERAÇÃO

gemini-2.0-flash-001

Nosso modelo de segunda geração, com uma janela de contexto de 1 milhão de tokens. Oferece recursos de última geração e capacidades aprimoradas, incluindo velocidade superior e uso de ferramentas nativas.

NOSSO MODELO RÁPIDO DE SEGUNDA GERAÇÃO

gemini-2.0-flash-lite-001

Nosso modelo pequeno de segunda geração, com uma janela de contexto de 1 milhão de tokens. Otimizado para eficiência de custo e baixa latência.


O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.

  • Comparar modelos:

    • Entrada e saída compatíveis
    • Comparação de alto nível dos recursos compatíveis
    • Especificações e limitações, por exemplo, número máximo de tokens de entrada ou duração máxima do vídeo de entrada
  • Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental

  • Listas de nomes de modelos disponíveis para incluir no código durante a inicialização

  • Listas de idiomas disponíveis para os modelos

Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos de geração anterior.



Comparação de modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que procura nas subseções a seguir, consulte a documentação do provedor de API escolhido para mais detalhes:

Entrada e saída compatíveis

Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Live </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Tipos de entrada
Texto
Texto (streaming)
Código
Documentos
(PDFs ou texto simples)
Imagens
Vídeo
Áudio
Áudio (streaming)
Tipos de saída
Texto
Texto (streaming)
Código
Saída estruturada
(como JSON)
Imagens
Áudio
Áudio (streaming)

Para saber mais sobre os tipos de arquivo compatíveis, consulte Arquivos de entrada e requisitos compatíveis.

Recursos e funcionalidades compatíveis

Estas são as funcionalidades e os recursos compatíveis ao usar cada modelo com Firebase AI Logic:

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Live </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Pensar
Gerar texto com base em entradas somente de texto ou multimodais intercalado ou como parte da imagem somente streaming
Gerar imagens
(Gemini ou Imagen)
Editar imagens
(Gemini ou Imagen)
Gerar áudio somente streaming
Gerar saída estruturada
(como JSON)
Analisar documentos
(PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão)
Analisar áudio somente streaming
Chat multiturno
Streaming multimodal bidirecional
Chamadas de função
Execução de código
Embasamento com a Pesquisa Google
Instruções do sistema
Contar tokens

Especificações e limitações

Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:

Propriedade <span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Imagem de flash do Gemini
2.5 
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Live </span="notranslate">
Imagen (gerar) Imagen (capacidade)
Janela de contexto *
Limite total de tokens
(entrada e saída combinadas)
1 milhão de tokens 1.048.576 tokens 32.768 tokens 32.768 tokens 480 tokens 480 tokens
Limite de token de saída * 64 mil tokens 65.536 tokens 8.192 tokens 8.192 tokens --- ---
Data do limite de conhecimento Janeiro de 2025 Janeiro de 2025 Junho de 2025 Agosto de 2024 --- ---
PDFs (por solicitação)
Número máximo
de arquivos PDF de entrada **
900 arquivos 3.000 arquivos 3 arquivos --- --- ---
Número máximo
de páginas
por arquivo PDF de entrada **
900 páginas 1.000 páginas 3 páginas --- --- ---
Tamanho máximo
por arquivo PDF de entrada
50 MB 50 MB 50 MB --- --- ---
Imagens (por solicitação)
Número máximo
de imagens de entrada
1.000 imagens 3.000 imagens 3 imagens --- --- 4 imagens
Número máximo
de imagens de saída
--- --- 10 imagens --- 4 imagens 4 imagens
Tamanho máximo
por imagem codificada em base64 de entrada
7 MB 7 MB 7 MB --- --- ---
Vídeo (por solicitação)
Número máximo
de arquivos de vídeo de entrada
10 arquivos 10 arquivos --- --- --- ---
Duração máxima
de todos os vídeos de entrada
(somente frames)
aproximadamente 60 minutos aproximadamente 60 minutos --- --- --- ---
Duração máxima
de todos os vídeos de entrada
(frames e áudio)
aproximadamente 45 minutos aproximadamente 45 minutos --- --- --- ---
Áudio (por solicitação)
Número máximo
de arquivos de áudio de entrada
1 arquivo 1 arquivo --- --- --- ---
Número máximo
de arquivos de áudio de saída
--- --- --- --- --- ---
Comprimento máximo
de todo o áudio de entrada
Cerca de 8,4 horas Cerca de 8,4 horas Cerca de 8,4 horas --- --- ---
Comprimento máximo
de todo o áudio de saída
--- --- --- --- --- ---

* Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres, portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.

** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.

Encontrar mais informações detalhadas



Controle de versões e padrões de nomenclatura de modelos

Os modelos são oferecidos em versões estável, prévia e experimental. Para facilidade, aliases sem valores de versão explícitos são aceitos.

Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão /
Etapa da versão
Descrição Padrão de nome do modelo
Estável As versões estáveis estão disponíveis e têm suporte para uso em produção a partir da data de lançamento.
  • Normalmente, uma versão estável de um modelo é lançada com uma data de desativação, que indica o último dia em que o modelo fica disponível. Depois dessa data, o modelo não estará mais acessível nem terá suporte do Google.
  • Modelos Gemini 2.5
    Os nomes de modelos de versões estáveis não têm sufixo

    Exemplo: gemini-2.5-pro

  • Modelos Gemini 2.0 e Imagen
    Os nomes de modelos de versões estáveis são anexados com um número de versão específico de três dígitos.

    Exemplo: gemini-2.0-flash-001
    Exemplo: imagen-3.0-generate-002

Alias estável atualizado automaticamente
(somente modelos Gemini 2.0)
Os aliases estáveis atualizados automaticamente sempre apontam para a versão mais recente estável desse modelo.
  • Se uma nova versão estável for lançada, o alias atualizado automaticamente começará a apontar para essa nova versão estável.

Somente modelos Gemini 2.0
Os nomes de modelos de aliases não têm sufixo

Exemplo: gemini-2.0-flash

Visualizar As versões de pré-lançamento têm novos recursos e são consideradas instáveis.
  • Esses modelos não são recomendados para uso em produção, vêm com limites de taxa mais restritivos e podem ter requisitos de faturamento.
  • Esses modelos são desativados algumas semanas ou meses após o lançamento da versão estável associada.
  • Para a Vertex AI Gemini API, os modelos de prévia lançados após junho de 2025 geralmente exigem que você defina o local do modelo como global.

Os nomes dos modelos de versões de prévia são anexados com -preview e geralmente a data de lançamento do modelo (-MM-DD para modelos mais antigos ou -MM-YYYY para modelos mais recentes)

Exemplos:
gemini-2.5-flash-preview-04-17
(lançado em 17 de abril de 2025)
ou
gemini-2.5-flash-preview-09-2025
(lançado em setembro de 2025)
ou
gemini-3-pro-preview
(lançado em novembro de 2025)

Experimental As versões experimentais têm novos recursos e são consideradas instáveis.
  • Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir a experimentação com nossos recursos mais recentes.
  • Esses modelos são desativados algumas semanas ou meses após o lançamento da versão estável associada.
  • Para o Vertex AI Gemini API, os modelos experimentais lançados depois de junho de 2025 exigem que você defina o local do modelo como global.

Os nomes de modelos de versões experimentais são anexados com -exp, além da data de lançamento do modelo (-MM-DD).

Exemplo: gemini-2.5-pro-exp-03-25
(lançado em 25 de março de 2025)

Aposentado Versões desativadas já passaram da data de desativação e foram desativadas permanentemente.
  • Os modelos desativados não estão mais acessíveis nem têm suporte do Google, e uma solicitação usando um nome de modelo desativado retorna um erro 404.

---



Nomes de modelos disponíveis

Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.

Ir para os nomes dos modelos Gemini Ir para os nomes dos modelos Imagen

Listar todos os modelos disponíveis de maneira programática

É possível listar todos os nomes de modelos disponíveis usando a API REST:

A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só é compatível com os modelos Gemini e Imagen descritos nesta página. Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo de base.

Gemini nomes de modelos

Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.

Gemini 3 Pro nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-3-pro-preview Versão de prévia de Gemini 3 Pro Visualizar 2025-11-18 A ser determinado

Gemini 2.5 Pro nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-pro Versão estável do Gemini 2.5 Pro Estável 2025-06-17 A partir de
2026-06-17

Gemini 2.5 Flash nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash Versão estável do Gemini 2.5 Flash Estável 2025-06-17 A partir de
2026-06-17

Gemini 2.5 Flash‑Lite nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-lite Versão estável do Gemini 2.5 Flash‑Lite Estável 2025-07-22 A partir de
2026-07-22

Nomes de modelos Gemini 2.5 Flash Image (também conhecidos como "nano banana")

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.5-flash-image Versão estável para Gemini 2.5 Flash Image (também conhecida como "nano banana") Estável 2025-10-02 A partir de
2026-10-02

Gemini 2.5 Flash Live nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-live-2.5-flash Versão estável para Gemini 2.5 Flash Live Estável
(GA particular) 1
2025-06-01 A partir de
2026-06-01
gemini-live-2.5-flash-preview 2 Versão de prévia para Gemini 2.5 Flash Live Visualizar 2025-06-01 A ser determinado

O Firebase AI Logic ainda não é compatível com os modelos de áudio nativos (como gemini-2.5-flash-native-audio-preview-09-2025).

1 Entre em contato com o representante da sua equipe de conta do Google Cloud para solicitar acesso. 2 Não é compatível com o Vertex AI Gemini API, seja qual for a forma de acesso.

Gemini 2.0 Flash Live nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
gemini-2.0-flash-live-001 2 Versão estável para Gemini 2.0 Flash Live Estável 2025-04-01 A partir de
2026-04-01
gemini-2.0-flash-live-preview-04-09 Versão de prévia para Gemini 2.0 Flash Live Visualizar 2025-04-09 A ser determinado

2 Não é compatível com o Vertex AI Gemini API, não importa como você acesse.

Imagen nomes de modelos

Para exemplos de inicialização da sua plataforma, consulte o guia de geração de imagens com Imagen.

Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.

Imagen 4 nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-generate-001 Versão estável do Imagen 4 Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 4 Fast nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-fast-generate-001 Versão estável do Imagen 4 Fast Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 4 Ultra nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-4.0-ultra-generate-001 Versão estável do Imagen 4 Ultra Estável 2025-08-14 A partir de 14 de agosto de 2026

Imagen 3 Capability nomes de modelos

Nome do modelo Descrição Etapa de lançamento Data da versão Data de desativação
imagen-3.0-capability-001 3 Versão estável inicial do Imagen 3 Capability Estável 2024-12-10 A partir de 10 de dezembro de 2025

3 Não é compatível com o Gemini Developer API, seja qual for a forma de acesso.



Idiomas compatíveis

Gemini

  • Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:

    Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)

  • Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes outros idiomas:

    Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)

Imagen

  • Disponibilidade geral: inglês

  • Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol



Informações sobre modelos anteriores

Os seguintes modelos estão ativos, mas são de geração anterior. Recomendamos usar um dos modelos mais recentes sempre que possível.

Gemini modelos

Modelo Entrada Saída Descrição
Gemini 2.0 Flash
gemini-2.0-flash-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Nosso modelo multimodal com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas integrado e uma janela de contexto de 1 milhão de tokens
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do 1.5 Flash que querem melhor qualidade pelo mesmo preço e velocidade.

Imagen modelos

Modelo Entrada Saída Descrição
Imagen 3
imagen-3.0-generate-002
texto imagens Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
texto imagens Gera imagens para prototipagem ou casos de uso de baixa latência

2 Não é compatível com o Gemini Developer API, seja qual for a forma de acesso.



Próximas etapas

Teste os recursos do Gemini API