Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini e Imagen compatíveis diretamente do seu app.
Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. É possível pedir aos modelos Imagen para gerar imagens com texto.
Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic oferece suporte e não oferece.
Modelos em destaque
Pular para comparações de modelos
Gemini 3 Pro
gemini-3-pro-preview
Nosso melhor modelo para compreensão multimodal e nosso agente mais eficiente e modelo de codificação de vibe até agora, oferecendo recursos visuais mais ricos e interatividade mais profunda, tudo isso com base em um raciocínio de última geração. (faturamento obrigatório)
Gemini 2.5 Pro
gemini-2.5-pro
Nosso modelo de pensamento de última geração, capaz de raciocinar sobre problemas complexos em código, matemática e STEM, além de analisar grandes conjuntos de dados, bases de código e documentos usando contexto longo.
Gemini 2.5 Flash
gemini-2.5-flash
Nosso melhor modelo em termos de custo-benefício, com recursos completos. O 2.5 Flash é ideal para processamento em grande escala, tarefas de baixo volume e baixa latência que exigem pensamento e casos de uso de agentes.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Nosso modelo flash mais rápido, otimizado para eficiência de custo e alta capacidade de processamento.
Modelos de geração de imagens
Você pode gerar imagens com os modelos Gemini ou Imagen.
Pular para comparações de modelos
Gemini
Gemini 2.5 Flash Image (também conhecido como nano banana)
gemini-2.5-flash-image
Nosso modelo Flash padrão foi atualizado para fluxos de trabalho criativos rápidos com recursos de geração de imagens e edição conversacional em várias etapas. (faturamento obrigatório)
Imagen
Imagen 4
imagen-4.0-generate-001
Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Gera imagens para prototipagem ou casos de uso de baixa latência. (faturamento obrigatório)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural. (faturamento obrigatório)
Modelos de geração anterior
Os seguintes modelos estão ativos, mas são de geração anterior. Recomendamos usar um dos modelos mais recentes sempre que possível.
Pular para comparações de modelos
Modelos do Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
Nosso modelo de segunda geração, com uma janela de contexto de 1 milhão de tokens. Oferece recursos de última geração e capacidades aprimoradas, incluindo velocidade superior e uso de ferramentas nativas.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Nosso modelo pequeno de segunda geração, com uma janela de contexto de 1 milhão de tokens. Otimizado para eficiência de custo e baixa latência.
O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.
-
- Entrada e saída compatíveis
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, por exemplo, número máximo de tokens de entrada ou duração máxima do vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas disponíveis para os modelos
Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos de geração anterior.
Comparação de modelos
Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.
Se você não encontrar as informações que procura nas subseções a seguir, consulte a documentação do provedor de API escolhido para mais detalhes:
Gemini Developer API: modelos Gemini e modelos Imagen
Vertex AI Gemini API: modelos Gemini e modelos Imagen
Entrada e saída compatíveis
Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Imagem de flash do Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Live </span="notranslate"> |
Imagen (gerar) | Imagen (capacidade) | |
|---|---|---|---|---|---|---|
| Tipos de entrada | ||||||
| Texto | ||||||
| Texto (streaming) | ||||||
| Código | ||||||
| Documentos (PDFs ou texto simples) |
||||||
| Imagens | ||||||
| Vídeo | ||||||
| Áudio | ||||||
| Áudio (streaming) | ||||||
| Tipos de saída | ||||||
| Texto | ||||||
| Texto (streaming) | ||||||
| Código | ||||||
| Saída estruturada (como JSON) |
||||||
| Imagens | ||||||
| Áudio | ||||||
| Áudio (streaming) | ||||||
Para saber mais sobre os tipos de arquivo compatíveis, consulte Arquivos de entrada e requisitos compatíveis.
Recursos e funcionalidades compatíveis
Estas são as funcionalidades e os recursos compatíveis ao usar cada modelo com Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Imagem de flash do Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Live </span="notranslate"> |
Imagen (gerar) | Imagen (capacidade) | |
|---|---|---|---|---|---|---|
| Pensar | ||||||
| Gerar texto com base em entradas somente de texto ou multimodais | intercalado ou como parte da imagem | somente streaming | ||||
|
Gerar imagens (Gemini ou Imagen) |
||||||
|
Editar imagens (Gemini ou Imagen) |
||||||
| Gerar áudio | somente streaming | |||||
|
Gerar
saída estruturada
(como JSON) |
||||||
|
Analisar documentos
(PDFs ou texto simples) |
||||||
| Analisar imagens (visão) | ||||||
| Analisar vídeo (visão) | ||||||
| Analisar áudio | somente streaming | |||||
| Chat multiturno | ||||||
| Streaming multimodal bidirecional | ||||||
| Chamadas de função | ||||||
| Execução de código | ||||||
| Embasamento com a Pesquisa Google | ||||||
| Instruções do sistema | ||||||
| Contar tokens |
Especificações e limitações
Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:
| Propriedade |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Imagem de flash do Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Live </span="notranslate"> |
Imagen (gerar) | Imagen (capacidade) |
|---|---|---|---|---|---|---|
| Janela de contexto * Limite total de tokens (entrada e saída combinadas) |
1 milhão de tokens | 1.048.576 tokens | 32.768 tokens | 32.768 tokens | 480 tokens | 480 tokens |
| Limite de token de saída * | 64 mil tokens | 65.536 tokens | 8.192 tokens | 8.192 tokens | --- | --- |
| Data do limite de conhecimento | Janeiro de 2025 | Janeiro de 2025 | Junho de 2025 | Agosto de 2024 | --- | --- |
| PDFs (por solicitação) | ||||||
| Número máximo de arquivos PDF de entrada ** |
900 arquivos | 3.000 arquivos | 3 arquivos | --- | --- | --- |
| Número máximo de páginas por arquivo PDF de entrada ** |
900 páginas | 1.000 páginas | 3 páginas | --- | --- | --- |
| Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | --- | --- | --- |
| Imagens (por solicitação) | ||||||
| Número máximo de imagens de entrada |
1.000 imagens | 3.000 imagens | 3 imagens | --- | --- | 4 imagens |
| Número máximo de imagens de saída |
--- | --- | 10 imagens | --- | 4 imagens | 4 imagens |
| Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | --- | --- | --- |
| Vídeo (por solicitação) | ||||||
| Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | --- | --- | --- | --- |
| Duração máxima de todos os vídeos de entrada (somente frames) |
aproximadamente 60 minutos | aproximadamente 60 minutos | --- | --- | --- | --- |
| Duração máxima de todos os vídeos de entrada (frames e áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | --- | --- | --- | --- |
| Áudio (por solicitação) | ||||||
| Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | --- | --- | --- | --- |
| Número máximo de arquivos de áudio de saída |
--- | --- | --- | --- | --- | --- |
| Comprimento máximo de todo o áudio de entrada |
Cerca de 8,4 horas | Cerca de 8,4 horas | Cerca de 8,4 horas | --- | --- | --- |
| Comprimento máximo de todo o áudio de saída |
--- | --- | --- | --- | --- | --- |
*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Encontrar mais informações detalhadas
As cotas e os preços são diferentes para cada modelo. O preço também depende da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada aceitos, como especificar o tipo MIME e como garantir que seus arquivos de entrada e solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Requisitos e arquivos de entrada aceitos.
Controle de versões e padrões de nomenclatura de modelos
Os modelos são oferecidos em versões estável, prévia e experimental. Para facilidade, aliases sem valores de versão explícitos são aceitos.
Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.
| Tipo de versão / Etapa da versão |
Descrição | Padrão de nome do modelo | |
|---|---|---|---|
| Estável |
As versões estáveis estão disponíveis e têm suporte
para uso em produção a partir da data de lançamento.
|
|
|
| Alias estável atualizado automaticamente (somente modelos Gemini 2.0) |
Os aliases estáveis atualizados automaticamente sempre apontam para
a versão mais recente estável desse modelo.
|
Somente modelos Gemini 2.0
Exemplo: |
|
| Visualizar |
As versões de pré-lançamento têm novos recursos e são consideradas instáveis.
|
Os nomes dos modelos de versões de prévia são anexados com
Exemplos: |
|
| Experimental |
As versões experimentais têm novos recursos e são consideradas instáveis.
|
Os nomes de modelos de versões experimentais são anexados com
Exemplo: |
|
| Aposentado |
Versões desativadas já passaram da data de desativação e foram desativadas permanentemente.
|
--- |
|
Nomes de modelos disponíveis
Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.
Ir para os nomes dos modelos Gemini Ir para os nomes dos modelos Imagen
Listar todos os modelos disponíveis de maneira programática
É possível listar todos os nomes de modelos disponíveis usando a API REST:
Gemini Developer API: chame o endpoint
models.list.Vertex AI Gemini API: chame o endpoint
publishers.models.list.
A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só é compatível com os modelos Gemini e Imagen descritos nesta página.
Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo de base.
Gemini nomes de modelos
Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.
Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.
Gemini 3 Pro nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-3-pro-preview |
Versão de prévia de Gemini 3 Pro | Visualizar | 2025-11-18 | A ser determinado |
Gemini 2.5 Pro nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-2.5-pro |
Versão estável do Gemini 2.5 Pro | Estável | 2025-06-17 | A partir de 2026-06-17 |
Gemini 2.5 Flash nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-2.5-flash |
Versão estável do Gemini 2.5 Flash | Estável | 2025-06-17 | A partir de 2026-06-17 |
Gemini 2.5 Flash‑Lite nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Versão estável do Gemini 2.5 Flash‑Lite | Estável | 2025-07-22 | A partir de 2026-07-22 |
Nomes de modelos Gemini 2.5 Flash Image (também conhecidos como "nano banana")
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-2.5-flash-image |
Versão estável para Gemini 2.5 Flash Image (também conhecida como "nano banana") | Estável | 2025-10-02 | A partir de 2026-10-02 |
Gemini 2.5 Flash Live nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-live-2.5-flash |
Versão estável para Gemini 2.5 Flash Live | Estável (GA particular) 1 |
2025-06-01 | A partir de 2026-06-01 |
gemini-live-2.5-flash-preview 2 |
Versão de prévia para Gemini 2.5 Flash Live | Visualizar | 2025-06-01 | A ser determinado |
O Firebase AI Logic ainda não é compatível com os modelos de áudio nativos (como gemini-2.5-flash-native-audio-preview-09-2025).
1 Entre em contato com o representante da sua equipe de conta do Google Cloud para solicitar acesso. 2 Não é compatível com o Vertex AI Gemini API, seja qual for a forma de acesso.
Gemini 2.0 Flash Live nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Versão estável para Gemini 2.0 Flash Live | Estável | 2025-04-01 | A partir de 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 |
Versão de prévia para Gemini 2.0 Flash Live | Visualizar | 2025-04-09 | A ser determinado |
2 Não é compatível com o Vertex AI Gemini API, não importa como você acesse.
Imagen nomes de modelos
Para exemplos de inicialização da sua plataforma, consulte o guia de geração de imagens com Imagen.
Para detalhes sobre as etapas de lançamento (especialmente para casos de uso, faturamento e desativação), consulte padrões de nomenclatura e controle de versões de modelos.
Imagen 4 nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Versão estável do Imagen 4 | Estável | 2025-08-14 | A partir de 14 de agosto de 2026 |
Imagen 4 Fast nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Versão estável do Imagen 4 Fast | Estável | 2025-08-14 | A partir de 14 de agosto de 2026 |
Imagen 4 Ultra nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Versão estável do Imagen 4 Ultra | Estável | 2025-08-14 | A partir de 14 de agosto de 2026 |
Imagen 3 Capability nomes de modelos
| Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Versão estável inicial do Imagen 3 Capability | Estável | 2024-12-10 | A partir de 10 de dezembro de 2025 |
3 Não é compatível com o Gemini Developer API, seja qual for a forma de acesso.
Idiomas compatíveis
Gemini
Todos os modelos do Gemini podem entender e responder nos seguintes idiomas:
Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes outros idiomas:
Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)
Imagen
Disponibilidade geral: inglês
Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol
Informações sobre modelos anteriores
Os seguintes modelos estão ativos, mas são de geração anterior. Recomendamos usar um dos modelos mais recentes sempre que possível.
Gemini modelos
| Modelo | Entrada | Saída | Descrição |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo multimodal com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas integrado e uma janela de contexto de 1 milhão de tokens |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do 1.5 Flash que querem melhor qualidade pelo mesmo preço e velocidade. |
Imagen modelos
| Modelo | Entrada | Saída | Descrição |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |
2 Não é compatível com o Gemini Developer API, seja qual for a forma de acesso.
Próximas etapas
Teste os recursos do Gemini API
- Crie conversas multiturno (chat).
- Gerar texto com base em comandos somente de texto.
- Gere texto usando comandos com vários tipos de arquivos, como imagens, PDFs, vídeos e áudios.
- Gerar saída estruturada (como JSON) com base em comandos de texto e multimodais.
- Gerar imagens com base em comandos de texto (Gemini ou Imagen).
- Entrada e saída de stream (incluindo áudio) usando o Gemini Live API.
- Use ferramentas (como chamada de função e embasamento com a Pesquisa Google) para conectar um modelo Gemini a outras partes do app e a sistemas e informações externas.