Saiba mais sobre os modelos compatíveis

Para apps para dispositivos móveis e Web, os SDKs Vertex AI in Firebase permitem interagir com os modelos Gemini e Imagen 3 diretamente no app.

Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. Os modelos Imagen 3 podem ser solicitados com texto para gerar imagens.

A tabela a seguir é uma breve visão geral dos modelos compatíveis com Vertex AI in Firebase e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de visualização e experimentais disponíveis para casos de uso de prototipagem.

Modelo Entrada Saída Descrição
Modelos Gemini com versões estáveis
Gemini 2.0 Flash
gemini-2.0-flash-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON
(imagens e áudio em breve)
Oferece recursos e velocidade de última geração para uma variedade de tarefas
(geração multimodal em breve)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece desempenho econômico e de baixa latência, além de oferecer suporte a alta taxa de transferência
Gemini 1.5 Pro
gemini-1.5-pro-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto longo de 2 milhões
Gemini 1.5 Flash
gemini-1.5-flash-002
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece desempenho rápido e versátil em diversas tarefas
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
texto, código, PDFs, imagens, vídeo, áudio texto, código, JSON Oferece a melhor qualidade de modelo, especialmente para código e conhecimento mundial; contexto de 2 milhões
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
texto, código, PDFs, imagens texto, código, JSON Oferece recursos de raciocínio mais fortes e inclui o processo de pensamento nas respostas
Modelos Imagen 3 (ao usar com Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
texto imagens Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural
Imagen 3 Fast
imagen-3.0-fast-generate-001
texto imagens Gera imagens para prototipagem ou casos de uso de baixa latência


O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Vertex AI in Firebase:

  • Comparar modelos:

    • Entrada e saída com suporte
    • Comparação de alto nível dos recursos compatíveis
    • Especificações e limitações, por exemplo, tokens de entrada máximos ou comprimento máximo de vídeo de entrada
  • Descrição de como os modelos são versionados, especificamente as versões estáveis, atualizadas automaticamente e de pré-lançamento

  • Listas de nomes de modelos disponíveis para incluir no código durante a inicialização

  • Listas de idiomas com suporte para os modelos

Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos.



Comparar modelos

Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Observe que cada uma das tabelas nesta seção descreve cada modelo quando usado com Vertex AI in Firebase. Cada modelo pode ter recursos adicionais que não estão disponíveis ao usar nossos SDKs.

Se você não encontrar as informações que está procurando nas subseções a seguir, consulte mais informações sobre os modelos Gemini e Imagen 3 na documentação do Google Cloud.

Entrada e saída com suporte

Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Vertex AI in Firebase:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 
Pensamento em Flash </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Tipos de entrada
Texto
Código
Documentos
(PDFs ou texto simples)
Imagens
Vídeo
Áudio
Áudio (streaming) Em breve
Tipos de saída
Texto
Código
Saída estruturada
(como JSON)
Imagens Em breve
Áudio Em breve
Áudio (streaming) Em breve

Para saber mais sobre os tipos de arquivo aceitos, consulte Arquivos de entrada e requisitos compatíveis com o Vertex AI Gemini API.

Recursos e recursos compatíveis

Estes são os recursos e os recursos com suporte ao usar cada modelo com Vertex AI in Firebase:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 
Pensamento em Flash </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Gerar texto com base em entradas de texto ou multimodal
Gerar imagens
(Imagen 3)
Em breve
Gerar áudio Em breve
Gerar saída estruturada
(como JSON)
Analisar documentos
(PDFs ou texto simples)
Analisar imagens (visão)
Analisar vídeo (visão)
Analisar áudio
Chat multiturno
Chamadas de função (ferramentas)
Contar tokens e caracteres faturáveis
Instruções do sistema
API Multimodal Live
(streaming bidirecional)
Em breve

Especificações e limitações

Estas são as especificações e limitações ao usar cada modelo com Vertex AI in Firebase:

Propriedade <span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 
Pensamento em Flash </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Janela de contexto *
Limite total de tokens
(entrada+saída combinadas)
2.097.152 tokens 1.048.576 tokens 1.048.576 tokens 1.048.576 tokens 2.097.152 tokens 1.048.576 tokens 480 tokens
Limite de token de saída * 8.192 tokens 8.192 tokens 8.192 tokens 8.192 tokens 8.192 tokens 8.192 tokens ---
Data de corte do conhecimento Junho de 2024 Junho de 2024 Junho de 2024 Junho de 2024 Maio de 2024 Maio de 2024 ---
PDFs (por solicitação)
Número máximo
de arquivos PDF de entrada **
3.000 arquivos 3.000 arquivos 3.000 arquivos 3.000 arquivos 3.000 arquivos 3.000 arquivos ---
Número máximo
de páginas por arquivo PDF de entrada **
1.000 páginas 1.000 páginas 1.000 páginas 1.000 páginas 1.000 páginas 1.000 páginas ---
Tamanho máximo
por arquivo PDF de entrada
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB ---
Imagens (por solicitação)
Número máximo
de imagens de entrada
3.000 imagens 3.000 imagens 3.000 imagens 3.000 imagens 3.000 imagens 3.000 imagens ---
Número máximo
de imagens de saída
--- Em breve --- --- --- --- 4 imagens
Tamanho máximo
por imagem codificada em base64 de entrada
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB ---
Vídeo (por solicitação)
Número máximo
de arquivos de vídeo de entrada
10 arquivos 10 arquivos 10 arquivos --- 10 arquivos 10 arquivos ---
Duração máxima
de todo o vídeo de entrada
(somente frames)
~60 minutos ~60 minutos ~60 minutos --- ~60 minutos ~60 minutos ---
Comprimento máximo
de todo o vídeo de entrada
(frames + áudio)
aproximadamente 45 minutos aproximadamente 45 minutos aproximadamente 45 minutos --- aproximadamente 45 minutos aproximadamente 45 minutos ---
Áudio (por solicitação)
Número máximo
de arquivos de áudio de entrada
1 arquivo 1 arquivo 1 arquivo --- 1 arquivo 1 arquivo ---
Número máximo
de arquivos de áudio de saída
--- Em breve --- --- --- --- ---
Comprimento máximo
de todo o áudio de entrada
~8,4 horas ~8,4 horas ~8,4 horas --- ~8,4 horas ~8,4 horas ---
Comprimento máximo
de todo o áudio de saída
--- Em breve --- --- --- --- ---

* Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres, então 100 tokens são cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens.

** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.

Encontre mais informações detalhadas



Controle de versões de modelos e padrões de nomenclatura

Os modelos são oferecidos nas versões estável, pré-lançamento e experimental. Para conveniência, há suporte para aliases sem valores de versão explícitos.

Para encontrar nomes de modelos específicos para usar no código, consulte a seção "Nomes de modelos disponíveis" mais adiante nesta página.

Tipo de versão Descrição Padrão de nome do modelo
Estável As versões estáveis são consideradas de disponibilidade geral.

Os nomes de modelos de versões estáveis são anexados com um número de versão de três dígitos específico.

Exemplo: gemini-2.0-flash-001
Exemplo: imagen-3.0-generate-002

Alias estável atualizado automaticamente Os aliases estáveis atualizados automaticamente sempre apontam para a versão estável mais recente desse modelo. Se uma nova versão estável for lançada, o alias auto-atualizado vai começar a apontar para essa nova versão estável.

Os nomes de modelos de aliases não têm apêndices

Exemplo: gemini-2.0-flash

Visualizar As versões Pré-lançamento têm novos recursos e são consideradas não estáveis.

As versões de pré-lançamento sempre apontam para a última versão de pré-lançamento desse modelo. Se uma nova versão de visualização for lançada, todas as versões de visualização atuais vão começar a apontar para essa nova versão.

Os nomes de modelos das versões de pré-lançamento são anexados com -preview e a data de lançamento inicial do modelo (-MMDD).

Exemplo: gemini-2.0-flash-lite-preview-02-05
(lançado em 5 de fevereiro de 2025)

Experimental As versões experimentais têm novos recursos e são consideradas não estáveis. Elas não seguem o plano de ciclo de vida do modelo e o esquema de controle de versão padrão do Google.

Saiba mais sobre os modelos experimentais.

Os nomes de modelos de versões experimentais são anexados com -exp e a data de lançamento inicial do modelo (-MMDD).

Exemplo: gemini-2.0-pro-exp-02-05
(lançado em 5 de fevereiro de 2025)

Saiba mais sobre as versões de modelo disponíveis e o ciclo de vida delas (Gemini) ou Imagen na documentação do Google Cloud.



Nomes de modelos disponíveis

Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo.

É possível usar o endpoint publishers.models.list para listar todos os nomes de modelos disponíveis. Essa lista retornada vai incluir todos os modelos compatíveis com Vertex AI, mas Vertex AI in Firebase só aceita os modelos Gemini e Imagen descritos nesta página. Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash) não são listados porque são um alias de conveniência para o modelo básico.

Nomes de modelos Gemini

Para conferir exemplos de inicialização no seu idioma, consulte o guia de início.

Nomes de modelos Gemini 2.0 Pro

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
Nenhuma versão estável disponível --- --- --- ---
Alias estável atualizado automaticamente
Nenhum alias estável atualizado automaticamente disponível --- --- --- ---
Versões de pré-lançamento
Nenhuma versão de visualização disponível --- --- --- ---
Versões experimentais
gemini-2.0-pro-exp-02-05 Versão experimental de Gemini 2.0 Pro Experimental 2025-02-05 A ser determinado

Nomes de modelos Gemini 2.0 Flash

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
gemini-2.0-flash-001 Versão estável mais recente do Gemini 2.0 Flash Disponibilidade geral 2025-02-05 A partir de
2026-02-05
Alias estável atualizado automaticamente
gemini-2.0-flash Indica a versão estável mais recente do Flash 2.0
(atualmente gemini-2.0-flash-001).
Disponibilidade geral 2025-02-10 ---
Versões de pré-lançamento
Nenhuma versão de visualização disponível --- --- --- ---
Versões experimentais
Nenhuma versão experimental disponível --- --- --- ---

Nomes de modelos Gemini 2.0 Flash‑Lite

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
gemini-2.0-flash-lite-001 Versão estável mais recente do Gemini 2.0 Flash‑Lite Disponibilidade geral 2025-02-25 A partir de
2026-02-25
Alias estável atualizado automaticamente
gemini-2.0-flash-lite Aponta para a versão mais recente do Flash-Lite
2.0 (atualmente gemini-2.0-flash-lite-001).
Disponibilidade geral 2025-02-25 ---
Versões de pré-lançamento
gemini-2.0-flash-lite-preview-02-05 Versão de pré-lançamento de Gemini 2.0 Flash‑Lite Visualizar 2025-02-05 A ser determinado
Versões experimentais
Nenhuma versão experimental disponível --- --- --- ---

Nomes de modelos Gemini 2.0 Flash‑Thinking

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
Nenhuma versão estável disponível --- --- --- ---
Alias estável atualizado automaticamente
Nenhum alias estável atualizado automaticamente disponível --- --- --- ---
Versões de pré-lançamento
Nenhuma versão de visualização disponível --- --- --- ---
Versões experimentais
gemini-2.0-flash-thinking-exp-01-21 Versão experimental de Gemini 2.0 Flash‑Thinking Experimental 2025-01-21 A ser determinado

Nomes dos modelos Gemini 1.5 Pro

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
gemini-1.5-pro-002 Versão estável mais recente do Gemini 1.5 Pro Disponibilidade geral 2024-09-24 A partir de 24-09-2025
gemini-1.5-pro-001 Versão estável inicial de Gemini 1.5 Pro Disponibilidade geral 2024-05-24 A partir de 24/05/2025
Alias estável atualizado automaticamente
gemini-1.5-pro Aponta para a versão estável mais recente do 1.5 Pro
(atualmente gemini-1.5-pro-002)
Disponibilidade geral 2024-09-24 ---
Versões de pré-lançamento
Nenhuma versão de visualização disponível --- --- --- ---
Versões experimentais
Nenhuma versão experimental disponível --- --- --- ---

Nomes de modelos Gemini 1.5 Flash

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
gemini-1.5-flash-002 Versão estável mais recente do Gemini 1.5 Flash Disponibilidade geral 2024-09-24 A partir de 24-09-2025
gemini-1.5-flash-001 Versão estável inicial de Gemini 1.5 Flash Disponibilidade geral 2024-05-24 A partir de 24/05/2025
Alias estável atualizado automaticamente
gemini-1.5-flash Aponta para a versão estável mais recente do Flash 1.5
(atualmente gemini-1.5-flash-002)
Disponibilidade geral 2024-09-24 ---
Versões de pré-lançamento
Nenhuma versão de visualização disponível --- --- --- ---
Versões experimentais
Nenhuma versão experimental disponível --- --- --- ---

Nomes de modelos Imagen

Para conferir exemplos de inicialização para seu idioma, consulte o guia de geração de imagens com Imagen.

No momento, nenhum dos modelos Imagen 3 tem versões de visualização ou experimentais disponíveis.

Nomes de modelos Imagen 3

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
imagen-3.0-generate-002 Versão estável mais recente do Imagen 3 Disponibilidade geral 2025-01-23 A partir de 23/01/2026
imagen-3.0-generate-001 Versão estável inicial de Imagen 3 Disponibilidade geral 2024-07-31 A partir de 31-07-2025

Nomes de modelos Imagen 3 Fast

Nome do modelo Descrição Etapa de lançamento Data de lançamento inicial Data de desativação
Versões estáveis
imagen-3.0-fast-generate-001 Versão estável inicial de Imagen 3 Fast Disponibilidade geral 2024-07-31 A partir de 31-07-2025



Idiomas com suporte

Gemini

  • Todos os modelos Gemini podem entender e responder nos seguintes idiomas:

    Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)

  • Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes idiomas adicionais:

    Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)

Imagen

  • Disponibilidade geral: inglês

  • Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol



Informações sobre modelos mais antigos

O Vertex AI in Firebase oferece suporte a todos os modelos Gemini, incluindo modelos mais antigos, como Gemini 1.0 Pro e Gemini 1.0 Pro Vision. No entanto, recomendamos usar um modelo mais recente com nossos SDKs. Esses modelos Gemini mais antigos estão se aproximando da data de descontinuação e não oferecem todos os recursos dos modelos mais recentes.

Vertex AI in Firebase só oferece suporte a modelos Imagen 3. Ele não oferece suporte aos modelos Imagen mais antigos (como Imagen 2).



Próximas etapas

Testar os recursos do Gemini API