Para apps para dispositivos móveis e da Web, os SDKs Vertex AI in Firebase permitem interagir com os modelos Gemini diretamente no app.
Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio.
A tabela a seguir é uma breve visão geral dos modelos compatíveis com Vertex AI in Firebase e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de visualização e experimentais disponíveis para casos de uso de prototipagem.
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Gemini com versões estáveis | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON (imagens e áudio em breve) |
Oferece recursos e velocidade de última geração para uma variedade de tarefas
(geração multimodal em breve) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho econômico e de baixa latência, além de oferecer suporte a alta taxa de transferência |
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto longo de 2 milhões |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho rápido e versátil em diversas tarefas |
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece a melhor qualidade de modelo, especialmente para código e conhecimento mundial; contexto de 2 milhões |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
texto, código, PDFs, imagens | texto, código, JSON | Oferece recursos de raciocínio mais fortes e inclui o processo de pensamento nas respostas |
O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Vertex AI in Firebase:
-
- Entrada e saída com suporte
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, por exemplo, tokens de entrada máximos ou comprimento máximo de vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estáveis, atualizadas automaticamente e de pré-lançamento
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas com suporte para os modelos
Na parte de baixo da página, você pode acessar informações detalhadas sobre modelos mais antigos.
Comparar modelos
Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Observe que cada uma das tabelas nesta seção descreve cada modelo quando usado com Vertex AI in Firebase. Cada modelo pode ter recursos adicionais que não estão disponíveis ao usar nossos SDKs.
Se você não encontrar as informações que está procurando nas subseções a seguir, consulte mais informações sobre os modelos Gemini na documentação do Google Cloud.
Entrada e saída com suporte
Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Pensamento em Flash </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Tipos de entrada | ||||||
Texto | ||||||
Código | ||||||
Documentos (PDFs ou texto simples) |
||||||
Imagens | ||||||
Vídeo | ||||||
Áudio | ||||||
Áudio (streaming) | Em breve | |||||
Tipos de saída | ||||||
Texto | ||||||
Código | ||||||
Saída estruturada (como JSON) |
||||||
Imagens | Em breve | |||||
Áudio | Em breve | |||||
Áudio (streaming) | Em breve |
Para saber mais sobre os tipos de arquivo aceitos, consulte Arquivos de entrada e requisitos compatíveis com o Vertex AI Gemini API.
Recursos e recursos compatíveis
Estes são os recursos e os recursos com suporte ao usar cada modelo com Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Pensamento em Flash </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Gerar texto com base em entradas de texto ou multimodal | ||||||
Gerar imagens | Em breve | |||||
Gerar áudio | Em breve | |||||
Gerar saída estruturada
(como JSON) |
||||||
Analisar documentos
(PDFs ou texto simples) |
||||||
Analisar imagens (visão) | ||||||
Analisar vídeo (visão) | ||||||
Analisar áudio | ||||||
Chat multiturno | ||||||
Chamadas de função (ferramentas) | ||||||
Contar tokens e caracteres faturáveis | ||||||
Instruções do sistema | ||||||
API Multimodal Live (streaming bidirecional) |
Em breve |
Especificações e limitações
Estas são as especificações e limitações ao usar cada modelo com Vertex AI in Firebase:
Propriedade |
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Pensamento em Flash </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
---|---|---|---|---|---|---|
Janela de contexto * Limite total de tokens (entrada+saída combinadas) |
2.097.152 tokens | 1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 2.097.152 tokens | 1.048.576 tokens |
Limite de token de saída * | 8.192 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens |
Data de corte do conhecimento | Junho de 2024 | Junho de 2024 | Junho de 2024 | Junho de 2024 | Maio de 2024 | Maio de 2024 |
PDFs (por solicitação) | ||||||
Número máximo de arquivos PDF de entrada ** |
3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos |
Número máximo de páginas por arquivo PDF de entrada ** |
1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas |
Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB |
Imagens (por solicitação) | ||||||
Número máximo de imagens de entrada |
3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens |
Número máximo de imagens de saída |
--- | Em breve | --- | --- | --- | --- |
Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB |
Vídeo (por solicitação) | ||||||
Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | 10 arquivos | --- | 10 arquivos | 10 arquivos |
Duração máxima de todo o vídeo de entrada (somente frames) |
~60 minutos | ~60 minutos | ~60 minutos | --- | ~60 minutos | ~60 minutos |
Comprimento máximo de todo o vídeo de entrada (frames + áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | --- | aproximadamente 45 minutos | aproximadamente 45 minutos |
Áudio (por solicitação) | ||||||
Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | 1 arquivo | --- | 1 arquivo | 1 arquivo |
Número máximo de arquivos de áudio de saída |
--- | Em breve | --- | --- | --- | --- |
Comprimento máximo de todo o áudio de entrada |
~8,4 horas | ~8,4 horas | ~8,4 horas | --- | ~8,4 horas | ~8,4 horas |
Comprimento máximo de todo o áudio de saída |
--- | Em breve | --- | --- | --- | --- |
*
Para todos os modelos, um token equivale a cerca de quatro caracteres,
então 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos do Gemini, é possível
determinar a contagem total de tokens nas solicitações usando
countTokens
.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Encontre mais informações detalhadas
As cotas e os preços são diferentes para cada modelo. Os preços também dependem da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada aceitos, como especificar o tipo MIME e como garantir que os arquivos de entrada e as solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Arquivos de entrada e requisitos compatíveis com o Vertex AI Gemini API.
Controle de versões de modelos e padrões de nomenclatura
Os modelos são oferecidos nas versões estável, pré-lançamento e experimental. Para conveniência, há suporte para aliases sem valores de versão explícitos.
Para encontrar nomes de modelos específicos para usar no código, consulte a seção "Nomes de modelos disponíveis" mais adiante nesta página.
Tipo de versão | Descrição | Padrão de nome do modelo | |
---|---|---|---|
Estável | As versões estáveis são consideradas de disponibilidade geral. |
Os nomes de modelos de versões estáveis são anexados com um número de versão de três dígitos específico.
Exemplo: |
|
Alias estável atualizado automaticamente | Os aliases estáveis atualizados automaticamente sempre apontam para a versão estável mais recente desse modelo. Se uma nova versão estável for lançada, o alias auto-atualizado vai começar a apontar para essa nova versão estável. |
Os nomes de modelos de aliases não têm apêndices
Exemplo: |
|
Visualizar |
As versões Pré-lançamento têm novos recursos e
são consideradas não estáveis.
As versões de pré-lançamento sempre apontam para a última versão de pré-lançamento desse modelo. Se uma nova versão de visualização for lançada, todas as versões de visualização atuais vão começar a apontar para essa nova versão. |
Os nomes de modelos das versões de pré-lançamento são anexados com
Exemplo: |
|
Experimental |
As versões experimentais têm novos recursos
e são consideradas não estáveis. Elas não seguem o
plano de ciclo de vida do modelo e o esquema de controle de versão padrão do Google.
Saiba mais sobre os modelos experimentais. |
Os nomes de modelos de versões experimentais são anexados com
Exemplo: |
Saiba mais sobre as versões de modelo disponíveis e o ciclo de vida delas (Gemini) na documentação do Google Cloud.
Nomes de modelos disponíveis
Os nomes de modelo são os valores explícitos que você inclui no código durante a inicialização do modelo generativo, que é uma etapa obrigatória para chamar o Gemini API.
É possível usar o
endpoint publishers.models.list
para listar todos os nomes de modelos disponíveis. Essa lista retornada inclui
todos os modelos compatíveis com Vertex AI, mas Vertex AI in Firebase só aceita
os modelos Gemini descritos nesta página.
Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash
) não são
listados porque são um alias de conveniência para o modelo básico.
Nomes de modelos Gemini
Para conferir exemplos de inicialização no seu idioma, consulte o guia de início.
Nomes de modelos Gemini 2.0 Pro
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
Nenhuma versão estável disponível | --- | --- | --- | --- |
Alias estável atualizado automaticamente | ||||
Nenhum alias estável atualizado automaticamente disponível | --- | --- | --- | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
gemini-2.0-pro-exp-02-05 |
Versão experimental de Gemini 2.0 Pro | Experimental | 2025-02-05 | A ser determinado |
Nomes de modelos Gemini 2.0 Flash
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-2.0-flash-001 |
Versão estável mais recente do Gemini 2.0 Flash | Disponibilidade geral | 2025-02-05 | A partir de 2026-02-05 |
Alias estável atualizado automaticamente | ||||
gemini-2.0-flash |
Indica a versão estável mais recente do Flash 2.0 (atualmente gemini-2.0-flash-001 |
Disponibilidade geral | 2025-02-10 | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Nomes de modelos Gemini 2.0 Flash‑Lite
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-2.0-flash-lite-001 |
Versão estável mais recente do Gemini 2.0 Flash‑Lite | Disponibilidade geral | 2025-02-25 | A partir de 2026-02-25 |
Alias estável atualizado automaticamente | ||||
gemini-2.0-flash-lite |
Aponta para a versão mais recente do Flash-Lite 2.0 (atualmente gemini-2.0-flash-lite-001 |
Disponibilidade geral | 2025-02-25 | --- |
Versões de pré-lançamento | ||||
gemini-2.0-flash-lite-preview-02-05 |
Versão de pré-lançamento de Gemini 2.0 Flash‑Lite | Visualizar | 2025-02-05 | A ser determinado |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Nomes de modelos Gemini 2.0 Flash‑Thinking
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
Nenhuma versão estável disponível | --- | --- | --- | --- |
Alias estável atualizado automaticamente | ||||
Nenhum alias estável atualizado automaticamente disponível | --- | --- | --- | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Versão experimental de Gemini 2.0 Flash‑Thinking | Experimental | 2025-01-21 | A ser determinado |
Nomes dos modelos Gemini 1.5 Pro
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.5-pro-002 |
Versão estável mais recente do Gemini 1.5 Pro | Disponibilidade geral | 2024-09-24 | A partir de 24-09-2025 |
gemini-1.5-pro-001 |
Versão estável inicial de Gemini 1.5 Pro | Disponibilidade geral | 2024-05-24 | A partir de 24/05/2025 |
Alias estável atualizado automaticamente | ||||
gemini-1.5-pro |
Aponta para a versão estável mais recente do 1.5 Pro (atualmente gemini-1.5-pro-002 |
Disponibilidade geral | 2024-09-24 | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Nomes de modelos Gemini 1.5 Flash
Nome do modelo | Descrição | Etapa de lançamento | Data de lançamento inicial | Data de desativação |
---|---|---|---|---|
Versões estáveis | ||||
gemini-1.5-flash-002 |
Versão estável mais recente do Gemini 1.5 Flash | Disponibilidade geral | 2024-09-24 | A partir de 24-09-2025 |
gemini-1.5-flash-001 |
Versão estável inicial de Gemini 1.5 Flash | Disponibilidade geral | 2024-05-24 | A partir de 24/05/2025 |
Alias estável atualizado automaticamente | ||||
gemini-1.5-flash |
Aponta para a versão estável mais recente do Flash 1.5 (atualmente gemini-1.5-flash-002 |
Disponibilidade geral | 2024-09-24 | --- |
Versões de pré-lançamento | ||||
Nenhuma versão de visualização disponível | --- | --- | --- | --- |
Versões experimentais | ||||
Nenhuma versão experimental disponível | --- | --- | --- | --- |
Idiomas com suporte
Gemini
Todos os modelos Gemini podem entender e responder nos seguintes idiomas:
Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes idiomas adicionais:
Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)
Informações sobre modelos mais antigos
O Vertex AI in Firebase oferece suporte a todos os modelos Gemini, incluindo modelos mais antigos, como Gemini 1.0 Pro e Gemini 1.0 Pro Vision. No entanto, recomendamos usar um modelo mais recente com nossos SDKs. Esses modelos Gemini mais antigos estão se aproximando da data de descontinuação e não oferecem todos os recursos dos modelos mais recentes.
Próximas etapas
Testar os recursos do Gemini API
- Crie conversas com vários turnos (chat).
- Gerar texto com base em comandos somente de texto.
- Gerar texto a partir de comandos multimodais (incluindo texto, imagens, PDFs, vídeo e áudio).
- Gere saída estruturada (como JSON) com comandos de texto e multimodais.
- Use a chamada de função para conectar modelos generativos a sistemas e informações externas.