Para apps para dispositivos móveis e Web, os SDKs do Firebase AI Logic permitem interagir com os modelos Gemini e Imagen compatíveis diretamente do seu app.
Os modelos Gemini são considerados multimodais porque são capazes de processar e até gerar várias modalidades, incluindo texto, código, PDFs, imagens, vídeo e áudio. É possível pedir aos modelos Imagen para gerar imagens com texto.
A tabela a seguir é uma visão geral breve dos modelos compatíveis com Firebase AI Logic e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos experimentais e de prévia disponíveis para prototipagem de casos de uso.
Consulte também nossas perguntas frequentes sobre todos os modelos que o Firebase AI Logic oferece suporte e não oferece.
Gemini modelos
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Gemini com versões estáveis | |||
Gemini 2.5 Progemini-2.5-pro
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo de raciocínio mais avançado, capaz de resolver problemas complexos. |
Gemini 2.5 Flashgemini-2.5-flash
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo de pensamento que oferece recursos excelentes e abrangentes. Ele foi projetado para oferecer um equilíbrio entre preço e desempenho. |
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo multimodal com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas integrado e uma janela de contexto de 1 milhão de tokens |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo Flash mais rápido e econômico. É um caminho de upgrade para usuários do 1.5 Flash que querem melhor qualidade pelo mesmo preço e velocidade. |
Modelos Gemini com versões somente de prévia e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Nosso modelo de Gemini mais equilibrado, otimizado para casos de uso de baixa latência. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
texto, código, PDFs, imagens, vídeo, áudio | imagens, texto e imagens | Nosso modelo multimodal que aceita entradas multimodais e gera imagens. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
texto (streaming), áudio (streaming) |
texto (streaming), áudio (streaming) |
Nosso modelo multimodal que oferece suporte a streaming em tempo real de baixa latência de entradas e saídas multimodais. |
1 Não há suporte ao usar o Gemini Developer API
com SDKs Firebase AI Logic.
Imagen modelos
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Imagen com versões estáveis | |||
Imagen 3imagen-3.0-generate-002 |
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |
Modelos Imagen com versões somente de prévia e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
2 Este modelo Imagen não é compatível com o Gemini Developer API, independente de como você acessa a API.
O restante desta página oferece informações detalhadas sobre os modelos compatíveis com Firebase AI Logic.
-
- Entrada e saída compatíveis
- Comparação de alto nível dos recursos compatíveis
- Especificações e limitações, como o número máximo de tokens de entrada ou o comprimento máximo do vídeo de entrada
Descrição de como os modelos são versionados, especificamente as versões estável, atualizada automaticamente, prévia e experimental
Listas de nomes de modelos disponíveis para incluir no código durante a inicialização
Listas de idiomas compatíveis para os modelos
Na parte de baixo desta página, você pode conferir informações detalhadas sobre modelos mais antigos.
Comparação de modelos
Cada modelo tem recursos diferentes para oferecer suporte a vários casos de uso. Cada uma das tabelas nesta seção descreve cada modelo quando usado com Firebase AI Logic. Cada modelo pode ter outros recursos que não estão disponíveis ao usar nossos SDKs.
Se você não encontrar as informações que procura nas subseções a seguir, consulte mais detalhes na documentação do provedor de API escolhido:
Gemini Developer API: modelos Gemini e modelos Imagen
Vertex AI Gemini API: modelos Gemini e modelos Imagen
Entrada e saída compatíveis
Estes são os tipos de entrada e saída compatíveis ao usar cada modelo com Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
Tipos de entrada | |||||||||
Texto | |||||||||
Texto (streaming) | |||||||||
Código | |||||||||
Documentos (PDFs ou texto simples) |
|||||||||
Imagens | |||||||||
Vídeo | |||||||||
Áudio | |||||||||
Áudio (streaming) | |||||||||
Tipos de saída | |||||||||
Texto | |||||||||
Texto (streaming) | |||||||||
Código | |||||||||
Saída estruturada (como JSON) |
|||||||||
Imagens | |||||||||
Áudio | |||||||||
Áudio (streaming) |
Para saber mais sobre os tipos de arquivo compatíveis, consulte Arquivos de entrada e requisitos compatíveis.
Recursos e funcionalidades compatíveis
Estas são as funcionalidades e os recursos compatíveis ao usar cada modelo com Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
Gerar texto com base em entradas somente de texto ou multimodais | intercalado ou como parte da imagem | somente streaming | ||||||
Gerar imagens (Gemini ou Imagen) |
||||||||
Gerar áudio | somente streaming | |||||||
Gerar saída estruturada
(como JSON) |
||||||||
Analisar documentos
(PDFs ou texto simples) |
||||||||
Analisar imagens (visão) | ||||||||
Analisar vídeo (visão) | ||||||||
Analisar áudio | somente streaming | |||||||
Chat multiturno | ||||||||
Chamada de função (ferramentas) | ||||||||
Contar tokens | ||||||||
Instruções do sistema | ||||||||
Streaming multimodal bidirecional |
Especificações e limitações
Estas são as especificações e limitações ao usar cada modelo com o Firebase AI Logic:
Propriedade |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Geração de imagens do Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
Janela de contexto * Limite total de tokens (entrada e saída combinadas) |
1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 1.048.576 tokens | 32.768 tokens | 32.768 tokens | 480 tokens |
Limite de token de saída * | 65.536 tokens | 65.536 tokens | 65.536 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens | 8.192 tokens | --- |
Data de limite de conhecimento | Janeiro de 2025 | Janeiro de 2025 | Janeiro de 2025 | Junho de 2024 | Junho de 2024 | Agosto de 2024 | Agosto de 2024 | --- |
PDFs (por solicitação) | ||||||||
Número máximo de arquivos PDF de entrada ** |
3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | 3.000 arquivos | --- | --- |
Número máximo de páginas por arquivo PDF de entrada ** |
1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | 1.000 páginas | --- | --- |
Tamanho máximo por arquivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Imagens (por solicitação) | ||||||||
Número máximo de imagens de entrada |
3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | 3.000 imagens | --- | --- |
Número máximo de imagens de saída |
--- | --- | --- | --- | --- | 10 imagens | --- | 4 imagens |
Tamanho máximo por imagem codificada em base64 de entrada |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Vídeo (por solicitação) | ||||||||
Número máximo de arquivos de vídeo de entrada |
10 arquivos | 10 arquivos | 10 arquivos | 10 arquivos | 10 arquivos | 10 arquivos | --- | --- |
Duração máxima de todos os vídeos de entrada (somente frames) |
Cerca de 60 minutos | Cerca de 60 minutos | Cerca de 60 minutos | Cerca de 60 minutos | Cerca de 60 minutos | Cerca de 60 minutos | --- | --- |
Duração máxima de todos os vídeos de entrada (frames e áudio) |
aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | aproximadamente 45 minutos | --- | --- |
Áudio (por solicitação) | ||||||||
Número máximo de arquivos de áudio de entrada |
1 arquivo | 1 arquivo | 1 arquivo | 1 arquivo | 1 arquivo | 1 arquivo | --- | --- |
Número máximo de arquivos de áudio de saída |
--- | --- | --- | --- | --- | --- | --- | --- |
Comprimento máximo de todo o áudio de entrada |
Cerca de 8,4 horas | Cerca de 8,4 horas | Cerca de 8,4 horas | Cerca de 8,4 horas | Cerca de 8,4 horas | Cerca de 8,4 horas | --- | --- |
Comprimento máximo de todo o áudio de saída |
--- | --- | --- | --- | --- | --- | --- | --- |
*
Para todos os modelos Gemini, um token equivale a cerca de quatro caracteres,
portanto, 100 tokens equivalem a cerca de 60 a 80 palavras em inglês. Para modelos Gemini, é possível determinar a contagem total de tokens nas solicitações usando countTokens
.
** Os PDFs são tratados como imagens. Por isso, uma única página de um PDF é tratada como uma imagem. O número de páginas permitido em uma solicitação é limitado ao número de imagens que o modelo aceita.
Encontrar mais informações detalhadas
As cotas e os preços são diferentes para cada modelo. O preço também depende da entrada e da saída.
Saiba mais sobre os tipos de arquivos de entrada compatíveis, como especificar o tipo MIME e como garantir que seus arquivos de entrada e solicitações multimodais atendam aos requisitos e sigam as práticas recomendadas em Requisitos e tipos de arquivos de entrada compatíveis.
Controle de versões e padrões de nomenclatura de modelos
Os modelos são oferecidos em versões estável, prévia e experimental. Para facilitar, há suporte para aliases sem valores de versão explícitos.
Para encontrar nomes de modelos específicos a serem usados no seu código, consulte a seção "nomes de modelos disponíveis" mais adiante nesta página.
Tipo de versão / Etapa da versão |
Descrição | Padrão de nome do modelo | |
---|---|---|---|
Estável |
As versões estáveis estão disponíveis e têm suporte
para uso em produção a partir da data de lançamento.
Normalmente, uma versão estável de um modelo é lançada com uma data de desativação, que indica o último dia em que o modelo fica disponível. Depois dessa data, o modelo não estará mais acessível nem terá suporte do Google. |
|
|
Alias estável atualizado automaticamente (somente modelos Gemini 2.0) |
Os aliases estáveis atualizados automaticamente sempre apontam para a versão mais recente estável desse modelo. Se uma nova versão estável for lançada, o alias atualizado automaticamente começará a apontar para essa nova versão estável. |
Somente modelos Gemini 2.0
Exemplo: |
|
Visualizar |
As versões de pré-lançamento têm novos recursos e são consideradas instáveis.
Esses modelos não são recomendados para uso em produção, vêm com limites de taxa mais restritivos e podem ter requisitos de faturamento.
Para a Vertex AI Gemini API, os modelos de prévia lançados após junho de 2025 geralmente exigem que você defina o local do modelo como |
Os nomes dos modelos de versões de pré-lançamento são anexados com
Exemplo: |
|
Experimental |
As versões experimentais têm novos recursos e são consideradas instáveis.
Esses modelos não são recomendados para uso em produção e têm limites de taxa mais restritivos. Os modelos experimentais são destinados a coletar feedback e permitir testes com nossos recursos mais recentes. Para o Vertex AI Gemini API, os modelos experimentais lançados
depois de junho de 2025 exigem que você
defina o local do modelo como
|
Os nomes de modelos de versões experimentais são anexados com
Exemplo: |
|
Aposentado |
Versões desativadas já passaram da data de desativação e foram desativadas permanentemente.
Os modelos desativados não estão mais acessíveis nem são compatíveis com o Google, e as solicitações que fazem referência a um ID de modelo desativado geralmente retornam um erro 404. |
--- |
Nomes de modelos disponíveis
Os nomes de modelos são os valores explícitos que você inclui no seu código durante a inicialização do modelo.
Listar todos os modelos disponíveis de maneira programática
É possível listar todos os nomes de modelos disponíveis usando a API REST:
Gemini Developer API: chame o endpoint
models.list
Vertex AI Gemini API: chame o endpoint
publishers.models.list
A lista retornada inclui todos os modelos compatíveis com os provedores de API, mas o Firebase AI Logic só é compatível com os modelos Gemini e Imagen descritos nesta página.
Além disso, os aliases atualizados automaticamente (por exemplo, gemini-2.0-flash
) não são listados porque são um alias de conveniência para o modelo de base.
Gemini nomes de modelos
Para ver exemplos de inicialização da sua plataforma, consulte o guia de primeiros passos.
Para detalhes sobre as etapas de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.
Gemini 2.5 Pro nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.5-pro |
A versão estável mais recente do Gemini 2.5 Pro | Estável | 2025-06-17 | A partir de 2026-06-17 |
gemini-2.5-pro-preview-06-05 |
Versão de pré-lançamento que aponta para a versão estável mais recente de
Gemini 2.5 Pro (atualmente gemini-2.5-pro |
Visualizar | 2025-06-05 | A partir de 2025-07-15 |
gemini-2.5-pro-preview-05-06 |
Versão de pré-lançamento que aponta para a versão estável mais recente de
Gemini 2.5 Pro* (atualmente gemini-2.5-pro |
Visualizar | 2025-05-06 | A partir de 2025-07-15 |
gemini-2.5-pro-preview-03-25 |
Versão de pré-lançamento que aponta para a versão estável mais recente de
Gemini 2.5 Pro* (atualmente gemini-2.5-pro |
Visualizar | 25/03/2025 | A partir de 2025-07-15 |
* As versões de prévia atuais dos modelos Gemini 2.5 Pro começarão a apontar para a versão estável em 19 de junho de 2025.
Gemini 2.5 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.5-flash |
A versão estável mais recente do Gemini 2.5 Flash | Estável | 2025-06-17 | A partir de 2026-06-17 |
gemini-2.5-flash-preview-05-20 |
Versão de pré-lançamento que aponta para a versão estável mais recente de
Gemini 2.5 Flash (atualmente gemini-2.5-flash |
Visualizar | 2025-05-20 | A partir de 2025-07-15 |
gemini-2.5-flash-preview-04-17 |
Versão de pré-lançamento que aponta para a versão estável mais recente de
Gemini 2.5 Flash* (atualmente gemini-2.5-flash |
Visualizar | 2025-04-17 | A partir de 2025-07-15 |
* As versões de prévia atuais dos modelos Gemini 2.5 Flash começarão a apontar para a versão estável em 19 de junho de 2025.
Gemini 2.5 Flash‑Lite nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Versão de prévia inicial do Gemini 2.5 Flash‑Lite | Visualizar | 2025-06-17 | A ser determinado |
Gemini 2.0 Flash nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-001 |
A versão estável mais recente do Gemini 2.0 Flash | Estável | 2025-02-05 | A partir de 2026-02-05 |
gemini-2.0-flash |
Alias atualizado automaticamente que aponta para a versão estável mais recente do
Gemini 2.0 Flash (atualmente gemini-2.0-flash-001 |
Estável | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
A versão estável mais recente do Gemini 2.0 Flash‑Lite | Estável | 2025-02-25 | A partir de 2026-02-25 |
gemini-2.0-flash-lite |
Alias atualizado automaticamente que aponta para a versão estável mais recente do
Gemini 2.0 Flash‑Lite (atualmente gemini-2.0-flash-lite-001 |
Estável | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Versão de prévia para Gemini 2.0 Flash Image Generation | Visualizar | 2025-05-06 | A ser determinado |
Gemini 2.0 Flash Live nomes de modelos
Disponível apenas quando você usa o Vertex AI Gemini API como seu provedor de API. |
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Versão de prévia para Gemini 2.0 Flash Live | Visualizar | 2025-04-09 | A ser determinado |
1 Não há suporte ao usar o Gemini Developer API com SDKs Firebase AI Logic.
Imagen nomes de modelos
Para exemplos de inicialização da sua plataforma, consulte o guia de geração de imagens com Imagen.
Para detalhes sobre as etapas de lançamento (especialmente para casos de uso e faturamento), consulte controle de versões e padrões de nomenclatura de modelos.
Imagen 4 nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Versão de pré-lançamento de Imagen 4 | Visualizar | 2025-06-06 | A ser determinado |
imagen-4.0-generate-preview-05-20 2 |
Versão de pré-lançamento de Imagen 4 | Visualizar | 2025-05-20 | A partir de 2025-07-07 |
Imagen 4 Fast nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Versão de pré-lançamento de Imagen 4 Fast | Visualizar | 2025-06-06 | A ser determinado |
Imagen 4 Ultra nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Versão de pré-lançamento de Imagen 4 Ultra | Visualizar | 2025-06-06 | A ser determinado |
imagen-4.0-ultra-generate-exp-05-20 2 |
Versão experimental do Imagen 4 Ultra | Experimental | 2025-05-20 | A partir de 2025-07-07 |
Imagen 3 nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-3.0-generate-002 |
A versão estável mais recente do Imagen 3 | Estável | 2025-01-23 | A partir de 23 de janeiro de 2026 |
imagen-3.0-generate-001 2 |
Versão estável inicial do Imagen 3 | Estável | 2024-07-31 | A partir de 31 de julho de 2025 |
Imagen 3 Fast nomes de modelos
Nome do modelo | Descrição | Etapa de lançamento | Data da versão | Data de desativação |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Versão estável inicial do Imagen 3 Fast | Estável | 2024-07-31 | A partir de 31 de julho de 2025 |
2 Não é compatível com o Gemini Developer API, independente de como você acessa a API.
Idiomas disponíveis
Gemini
Todos os modelos Gemini podem entender e responder nos seguintes idiomas:
Árabe (ar), bengali (bn), búlgaro (bg), chinês simplificado e tradicional (zh), croata (hr), tcheco (cs), dinamarquês (da), neerlandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), hebraico (iw), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), norueguês (no), polonês (pl), português (pt), romeno (ro), russo (ru), sérvio (sr), eslovaco (sk), esloveno (sl), espanhol (es), swahili (sw), sueco (sv), tailandês (th), turco (tr), ucraniano (uk), vietnamita (vi)
Os modelos Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash podem entender e responder nos seguintes outros idiomas:
Africâner (af), amárico (am), assamês (as), azerbaijano (az), bielorrusso (be), bósnio (bs), catalão (ca), cebuano (ceb), córsico (co), galês (cy), divehi (dv), esperanto (eo), basco (eu), persa (fa), filipino (tagalo) (fil), frísio (fy), irlandês (ga), gaélico escocês (gd), galego (gl), guzerate (gu), hauçá (ha), havaiano (haw), hmong (hmn), crioulo haitiano (ht), armênio (hy), igbo (ig), islandês (is), javanês (jv), georgiano (ka), cazaque (kk), khmer (km), canarês (kn), krio (kri), curdo (ku), quirguiz (ky), latim (la), luxemburguês (lb), laosiano (lo), malgaxe (mg), maori (mi), macedônio (mk), malaiala (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marati (mr), malaio (ms), maltês (mt), mianmar (birmanês) (my), nepalês (ne), nianja (chicheua) (ny), odia (oriá) (or), punjabi (pa), pashto (ps), sindi (sd), cingalês (si), samoano (sm), chona (sn), somali (so), albanês (sq), sesotho (st), sundanês (su), tâmil (ta), télugo (te), tadjique (tg), uyghur (ug), urdu (ur), usbeque (uz), xhosa (xh), Ídiche (yi), iorubá (yo), zulu (zu)
Imagen
Disponibilidade geral: inglês
Prévia: chinês (simplificado), chinês (tradicional), hindi, japonês, coreano, português, espanhol
Informações sobre modelos mais antigos
O Firebase AI Logic é compatível com os modelos ativos Gemini mais antigos (como os modelos Gemini 1.5).
Firebase AI Logic não é compatível com os modelos Imagen mais antigos (como Imagen 2).
Modelo | Entrada | Saída | Otimizado para |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Suporta tarefas de raciocínio complexas que exigem mais inteligência; Contexto longo de 2 milhões |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho rápido e versátil em uma variedade de tarefas |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Próximas etapas
Teste os recursos do Gemini API
- Crie conversas multiturno (chat).
- Gerar texto com base em comandos somente de texto.
- Gere texto usando comandos com vários tipos de arquivos, como imagens, PDFs, vídeos e áudios.
- Gerar saída estruturada (como JSON) com base em comandos de texto e multimodais.
- Gerar imagens com base em comandos de texto (Gemini ou Imagen).
- Entrada e saída de stream (incluindo áudio) usando o Gemini Live API.
- Use a chamada de função para conectar modelos generativos a sistemas e informações externas.