Usar a configuração do modelo para controlar as respostas

Em cada chamada para um modelo, é possível enviar uma configuração para controlar como ele gera uma resposta. Cada modelo oferece diferentes opções de configuração.

É possível testar comandos e configurações de modelo e iterar rapidamente usando Vertex AI Studio.

Ir para as opções de configuração Gemini Ir para as opções de configuração Imagen



Opções de configuração para modelos Gemini

Esta seção mostra como configurar uma configuração para uso com modelos Gemini e fornece uma descrição de cada parâmetro.

Configurar uma configuração de modelo para modelos Gemini

Confira uma descrição de cada parâmetro na próxima seção desta página.

Descrição de cada parâmetro para uso com modelos Gemini

Confira uma visão geral dos parâmetros disponíveis, conforme aplicável. Encontre uma lista abrangente de parâmetros e valores na documentação de Google Cloud.

Parâmetro Descrição Valor padrão
Carimbo de data/hora do áudio
audioTimestamp

Um booleano que permite a compreensão de carimbos de data/hora para arquivos de entrada somente de áudio.

Aplicável somente ao usar chamadas generateContent ou generateContentStream e quando o tipo de entrada é um arquivo somente de áudio.

false
Penalidade de frequência
frequencyPenalty
Controla a probabilidade de incluir tokens que aparecem repetidamente na resposta gerada.
Valores positivos penalizam tokens que aparecem repetidamente no conteúdo gerado, diminuindo a probabilidade de repetir conteúdo.
---
Máximo de tokens de saída
maxOutputTokens
Número máximo de tokens que podem ser gerados na resposta. ---
Penalidade de presença
presencePenalty
Controla a probabilidade de incluir tokens que já aparecem na resposta gerada.
Valores positivos penalizam tokens que já aparecem no conteúdo gerado, aumentando a probabilidade de gerar conteúdo mais diversificado.
---
Parar sequências
stopSequences
Especifica uma lista de strings que instrui o modelo a parar de gerar conteúdo se uma das strings for encontrada na resposta. ---
Temperatura
temperature
Controla o grau de aleatoriedade na resposta.
Temperaturas mais baixas resultam em respostas mais deterministas, e temperaturas mais altas resultam em respostas mais diversas ou criativas.
Depende do modelo
Top-K
topK
Limita o número de palavras de maior probabilidade usadas no conteúdo gerado.
Um valor de top-K de 1 significa que o próximo token selecionado precisa ser o mais provável entre todos os tokens no vocabulário do modelo, enquanto um valor de top-K de n significa que o próximo token precisa ser selecionado entre os n tokens mais prováveis (todos com base na temperatura definida).
Depende do modelo
Top-P
topP
Controla a diversidade do conteúdo gerado.
Os tokens são selecionados do mais provável (confira o top-K acima) para o menos provável até que a soma das probabilidades seja igual ao valor do top-P.
Depende do modelo



Opções de configuração para modelos Imagen

Esta seção mostra como configurar uma configuração para uso com modelos Imagen e fornece uma descrição de cada parâmetro.

Configurar uma configuração de modelo para modelos Imagen

Confira uma descrição de cada parâmetro na próxima seção desta página.

Descrição de cada parâmetro para uso com modelos Imagen

Confira uma visão geral de alto nível dos parâmetros disponíveis, conforme aplicável. Encontre uma lista abrangente de parâmetros e valores na documentação de Google Cloud.

Parâmetro Descrição Valor padrão
Comando negativo
negativePrompt
Uma descrição do que você quer omitir nas imagens geradas

Esse parâmetro ainda não é compatível com imagen-3.0-generate-002.

---
Número de resultados
numberOfImages
O número de imagens geradas retornadas para cada solicitação O padrão é uma imagem para modelos Imagen 3
Proporção
aspectRatio
A proporção entre a largura e a altura das imagens geradas O padrão é quadrado (1:1)
Formato da imagem
imageFormat
As opções de saída, como o formato de imagem (tipo MIME) e o nível de compactação das imagens geradas O tipo MIME padrão é PNG
A compactação padrão é 75 (se o tipo MIME estiver definido como JPEG)
Marca-d'água
addWatermark
Define se uma marca-d'água digital não visível (chamada de SynthID) será adicionada às imagens geradas O padrão é true para modelos Imagen 3
Geração de pessoas
personGeneration
Permite a geração de imagens de pessoas pelo modelo padrão depende do modelo



Outras opções para controlar a geração de conteúdo

  • Saiba mais sobre o design de comando para influenciar o modelo a gerar resultados específicos para suas necessidades.
  • Use as configurações de segurança para ajustar a probabilidade de receber respostas que possam ser consideradas nocivas, incluindo discurso de ódio e conteúdo sexualmente explícito.
  • Defina instruções do sistema para orientar o comportamento do modelo. Esse recurso é como um "preâmbulo" que você adiciona antes que o modelo seja exposto a outras instruções do usuário final.
  • Transmita um esquema de resposta com o comando para especificar um esquema de saída específico. Esse recurso é usado com mais frequência ao gerar saída JSON, mas também pode ser usado para tarefas de classificação, como quando você quer que o modelo use rótulos ou tags específicos.