Używanie konfiguracji modelu do kontrolowania odpowiedzi

W każdym wywołaniu modelu możesz przesłać konfigurację modelu, aby kontrolować sposób generowania odpowiedzi. Każdy model oferuje różne opcje konfiguracji.

Możesz eksperymentować z promptami i konfiguracjami modeli oraz szybko ulepszać model za pomocą Vertex AI Studio.

Przejdź do opcji konfiguracji Gemini Przejdź do opcji konfiguracji Imagen

Opcje konfiguracji modeli Gemini

W tej sekcji dowiesz się, jak skonfigurować konfigurację na potrzeby modeli Gemini oraz jak opisy poszczególnych parametrów.

Konfigurowanie konfiguracji modelu w przypadku modeli Gemini

Opis każdego parametru znajdziesz w następnej sekcji tej strony.

Opis każdego parametru do użycia z modelami Gemini

Oto ogólny przegląd dostępnych parametrów. Pełną listę parametrów i ich wartości znajdziesz w dokumentacji Google Cloud.

Parametr	Opis	Wartość domyślna
Sygnalizowanie czasu w dźwięku `audioTimestamp`	Wartość logiczna, która umożliwia rozpoznawanie sygnatur czasowych w plikach wejściowych zawierających tylko dźwięk. Dotyczy tylko połączeń `generateContent` lub `generateContentStream`, gdy typ danych to plik tylko z dźwiękiem.	`false`
Kara za nadmierne wyświetlanie reklam `frequencyPenalty`	Określa prawdopodobieństwo uwzględnienia tokenów, które wielokrotnie pojawiają się w wygenerowanej odpowiedzi. Wartości dodatnie penalizują tokeny, które wielokrotnie pojawiają się w wygenerowanych treściach, zmniejszając prawdopodobieństwo powtarzania się treści.	---
Maksymalna liczba tokenów wyjściowych `maxOutputTokens`	Maksymalna liczba tokenów, które można wygenerować w odpowiedzi.	---
Kara za obecność `presencePenalty`	Określa prawdopodobieństwo uwzględnienia tokenów, które występują już w wygenerowanej odpowiedzi. Wartości dodatnie penalizują tokeny, które występują już w wygenerowanych treściach, zwiększając prawdopodobieństwo wygenerowania bardziej zróżnicowanych treści.	---
Sekwencja zatrzymania `stopSequences`	Określa listę ciągów znaków, która informuje model, że ma przestać generować treści, jeśli w odpowiedzi pojawi się jeden z tych ciągów.	---
Temperatura `temperature`	Określa stopień losowości odpowiedzi. Niższe temperatury skutkują bardziej deterministycznymi odpowiedziami, a wyższe – bardziej zróżnicowanymi lub kreatywnymi odpowiedziami.	Zależy od modelu
Top-K `topK`	Ogranicza liczbę słów o najwyższym prawdopodobieństwie występujących w treści wygenerowanej przez model. Wartość top-K `1` oznacza, że następny wybrany token powinien być najbardziej prawdopodobny spośród wszystkich tokenów w słowniku modelu, natomiast wartość top-K `n` oznacza, że następny token powinien być wybrany spośród n najbardziej prawdopodobnych tokenów (wszystko na podstawie ustawionej temperatury).	Zależy od modelu
Top-P `topP`	kontroluje różnorodność generowanych treści; Tokeny są wybierane w kolejności od najbardziej (patrz Top-K powyżej) do najmniej prawdopodobnych, aż suma ich prawdopodobieństw będzie równa wartości Top-P.	Zależy od modelu

Opcje konfiguracji modeli Imagen

W tej sekcji dowiesz się, jak skonfigurować konfigurację na potrzeby modeli Imagen oraz jak opisy poszczególnych parametrów.

Konfigurowanie konfiguracji modelu w przypadku modeli Imagen

Opis każdego parametru znajdziesz w następnej sekcji tej strony.

Opis każdego parametru do użycia z modelami Imagen

Oto ogólny przegląd dostępnych parametrów. Pełną listę parametrów i ich wartości znajdziesz w dokumentacji Google Cloud.

Parametr	Opis	Wartość domyślna
Prompt negatywny `negativePrompt`	opis tego, co chcesz pominąć w wygenerowanych obrazach; Ten parametr nie jest jeszcze obsługiwany przez usługę `imagen-3.0-generate-002`.	---
Liczba wyników `numberOfImages`	Liczba wygenerowanych obrazów zwróconych na potrzeby każdego żądania	domyślnie jeden obraz w przypadku modeli Imagen 3
Format obrazu `aspectRatio`	Stosunek szerokości do wysokości wygenerowanych obrazów	Domyślnie jest to kwadrat (1:1).
Format obrazu `imageFormat`	opcje wyjściowe, takie jak format obrazu (typ MIME) i poziom kompresji wygenerowanych obrazów;	domyślny typ MIME to PNG domyślne skompresowanie to 75 (jeśli typ MIME to JPEG)
Znak wodny `addWatermark`	czy do wygenerowanych obrazów ma zostać dodany niewidoczny cyfrowy znak wodny (nazywany SynthID);	Domyślna wartość dla modeli Imagen 3 to `true`
Generowanie osób `personGeneration`	czy chcesz zezwolić na generowanie osób przez model.	domyślnie zależy od modelu

Inne opcje kontrolowania generowania treści

Dowiedz się więcej o projektowaniu promptów, aby móc wpływać na model w celu generowania wyników odpowiadających Twoim potrzebom.
Użyj ustawień bezpieczeństwa, aby dostosować prawdopodobieństwo otrzymania odpowiedzi, które mogą być uznane za szkodliwe, w tym wypowiedzi szerzące nienawiść i treści o charakterze jednoznacznie seksualnym.
Ustaw instrukcje systemowe, aby kierować działaniem modelu. Ta funkcja jest jak „wstęp”, który dodajesz przed udostępnieniem modelu w celu uzyskania dalszych instrukcji od użytkownika końcowego.
Przekaż schemat odpowiedzi wraz z promptem, aby określić konkretny schemat wyjściowy. Ta funkcja jest najczęściej używana do generowania danych wyjściowych w formacie JSON, ale można jej też używać do zadań klasyfikacji (np. gdy chcesz, aby model używał określonych etykiet).