Omówienie i konfigurowanie parametrów modelu

Każde wywołanie wysłane do modelu zawiera wartości parametrów, które określają, jak model wygeneruje odpowiedź. Model może generować różne wyniki zależnie od tych wartości. Wypróbuj różne wartości parametrów, aby uzyskać najlepsze wyniki w tym zadaniu. Parametry dostępne w różnych modelach mogą się różnić.

Przejdź do parametrów Gemini Przejdź do parametrów Imagen

Parametry modeli Gemini

Dowiedz się więcej o parametrach dostępnych do użycia z modelami Gemini, w tym o tym, jak je skonfigurować.

Konfiguracja jest utrzymywana przez cały czas istnienia zainicjowanej Vertex AIusługi i instancji modelu. Aby zaktualizować konfigurację modelu, należy ponownie zainicjować jego instancję.

Opis każdego parametru

Najczęstsze parametry to:

W kolejnych sekcjach tej strony znajdziesz informacje o każdym z tych parametrów.

Maksymalna liczba tokenów wyjściowych

Maksymalna liczba tokenów, które można wygenerować w odpowiedzi. Token ma około 4 znaków. 100 tokenów odpowiada około 20 słowom.

Jeśli chcesz uzyskiwać krótsze odpowiedzi, podaj niższą wartość, a jeśli dłuższe – wyższą.

Temperatura

Temperatura jest używana do próbkowania podczas generowania odpowiedzi, co ma miejsce, gdy są stosowane topPtopK. Temperatura decyduje o stopniu losowości wyboru tokenów. Niższe temperatury są przydatne w przypadku promptów, na które oczekuje się bardziej deterministycznej i mniej otwartej lub kreatywnej odpowiedzi, a wyższe mogą prowadzić do bardziej różnorodnych lub kreatywnych wyników. Temperatura 0 jest deterministyczna, co oznacza, że zawsze jest wybierana najbardziej prawdopodobna odpowiedź.

W większości przypadków dobrze jest zacząć od temperatury 0.2. Jeśli model zwróci zbyt ogólną lub krótką odpowiedź, albo odpowiedź zastępczą, spróbuj zwiększyć temperaturę.

Top-K

Parametr Top-K zmienia sposób, w jaki model wybiera tokeny w celu wygenerowania odpowiedzi. Top-K o wartości 1 oznacza, że wybierany jest najbardziej prawdopodobny token spośród wszystkich tokenów w słowniku modelu (jest to też nazywane dekodowaniem zachłannym), natomiast Top-K o wartości 3 oznacza, że następny token jest wybierany z użyciem temperatury spośród 3 najbardziej prawdopodobnych.

Na każdym etapie wyboru tokena próbkowane są tokeny Top-K o najwyższym prawdopodobieństwie. Tokeny są następnie filtrowane na podstawie parametru Top-P, a ostateczny wybór tokena dokonywany jest przy pomocy próbkowania z użyciem temperatury.

Jeśli chcesz uzyskiwać mniej losowe odpowiedzi, podaj niższą wartość, a jeśli bardziej – wyższą. Wartość domyślna parametru górnego K to 40.

Top-P

Parametr Top-P również zmienia sposób, w jaki model wybiera tokeny w celu wygenerowania odpowiedzi. Tokeny są wybierane w kolejności od najbardziej (patrz Top-K) do najmniej prawdopodobnych, aż suma ich prawdopodobieństw będzie równa wartości Top-P. Jeśli na przykład tokeny A, B i C mają prawdopodobieństwa 0,3, 0,2 i 0,1, a wartością Top-P jest 0.5, jako kolejny token model wybierze A lub B (z użyciem temperatury), a token C zostanie wykluczony.

Jeśli chcesz uzyskiwać mniej losowe odpowiedzi, podaj niższą wartość, a jeśli bardziej – wyższą. Wartość domyślna parametru górnego P to 0.95.

Konfigurowanie parametrów modeli Gemini

Parametry modeli Imagen

Dowiedz się więcej o parametrach dostępnych do użycia z modelami Imagen, w tym o tym, jak je skonfigurować.

Konfiguracja jest utrzymywana przez cały czas istnienia zainicjowanej Vertex AIusługi i instancji modelu. Aby zaktualizować konfigurację modelu, należy ponownie zainicjować jego instancję.

Opis każdego parametru

Pełną listę parametrów i ich wartości znajdziesz w dokumentacji Google Cloud, ale poniżej przedstawiamy ogólny przegląd dostępnych parametrów i ich wartości domyślnych.

Parametr Opis Wartość domyślna
Prompt negatywny
negativePrompt
opis tego, co chcesz pominąć w wygenerowanych obrazach;

Ten parametr nie jest jeszcze obsługiwany przez usługę imagen-3.0-generate-002.

---
Liczba wyników
numberOfImages
Liczba wygenerowanych obrazów zwróconych na potrzeby każdego żądania domyślnie jeden obraz w przypadku modeli Imagen 3
Format obrazu
aspectRatio
Stosunek szerokości do wysokości wygenerowanych obrazów domyślnie kwadrat 1:1
Format obrazu
imageFormat
opcje wyjściowe, takie jak format obrazu (typ MIME) i poziom kompresji wygenerowanych obrazów; domyślny typ MIME to PNG
domyślne skompresowanie to 75 (jeśli typ MIME to JPEG)
Znak wodny
addWatermark
czy do wygenerowanych obrazów ma zostać dodany niewidoczny cyfrowy znak wodny (nazywany SynthID); Domyślna wartość dla modeli Imagen 3 to true
Generowanie osób
personGeneration
czy chcesz zezwolić na generowanie osób przez model. domyślnie zależy od modelu

Konfigurowanie parametrów modeli Imagen

Inne opcje umożliwiające kontrolowanie generowania treści

  • Dowiedz się więcej o projektowaniu promptów, aby móc wpływać na model w celu generowania wyników odpowiadających Twoim potrzebom.
  • Użyj ustawień bezpieczeństwa, aby dostosować prawdopodobieństwo otrzymania odpowiedzi, które mogą być uznane za szkodliwe, w tym wypowiedzi szerzące nienawiść i treści o charakterze jednoznacznie seksualnym.
  • Ustaw instrukcje systemowe, aby kierować działaniem modelu. Ta funkcja jest jak „wstęp”, który dodajesz przed udostępnieniem modelu w celu uzyskania dalszych instrukcji od użytkownika końcowego.
  • Przekaż schemat odpowiedzi wraz z promptem, aby określić konkretny schemat wyjściowy. Ta funkcja jest najczęściej używana do generowania danych wyjściowych w formacie JSON, ale można jej też używać do zadań klasyfikacji (np. gdy chcesz, aby model używał określonych etykiet).