כל קריאה ששולחים למודל כוללת ערכי פרמטרים ששולטים באופן שבו המודל יוצר תגובה. המודל יכול ליצור תוצאות שונות לערכים שונים של הפרמטרים. כדאי לנסות ערכים שונים של הפרמטרים כדי למצוא את הערכים הטובים ביותר למשימה. הפרמטרים שזמינים למודלים שונים עשויים להשתנות.
Gemini מעבר לפרמטרים של Imagen מעבר לפרמטרים של
פרמטרים למודלים של Gemini
מידע על הפרמטרים שזמינים לשימוש עם מודלים מסוג Gemini, כולל איך מגדירים אותם
ההגדרה נשמרת לכל משך החיים של מופע השירות והמודל של Vertex AI שהותחל. כדי לעדכן את הגדרות המודל, צריך לאתחל מחדש את מופע המודל.
תיאור של כל פרמטר
הפרמטרים הנפוצים ביותר הם:
בקטעים הבאים בדף מוסבר על כל אחד מהפרמטרים האלה.
מספר מקסימלי של אסימוני פלט
המספר המקסימלי של אסימונים שאפשר ליצור בתגובה. אסימון הוא ארבעה תווים בערך. 100 אסימונים תואמים לכ-20 מילים.
מציינים ערך נמוך יותר לתשובות קצרות וערך גבוה יותר לתשובות ארוכות יותר.
טמפרטורה
הטמפרטורה משמשת לדגימה במהלך יצירת התשובה, שמתרחשת כשמפעילים את topP
ואת topK
. הטמפרטורה שולטת במידת האקראיות בבחירת האסימון. טמפרטורות נמוכות טובות להנחיות עם ציפייה לתשובה deterministית יותר, ולא לתשובה פתוחה או יצירתית, ואילו טמפרטורות גבוהות יכולות להוביל לתוצאות יותר מגוונות או יצירתיות. טמפרטורה של 0
היא גורמית, כלומר תמיד נבחרת התשובה עם ההסתברות הגבוהה ביותר.
ברוב התרחישים לדוגמה, כדאי להתחיל בטמפרטורה של 0.2
. אם התשובה שמוחזרת על ידי המודל קצרה מדי, גנרית מדי או תגובה חלופית, כדאי לנסות להגדיל את הטמפרטורה.
Top-K
Top-K משנה את האופן שבו המודל בוחר אסימונים לפלט. כשה-top-K הוא 1
, המשמעות היא שהאסימון הבא שנבחר הוא בעל ההסתברות הגבוהה ביותר מבין כל האסימונים במילון של המודל (נקרא גם פענוח חמדן). לעומת זאת, כשה-top-K הוא 3
, המשמעות היא שהאסימון הבא נבחר מתוך שלושת האסימונים עם ההסתברות הגבוהה ביותר באמצעות טמפרטורה.
בכל שלב של בחירת אסימונים, מתבצע דגימה של 'ה-K הטובים ביותר' עם ההסתברויות הגבוהות ביותר. לאחר מכן, האסימונים מסוננים עוד יותר על סמך ה-top-P, והאסימון הסופי נבחר באמצעות דגימת טמפרטורה.
מציינים ערך נמוך יותר כדי לקבל פחות תשובות אקראיות וערך גבוה יותר כדי לקבל יותר תשובות אקראיות. ערך ברירת המחדל של top-K הוא 40
.
Top-P
Top-P משנה את האופן שבו המודל בוחר אסימונים לפלט. האסימונים נבחרים מהסיכוי הגבוה ביותר (ראו top-K) עד הנמוך ביותר, עד שסכום הסיכויים שלהם שווה לערך top-P. לדוגמה, אם ההסתברויות של האסימונים A, B ו-C הן 0.3, 0.2 ו-0.1, וערך ה-top-P הוא 0.5
, המודל יבחר את האסימון הבא מתוך A או B באמצעות הטמפרטורה, ויחרוג את C מהאפשרויות.
מציינים ערך נמוך יותר כדי לקבל פחות תשובות אקראיות וערך גבוה יותר כדי לקבל יותר תשובות אקראיות. ערך ברירת המחדל של top-P הוא 0.95
.
הגדרת פרמטרים של מודלים למודלים מסוג Gemini
מגדירים את הפרמטרים של המודל ב-generationConfig
במהלך האתחול של המודל. הנה דוגמה בסיסית:
Kotlin
// ...
val config = generationConfig {
maxOutputTokens = 200
stopSequences = listOf("red")
temperature = 0.9f
topK = 16
topP = 0.1f
}
val generativeModel = Firebase.vertexAI.generativeModel(
modelName = "GEMINI_MODEL_NAME",
generationConfig = config
)
// ...
Java
// ...
GenerationConfig.Builder configBuilder = new GenerationConfig.Builder();
configBuilder.maxOutputTokens = 200;
configBuilder.stopSequences = List.of("red");
configBuilder.temperature = 0.9f;
configBuilder.topK = 16;
configBuilder.topP = 0.1f;
GenerationConfig generationConfig = configBuilder.build();
GenerativeModel gm = FirebaseVertexAI.getInstance().generativeModel(
"GEMINI_MODEL_NAME",
generationConfig
);
GenerativeModelFutures model = GenerativeModelFutures.from(gm);
// ...
פרמטרים למודלים של Imagen
מידע על הפרמטרים שזמינים לשימוש עם מודלים מסוג Imagen, כולל הסבר על הגדרתם.
ההגדרה נשמרת לכל משך החיים של מופע השירות והמודל של Vertex AI שהותחל. כדי לעדכן את הגדרות המודל, צריך לאתחל מחדש את מופע המודל.
תיאור של כל פרמטר
רשימה מקיפה של הפרמטרים והערכים שלהם מופיעה במסמכי העזרה של Google Cloud, אבל כאן מופיעה סקירה כללית של הפרמטרים הזמינים וערכי ברירת המחדל שלהם, לפי הצורך.
פרמטר | תיאור | ערך ברירת מחדל |
---|---|---|
הנחיה שלילית
negativePrompt
|
תיאור של מה שרוצים להשמיט בתמונות שייווצרו
הפרמטר הזה עדיין לא נתמך על ידי |
--- |
מספר התוצאות
numberOfImages
|
מספר התמונות שנוצרו שהוחזרו לכל בקשה | ברירת המחדל היא תמונה אחת במודלים של Imagen 3 |
יחס גובה-רוחב
aspectRatio
|
היחס בין הרוחב לגובה של התמונות שנוצרו | ברירת המחדל היא ריבוע 1:1 |
פורמט התמונה
imageFormat
|
אפשרויות הפלט, כמו פורמט התמונה (סוג ה-MIME) ורמת הדחיסה של התמונות שנוצרות | סוג ה-MIME שמוגדר כברירת מחדל הוא PNG דחיסת ברירת המחדל היא 75 (אם סוג ה-MIME מוגדר כ-JPEG) |
סימן מים
addWatermark
|
האם להוסיף סימן מים דיגיטלי בלתי נראה (שנקרא SynthID) לתמונות שנוצרו | ברירת המחדל היא true במודלים מסוג Imagen 3
|
יצירת אנשים
personGeneration
|
האם לאפשר ליצירת אנשים על ידי המודל | ברירת המחדל תלויה במודל |
הגדרת פרמטרים של מודלים למודלים מסוג Imagen
Kotlin
// ...
val config = ImagenGenerationConfig(
negativePrompt = "frogs",
numberOfImages = 2,
aspectRatio = ImagenAspectRatio.LANDSCAPE_16x9,
imageFormat = ImagenImageFormat.jpeg(compressionQuality = 100),
addWatermark = false
)
val imagenModel = Firebase.vertexAI.imagenModel(
modelName = "IMAGEN_MODEL_NAME",
generationConfig = config
)
// ...
Java
// ...
ImagenGenerationConfig config = new ImagenGenerationConfig.Builder()
.setNegativePrompt("frogs")
.setNumberOfImages(2)
.setAspectRatio(ImagenAspectRatio.LANDSCAPE_16x9)
.setImageFormat(ImagenImageFormat.jpeg(100))
.setAddWatermark(false)
.build();
ImagenModel m = FirebaseVertexAI.getInstance().imagenModel(
"IMAGEN_MODEL_NAME",
config
);
ImagenModelFutures model = ImagenModelFutures.from(m);
// ...
אפשרויות אחרות לניהול יצירת התוכן
- מידע נוסף על עיצוב הנחיות כדי שתוכלו להשפיע על המודל כך שיניב פלט ספציפי לצרכים שלכם.
- אתם יכולים להשתמש בהגדרות הבטיחות כדי לשנות את הסבירות לקבלת תשובות שעשויות להיחשב כפוגעניות, כולל דברי שטנה ותוכן מיני בוטה.
- מגדירים הוראות מערכת כדי להשפיע על התנהגות המודל. התכונה הזו היא כמו 'מבוא' שמוסיפים לפני שהמודל נחשף להוראות נוספות ממשתמש הקצה.
- מעבירים סכימה של תגובה יחד עם ההנחיה כדי לציין סכימה ספציפית של פלט. התכונה הזו משמשת בדרך כלל ליצירת פלט בפורמט JSON, אבל אפשר להשתמש בה גם למשימות סיווג (למשל, כשרוצים שהמודל ישתמש בתוויות או בתגים ספציפיים).