Sử dụng cấu hình mô hình để kiểm soát phản hồi

Trong mỗi lệnh gọi đến một mô hình, bạn có thể gửi cùng một cấu hình mô hình để kiểm soát cách mô hình tạo phản hồi. Mỗi mô hình cung cấp nhiều tuỳ chọn cấu hình.

Bạn có thể thử nghiệm với các câu lệnh và cấu hình mô hình, đồng thời lặp lại nhanh bằng cách sử dụng Vertex AI Studio.

Chuyển đến các tuỳ chọn cấu hình Gemini Chuyển đến các tuỳ chọn cấu hình Imagen



Các tuỳ chọn cấu hình cho mô hình Gemini

Phần này cho bạn biết cách thiết lập cấu hình để sử dụng với các mô hình Gemini và cung cấp nội dung mô tả về từng thông số.

Thiết lập cấu hình mô hình cho các mô hình Gemini

Bạn có thể tìm thấy nội dung mô tả về từng tham số trong phần tiếp theo của trang này.

Nội dung mô tả từng tham số để sử dụng với các mô hình Gemini

Dưới đây là thông tin tổng quan cấp cao về các thông số có sẵn (nếu có). Bạn có thể tìm thấy danh sách đầy đủ các tham số và giá trị của các tham số đó trong tài liệu về Google Cloud.

Thông số Mô tả Giá trị mặc định
Dấu thời gian âm thanh
audioTimestamp

Một boolean cho phép hiểu dấu thời gian cho các tệp đầu vào chỉ âm thanh.

Chỉ áp dụng khi sử dụng lệnh gọi generateContent hoặc generateContentStream và loại dữ liệu đầu vào là tệp chỉ âm thanh.

false
Hình phạt về tần suất
frequencyPenalty
Kiểm soát xác suất đưa vào các mã thông báo xuất hiện nhiều lần trong phản hồi được tạo.
Giá trị dương sẽ phạt các mã thông báo xuất hiện lặp lại trong nội dung được tạo, làm giảm xác suất lặp lại nội dung.
---
Số lượng mã thông báo đầu ra tối đa
maxOutputTokens
Số lượng mã thông báo tối đa có thể được tạo trong phản hồi. ---
Trường hợp bị phạt do không có mặt
presencePenalty
Kiểm soát xác suất đưa các mã thông báo đã xuất hiện vào phản hồi đã tạo.
Giá trị dương sẽ phạt các mã thông báo đã xuất hiện trong nội dung được tạo, tăng khả năng tạo nội dung đa dạng hơn.
---
Dừng trình tự
stopSequences
Chỉ định danh sách các chuỗi yêu cầu mô hình ngừng tạo nội dung nếu gặp một trong các chuỗi đó trong phản hồi. ---
Nhiệt độ
temperature
Kiểm soát mức độ ngẫu nhiên trong câu trả lời.
Nhiệt độ thấp hơn sẽ dẫn đến các phản hồi có tính quyết định hơn, còn nhiệt độ cao hơn sẽ dẫn đến các phản hồi đa dạng hoặc sáng tạo hơn.
Tuỳ thuộc vào mẫu
Top-K
topK
Giới hạn số lượng từ có xác suất cao nhất được sử dụng trong nội dung được tạo.
Giá trị top-K là 1 có nghĩa là mã thông báo được chọn tiếp theo phải là có nhiều khả năng nhất trong số tất cả mã thông báo trong từ vựng của mô hình, trong khi giá trị top-K là n có nghĩa là mã thông báo tiếp theo phải được chọn trong số n mã thông báo có nhiều khả năng nhất (tất cả đều dựa trên nhiệt độ đã đặt).
Tuỳ thuộc vào mẫu
Top-P
topP
Kiểm soát tính đa dạng của nội dung được tạo.
Các mã thông báo được chọn từ mã có nhiều khả năng nhất (xem top-K ở trên) đến mã có ít khả năng nhất cho đến khi tổng xác suất của các mã đó bằng giá trị top-P.
Tuỳ thuộc vào mẫu



Các tuỳ chọn cấu hình cho mô hình Imagen

Phần này cho bạn biết cách thiết lập cấu hình để sử dụng với các mô hình Imagen và cung cấp nội dung mô tả về từng thông số.

Thiết lập cấu hình mô hình cho các mô hình Imagen

Bạn có thể tìm thấy nội dung mô tả về từng tham số trong phần tiếp theo của trang này.

Nội dung mô tả từng tham số để sử dụng với các mô hình Imagen

Dưới đây là thông tin tổng quan cấp cao về các thông số có sẵn (nếu có). Bạn có thể tìm thấy danh sách đầy đủ các tham số và giá trị của các tham số đó trong tài liệu về Google Cloud.

Thông số Mô tả Giá trị mặc định
Câu lệnh phủ định
negativePrompt
Nội dung mô tả những gì bạn muốn bỏ qua trong hình ảnh được tạo

imagen-3.0-generate-002 chưa hỗ trợ tham số này.

---
Số kết quả
numberOfImages
Số lượng hình ảnh được tạo trả về cho mỗi yêu cầu mặc định là một hình ảnh cho các mô hình Imagen 3
Tỷ lệ khung hình
aspectRatio
Tỷ lệ chiều rộng và chiều cao của hình ảnh được tạo mặc định là hình vuông (1:1)
Định dạng hình ảnh
imageFormat
Các tuỳ chọn đầu ra, chẳng hạn như định dạng hình ảnh (loại MIME) và mức độ nén của hình ảnh được tạo loại MIME mặc định là PNG
tỷ lệ nén mặc định là 75 (nếu loại MIME được đặt thành JPEG)
Hình mờ
addWatermark
Liệu có thêm hình mờ kỹ thuật số không nhìn thấy được (gọi là SynthID) vào hình ảnh được tạo hay không mặc định là true đối với các mô hình Imagen 3
Tạo người
personGeneration
Cho phép tạo người theo mô hình hay không mặc định tuỳ thuộc vào mô hình



Các lựa chọn khác để kiểm soát việc tạo nội dung

  • Tìm hiểu thêm về thiết kế câu lệnh để có thể tác động đến mô hình nhằm tạo ra kết quả phù hợp với nhu cầu của bạn.
  • Sử dụng chế độ cài đặt an toàn để điều chỉnh khả năng nhận được những câu trả lời có thể bị coi là gây hại, bao gồm cả lời nói hận thù và nội dung khiêu dâm.
  • Đặt hướng dẫn hệ thống để điều hướng hành vi của mô hình. Tính năng này giống như một "lời mở đầu" mà bạn thêm vào trước khi mô hình hiển thị bất kỳ hướng dẫn nào khác từ người dùng cuối.
  • Truyền giản đồ phản hồi cùng với lời nhắc để chỉ định một giản đồ đầu ra cụ thể. Tính năng này thường được dùng nhất khi tạo đầu ra JSON, nhưng cũng có thể dùng cho các nhiệm vụ phân loại (chẳng hạn như khi bạn muốn mô hình sử dụng các nhãn hoặc thẻ cụ thể).