Theo mặc định, Gemini API trả về các phản hồi dưới dạng văn bản không có cấu trúc. Tuy nhiên, một số trường hợp sử dụng yêu cầu văn bản có cấu trúc, chẳng hạn như JSON. Ví dụ: bạn có thể sử dụng phản hồi cho các tác vụ hạ nguồn khác cần có giản đồ dữ liệu đã thiết lập.
Để đảm bảo rằng đầu ra được tạo của mô hình luôn tuân thủ một giản đồ cụ thể, bạn có thể xác định một giản đồ phản hồi. Giản đồ này hoạt động như một bản thiết kế cho các phản hồi của mô hình. Sau đó, bạn có thể trực tiếp trích xuất dữ liệu từ đầu ra của mô hình với ít quá trình xử lý sau hơn.
Sau đây là một số ví dụ:
Đảm bảo rằng phản hồi của mô hình tạo ra JSON hợp lệ và tuân thủ giản đồ bạn cung cấp.
Ví dụ: mô hình có thể tạo các mục nhập có cấu trúc cho các công thức nấu ăn luôn bao gồm tên công thức, danh sách nguyên liệu và các bước. Sau đó, bạn có thể dễ dàng phân tích cú pháp và hiển thị thông tin này trong giao diện người dùng của ứng dụng.Giới hạn cách mô hình có thể phản hồi trong các nhiệm vụ phân loại.
Ví dụ: bạn có thể yêu cầu mô hình chú thích văn bản bằng một tập hợp nhãn cụ thể (ví dụ: một tập hợp enum cụ thể nhưpositive
vànegative
), thay vì nhãn mà mô hình tạo ra (có thể có mức độ biến đổi nhưgood
,positive
,negative
hoặcbad
).
Hướng dẫn này cho bạn biết cách tạo đầu ra JSON bằng cách cung cấp responseSchema
trong lệnh gọi đến generateContent
. Công cụ này tập trung vào dữ liệu đầu vào chỉ văn bản, nhưng Gemini cũng có thể tạo ra các phản hồi có cấu trúc cho các yêu cầu đa phương thức bao gồm hình ảnh, video và âm thanh làm dữ liệu đầu vào.
Ở cuối trang này là các ví dụ khác, chẳng hạn như cách tạo giá trị enum dưới dạng đầu ra. Để xem thêm ví dụ về cách tạo đầu ra có cấu trúc, hãy xem danh sách Mẫu ví dụ và phản hồi mô hình trong tài liệu về Google Cloud.
Trước khi bắt đầu
Hãy hoàn thành hướng dẫn bắt đầu sử dụng cho SDK Vertex AI in Firebase nếu bạn chưa thực hiện. Hãy đảm bảo rằng bạn đã làm tất cả những việc sau:
Thiết lập một dự án Firebase mới hoặc hiện có, bao gồm cả việc sử dụng gói giá linh hoạt và bật các API bắt buộc.
Kết nối ứng dụng của bạn với Firebase, bao gồm cả việc đăng ký ứng dụng và thêm cấu hình Firebase vào ứng dụng.
Thêm SDK và khởi chạy dịch vụ Vertex AI cũng như mô hình tạo sinh trong ứng dụng.
Sau khi kết nối ứng dụng với Firebase, thêm SDK và khởi chạy dịch vụ Vertex AI cũng như mô hình tạo sinh, bạn đã sẵn sàng gọi Gemini API.
Bước 1: Xác định giản đồ phản hồi
Xác định giản đồ phản hồi để chỉ định cấu trúc của đầu ra của mô hình, tên trường và loại dữ liệu dự kiến cho mỗi trường.
Khi tạo phản hồi, mô hình sẽ sử dụng tên trường và ngữ cảnh từ câu lệnh của bạn. Để ý định của bạn rõ ràng, bạn nên sử dụng cấu trúc rõ ràng, tên trường rõ ràng và thậm chí là nội dung mô tả nếu cần.
Những điều cần cân nhắc đối với giản đồ phản hồi
Hãy lưu ý những điều sau khi viết giản đồ phản hồi:
Kích thước của giản đồ phản hồi được tính vào giới hạn mã thông báo đầu vào.
Tính năng giản đồ phản hồi hỗ trợ các loại MIME phản hồi sau:
application/json
: JSON đầu ra như được xác định trong giản đồ phản hồi (hữu ích cho các yêu cầu về đầu ra có cấu trúc)text/x.enum
: xuất một giá trị enum như được xác định trong giản đồ phản hồi (hữu ích cho các nhiệm vụ phân loại)
Tính năng giản đồ phản hồi hỗ trợ các trường giản đồ sau:
enum
items
maxItems
nullable
properties
required
Nếu bạn sử dụng một trường không được hỗ trợ, mô hình vẫn có thể xử lý yêu cầu của bạn, nhưng sẽ bỏ qua trường đó. Xin lưu ý rằng danh sách ở trên là một tập hợp con của đối tượng giản đồ OpenAPI 3.0 (xem Tham chiếu giản đồ Vertex AI).
Theo mặc định, đối với SDK Vertex AI in Firebase, tất cả các trường đều được coi là bắt buộc, trừ phi bạn chỉ định các trường đó là không bắt buộc trong mảng
optionalProperties
. Đối với các trường không bắt buộc này, mô hình có thể điền sẵn các trường hoặc bỏ qua các trường đó.Xin lưu ý rằng điều này trái ngược với hành vi mặc định của Vertex AI Gemini API.
Bước 2: Gửi lời nhắc có giản đồ phản hồi để tạo JSON
Ví dụ sau đây cho thấy cách tạo đầu ra JSON có cấu trúc.
Để tạo đầu ra có cấu trúc, bạn cần chỉ định trong quá trình khởi chạy mô hình responseMimeType
thích hợp (trong ví dụ này là application/json
) cũng như responseSchema
mà bạn muốn mô hình sử dụng.
Gemini 1.5 Pro và Gemini 1.5 Flash hỗ trợ việc sử dụng responseSchema
.
Tìm hiểu cách chọn một mô hình Gemini và một vị trí phù hợp với trường hợp sử dụng và ứng dụng của bạn (không bắt buộc).
Các ví dụ khác
Để xem thêm ví dụ về cách sử dụng và tạo đầu ra có cấu trúc, hãy xem danh sách Ví dụ về giản đồ và phản hồi mô hình trong tài liệu về Google Cloud.
Tạo giá trị enum dưới dạng đầu ra
Ví dụ sau đây cho thấy cách sử dụng giản đồ phản hồi cho một tác vụ phân loại. Mô hình được yêu cầu xác định thể loại của một bộ phim dựa trên nội dung mô tả của bộ phim đó. Kết quả là một giá trị enum văn bản thuần tuý mà mô hình chọn trong danh sách các giá trị được xác định trong giản đồ phản hồi được cung cấp.
Để thực hiện nhiệm vụ phân loại có cấu trúc này, bạn cần chỉ định responseMimeType
thích hợp (trong ví dụ này là text/x.enum
) cũng như responseSchema
mà bạn muốn mô hình sử dụng trong quá trình khởi tạo mô hình.
Tìm hiểu cách chọn một mô hình Gemini và một vị trí phù hợp với trường hợp sử dụng và ứng dụng của bạn (không bắt buộc).
Các lựa chọn khác để kiểm soát việc tạo nội dung
- Tìm hiểu thêm về thiết kế câu lệnh để có thể tác động đến mô hình nhằm tạo ra kết quả phù hợp với nhu cầu của bạn.
- Định cấu hình các thông số mô hình để kiểm soát cách mô hình tạo phản hồi. Các tham số này bao gồm mã thông báo đầu ra tối đa, nhiệt độ, topK và topP.
- Sử dụng chế độ cài đặt an toàn để điều chỉnh khả năng nhận được những câu trả lời có thể bị coi là gây hại, bao gồm cả lời nói hận thù và nội dung khiêu dâm.
- Đặt hướng dẫn hệ thống để điều hướng hành vi của mô hình. Tính năng này giống như một "lời mở đầu" mà bạn thêm vào trước khi mô hình hiển thị bất kỳ hướng dẫn nào khác từ người dùng cuối.
Đưa ra ý kiến phản hồi về trải nghiệm của bạn với Vertex AI in Firebase