ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

เมื่อเรียกใช้ Vertex AI Gemini API จากแอปของคุณโดยใช้ SDK สำหรับ Vertex AI สำหรับ Firebase คุณสามารถสั่งให้โมเดล Gemini สร้างข้อความที่อิงตามอินพุตหลายรูปแบบได้ พรอมต์หลายรูปแบบอาจรวมถึงวิธีการหลายรูปแบบ (หรือการป้อนข้อมูลประเภทต่างๆ) เช่น ข้อความพร้อมกับรูปภาพ, PDF, วิดีโอ และเสียง

สำหรับอินพุตที่ไม่ใช่ข้อความ (เช่น ไฟล์สื่อ) คุณต้องใช้ประเภทไฟล์ที่รองรับ ระบุประเภท MIME ที่รองรับ รวมถึงตรวจสอบว่าไฟล์และคำขอหลายรูปแบบเป็นไปตามข้อกำหนดและปฏิบัติตามแนวทางปฏิบัติแนะนำ

  • ไฟล์อินพุตที่รองรับจะแตกต่างกันไปตามรุ่นและอาจมีรูปภาพ, PDF, วิดีโอ และเสียง

    • โปรดทราบว่าอินพุตวิดีโอที่รองรับอาจแตกต่างกันไปตามรุ่น และอาจรวมถึงเฟรมเท่านั้นหรือเฟรมที่มีเสียง
  • ข้อกำหนดและแนวทางปฏิบัติที่ดีที่สุดสำหรับไฟล์อินพุตและคำขอหลายรูปแบบ

    • ในส่วนดูข้อมูลเกี่ยวกับโมเดล Gemini คุณสามารถดูสรุปสั้นๆ เกี่ยวกับข้อกำหนดสำหรับไฟล์ที่รองรับตามโมเดล (เช่น จำนวนไฟล์สูงสุดและขนาดไฟล์สูงสุด)

    • ในเอกสารของ Google Cloud คุณสามารถดูข้อมูลโดยละเอียดเกี่ยวกับข้อกำหนดและแนวทางปฏิบัติแนะนำสำหรับไฟล์อินพุตและคำขอผ่านสื่อหลากรูปแบบ (เช่น ประเภท MIME ที่รองรับ และกรณีที่ควรระบุไฟล์อินพุตในคำขอ)

ข้อกำหนดเฉพาะสำหรับ Vertex AI สำหรับ Firebase SDK

สำหรับ Vertex AI สำหรับ Firebase SDK ขนาดคำขอสูงสุดคือ 20 MB คุณจะได้รับข้อผิดพลาด HTTP 413 หากคำขอมีขนาดใหญ่เกินไป