สําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ Vertex AI in FirebaseSDK จะช่วยให้คุณโต้ตอบกับGemini รุ่นที่รองรับได้โดยตรงจากแอป
โมเดล Gemini ถือว่าเป็นแบบหลายโมดัลเนื่องจากสามารถประมวลผลและสร้างโมดัลได้หลายรูปแบบ ซึ่งรวมถึงข้อความ โค้ด PDF รูปภาพ วิดีโอ และเสียง
ต่อไปนี้เป็นภาพรวมโดยย่อของรุ่นที่รองรับสำหรับ Vertex AI in Firebase และเวอร์ชันล่าสุดที่เสถียร ส่วนต่อๆ ไปในหน้านี้จะแสดงการเปรียบเทียบและข้อมูลโดยละเอียด
รุ่น | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini models | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON (รูปภาพและเสียงจะพร้อมใช้งานเร็วๆ นี้) |
ฟีเจอร์รุ่นถัดไป ความเร็ว และการสร้างแบบมัลติโมเดลสําหรับงานที่มีความหลากหลาย |
Gemini 1.5 Progemini-1.5-pro-002 |
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น |
Gemini 1.5 Flashgemini-1.5-flash-002 |
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ |
ส่วนที่เหลือของหน้านี้จะให้ข้อมูลโดยละเอียดเกี่ยวกับรุ่นที่ Vertex AI in Firebase รองรับ
-
- อินพุตและเอาต์พุตที่รองรับ
- การเปรียบเทียบความสามารถที่รองรับในระดับสูง
- ข้อกำหนดและข้อจำกัด เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุดของวิดีโออินพุต
คําอธิบายวิธีจัดเวอร์ชันโมเดล โดยเฉพาะเวอร์ชันเสถียร อัปเดตอัตโนมัติ และเวอร์ชันตัวอย่าง
รายการชื่อโมเดลที่ใช้ได้ที่จะรวมไว้ในโค้ดระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับรุ่นต่างๆ
คุณดูข้อมูลโดยละเอียดเกี่ยวกับรุ่นเก่าได้ที่ด้านล่างของหน้านี้
เปรียบเทียบรูปแบบ
แต่ละรูปแบบมีความสามารถแตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย โปรดทราบว่าตารางแต่ละตารางในส่วนนี้จะอธิบายรูปแบบแต่ละรูปแบบเมื่อใช้กับ Vertex AI in Firebase แต่ละรุ่นอาจมีความสามารถเพิ่มเติมที่ไม่พร้อมใช้งานเมื่อใช้ SDK ของเรา
ดูข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบ Gemini แต่ละรูปแบบได้ในเอกสารประกอบของ Google Cloud
อินพุตและเอาต์พุตที่รองรับ
ประเภทอินพุตและเอาต์พุตที่รองรับเมื่อใช้แต่ละรูปแบบกับ Vertex AI in Firebase มีดังนี้
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
ประเภทอินพุต | ||||
ข้อความ | ||||
รหัส | ||||
เอกสาร (PDF หรือข้อความธรรมดา) | ||||
รูปภาพ วิดีโอ และเสียง | ||||
เสียง (สตรีมมิง) | เร็วๆ นี้ | |||
ประเภทเอาต์พุต | ||||
ข้อความ | ||||
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) | ||||
รหัส | ||||
รูปภาพ | เร็วๆ นี้ | |||
เสียง | เร็วๆ นี้ | |||
เสียง (สตรีมมิง) | เร็วๆ นี้ |
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API
ความสามารถและฟีเจอร์ที่รองรับ
ความสามารถและฟีเจอร์ที่รองรับเมื่อใช้แต่ละโมเดลกับ Vertex AI in Firebase มีดังนี้
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
สร้างข้อความจากอินพุตข้อความหรือสื่อหลายรูปแบบ | ||||
สร้างรูปภาพ | เร็วๆ นี้ | |||
สร้างเสียง | เร็วๆ นี้ | |||
สร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON) | ||||
วิเคราะห์รูปภาพและวิดีโอ (วิสัยทัศน์) | ||||
วิเคราะห์เสียง | ||||
วิเคราะห์เอกสาร (PDF หรือข้อความธรรมดา) | ||||
แชทแบบหลายรอบ | ||||
การเรียกใช้ฟังก์ชัน (เครื่องมือ) | ||||
การเรียกฟังก์ชันพื้นฐาน | ||||
การเรียกฟังก์ชันพร้อมกัน | ||||
โหมดการเรียกฟังก์ชัน | ||||
นับโทเค็นและอักขระที่เรียกเก็บเงินได้ | ||||
วิธีการของระบบ | ||||
Multimodal Live API (สตรีมมิงแบบ 2 ทิศทาง) | เร็วๆ นี้ |
ข้อกำหนดและข้อจำกัด
ข้อมูลจำเพาะและข้อจำกัดเมื่อใช้แต่ละรุ่นกับ Vertex AI in Firebase มีดังนี้
พร็อพเพอร์ตี้ | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
กรอบบริบท * ขีดจํากัดโทเค็นทั้งหมด (อินพุต + เอาต์พุตรวมกัน) |
โทเค็น 1,048,576 รายการ | โทเค็น 2,097,152 รายการ | โทเค็น 1,048,576 รายการ |
ขีดจํากัดโทเค็นเอาต์พุต * | โทเค็น 8,192 รายการ | โทเค็น 8,192 รายการ | โทเค็น 8,192 รายการ |
วันที่ปิดรับความรู้ | มิถุนายน 2024 | พฤษภาคม 2024 | พฤษภาคม 2024 |
รูปภาพ (ต่อคำขอ) | |||
จํานวนรูปภาพอินพุตสูงสุด | 3,000 รูปภาพ | 3,000 รูปภาพ | 3,000 รูปภาพ |
จำนวนรูปภาพเอาต์พุตสูงสุด | เร็วๆ นี้ | --- | --- |
ขนาดสูงสุดต่อรูปภาพที่เข้ารหัส Base64 ของอินพุต | 7 MB | 7 MB | 7 MB |
PDF (ตามคำขอ) | |||
จํานวนไฟล์ PDF สูงสุดที่ส่งเข้า ** | ไฟล์ 3,000 รายการ | ไฟล์ 3,000 รายการ | ไฟล์ 3,000 รายการ |
จำนวนหน้าสูงสุดต่อไฟล์ PDF อินพุต ** | 1,000 หน้า | 1,000 หน้า | 1,000 หน้า |
ขนาดสูงสุดต่อไฟล์ PDF อินพุต | 50 MB | 50 MB | 50 MB |
วิดีโอ (ตามคำขอ) | |||
จำนวนไฟล์วิดีโออินพุตสูงสุด | 10 ไฟล์ | 10 ไฟล์ | 10 ไฟล์ |
ความยาวสูงสุดของวิดีโออินพุตทั้งหมด (เฟรมเท่านั้น) | ประมาณ 60 นาที | ประมาณ 60 นาที | ประมาณ 60 นาที |
ความยาวสูงสุดของวิดีโออินพุตทั้งหมด (เฟรมและเสียง) | ประมาณ 45 นาที | ประมาณ 45 นาที | ประมาณ 45 นาที |
เสียง (ตามคำขอ) | |||
จำนวนไฟล์เสียงอินพุตสูงสุด | 1 ไฟล์ | 1 ไฟล์ | 1 ไฟล์ |
จำนวนไฟล์เสียงเอาต์พุตสูงสุด | เร็วๆ นี้ | --- | --- |
ความยาวสูงสุดของเสียงอินพุตทั้งหมด | ประมาณ 8.4 ชั่วโมง | ประมาณ 8.4 ชั่วโมง | ประมาณ 8.4 ชั่วโมง |
ความยาวสูงสุดของเสียงเอาต์พุตทั้งหมด | เร็วๆ นี้ | --- | --- |
* สำหรับโมเดลทั้งหมด โทเค็นจะเท่ากับอักขระประมาณ 4 ตัว ดังนั้น 100 โทเค็นจึงเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ สําหรับโมเดล Gemini คุณสามารถระบุจํานวนโทเค็นทั้งหมดในคําขอได้โดยใช้ countTokens
** ระบบจะถือว่า PDF เป็นรูปภาพ ดังนั้นระบบจะถือว่าหน้าเดียวของ PDF เป็นรูปภาพ 1 รูป จำนวนหน้าที่อนุญาตในคำขอจะจำกัดตามจำนวนรูปภาพที่โมเดลรองรับ
ดูรายละเอียดเพิ่มเติม
โควต้าและราคาจะแตกต่างกันไปในแต่ละรุ่น ราคายังขึ้นอยู่กับอินพุตและเอาต์พุตด้วย
ดูข้อมูลเกี่ยวกับประเภทไฟล์อินพุตที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์อินพุตและคำขอแบบหลายรูปแบบเป็นไปตามข้อกำหนดและเป็นไปตามแนวทางปฏิบัติแนะนำในไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API
รูปแบบการตั้งชื่อและการกำหนดเวอร์ชันของโมเดล
โดยโมเดลจะมีให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และเวอร์ชันตัวอย่าง
เวอร์ชันเสถียรจะถือว่าพร้อมให้บริการสำหรับผู้ใช้ทั่วไป
- เวอร์ชันที่เสถียรจะมีชื่อรุ่นต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักที่เฉพาะเจาะจง เช่น
gemini-2.0-flash-001
- เวอร์ชันที่เสถียรจะมีชื่อรุ่นต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักที่เฉพาะเจาะจง เช่น
เวอร์ชันอัปเดตอัตโนมัติจะชี้ไปยังเวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันเสถียรใหม่นั้นโดยอัตโนมัติ
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อรูปแบบที่ไม่มีส่วนต่อท้าย เช่น
gemini-2.0-flash
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อรูปแบบที่ไม่มีส่วนต่อท้าย เช่น
เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่ๆ และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปยังโมเดลนั้นในเวอร์ชันตัวอย่างล่าสุดเสมอ หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ
- เวอร์ชันตัวอย่างจะมีชื่อรุ่นต่อท้ายด้วย
พร้อมกับวันที่เปิดตัวครั้งแรกของรุ่น (-preview
) เช่น-MMDD
(เปิดตัวเมื่อวันที่ 9 เมษายน 2024)gemini-1.5-pro-preview-0409
- เวอร์ชันตัวอย่างจะมีชื่อรุ่นต่อท้ายด้วย
ดูข้อมูลเพิ่มเติมเกี่ยวกับัวร์รุ่นที่ใช้ได้และวงจรการใช้งาน (Gemini) ในเอกสารประกอบของ Google Cloud
ชื่อรุ่นที่ใช้ได้
ชื่อโมเดลคือค่าที่ชัดเจนที่คุณระบุในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกใช้Gemini API)
คุณสามารถใช้ปลายทาง publishers.models.list
เพื่อแสดงรายการชื่อโมเดลทั้งหมดที่ใช้ได้ โปรดทราบว่ารายการที่แสดงผลนี้จะรวมรุ่นทั้งหมดที่ Vertex AI รองรับ แต่ Vertex AI in Firebase จะรองรับเฉพาะรุ่น Gemini ที่อธิบายไว้ในหน้านี้
นอกจากนี้ โปรดทราบว่าระบบจะไม่แสดงเวอร์ชันที่อัปเดตโดยอัตโนมัติ (เช่น gemini-2.0-flash
) เนื่องจากเป็นชื่อแทนที่สะดวกสำหรับโมเดลเสถียรพื้นฐาน
ชื่อรุ่น Gemini
ดูตัวอย่างการเริ่มต้นใช้งานภาษาของคุณได้ที่คู่มือเริ่มต้นใช้งาน
ชื่อรุ่น Gemini 2.0 Flash
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่หยุดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2025-02-05 | จะแจ้งให้ทราบภายหลัง |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-2.0-flash |
ชี้ไปยัง 2.0 Flash เวอร์ชันเสถียรล่าสุด (ปัจจุบันคือ gemini-2.0-flash-001 |
สำหรับผู้ใช้ทั่วไป | 2025-02-10 | --- |
ชื่อรุ่น Gemini 1.5 Pro
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่หยุดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-09-24 | ไม่เกินวันที่ 24-09-2025 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro เวอร์ชันเสถียรเริ่มต้น | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่เกินวันที่ 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-pro |
ชี้ไปยัง 1.5 Pro เวอร์ชันเสถียรล่าสุด (ปัจจุบันคือ gemini-1.5-pro-002 |
สำหรับผู้ใช้ทั่วไป | 2024-09-24 | --- |
ชื่อรุ่น Gemini 1.5 Flash
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่หยุดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-09-24 | ไม่เกินวันที่ 24-09-2025 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash เวอร์ชันเสถียรเริ่มต้น | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่เกินวันที่ 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-flash |
ชี้ไปยัง 1.5 Flash เวอร์ชันเสถียรล่าสุด (ปัจจุบันคือ gemini-1.5-flash-002 |
สำหรับผู้ใช้ทั่วไป | 2024-09-24 | --- |
ภาษาที่รองรับ
หากจําเป็นGemini
โมเดล Gemini ทั้งหมดจะเข้าใจและตอบกลับเป็นภาษาต่อไปนี้ได้
อาหรับ (ar), เบงกอล (bn), บัลแกเรีย (bg), จีน (ตัวย่อและตัวเต็ม) (zh), โครเอเชีย (hr), เช็ก (cs), ญี่ปุ่น (ja), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวาเกีย (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)
โมเดล Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบกลับเป็นภาษาเพิ่มเติมต่อไปนี้
อาหรับ (ar), ไอซ์แลนด์ (is), อินโดนีเซีย (id), อุษาครี (ur), อุซเบก (uz), อังกฤษ (en), อิตาลี (it), อินเดีย (ฮินดี) (hi), อินเดีย (อูรดู) (ur), อินเดีย (ทมิฬ) (ta), อินเดีย (เตลูกู) (te), อินเดีย (มราฐี) (mr), อินเดีย (คุชราต) (gu), อินเดีย (เบงกาลี) (bn), อินเดีย (ปัญจาบ) (pa), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (ม
ข้อมูลเกี่ยวกับรุ่นเก่า
Vertex AI in Firebase รองรับ Gemini ทุกรุ่น รวมถึงรุ่นเก่าๆ เช่น Gemini 1.0 Pro และ Gemini 1.0 Pro Vision อย่างไรก็ตาม เราขอแนะนําอย่างยิ่งให้ใช้อุปกรณ์รุ่นใหม่กับ SDK ของเรา โมเดลGeminiรุ่นเก่าเหล่านี้ใกล้จะหยุดให้บริการแล้ว และไม่มีความสามารถทั้งหมดของโมเดลที่ใหม่กว่า
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบหลายรอบ (แชท)
- สร้างข้อความจากพรอมต์แบบข้อความเท่านั้น
- สร้างข้อความจากพรอมต์แบบหลายรูปแบบ (รวมถึงข้อความ รูปภาพ PDF วิดีโอ และเสียง)
- สร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON) จากทั้งพรอมต์แบบข้อความและแบบมัลติโมเดล
- ใช้การเรียกฟังก์ชันเพื่อเชื่อมต่อโมเดล Generative กับระบบและข้อมูลภายนอก