กลุ่มโมเดลของ Gemini ถือเป็นสื่อหลากรูปแบบเนื่องจากมีความสามารถ การประมวลผลข้อมูลจากรูปแบบต่างๆ เช่น รูปภาพ วิดีโอ และข้อความ ตัวอย่างเช่น คุณสามารถส่งภาพจานของโมเดล Gemini ได้ แล้วขอให้ระบบบอกสูตรคุกกี้เหล่านั้นแก่คุณ
พรอมต์ | คำตอบ |
ขอสูตรทำคุกกี้พวกนี้หน่อย |
**ส่วนผสม** - 1 ค. (2 แท่ง) เนยจืด นิ่ม - 3/4 ค. น้ำตาลทราย - 3/4 ค. น้ำตาลทรายแดง บรรจุหีบห่อ - 1 ช้อนชา วานิลลาสกัด - ไข่ใหญ่ 2 ฟอง - 2 1/4 ค. แป้งอเนกประสงค์ - 1 ช้อนชา เบกกิ้งโซดา - 1 ช้อนชา เกลือ ... |
คุณสามารถโต้ตอบกับกลุ่มโมเดล Gemini โดยใช้ Gemini API ให้บริการโดย Vertex AI ในวันที่ Google Cloud สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป คุณสามารถใช้ SDK Vertex AI in Firebase สำหรับเรียกใช้ Gemini API และโต้ตอบกับ โมเดล Gemini ได้โดยตรงจากแอปของคุณ
หน้านี้จะให้ข้อมูลต่อไปนี้เกี่ยวกับโมเดล Gemini
การเปรียบเทียบกรณีการใช้งานระดับสูงสำหรับ Gemini รวมถึงประเภทอินพุตที่รองรับ
การเปรียบเทียบรายละเอียดของแต่ละรุ่น เช่น โทเค็นอินพุตสูงสุด หรือความยาวสูงสุดของวิดีโอ
คำอธิบายว่าโมเดล Gemini มีเวอร์ชันอย่างไร โดยเฉพาะอย่างยิ่ง เวอร์ชันเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง
รายการชื่อโมเดลที่ใช้ได้ที่จะรวมไว้ใน ในระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับโมเดล Gemini
รุ่นที่พร้อมใช้งาน
คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI in Firebase
Gemini 1.5 Flash
โมเดลหลายรูปแบบที่รองรับอินพุตและเอาต์พุตเดียวกัน พิมพ์ 1.5 Pro แต่มีความเข้าใจบริบทที่ยาวนานถึง 1 ล้านโทเค็น Gemini 1.5 Flash ออกแบบมาเพื่อการใช้งานปริมาณมากและคุ้มค่า แอปพลิเคชันGemini 1.5 Pro
โมเดลหลายรูปแบบที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทสำหรับการตอบกลับที่เป็นข้อความหรือรหัส นอกจากนี้ยังรองรับการทำความเข้าใจบริบทแบบยาวด้วยโทเค็น 2 ล้านโทเค็นGemini 1.0 Pro Vision
โมเดลหลายรูปแบบที่ออกแบบมาเพื่อจัดการกับข้อความ Plus รูปภาพและวิดีโอเป็นข้อความหรือโค้ดตอบกลับ ใช้สำหรับการแชทไม่ได้Gemini 1.0 Pro
โมเดลที่ออกแบบมาเพื่อจัดการงานทางภาษาธรรมชาติและมัลติเทิร์น แชทด้วยข้อความและรหัส และการสร้างโค้ด
ข้ามไปที่ชื่อโมเดลเพื่อรวมไว้ในโค้ด
กรณีการใช้งานและความสามารถของแต่ละโมเดล
Gemini แต่ละโมเดลมีความสามารถเพื่อรองรับกรณีการใช้งานที่แตกต่างกัน ดูข้อมูลเพิ่มเติมได้ในเอกสาร Google Cloud เกี่ยวกับ โมเดล Gemini
อินพุตและเอาต์พุตที่รองรับของแต่ละรุ่น
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
ประเภทการป้อนข้อมูล | ||||
ข้อความ | ||||
รหัส | ||||
อิมเมจ | ||||
วิดีโอ (เฟรมเท่านั้น) | ||||
วิดีโอ (เฟรมและเสียง) | ||||
เสียง | ||||
ประเภทเอาต์พุต | ||||
ข้อความ | ||||
รหัส |
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API
ความสามารถที่รองรับและฟีเจอร์ทั่วไปของแต่ละรุ่น
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
การสร้างข้อความจากพรอมต์แบบข้อความเท่านั้น | |||||
การสร้างข้อความจากพรอมต์หลายรูปแบบ | |||||
เอาต์พุต JSON (โหมดสคีมาที่จํากัด) (จะมีให้บริการใน Vertex AI in Firebase SDK เร็วๆ นี้) |
|||||
การแชทแบบมัลติเทิร์น | |||||
กำลังเรียกฟังก์ชัน | |||||
การเรียกใช้ฟังก์ชันพื้นฐาน | |||||
การเรียกใช้ฟังก์ชันพร้อมกัน | |||||
โหมดการเรียกฟังก์ชัน | |||||
นับโทเค็นและอักขระที่เรียกเก็บเงินได้ | |||||
วิธีการของระบบ |
ข้อมูลโดยละเอียดเกี่ยวกับแต่ละโมเดล
พร็อพเพอร์ตี้ | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|---|
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตแบบรวม) * | 1,048,576 โทเค็น | โทเค็น 2,097,152 รายการ | โทเค็น 16,384 รายการ | โทเค็น 32,760 รายการ |
ขีดจำกัดโทเค็นเอาต์พุต * | 8,192 โทเค็น | 8,192 โทเค็น | 2,048 โทเค็น | 8,192 โทเค็น |
จำนวนรูปภาพสูงสุดต่อคำขอ | รูปภาพ 3,000 รูป | รูปภาพ 3,000 รูป | รูปภาพ 16 รูป | ไม่มี |
ขนาดรูปภาพที่เข้ารหัสฐาน 64 สูงสุด | 7 เมกะไบต์ | 7 เมกะไบต์ | 7 เมกะไบต์ | ไม่มี |
ขนาดสูงสุดของ PDF | 30 MB | 30 MB | 30 MB | ไม่มี |
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ | ไฟล์วิดีโอ 10 ไฟล์ | ไฟล์วิดีโอ 10 ไฟล์ | ไฟล์วิดีโอ 1 ไฟล์ | ไม่มี |
ความยาวสูงสุดของวิดีโอ (เฟรมเท่านั้น) | วิดีโอความยาวประมาณ 60 นาที | วิดีโอความยาวประมาณ 60 นาที | 2 นาที | ไม่มี |
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) | วิดีโอความยาวประมาณ 45 นาที | วิดีโอความยาวประมาณ 45 นาที | ไม่มี | ไม่มี |
จำนวนไฟล์เสียงสูงสุดต่อคำขอ | ไฟล์เสียง 1 ไฟล์ | ไฟล์เสียง 1 ไฟล์ | ไม่มี | ไม่มี |
ความยาวสูงสุดของเสียง | เสียงประมาณ 8.4 ชั่วโมง | เสียงประมาณ 8.4 ชั่วโมง | ไม่มี | ไม่มี |
* สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะมีความยาวประมาณ 4 อักขระ
ดังนั้น โทเค็น 100 รายการจึงเป็นคำภาษาอังกฤษประมาณ 60-80 คำ คุณสามารถระบุจำนวนรวม
ในคำขอของคุณโดยใช้
countTokens
คุณสามารถดูข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับโมเดลและ ไฟล์อินพุตต่อไปนี้
ดูข้อมูลเกี่ยวกับ ความแตกต่างระหว่างโมเดลหลายรูปแบบในเอกสารประกอบ Google Cloud
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับ วิธีระบุประเภท MIME และวิธีสร้าง ตรวจสอบว่าไฟล์และคำขอผ่านสื่อหลากรูปแบบ เป็นไปตามข้อกำหนดและ แนวทางปฏิบัติแนะนำใน ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API
การกำหนดเวอร์ชันของโมเดล
โมเดล Gemini ให้บริการในรูปแบบเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง เวอร์ชันต่างๆ
เวอร์ชันเสถียรจะถือว่าพร้อมใช้งานสำหรับเวอร์ชันสำหรับผู้ใช้ทั่วไป
- เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วย
หมายเลขเวอร์ชัน 3 หลักที่เจาะจง เช่น
gemini-1.0-pro-001
- เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วย
หมายเลขเวอร์ชัน 3 หลักที่เจาะจง เช่น
เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปที่เวอร์ชันที่เสถียรเวอร์ชันล่าสุดเสมอ โมเดลนั้น หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันที่อัปเดตอัตโนมัติ จะเริ่มชี้ไปยังเวอร์ชันที่เสถียรใหม่นั้นโดยอัตโนมัติ
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มี
เช่น ส่วนต่อท้าย
gemini-1.0-pro
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มี
เช่น ส่วนต่อท้าย
เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปที่ตัวอย่างเวอร์ชันล่าสุดของ โมเดลนั้น หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่ จะเริ่มนำไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ
- เวอร์ชันตัวอย่างมีชื่อโมเดลต่อท้าย
พร้อมกับรุ่นเริ่มต้นของโมเดล วันที่ (-preview
) เช่น-MMDD
(เผยแพร่เมื่อวันที่ 9 เมษายน 2024)gemini-1.5-pro-preview-0409
- เวอร์ชันตัวอย่างมีชื่อโมเดลต่อท้าย
ดูข้อมูลเพิ่มเติมเกี่ยวกับ เวอร์ชันโมเดล Gemini ที่มีอยู่และวงจร ในเอกสารประกอบของ Google Cloud
ชื่อโมเดลที่ใช้ได้
ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ในโค้ดระหว่าง การเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกฟังก์ชัน Gemini API) สำหรับตัวอย่างการเริ่มต้นสำหรับภาษาของคุณ โปรดดูที่ คู่มือเริ่มต้นใช้งาน
ชื่อโมเดล Flash ของ Gemini 1.5
ชื่อรุ่น | คำอธิบาย | ช่วงการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันที่เสถียร | ||||
gemini-1.5-flash-001 |
Gemini 1.5 Flash เวอร์ชันล่าสุดที่มีความเสถียร | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่เกิน 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-flash |
ชี้ไปที่ Flash 1.5 เวอร์ชันที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.5-flash-001 |
สำหรับผู้ใช้ทั่วไป | 2024-05-24 | --- |
เวอร์ชันตัวอย่าง | ||||
gemini-1.5-flash-preview-0514 |
เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Flash | เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-05-14 | 2024-06-24 |
ชื่อรุ่น Gemini 1.5 Pro
ชื่อรุ่น | คำอธิบาย | ช่วงการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันที่เสถียร | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่เกิน 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-pro |
ชี้ไปที่เวอร์ชัน 1.5 Pro ที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.5-pro-001 |
สำหรับผู้ใช้ทั่วไป | 2024-05-24 | --- |
เวอร์ชันตัวอย่าง | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro เวอร์ชันตัวอย่างล่าสุด | เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
ชี้ไปที่ gemini-1.5-pro-preview-0514 (ซึ่งเป็นตัวอย่างเวอร์ชันล่าสุด) |
เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-04-09 | 2024-06-14 |
ชื่อโมเดล Gemini 1.0 Pro Vision
ชื่อรุ่น | คำอธิบาย | ช่วงการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันที่เสถียร | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-02-15 | ไม่เกิน 15-02-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.0-pro-vision |
ชี้ไปที่ Pro Vision เวอร์ชัน 1.5 ที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.5-pro-vision-001 |
สำหรับผู้ใช้ทั่วไป | 2024-01-04 | --- |
ชื่อโมเดล Gemini 1.0 Pro
ชื่อรุ่น | คำอธิบาย | ช่วงการเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันที่เสถียร | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-04-09 | ไม่เกิน 09-04-2025 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro เวอร์ชันเสถียร | สำหรับผู้ใช้ทั่วไป | 2024-02-15 | ไม่เกิน 15-02-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.0-pro |
ชี้ไปที่เวอร์ชัน 1.0 Pro ที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.0-pro-002 |
สำหรับผู้ใช้ทั่วไป | 2024-02-15 | --- |
ภาษาที่สนับสนุน
โมเดล Gemini ทั้งหมดสามารถทำความเข้าใจและตอบได้ใน ภาษาต่อไปนี้:
อาหรับ (ar), เบงกาลี (bn), บัลแกเรีย (bg) จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (hr), เช็ก (cs) เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi) ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu) อินโดนีเซีย (id), อิตาลี (it), ญี่ปุ่น (ja), เกาหลี (ko), ลัตเวีย (lv) ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro) รัสเซีย (ru), เซอร์เบีย (sr), สโลวัก (sk), สโลวีเนีย (sl), สเปน (es) สวาฮีลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk) เวียดนาม (vi)
Gemini 1.5 Pro และ Gemini 1.5 Flash โมเดลสามารถเข้าใจและตอบกลับในภาษาเพิ่มเติมต่อไปนี้
แอฟริคานส์ (af), อัมฮาริก (am), อัสสัม (as), อาเซอร์ไบจาน (az) เบลารุส (be), บอสเนีย (bs), คาตาลัน (ca), เซบัวโน (ceb), คอร์ซิกา (co), เวลส์ (ซี), ดิเวฮี (dv), เอสเปอรันโต (eo), บาสก์ (eu), เปอร์เซีย (fa) ฟิลิปปินส์ (ตากาล็อก) (fil), ฟริเซียน (fy), ไอริช (ga), สก็อตส์ เกลิก (gd), กาลิเซีย (gl), คุชราต (gu), เฮาซา (ha), ฮาวาย (haw), ม้ง (hmn) เฮติครีโอล (ht), อาร์เมเนีย (hy), อิกโบ (ig), ไอซ์แลนด์ (is), ชวา (jv) จอร์เจีย (ka), คาซัค (kk), เขมร (กม.), กันนาดา (kn), ครีโอ (ครี) เคิร์ด (ku), คีร์กีซ (ky), ละติน (la), ลักเซมเบิร์ก (ปอนด์), ลาว (lo) มาลากาซี (มก.), เมารี (ไมล์), มาซิโดเนีย (mk), มาลายาลัม (มล.), มองโกเลีย (mn) มณีปุระ (มณี-เมตี) มราฐี (mr) มลายู (ms) มัลทีส (mt) เมียนมา (พม่า) (ของฉัน) เนปาล (ne) เนียนจา (ชิเชวา) (ny) โอเดีย (โอริยา) (หรือ) ปัญจาบ (pa), พัชโต (ps), สินธี (sd) สิงหล (สิงหล) (si), ซามัว (sm), โชนา (sn), โซมาลี (so), แอลเบเนีย (ตาราง) เซโซโท (st), ซุนดา (su), ทมิฬ (ta), เตลูกู (te), ทาจิก (tg) อุยกูร์ (ug), อูรดู (ur), อุซเบก (uz), โคซา (xh), ยิดดิช (yi), โยรูบา (yo) ซูลู (zu)
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบผลัดกันเล่น (แชท)
- สร้างข้อความจาก พรอมต์แบบข้อความเท่านั้น
- สร้างข้อความจาก พรอมต์แบบสื่อหลากรูปแบบ (รวมถึงข้อความ, รูปภาพ, PDF, วิดีโอ และเสียง)
- ใช้การเรียกใช้ฟังก์ชันเพื่อเชื่อมต่อ โมเดล Generative กับระบบและข้อมูลภายนอก