โมเดลตระกูล Gemini ถือว่าเป็นแบบหลายรูปแบบ เนื่องจากสามารถประมวลผลข้อมูลได้จากหลากหลายวิธี เช่น รูปภาพ วิดีโอ และข้อความ ตัวอย่างเช่น คุณสามารถส่งรูปภาพจานคุกกี้ แบบ Gemini แล้วขอให้ส่งสูตรคุกกี้เหล่านั้นถึงคุณ
พรอมต์ | คำตอบ |
ขอสูตรทำคุกกี้เหล่านี้ |
**ส่วนผสม** - 1 ค. เนยจืด (2 แท่ง) เนยจืด - น้ำตาลป่น 3/4 ค. - น้ำตาลทรายแดง 3/4 ค. บรรจุหีบห่อ - 1 ช้อนชา วานิลลาสารสกัด - ไข่ใหญ่ 2 ฟอง - แป้งอเนกประสงค์ 2 1/4 ซี - เบกกิ้งโซดา 1 ช้อนชา - เกลือ 1 ช้อนชา ... |
คุณโต้ตอบกับโมเดลในตระกูล Gemini ได้โดยใช้ Gemini API จาก Vertex AI บน Google Cloud สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป คุณสามารถใช้ SDK ของ Vertex AI สำหรับ Firebase ในการเรียก Gemini API และโต้ตอบกับ โมเดล Gemini จากแอปของคุณโดยตรง
หน้านี้จะมีข้อมูลต่อไปนี้เกี่ยวกับรุ่น Gemini
การเปรียบเทียบ Use Case ในระดับสูงสำหรับ Gemini รุ่นต่างๆ รวมถึงประเภทอินพุตที่รองรับ
การเปรียบเทียบรายละเอียดของแต่ละรุ่น เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุดของวิดีโอ
คำอธิบายเกี่ยวกับวิธีเวอร์ชันของโมเดล Gemini โดยเฉพาะเวอร์ชันที่เสถียร อัปเดตอัตโนมัติ และตัวอย่าง
รายการชื่อโมเดลที่ใช้ได้เพื่อใส่ในโค้ดระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับรุ่น Gemini
รุ่นที่ใช้ได้
คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI สำหรับ Firebase
Gemini 1.5 Flash: โมเดลมัลติโมดัลที่รองรับอินพุตและเอาต์พุตประเภทเดียวกับ 1.5 Pro (และจำนวนโทเค็นทั้งหมด) แต่ Flash 1.5 ออกแบบมาโดยเฉพาะสำหรับแอปพลิเคชันที่มีปริมาณสูงและคุ้มค่า
Gemini 1.5 Pro: โมเดลแบบหลายโมดัลที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทสำหรับการตอบกลับข้อความหรือโค้ด นอกจากนี้ยังรองรับความเข้าใจในบริบทยาวๆ ด้วยโทเค็นสูงสุด 1 ล้านโทเค็น
Gemini 1.0 Pro Vision: โมเดลแบบหลายโมดัลที่ออกแบบมาเพื่อจัดการข้อความบวกรูปภาพและวิดีโอสำหรับการตอบกลับข้อความหรือโค้ด ใช้สำหรับแชทไม่ได้
Gemini 1.0 Pro: โมเดลที่ออกแบบมาเพื่อจัดการกับงานที่ใช้ภาษาธรรมชาติ การแชทแบบมัลติเทิร์นด้วยข้อความและโค้ด และการสร้างโค้ด
ข้ามไปยังชื่อโมเดลเพื่อรวมไว้ในโค้ด
Use Case สำหรับแต่ละรูปแบบ
Gemini 1.5 Flash / Gemini 1.5 Pro |
วิสัยทัศน์ของ Gemini 1.0 Pro | Gemini 1.0 Pro | |
---|---|---|---|
ประเภทอินพุต | |||
ข้อความ | |||
รหัส | |||
อิมเมจ | |||
วิดีโอ (เฟรมเท่านั้น) | |||
วิดีโอ (เฟรมและเสียง) | |||
เสียง | |||
ประเภทเอาต์พุต | |||
ข้อความ | |||
รหัส | |||
กรณีการใช้งานทั่วไป | |||
คำขอหลายรูปแบบ | |||
แชทแบบหลายมุมมอง |
ดูข้อมูลเพิ่มเติมเกี่ยวกับกรณีการใช้งานสำหรับรุ่น Gemini ในเอกสารประกอบของ Google Cloud
- กรณีการใช้งาน Flash ใน Gemini 1.5
- กรณีการใช้งานของ Gemini 1.5 Pro
- กรณีการใช้งานของ Gemini 1.0 Pro Vision
- กรณีการใช้งานของ Gemini 1.0 Pro
ข้อมูลโดยละเอียดเกี่ยวกับแต่ละรุ่น
สำหรับ Gemini ทุกรุ่น โทเค็นจะมีจำนวนอักขระประมาณ 4 ตัว โทเค็น 100 รายการ
เท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ คุณระบุจำนวนโทเค็นทั้งหมดในคำขอได้โดยใช้ countTokens
พร็อพเพอร์ตี้ |
Gemini 1.5 Flash / Gemini 1.5 Pro |
วิสัยทัศน์ของ Gemini 1.0 Pro | Gemini 1.0 Pro |
---|---|---|---|
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตรวมกัน) | 1 ล้านโทเค็น | 16,384 โทเค็น | 32,760 โทเค็น |
ขีดจำกัดโทเค็นเอาต์พุต | 8,192 โทเค็น | โทเค็น 2,048 รายการ | 8,192 โทเค็น |
จำนวนรูปภาพสูงสุดต่อคำขอ | รูปภาพ 3,000 รูป | รูปภาพ 16 รูป | ไม่มี |
ขนาดรูปภาพที่เข้ารหัสฐาน 64 สูงสุด | 7 เมกะไบต์ | 7 เมกะไบต์ | ไม่มี |
ขนาดสูงสุดของ PDF | 30 MB | 30 MB | ไม่มี |
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ | ไฟล์วิดีโอ 10 ไฟล์ | ไฟล์วิดีโอ 1 รายการ | ไม่มี |
ความยาววิดีโอสูงสุด (เฟรมเท่านั้น) | วิดีโอความยาว 60 นาที | 2 นาที | ไม่มี |
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) | วิดีโอประมาณ 45 นาที | ไม่มี | ไม่มี |
จำนวนไฟล์เสียงสูงสุดต่อคำขอ | ไฟล์เสียง 1 ไฟล์ | ไม่มี | ไม่มี |
ความยาวสูงสุดของเสียง | เสียงประมาณ 8.4 ชั่วโมง | ไม่มี | ไม่มี |
คุณสามารถดูข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับโมเดลและไฟล์อินพุตได้ที่นี่
ดูข้อมูลเกี่ยวกับความแตกต่างระหว่างโมเดลหลายรูปแบบในเอกสารของ Google Cloud
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์และคำขอหลายรูปแบบเป็นไปตามข้อกำหนดและปฏิบัติตามแนวทางปฏิบัติแนะนำในไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API
การกำหนดเวอร์ชันของโมเดล
รุ่น Gemini จะให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง
เวอร์ชันเสถียรจะถือว่าพร้อมให้ใช้งานโดยทั่วไป
- เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักเฉพาะ เช่น
gemini-1.0-pro-001
- เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักเฉพาะ เช่น
เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปยังเวอร์ชันที่เสถียรล่าสุดของโมเดลนั้น หากเผยแพร่เวอร์ชันที่เสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันที่เสถียรใหม่นั้นโดยอัตโนมัติ
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มีส่วนต่อท้าย เช่น
gemini-1.0-pro
- เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มีส่วนต่อท้าย เช่น
เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่ๆ และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปยังเวอร์ชันล่าสุดของตัวอย่างนั้นเสมอ หากเวอร์ชันตัวอย่างใหม่เผยแพร่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปที่เวอร์ชันตัวอย่างใหม่โดยอัตโนมัติ
- เวอร์ชันตัวอย่างจะมีชื่อโมเดลต่อท้ายด้วย
พร้อมด้วยวันที่วางจำหน่ายครั้งแรกของโมเดล (-preview
) ตัวอย่างเช่น-MMDD
(เปิดตัวเมื่อวันที่ 9 เมษายน 2024)gemini-1.5-pro-preview-0409
- เวอร์ชันตัวอย่างจะมีชื่อโมเดลต่อท้ายด้วย
ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันรุ่น Gemini ที่มีและวงจรการใช้งานในเอกสารประกอบของ Google Cloud
ชื่อโมเดลที่ใช้ได้
ชื่อโมเดลคือค่าที่ชัดเจนที่คุณใส่ในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกใช้ Gemini API) ดูตัวอย่างการเริ่มต้นใช้งานสำหรับภาษาของคุณได้ที่คู่มือเริ่มต้นใช้งาน
ชื่อรุ่น Flash Gemini 1.5
ชื่อโมเดล | คำอธิบาย | ช่วงเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.5-flash-001 |
Flash เวอร์ชันเสถียรล่าสุดของ Gemini 1.5 | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่ก่อนหน้าวันที่ 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-flash |
ชี้ไปที่ Flash เวอร์ชันเสถียรล่าสุด 1.5 (ปัจจุบันคือ gemini-1.5-flash-001 |
สำหรับผู้ใช้ทั่วไป | 2024-05-24 | --- |
ดูตัวอย่างเวอร์ชัน | ||||
gemini-1.5-flash-preview-0514 |
เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Flash | เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-05-14 | 2024-06-24 |
ชื่อรุ่น Gemini 1.5 Pro
ชื่อโมเดล | คำอธิบาย | ช่วงเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-05-24 | ไม่ก่อนหน้าวันที่ 24-05-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.5-pro |
ชี้ไปที่เวอร์ชัน 1.5 Proเสถียรล่าสุด (ปัจจุบันคือ gemini-1.5-pro-001 |
สำหรับผู้ใช้ทั่วไป | 2024-05-24 | --- |
ดูตัวอย่างเวอร์ชัน | ||||
gemini-1.5-pro-preview-0514 |
เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Pro | เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
ชี้ไปที่ gemini-1.5-pro-preview-0514 (ซึ่งเป็นเวอร์ชันตัวอย่างล่าสุด) |
เวอร์ชันตัวอย่างแบบสาธารณะ | 2024-04-09 | 2024-06-14 |
ชื่อรุ่น Gemini 1.0 Pro Vision
ชื่อโมเดล | คำอธิบาย | ช่วงเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-02-15 | ไม่ก่อนหน้าวันที่ 15-02-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.0-pro-vision |
ชี้ไปที่เวอร์ชัน 1.5 Pro Vision ที่เสถียรล่าสุด (ปัจจุบันคือ gemini-1.5-pro-vision-001 |
สำหรับผู้ใช้ทั่วไป | 2024-01-04 | --- |
ชื่อรุ่น Gemini 1.0 Pro
ชื่อโมเดล | คำอธิบาย | ช่วงเผยแพร่ | วันที่เปิดตัวครั้งแรก | วันที่ปิดให้บริการ |
---|---|---|---|---|
เวอร์ชันเสถียร | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด | สำหรับผู้ใช้ทั่วไป | 2024-04-09 | ไม่ก่อนหน้า 09-04-2025 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro เวอร์ชันเสถียร | สำหรับผู้ใช้ทั่วไป | 2024-02-15 | ไม่ก่อนหน้าวันที่ 15-02-2025 |
เวอร์ชันที่อัปเดตอัตโนมัติ | ||||
gemini-1.0-pro |
ชี้ไปที่เวอร์ชันเสถียรล่าสุดของ 1.0 Pro (ปัจจุบันคือ gemini-1.0-pro-002 |
สำหรับผู้ใช้ทั่วไป | 2024-02-15 | --- |
ภาษาที่สนับสนุน
โมเดล Gemini รองรับภาษาต่อไปนี้
อาหรับ (ar), เบงกาลี (bn), บัลแกเรีย (bg), จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (hr), เช็ก (cs), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), อิตาลี (hi), ฮังการี (hu), อินโดนีเซีย (id), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), อินโดนีเซีย (id), โรมาเนีย (id)
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบหลายมุมมอง (แชท)
- สร้างข้อความจากพรอมต์แบบข้อความเท่านั้น
- สร้างข้อความจากพรอมต์หลายรูปแบบ (รวมถึงข้อความ, รูปภาพ, PDF, วิดีโอ และเสียง)
- ใช้การเรียกใช้ฟังก์ชันเพื่อเชื่อมต่อโมเดล Generative กับระบบและข้อมูลภายนอก