ดูข้อมูลเกี่ยวกับโมเดลของ Gemini

โมเดลตระกูล Gemini ถือว่าเป็นแบบหลายรูปแบบ เนื่องจากสามารถประมวลผลข้อมูลได้จากหลากหลายวิธี เช่น รูปภาพ วิดีโอ และข้อความ ตัวอย่างเช่น คุณสามารถส่งรูปภาพจานคุกกี้ แบบ Gemini แล้วขอให้ส่งสูตรคุกกี้เหล่านั้นถึงคุณ

พรอมต์ คำตอบ

ขอสูตรทำคุกกี้เหล่านี้

ภาพถ่ายคุกกี้ช็อกโกแลตชิปหลายชิ้น
**ส่วนผสม**
- 1 ค. เนยจืด (2 แท่ง) เนยจืด
- น้ำตาลป่น 3/4 ค.
- น้ำตาลทรายแดง 3/4 ค. บรรจุหีบห่อ
- 1 ช้อนชา วานิลลาสารสกัด
- ไข่ใหญ่ 2 ฟอง
- แป้งอเนกประสงค์ 2 1/4 ซี
- เบกกิ้งโซดา 1 ช้อนชา
- เกลือ 1 ช้อนชา
...

คุณโต้ตอบกับโมเดลในตระกูล Gemini ได้โดยใช้ Gemini API จาก Vertex AI บน Google Cloud สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป คุณสามารถใช้ SDK ของ Vertex AI สำหรับ Firebase ในการเรียก Gemini API และโต้ตอบกับ โมเดล Gemini จากแอปของคุณโดยตรง

หน้านี้จะมีข้อมูลต่อไปนี้เกี่ยวกับรุ่น Gemini

  • การเปรียบเทียบ Use Case ในระดับสูงสำหรับ Gemini รุ่นต่างๆ รวมถึงประเภทอินพุตที่รองรับ

  • การเปรียบเทียบรายละเอียดของแต่ละรุ่น เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุดของวิดีโอ

  • คำอธิบายเกี่ยวกับวิธีเวอร์ชันของโมเดล Gemini โดยเฉพาะเวอร์ชันที่เสถียร อัปเดตอัตโนมัติ และตัวอย่าง

  • รายการชื่อโมเดลที่ใช้ได้เพื่อใส่ในโค้ดระหว่างการเริ่มต้น

  • รายการภาษาที่รองรับสำหรับรุ่น Gemini

รุ่นที่ใช้ได้

คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI สำหรับ Firebase

  • Gemini 1.5 Flash: โมเดลมัลติโมดัลที่รองรับอินพุตและเอาต์พุตประเภทเดียวกับ 1.5 Pro (และจำนวนโทเค็นทั้งหมด) แต่ Flash 1.5 ออกแบบมาโดยเฉพาะสำหรับแอปพลิเคชันที่มีปริมาณสูงและคุ้มค่า

  • Gemini 1.5 Pro: โมเดลแบบหลายโมดัลที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทสำหรับการตอบกลับข้อความหรือโค้ด นอกจากนี้ยังรองรับความเข้าใจในบริบทยาวๆ ด้วยโทเค็นสูงสุด 1 ล้านโทเค็น

  • Gemini 1.0 Pro Vision: โมเดลแบบหลายโมดัลที่ออกแบบมาเพื่อจัดการข้อความบวกรูปภาพและวิดีโอสำหรับการตอบกลับข้อความหรือโค้ด ใช้สำหรับแชทไม่ได้

  • Gemini 1.0 Pro: โมเดลที่ออกแบบมาเพื่อจัดการกับงานที่ใช้ภาษาธรรมชาติ การแชทแบบมัลติเทิร์นด้วยข้อความและโค้ด และการสร้างโค้ด

ข้ามไปยังชื่อโมเดลเพื่อรวมไว้ในโค้ด

Use Case สำหรับแต่ละรูปแบบ

Gemini 1.5 Flash /
Gemini 1.5 Pro
วิสัยทัศน์ของ Gemini 1.0 Pro Gemini 1.0 Pro
ประเภทอินพุต
ข้อความ
รหัส
อิมเมจ
PDF
วิดีโอ (เฟรมเท่านั้น)
วิดีโอ (เฟรมและเสียง)
เสียง
ประเภทเอาต์พุต
ข้อความ
รหัส
กรณีการใช้งานทั่วไป
คำขอหลายรูปแบบ
แชทแบบหลายมุมมอง

ดูข้อมูลเพิ่มเติมเกี่ยวกับกรณีการใช้งานสำหรับรุ่น Gemini ในเอกสารประกอบของ Google Cloud

ข้อมูลโดยละเอียดเกี่ยวกับแต่ละรุ่น

สำหรับ Gemini ทุกรุ่น โทเค็นจะมีจำนวนอักขระประมาณ 4 ตัว โทเค็น 100 รายการ เท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ คุณระบุจำนวนโทเค็นทั้งหมดในคำขอได้โดยใช้ countTokens

พร็อพเพอร์ตี้ Gemini 1.5 Flash /
Gemini 1.5 Pro
วิสัยทัศน์ของ Gemini 1.0 Pro Gemini 1.0 Pro
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตรวมกัน) 1 ล้านโทเค็น 16,384 โทเค็น 32,760 โทเค็น
ขีดจำกัดโทเค็นเอาต์พุต 8,192 โทเค็น โทเค็น 2,048 รายการ 8,192 โทเค็น
จำนวนรูปภาพสูงสุดต่อคำขอ รูปภาพ 3,000 รูป รูปภาพ 16 รูป ไม่มี
ขนาดรูปภาพที่เข้ารหัสฐาน 64 สูงสุด 7 เมกะไบต์ 7 เมกะไบต์ ไม่มี
ขนาดสูงสุดของ PDF 30 MB 30 MB ไม่มี
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 1 รายการ ไม่มี
ความยาววิดีโอสูงสุด (เฟรมเท่านั้น) วิดีโอความยาว 60 นาที 2 นาที ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) วิดีโอประมาณ 45 นาที ไม่มี ไม่มี
จำนวนไฟล์เสียงสูงสุดต่อคำขอ ไฟล์เสียง 1 ไฟล์ ไม่มี ไม่มี
ความยาวสูงสุดของเสียง เสียงประมาณ 8.4 ชั่วโมง ไม่มี ไม่มี

คุณสามารถดูข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับโมเดลและไฟล์อินพุตได้ที่นี่

การกำหนดเวอร์ชันของโมเดล

รุ่น Gemini จะให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง

  • เวอร์ชันเสถียรจะถือว่าพร้อมให้ใช้งานโดยทั่วไป

    • เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักเฉพาะ เช่น gemini-1.0-pro-001
  • เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปยังเวอร์ชันที่เสถียรล่าสุดของโมเดลนั้น หากเผยแพร่เวอร์ชันที่เสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันที่เสถียรใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มีส่วนต่อท้าย เช่น gemini-1.0-pro
  • เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่ๆ และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปยังเวอร์ชันล่าสุดของตัวอย่างนั้นเสมอ หากเวอร์ชันตัวอย่างใหม่เผยแพร่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปที่เวอร์ชันตัวอย่างใหม่โดยอัตโนมัติ

    • เวอร์ชันตัวอย่างจะมีชื่อโมเดลต่อท้ายด้วย -preview พร้อมด้วยวันที่วางจำหน่ายครั้งแรกของโมเดล (-MMDD) ตัวอย่างเช่น gemini-1.5-pro-preview-0409 (เปิดตัวเมื่อวันที่ 9 เมษายน 2024)

ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันรุ่น Gemini ที่มีและวงจรการใช้งานในเอกสารประกอบของ Google Cloud

ชื่อโมเดลที่ใช้ได้

ชื่อโมเดลคือค่าที่ชัดเจนที่คุณใส่ในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกใช้ Gemini API) ดูตัวอย่างการเริ่มต้นใช้งานสำหรับภาษาของคุณได้ที่คู่มือเริ่มต้นใช้งาน

ชื่อรุ่น Flash Gemini 1.5

ชื่อโมเดล คำอธิบาย ช่วงเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-flash-001 Flash เวอร์ชันเสถียรล่าสุดของ Gemini 1.5 สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่ก่อนหน้าวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-flash ชี้ไปที่ Flash เวอร์ชันเสถียรล่าสุด 1.5
(ปัจจุบันคือ gemini-1.5-flash-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
ดูตัวอย่างเวอร์ชัน
gemini-1.5-flash-preview-0514 เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Flash เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24

ชื่อรุ่น Gemini 1.5 Pro

ชื่อโมเดล คำอธิบาย ช่วงเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-pro-001 Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่ก่อนหน้าวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-pro ชี้ไปที่เวอร์ชัน 1.5 Proเสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
ดูตัวอย่างเวอร์ชัน
gemini-1.5-pro-preview-0514 เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Pro เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 ชี้ไปที่ gemini-1.5-pro-preview-0514
(ซึ่งเป็นเวอร์ชันตัวอย่างล่าสุด)
เวอร์ชันตัวอย่างแบบสาธารณะ 2024-04-09 2024-06-14

ชื่อรุ่น Gemini 1.0 Pro Vision

ชื่อโมเดล คำอธิบาย ช่วงเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่ก่อนหน้าวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro-vision ชี้ไปที่เวอร์ชัน 1.5 Pro Vision ที่เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-vision-001)
สำหรับผู้ใช้ทั่วไป 2024-01-04 ---

ชื่อรุ่น Gemini 1.0 Pro

ชื่อโมเดล คำอธิบาย ช่วงเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-002 Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-04-09 ไม่ก่อนหน้า 09-04-2025
gemini-1.0-pro-001 Gemini 1.0 Pro เวอร์ชันเสถียร สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่ก่อนหน้าวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro ชี้ไปที่เวอร์ชันเสถียรล่าสุดของ 1.0 Pro
(ปัจจุบันคือ gemini-1.0-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-02-15 ---

ภาษาที่สนับสนุน

โมเดล Gemini รองรับภาษาต่อไปนี้

อาหรับ (ar), เบงกาลี (bn), บัลแกเรีย (bg), จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (hr), เช็ก (cs), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), อิตาลี (hi), ฮังการี (hu), อินโดนีเซีย (id), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), อินโดนีเซีย (id), โรมาเนีย (id)

ขั้นตอนถัดไป

ลองใช้ความสามารถของ Gemini API