ดูข้อมูลเกี่ยวกับโมเดล Gemini

ชุดโมเดลของ Gemini ถือว่าเป็นแบบหลายโมดัล เนื่องจากสามารถประมวลผลข้อมูลจากหลายรูปแบบได้ ซึ่งรวมถึงรูปภาพ วิดีโอ และข้อความ เช่น คุณสามารถส่งรูปภาพจานคุกกี้ให้โมเดลของ Gemini และขอให้โมเดลบอกสูตรคุกกี้เหล่านั้น

พรอมต์ การตอบกลับ

ขอสูตรทำคุกกี้พวกนี้หน่อย

รูปภาพคุกกี้ช็อกโกแลตชิปหลายชิ้น
**ส่วนผสม**
- 1 ถ้วย เนยจืด (2 แท่ง) เนยนิ่มจาง
- น้ำตาลทรายป่น 3/4 ค.
- น้ำตาลทราย 3/4 ค. อัดเป็นชิ้น
- 1 ช้อนชา วานิลลาสกัด
- ไข่ใหญ่ 2 ฟอง
- แป้งอเนกประสงค์ 2 1/4 ค.
- เบกกิ้งโซดา 1 ช้อนชา
- เกลือ 1 ช้อนชา
...

คุณสามารถโต้ตอบกับกลุ่มผลิตภัณฑ์โมเดล Gemini ได้โดยใช้ Gemini API ที่ Vertex AI ให้บริการใน Google Cloud สําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ คุณสามารถใช้ Vertex AI in FirebaseSDK เพื่อเรียกใช้ Gemini API และโต้ตอบกับโมเดล Gemini จากแอปโดยตรง

หน้านี้มีข้อมูลต่อไปนี้เกี่ยวกับโมเดล Gemini

รุ่นที่ใช้ได้

คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI in Firebase

  • Gemini 1.5 Flash
    โมเดลมัลติโมดัลที่รองรับอินพุตและเอาต์พุตประเภทเดียวกับ 1.5 Pro แต่มีความเข้าใจตามบริบทแบบยาวถึง 1 ล้านโทเค็น Gemini 1.5 Flash ออกแบบมาสำหรับแอปพลิเคชันที่มีปริมาณการใช้งานสูงและคุ้มค่าโดยเฉพาะ

  • Gemini 1.5 Pro
    โมเดลมัลติโมดัลที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทเพื่อรับคำตอบที่เป็นข้อความหรือโค้ด นอกจากนี้ยังรองรับความเข้าใจตามบริบทแบบยาวด้วยโทเค็น 2 ล้านโทเค็น

  • Gemini 1.0 Pro Vision
    โมเดลมัลติโมดัลที่ออกแบบมาเพื่อจัดการข้อความ รวมถึงรูปภาพและวิดีโอสำหรับการตอบกลับด้วยข้อความหรือโค้ด ใช้สำหรับการแชทไม่ได้

  • Gemini 1.0 Pro
    โมเดลที่ออกแบบมาเพื่อจัดการงานภาษาธรรมชาติ แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด

ข้ามไปที่ชื่อโมเดลเพื่อรวมไว้ในโค้ด

กรณีการใช้งานและความสามารถของแต่ละโมเดล

Gemini แต่ละรุ่นมีความสามารถที่แตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย ดูข้อมูลเพิ่มเติมได้ในGoogle Cloudเอกสารประกอบเกี่ยวกับรุ่น Gemini แต่ละรุ่น

อินพุตและเอาต์พุตที่รองรับสำหรับแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ประเภทอินพุต
ข้อความ
รหัส
รูปภาพ
PDF
วิดีโอ (เฟรมเท่านั้น)
วิดีโอ (เฟรมและเสียง)
เสียง
ประเภทเอาต์พุต
ข้อความ
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) ที่ใช้สคีมาการตอบกลับ
รหัส

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

ความสามารถที่รองรับและฟีเจอร์ทั่วไปสำหรับแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
การสร้างข้อความจากการป้อนข้อมูลแบบข้อความเท่านั้น
การสร้างข้อความจากอินพุตหลายโมดัล
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) โดยใช้สคีมาการตอบกลับ
แชทแบบหลายรอบ
การเรียกใช้ฟังก์ชัน
การเรียกฟังก์ชันพื้นฐาน
การเรียกใช้ฟังก์ชันพร้อมกัน
โหมดการเรียกใช้ฟังก์ชัน
นับโทเค็นและอักขระที่เรียกเก็บเงินได้
วิธีการของระบบ
จะไม่รองรับ

ข้อมูลโดยละเอียดเกี่ยวกับแต่ละรุ่น

พร็อพเพอร์ตี้ Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตแบบรวม) * โทเค็น 1,048,576 รายการ โทเค็น 2,097,152 รายการ โทเค็น 16,384 รายการ โทเค็น 32,760 รายการ
ขีดจํากัดโทเค็นเอาต์พุต * โทเค็น 8,192 รายการ โทเค็น 8,192 รายการ 2,048 โทเค็น โทเค็น 8,192 รายการ
จำนวนรูปภาพสูงสุดต่อคำขอ 3,000 รูปภาพ รูปภาพ 3,000 รูป รูปภาพ 16 รูป ไม่มี
ขนาดรูปภาพสูงสุดที่เข้ารหัส Base64 7 MB 7 MB 7 MB ไม่มี
ขนาด PDF สูงสุด 30 MB 30 MB 30 MB ไม่มี
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 1 ไฟล์ ไม่มี
ความยาววิดีโอสูงสุด (เฟรมเท่านั้น) วิดีโอความยาวประมาณ 60 นาที วิดีโอความยาวประมาณ 60 นาที 2 นาที ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) วิดีโอความยาวประมาณ 45 นาที วิดีโอความยาวประมาณ 45 นาที ไม่มี ไม่มี
จำนวนไฟล์เสียงสูงสุดต่อคำขอ ไฟล์เสียง 1 ไฟล์ ไฟล์เสียง 1 ไฟล์ ไม่มี ไม่มี
ความยาวเสียงสูงสุด เสียงที่ยาวประมาณ 8.4 ชั่วโมง เสียงประมาณ 8.4 ชั่วโมง ไม่มี ไม่มี

* สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะเท่ากับประมาณ 4 อักขระ ดังนั้น 100 โทเค็นจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ คุณระบุจํานวนโทเค็นทั้งหมดในคําขอได้โดยใช้ countTokens

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์และคำขอแบบหลายรูปแบบเป็นไปตามข้อกำหนดและแนวทางปฏิบัติแนะนำในไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

การกำหนดเวอร์ชันของโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และเวอร์ชันตัวอย่าง

  • เวอร์ชันเสถียรจะถือว่าพร้อมให้บริการสำหรับผู้ใช้ทั่วไป

    • เวอร์ชันที่เสถียรจะมีชื่อรุ่นต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักที่เฉพาะเจาะจง เช่น gemini-1.5-pro-002
  • เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปที่เวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันเสถียรใหม่โดยอัตโนมัติ

    • เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อรูปแบบที่ไม่มีส่วนต่อท้าย เช่น gemini-1.5-pro
  • เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปยังเวอร์ชันตัวอย่างล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันตัวอย่างจะมีชื่อรุ่นต่อท้ายด้วย -preview พร้อมกับวันที่เปิดตัวครั้งแรกของรุ่น (-MMDD) เช่น gemini-1.5-pro-preview-0409 (เปิดตัวเมื่อวันที่ 9 เมษายน 2024)

ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันโมเดล Gemini ที่มีและวงจรการใช้งานในเอกสารประกอบ Google Cloud

ชื่อรุ่นที่ใช้ได้

ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ไว้ในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียก Gemini API) โปรดดูตัวอย่างการเริ่มต้นสำหรับภาษาของคุณในคู่มือเริ่มต้นใช้งาน

ชื่อโมเดล Gemini 1.5 Flash

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-flash-002 Gemini 1.5 Flash เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-09-24 ไม่เกิน 24-09-2025
gemini-1.5-flash-001 เวอร์ชันเสถียรเริ่มต้นของ Gemini 1.5 Flash สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกินวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-flash ชี้ไปที่ gemini-1.5-flash-001

หากต้องการเข้าถึง gemini-1.5-flash-002 ให้ใช้ชื่อโมเดลเสถียรที่ชัดเจนแทนเวอร์ชันที่อัปเดตโดยอัตโนมัติ
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---

ชื่อรุ่น Gemini 1.5 Pro

ชื่อโมเดล คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.5-pro-002 Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-09-24 ไม่เกิน 24-09-2025
gemini-1.5-pro-001 Gemini 1.5 Pro เวอร์ชันเสถียรเริ่มต้น สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกินวันที่ 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-pro ชี้ไปที่ gemini-1.5-pro-001

หากต้องการเข้าถึง gemini-1.5-pro-002 ให้ใช้ชื่อโมเดลที่เสถียรแบบชัดเจนแทนเวอร์ชันที่อัปเดตอัตโนมัติ
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---

ชื่อรุ่น Gemini 1.0 Pro Vision

ชื่อโมเดล คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกินวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro-vision ชี้ไปที่ ProVision 1.5 เวอร์ชันเสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-vision-001)
สำหรับผู้ใช้ทั่วไป 2024-01-04 ---

ชื่อโมเดล Gemini 1.0 Pro

ชื่อโมเดล คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่หยุดให้บริการ
เวอร์ชันเสถียร
gemini-1.0-pro-002 Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-04-09 ไม่เกินวันที่ 09-04-2025
gemini-1.0-pro-001 Gemini 1.0 Pro เวอร์ชันเสถียร สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกินวันที่ 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro ชี้ไปยังเวอร์ชัน 1.0 Pro เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.0-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-02-15 ---

ภาษาที่สนับสนุน

  • Gemini ทุกรุ่นจะเข้าใจและตอบกลับเป็นภาษาต่อไปนี้ได้

    อาหรับ (ar), เบงกอล (bn), บัลแกเรีย (bg), จีน (ตัวย่อและตัวเต็ม) (zh), โครเอเชีย (hr), เช็ก (cs), ญี่ปุ่น (ja), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวาเกีย (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)

  • โมเดล Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบเป็นภาษาเพิ่มเติมต่อไปนี้

    ภาษาแอฟคุณ

ขั้นตอนถัดไป

ลองใช้ความสามารถของ Gemini API