ดูข้อมูลเกี่ยวกับโมเดล Gemini

กลุ่มโมเดลของ Gemini ถือเป็นสื่อหลากรูปแบบเนื่องจากมีความสามารถ การประมวลผลข้อมูลจากรูปแบบต่างๆ เช่น รูปภาพ วิดีโอ และข้อความ ตัวอย่างเช่น คุณสามารถส่งภาพจานของโมเดล Gemini ได้ แล้วขอให้ระบบบอกสูตรคุกกี้เหล่านั้นแก่คุณ

พรอมต์ การตอบกลับ

ขอสูตรทำคุกกี้พวกนี้หน่อย

ภาพคุกกี้ช็อกโกแลตชิปหลายๆ ชิ้น
**ส่วนผสม**
- 1 ค. (2 แท่ง) เนยจืด นิ่ม
- 3/4 ค. น้ำตาลทราย
- 3/4 ค. น้ำตาลทรายแดง บรรจุหีบห่อ
- 1 ช้อนชา วานิลลาสกัด
- ไข่ใหญ่ 2 ฟอง
- 2 1/4 ค. แป้งอเนกประสงค์
- 1 ช้อนชา เบกกิ้งโซดา
- 1 ช้อนชา เกลือ
...

คุณสามารถโต้ตอบกับกลุ่มโมเดล Gemini โดยใช้ Gemini API ให้บริการโดย Vertex AI บน Google Cloud สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป คุณสามารถใช้ Vertex AI สำหรับ Firebase SDK เพื่อเรียกใช้ Gemini API และโต้ตอบกับ โมเดล Gemini ได้โดยตรงจากแอปของคุณ

หน้านี้จะให้ข้อมูลต่อไปนี้เกี่ยวกับโมเดล Gemini

รุ่นที่พร้อมใช้งาน

คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI สำหรับ Firebase

  • Gemini 1.5 Flash
    โมเดลหลายรูปแบบที่รองรับอินพุตและเอาต์พุตเดียวกัน ประเภท 1.5 Pro (และจำนวนโทเค็นทั้งหมด) แต่ 1.5 Flash ออกแบบมาสำหรับแอปพลิเคชันที่มีปริมาณการใช้งานสูงและคุ้มค่า

  • Gemini 1.5 Pro
    โมเดลหลายรูปแบบที่รองรับการเพิ่มรูปภาพ เสียง วิดีโอ และไฟล์ PDF ในพรอมต์ข้อความหรือแชทสำหรับการตอบกลับที่เป็นข้อความหรือรหัส นอกจากนี้ยังรองรับการทำความเข้าใจบริบทแบบยาวด้วยโทเค็นสูงถึง 1 ล้านโทเค็น

  • Gemini 1.0 Pro Vision
    โมเดลหลายรูปแบบที่ออกแบบมาเพื่อจัดการกับข้อความ Plus รูปภาพและวิดีโอเป็นข้อความหรือโค้ดตอบกลับ ใช้สำหรับการแชทไม่ได้

  • Gemini 1.0 Pro
    โมเดลที่ออกแบบมาเพื่อจัดการงานทางภาษาธรรมชาติและมัลติเทิร์น แชทด้วยข้อความและรหัส และการสร้างโค้ด

ข้ามไปที่ชื่อโมเดลเพื่อรวมไว้ในโค้ด

กรณีการใช้งานและความสามารถของแต่ละโมเดล

Gemini แต่ละโมเดลมีความสามารถเพื่อรองรับกรณีการใช้งานที่แตกต่างกัน ดูข้อมูลเพิ่มเติมในเอกสารประกอบของ Google Cloud เกี่ยวกับ โมเดล Gemini

อินพุตและเอาต์พุตที่รองรับของแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ประเภทการป้อนข้อมูล
ข้อความ
รหัส
อิมเมจ
PDF
วิดีโอ (เฟรมเท่านั้น)
วิดีโอ (เฟรมและเสียง)
เสียง
ประเภทเอาต์พุต
ข้อความ
รหัส

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

ความสามารถที่รองรับและฟีเจอร์ทั่วไปของแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
การสร้างข้อความจากพรอมต์แบบข้อความเท่านั้น
การสร้างข้อความจากพรอมต์หลายรูปแบบ
เอาต์พุต JSON (โหมดสคีมาที่จํากัด)
(จะมีให้บริการใน Vertex AI สำหรับ Firebase SDK เร็วๆ นี้)
การแชทแบบมัลติเทิร์น
กำลังเรียกฟังก์ชัน
การเรียกใช้ฟังก์ชันพื้นฐาน
การเรียกใช้ฟังก์ชันพร้อมกัน
โหมดการเรียกฟังก์ชัน
นับโทเค็นและอักขระที่เรียกเก็บเงินได้
วิธีการของระบบ

ข้อมูลโดยละเอียดเกี่ยวกับแต่ละโมเดล

พร็อพเพอร์ตี้ Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตแบบรวม) * 1 ล้านโทเค็น โทเค็น 16,384 รายการ โทเค็น 32,760 รายการ
ขีดจำกัดโทเค็นเอาต์พุต * 8,192 โทเค็น 2,048 โทเค็น 8,192 โทเค็น
จำนวนรูปภาพสูงสุดต่อคำขอ รูปภาพ 3,000 รูป รูปภาพ 16 รูป ไม่มี
ขนาดรูปภาพที่เข้ารหัสฐาน 64 สูงสุด 7 เมกะไบต์ 7 เมกะไบต์ ไม่มี
ขนาดสูงสุดของ PDF 30 MB 30 MB ไม่มี
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 1 ไฟล์ ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมเท่านั้น) วิดีโอความยาว 60 นาที 2 นาที ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) วิดีโอความยาวประมาณ 45 นาที ไม่มี ไม่มี
จำนวนไฟล์เสียงสูงสุดต่อคำขอ ไฟล์เสียง 1 ไฟล์ ไม่มี ไม่มี
ความยาวสูงสุดของเสียง เสียงประมาณ 8.4 ชั่วโมง ไม่มี ไม่มี

* สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะมีความยาวประมาณ 4 อักขระ ดังนั้น โทเค็น 100 รายการจึงเป็นคำภาษาอังกฤษประมาณ 60-80 คำ คุณสามารถระบุจำนวนรวม ในคำขอของคุณโดยใช้ countTokens

คุณสามารถดูข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับโมเดลและ ไฟล์อินพุตต่อไปนี้

การกำหนดเวอร์ชันของโมเดล

โมเดล Gemini ให้บริการในรูปแบบเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง versions.

  • เวอร์ชันเสถียรจะถือว่าพร้อมใช้งานสำหรับเวอร์ชันสำหรับผู้ใช้ทั่วไป

    • เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วย หมายเลขเวอร์ชัน 3 หลักที่เจาะจง เช่น gemini-1.0-pro-001
  • เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปที่เวอร์ชันที่เสถียรเวอร์ชันล่าสุดเสมอ โมเดลนั้น หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันที่อัปเดตอัตโนมัติ จะเริ่มชี้ไปยังเวอร์ชันที่เสถียรใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มี เช่น ส่วนต่อท้าย gemini-1.0-pro
  • เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปที่ตัวอย่างเวอร์ชันล่าสุดของ โมเดลนั้น หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่ จะเริ่มนำไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ

    • เวอร์ชันตัวอย่างมีชื่อโมเดลต่อท้าย -preview พร้อมกับรุ่นเริ่มต้นของโมเดล วันที่ (-MMDD) เช่น gemini-1.5-pro-preview-0409 (เผยแพร่เมื่อวันที่ 9 เมษายน 2024)

ดูข้อมูลเพิ่มเติมเกี่ยวกับ เวอร์ชันโมเดล Gemini ที่มีอยู่และวงจร ในเอกสารประกอบของ Google Cloud

ชื่อโมเดลที่ใช้ได้

ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ในโค้ดระหว่าง การเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกฟังก์ชัน Gemini API) สำหรับตัวอย่างการเริ่มต้นสำหรับภาษาของคุณ โปรดดูที่ คู่มือเริ่มต้นใช้งาน

ชื่อโมเดล Flash ของ Gemini 1.5

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.5-flash-001 Gemini 1.5 Flash เวอร์ชันล่าสุดที่มีความเสถียร สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกิน 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-flash ชี้ไปที่ Flash 1.5 เวอร์ชันที่เสถียรล่าสุด
(ปัจจุบันราคา gemini-1.5-flash-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
เวอร์ชันตัวอย่าง
gemini-1.5-flash-preview-0514 เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Flash เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24

ชื่อรุ่น Gemini 1.5 Pro

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.5-pro-001 Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกิน 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-pro ชี้ไปที่เวอร์ชัน 1.5 Pro
ที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.5-pro-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
เวอร์ชันตัวอย่าง
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro เวอร์ชันตัวอย่างล่าสุด เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 ชี้ไปที่ gemini-1.5-pro-preview-0514
(ซึ่งเป็นตัวอย่างเวอร์ชันล่าสุด)
เวอร์ชันตัวอย่างแบบสาธารณะ 2024-04-09 2024-06-14

ชื่อโมเดล Gemini 1.0 Pro Vision

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกิน 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro-vision ชี้ไปที่ Pro Vision เวอร์ชัน 1.5 ที่เสถียรล่าสุด
(ปัจจุบันราคา gemini-1.5-pro-vision-001)
สำหรับผู้ใช้ทั่วไป 2024-01-04 ---

ชื่อโมเดล Gemini 1.0 Pro

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.0-pro-002 Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-04-09 ไม่เกิน 09-04-2025
gemini-1.0-pro-001 Gemini 1.0 Pro เวอร์ชันเสถียร สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกิน 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro ชี้ไปที่เวอร์ชัน 1.0 Pro
ที่เสถียรล่าสุด (ปัจจุบันราคา gemini-1.0-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-02-15 ---

ภาษาที่สนับสนุน

โมเดล Gemini รองรับภาษาต่อไปนี้

Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi).

ขั้นตอนถัดไป

ลองใช้ความสามารถของ Gemini API