מידע על המודלים של Gemini

משפחת המודלים של Gemini נחשבת רב-אופנית כי הם יכולים לעבד מידע מכמה שיטות, כולל תמונות, סרטונים וטקסט. לדוגמה, אפשר לשלוח למודל של Gemini תמונה של צלחת עם עוגיות ולבקש ממנו לשלוח לכם מתכון לעוגיות האלה.

הנחיה תגובה

יש לך מתכון לקובצי ה-cookie האלה?

תמונה של כמה עוגיות שוקולד צ'יפס
**חשובים**
- 1 ג. (2 מקלות) חמאה לא מלוחה, רכה
- 3/4 כוס סוכר גס
- 3/4 כוס סוכר חום, דחוס
- כפית אחת . תמצית וניל
- 2 ביצים גדולות
- 2/4 ג. קמח רב-תכליתי
- כפית סודה לאפייה
- 1 כפית מלח
...

אפשר ליצור אינטראקציה עם משפחת המודלים של Gemini באמצעות Gemini API שסופקה על ידי Vertex AI ב-Google Cloud. באפליקציות לנייד ולאינטרנט, אפשר להשתמש ב-SDKs של Vertex AI in Firebase כדי לבצע קריאה ל-Gemini API ולנהל אינטראקציה עם המודלים של Gemini ישירות מהאפליקציה.

בדף הזה מופיע המידע הבא על המודלים של Gemini:

  • השוואה ברמה גבוהה של תרחישים לדוגמה למודלים השונים של Gemini, כולל סוגי הקלט הנתמכים.

  • השוואה בין הפרטים של כל מודל, למשל אסימוני קלט מקסימליים או אורך מקסימלי של סרטון.

  • תיאור של הגרסאות של המודלים של Gemini, ובמיוחד הגרסאות היציבות, המעודכנות האוטומטיות והתצוגה המקדימה שלהם.

  • רשימות של שמות מודלים זמינים שאפשר לכלול בקוד במהלך האינטראקציה הראשונית.

  • רשימת השפות הנתמכות במודלים של Gemini.

המודלים הזמינים

אפשר להשתמש בכל אחד מהמודלים הבאים של Gemini עם Vertex AI in Firebase:

  • Gemini 1.5 Flash
    מודל רב-אופני שתומך באותם סוגי קלט ופלט כמו 1.5 Pro, אבל עם הבנה של מיליון אסימונים בהקשר ארוך. Gemini 1.5 Flash מיועד במיוחד לאפליקציות עם נפח גבוה וחסכוניות.

  • Gemini 1.5 Pro
    מודל רב-מודלי שתומך בהוספת תמונות, קובצי אודיו, סרטונים וקובצי PDF בהנחיות בטקסט או בצ'אט, כדי לקבל תגובה בטקסט או בקוד. בנוסף, הוא תומך בהבנה של הקשר ארוך עם 2 מיליון אסימונים.

  • Gemini 1.0 Pro Vision
    מודל רב-אופני שמיועד לטפל בטקסט, תמונות ווידאו כדי לקבל תשובה באמצעות טקסט או קוד. לא ניתן להשתמש בשיחה בצ'אט.

  • Gemini 1.0 Pro
    מודל שמטפל במשימות של שפה טבעית, צ'אט רב-תכליתי עם טקסט וקוד ויצירת קוד.

מעבר אל שמות המודלים שייכללו בקוד

תרחישים לדוגמה ויכולות של כל מודל

לכל מודל של Gemini יש יכולות שונות שתומכות בתרחישים לדוגמה שונים. מידע נוסף על כל אחד מהמודלים של Gemini זמין במסמכי התיעוד של Google Cloud.

קלט ופלט נתמכים לכל מודל

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
סוגי קלט
טקסט
קוד
תמונה
PDF
וידאו (פריימים בלבד)
וידאו (פריימים ואודיו)
אודיו
סוגי פלט
טקסט
פלט מובנה (כמו JSON) באמצעות סכימה של תגובה
קוד

למידע על סוגי הקבצים הנתמכים, ראו קבצי קלט נתמכים ודרישות ל-Vertex AI Gemini API.

יכולות נתמכות ותכונות כלליות בכל דגם

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
יצירת טקסט מקלט טקסט בלבד
יצירת טקסט מקלט מרובה מצבים
פלט מובנה (כמו JSON) באמצעות סכימת תגובות
צ'אט מרובה פניות
שליחת פונקציות
קריאה בסיסית לפונקציה
שליחת קריאה לפונקציה מקבילה
מצב קריאה לפונקציה
ספירת אסימונים ותווים לחיוב
הוראות מערכת

מידע מפורט על כל מודל

נכס Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
מגבלת האסימונים הכוללת (קלט ופלט משולבים) * 1,048,576 טוקנים 2,097,152 אסימונים 16,384 אסימונים 32,760 אסימונים
מגבלת אסימוני פלט * 8,192 אסימונים 8,192 אסימונים 2,048 אסימונים 8,192 אסימונים
מספר תמונות מקסימלי לבקשה 3,000 תמונות 3,000 תמונות 16 תמונות לא רלוונטי
גודל מקסימלי של תמונה בקידוד Base64 7MB 7MB 7 MB לא רלוונטי
גודל מקסימלי של קובץ PDF 30 MB 30MB 30MB לא רלוונטי
המספר המקסימלי של קובצי וידאו בכל בקשה 10 קובצי סרטונים 10 קובצי וידאו קובץ סרטון אחד לא רלוונטי
אורך סרטון מקסימלי (פריימים בלבד) כ-60 דקות של סרטון כ-60 דקות של סרטון 2 דקות לא רלוונטי
אורך מקסימלי של סרטון (פריימים ואודיו) כ-45 דקות של סרטון כ-45 דקות של סרטון לא רלוונטי לא רלוונטי
המספר המקסימלי של קובצי אודיו בכל בקשה קובץ אודיו אחד קובץ אודיו אחד לא רלוונטי לא רלוונטי
אורך האודיו המקסימלי כ-8.4 שעות של אודיו כ-8.4 שעות אודיו לא רלוונטי לא רלוונטי

* בכל המודלים של Gemini, אסימון שווה ל-4 תווים בערך, כך ש-100 אסימונים הם כ-60-80 מילים באנגלית. אפשר לקבוע את המספר הכולל של הטוקנים בבקשות באמצעות countTokens.

במאמר קובצי קלט נתמכים ודרישות ל-Vertex AI Gemini API מוסבר על סוגי הקבצים הנתמכים, איך לציין סוג MIME ואיך לוודא שהקבצים והבקשות מרובות מצבים עומדים בדרישות ולפעול לפי השיטות המומלצות.

ניהול גרסאות של המודלים

המודלים של Gemini זמינים בגרסאות יציבות, עדכניות ובטא.

  • גרסאות יציבות נחשבות לזמינות לכולם.

    • לגרסאות יציבות יש שמות דגמים עם מספר גרסה ספציפי בן שלוש ספרות, לדוגמה gemini-1.5-pro-002.
  • גרסאות מתעדכנות תמיד מפנות לגרסה היציבה האחרונה של הדגם הזה. אם תופץ גרסה יציבה חדשה, הגרסה המעודכנת תתחיל להפנות באופן אוטומטי לגרסה היציבה החדשה.

    • לגרסאות שמתעדכנות אוטומטית יש שמות דגמים ללא תוספות, לדוגמה gemini-1.5-pro.
  • לגרסאות גרסת טרום-השקה (Preview) יש יכולות חדשות והן נחשבות לא יציבות. חשוב לזכור שגרסאות תצוגה מקדימה תמיד מפנות לגרסת התצוגה המקדימה האחרונה של המודל. אם תפורסם גרסה חדשה של תצוגה מקדימה, כל גרסה קיימת של תצוגה מקדימה תתחיל להפנות באופן אוטומטי לגרסה החדשה של תצוגה מקדימה.

    • לגרסאות המקדימות מצורף שם המודל עם הסיומת -preview ותאריך הפרסום הראשוני של המודל (-MMDD). לדוגמה: gemini-1.5-pro-preview-0409 (פורסם ב-9 באפריל 2024).

מידע נוסף על הגרסאות הזמינות של המודל של Gemini ומחזור החיים שלהן זמין במסמכי התיעוד של Google Cloud.

שמות המודלים הזמינים

שמות המודלים הם הערכים המפורשים שאתם כוללים בקוד שלכם במהלך האתחול של המודל הגנרטיבי (שלב חובה כדי לקרוא ל-Gemini API). דוגמאות לאתחול בשפה שלכם מופיעות במדריך לתחילת העבודה.

שמות של דגמים של Flash ב-Gemini 1.5

שם הדגם תיאור שלב ההפצה תאריך ההשקה של הגרסה הראשונית תאריך ביטול המינוי
גרסאות יציבות
gemini-1.5-flash-002 הגרסה היציבה האחרונה של Gemini 1.5 Flash זמינות לכלל המשתמשים (GA) 2024-09-24 לא לפני 24 בספטמבר 2025
gemini-1.5-flash-001 הגרסה היציבה הראשונית של Gemini 1.5 Flash זמינות לכלל המשתמשים (GA) 2024-05-24 לא לפני 24 במאי 2025
גרסה מתעדכנת אוטומטית
gemini-1.5-flash מפנה אל gemini-1.5-flash-001

כדי לגשת אל gemini-1.5-flash-002, צריך להשתמש בשם המודלים היציב והמפורש במקום בגרסת העדכון האוטומטי.
זמינות לכלל המשתמשים (GA) 2024-05-24 ---

שמות המודלים של Gemini 1.5 Pro

שם המודל תיאור שלב ההפצה תאריך ההשקה של הגרסה הראשונית תאריך ביטול המינוי
גרסאות יציבות
gemini-1.5-pro-002 הגרסה היציבה האחרונה של Gemini 1.5 Pro זמינות לכלל המשתמשים (GA) 2024-09-24 לא לפני 24 בספטמבר 2025
gemini-1.5-pro-001 הגרסה היציבה הראשונית של Gemini 1.5 Pro זמינות לכלל המשתמשים (GA) 2024-05-24 לא לפני 24 במאי 2025
גרסה מתעדכנת אוטומטית
gemini-1.5-pro מפנה אל gemini-1.5-pro-001

כדי לקבל גישה אל gemini-1.5-pro-002, צריך להשתמש בשם היציב המפורש של המודל במקום בגרסה המעודכנת.
זמינות לכלל המשתמשים (GA) 2024-05-24 ---

שמות המודלים של Gemini 1.0 Pro Vision

שם הדגם תיאור שלב ההפצה תאריך ההשקה של הגרסה הראשונית תאריך ביטול המינוי
גרסאות יציבות
gemini-1.0-pro-vision-001 הגרסה היציבה האחרונה של Gemini 1.0 Pro Vision זמינות לכלל המשתמשים (GA) 2024-02-15 לא לפני 15 בפברואר 2025
גרסה עם עדכונים אוטומטיים
gemini-1.0-pro-vision מפנה לגרסה היציבה האחרונה של 1.5 Pro Vision
(כרגע gemini-1.5-pro-vision-001)
זמינות לכלל המשתמשים (GA) 2024-01-04 ---

שמות המודלים של Gemini 1.0 Pro

שם המודל תיאור שלב ההפצה תאריך ההשקה של הגרסה הראשונית תאריך ביטול המינוי
גרסאות יציבות
gemini-1.0-pro-002 הגרסה היציבה האחרונה של Gemini 1.0 Pro זמינות לכלל המשתמשים (GA) 2024-04-09 לא לפני 9 באפריל 2025
gemini-1.0-pro-001 גרסה יציבה של Gemini 1.0 Pro זמינות לכלל המשתמשים (GA) 2024-02-15 לא לפני 15 בפברואר 2025
גרסה מתעדכנת אוטומטית
gemini-1.0-pro מצביע על הגרסה היציבה האחרונה של 1.0 Pro
(כרגע gemini-1.0-pro-002)
זמינות לכלל המשתמשים (GA) 2024-02-15 ---

שפות נתמכות

  • כל הדגמים של Gemini יכולים להבין ולענות בשפות הבאות:

    ערבית (ar), בנגלית (bn), בולגרית (bg), סינית פשוטה ומסורתית (zh), קרואטית (hr), צ'כית (cs), דנית (da), הולנדית (nl), אנגלית (en), אסטונית (et), פינית (fi), צרפתית (fr), גרמנית (de), יוונית (el), עברית (iw), הינדי (hi), הונגרית (hu), אינדונזית (id), איטלקית (it), יפנית (ja), קוריאנית (ko), לטבית (lv), ליטאית (lt), נורווגית (no), פולנית (pl), פורטוגזית (pt), רומנית (ro), רוסית (ru), סרבית (sr), סלובקית (sk), סלובנית (sl), ספרדית (es), סוואהילית (sw), שוודית (sv), תאילנדית (th), טורקית (tr), אוקראינית (uk), וייטנאמית (vi)

  • הדגמים Gemini 1.5 Pro ו-Gemini 1.5 Flash יכולים להבין ולתת תשובות בשפות הנוספות הבאות:

    אפריקאנס (af), אמהריית (am), אסאמית (as), אזרית (az), בלארוסית (be), בוסנית (bs), קטלאנית (ca), צ'בואנו (ceb), קורסיקאית (co), וולשית (cy), דיווהי (dv), ספרדית (es), אסטונית (et), אספניולת (es), אסטונית (et), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es), אספניולת (es),

השלבים הבאים

כדאי לנסות את היכולות של Gemini API