ספירת טוקנים במודלים של Gemini

מודלים של Gemini מעבדים קלט ופלט ביחידות שנקראות טוקנים.

אסימונים יכולים להיות תווים בודדים כמו z או מילים שלמות כמו cat. מילים ארוכות מפוצלות לכמה טוקנים. קבוצת כל האסימונים שבהם נעשה שימוש במודל נקראת אוצר מילים, והתהליך של פיצול טקסט לאסימונים נקרא טוקניזציה.

במודלים של Gemini, אסימון שווה בערך ל-4 תווים. ‫100 אסימונים שווים לכ-60-80 מילים באנגלית.

לכל מודל יש מספר אסימונים מקסימלי שהוא יכול לטפל בו בהנחיה ובתגובה. אם תדעו כמה טוקנים יש בהנחיה, תוכלו לדעת אם חרגתם מהמגבלה. בנוסף, העלות של בקשה נקבעת בחלקה לפי מספר האסימונים של הקלט והפלט, ולכן כדאי לדעת איך לספור אסימונים.

שימו לב שגם מודלים Gemini 1.0 ו-1.5 תמכו בספירה ובמחיר של 'תווים לחיוב', אבל מכיוון שכל המודלים האלה הוצאו משימוש או שעומדים לצאת משימוש, בדף הזה לא מפורט מידע על תווים לחיוב.

מודלים נתמכים

  • gemini-2.5-pro
  • gemini-2.5-flash
  • gemini-2.5-flash-lite
  • gemini-2.0-flash-001 (והכינוי שלו שמתעדכן אוטומטית gemini-2.0-flash)
  • gemini-2.0-flash-lite-001 (והכינוי שלו שמתעדכן אוטומטית gemini-2.0-flash-lite)
  • gemini-2.0-flash-preview-image-generation

אפשרויות לספירת טוקנים

כל הקלט והפלט של Gemini API עוברים טוקניזציה, כולל טקסט, קובצי תמונות ושיטות אחרות שאינן טקסט. אלה האפשרויות לספירת טוקנים:

בודקים את מספר הטוקנים של הבקשות בלבד (לפני ששולחים אותן למודל).
מתקשר countTokens עם הקלט של הבקשה לפני שליחתה למודל. הפלט שמתקבל:
  • total_tokens: מספר האסימונים של הקלט בלבד
בודקים את מספר הטוקנים גם בבקשות וגם בתשובות.
משתמשים במאפיין usageMetadata באובייקט התגובה. הם כוללים:
  • prompt_token_count: מספר האסימונים בקלט בלבד
  • candidates_token_count: מספר האסימונים של הפלט בלבד (לא כולל אסימוני חשיבה)
  • thoughts_token_count: מספר האסימונים של אסימוני חשיבה ששימשו ליצירת התגובה
  • total_token_count: המספר הכולל של האסימונים עבור הקלט והפלט (כולל אסימוני חשיבה)

כשמבצעים סטרימינג של פלט, המאפיין usageMetadata מופיע רק בחלק האחרון של הסטרימינג. הוא nil עבור חלקים בינוניים.

חשוב לשים לב לנקודות הבאות לגבי האפשרויות שלמעלה:

  • הם לא יספרו את מספר תמונות הקלט או את מספר השניות בקובצי קלט של וידאו או אודיו. עם זאת, מספר הטוקנים של כל אחד מהאופנים האלה יהיה קשור לערכים האלה.
  • מספר הטוקנים של הקלט כולל את ההנחיה (טקסט וקבצים של קלט) וגם את ההוראות והכלים של המערכת.
  • מספר האסימונים בפלט לא כולל אסימוני חשיבה, שמסופקים בשדה נפרד.
  • בהמשך הדף מופיע מידע נוסף שספציפי לכל סוג בקשה.

תמחור האפשרויות האלה

  • קריאה ל-countTokens: אין חיוב על קריאה ל-countTokens (Count Tokens API). המכסה המקסימלית של Count Tokens API היא 3,000 בקשות לדקה (RPM).

  • שימוש במאפיין usageMetadata: המאפיין הזה תמיד מוחזר כחלק מהתשובה, ולא כרוך בשימוש בטוקנים או בחיוב.

מידע נוסף

הנה מידע נוסף על עבודה עם סוגים ספציפיים של בקשות.

ספירת טוקנים של קלט טקסט

אין מידע נוסף.

ספירת טוקנים של שיחות עם זיכרון

כשמתקשרים ב-countTokens באמצעות הצ'אט, חשוב לזכור את הדברים הבאים:

  • אם קוראים לפונקציה countTokens עם היסטוריית הצ'אט, היא מחזירה את המספר הכולל של הטוקנים משני התפקידים בצ'אט (total_tokens).
  • כדי להבין מה יהיה גודל התגובה הבאה בשיחה, צריך לצרף אותה להיסטוריה כשמתקשרים אל countTokens.

ספירת טוקנים של קלט מרובה מצבים

חשוב לזכור את הנקודות הבאות לגבי ספירת טוקנים עם קלט רב-אופני:

  • אפשר גם להתקשר אל countTokens בנפרד לגבי הטקסט והקובץ.
  • בשתי האפשרויות לספירת טוקנים, תקבלו את אותו מספר טוקנים בין אם תספקו את הקובץ כנתונים מוטבעים או באמצעות כתובת ה-URL שלו.

קובצי קלט של תמונות

קבצים של תמונות קלט מומרים לטוקנים על סמך המידות שלהם:

  • תשומות של תמונות עם שני הממדים קטנים מ-384 פיקסלים או שווים להם: כל תמונה נספרת כ-258 טוקנים.
  • תמונות קלט שגדולות יותר באחד מהממדים או בשניהם: כל תמונה נחתכת ומשתנה לפי הצורך לאריחים בגודל 768x768 פיקסלים, ואז כל אריח נספר כ-258 טוקנים.

קובצי קלט של וידאו ואודיו

קובצי וידאו ואודיו להזנה מומרים לטוקנים בשיעורים הקבועים הבאים:

  • סרטון: 263 טוקנים לשנייה
  • אודיו: 32 טוקנים לשנייה

קבצי קלט של מסמכים (כמו קובצי PDF)

קבצים מסוג PDF נחשבים כתמונות, ולכן כל דף בקובץ PDF עובר טוקניזציה באותו אופן כמו תמונה.