מכסות ומגבלות קצב

לוחצים על הספק Gemini API כדי לראות בדף הזה תוכן וקוד שספציפיים לספק.


הגבלות על קצב שליחת בקשות (שנקראות בדרך כלל מכסות) קובעות את מספר הבקשות שאפשר לשלוח אל Gemini API בפרק זמן נתון. המגבלות האלה עוזרות לנו להבטיח שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

כשמשתמשים ב-Firebase AI Logic כדי לשלוח בקשות למודלים של Gemini ושל Imagen, מגבלות הקצב של הפרויקט תלויות בספק Gemini API שבחרתם. ‫Firebase AI Logic מספקת גם דרך להגדיר מגבלות קצב 'לכל משתמש'.

הצגת מגבלות התעריפים של Gemini Developer API

הסבר על מגבלות קצב (מכסות)

מגבלות התעריפים (מכסות) נמדדות בארבעה מאפיינים:

  • בקשות בדקה (RPM)
  • בקשות ביום (RPD)
  • טוקנים לדקה (TPM)
  • טוקנים ביום (TPD)

השימוש שלכם נבדק מול כל מגבלה, ואם תחרגו ממגבלה כלשהי, תוצג השגיאה 429 (חריגה מהמכסה). לדוגמה, אם מגבלת ה-RPM היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת ה-TPM או ממגבלות אחרות.

המגבלות על קצב הבקשות חלות ברמת הפרויקט, על כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

ההגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מההגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק עבור מודלים שיכולים ליצור תמונות (Imagen 3), אבל הוא דומה מבחינה רעיונית למדד TPM.

מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה הן מחמירות יותר.

בקשה להגדלת מגבלת קצב הבקשות

אם אתם משתמשים בGemini Developer API בתוכנית בתשלום, אתם יכולים לבקש להגדיל את קצב יצירת הבקשות שמותר במסגרת המגבלה.

הגדרת מגבלות קצב 'לכל משתמש'

כדי להשתמש ב-Firebase AI Logic, צריך להפעיל בפרויקט את ספק Firebase AI Logic שבחרתם, אבל צריך גם להפעיל את Firebase AI Logic API, שמשמש כשער בין ה-SDK של הלקוח שלנו לבין ספק Firebase AI Logic שלכם.Gemini APIGemini API ה-API הזה מופעל בשבילכם כשמגדירים את Firebase AI Logic בפרויקט Firebase.

אתם יכולים להשתמש במכסה (מגבלה) של קצב שליחת בקשות ל-API של Firebase AI Logic כמגבלה של קצב שליחת בקשות "לכל משתמש" באפליקציה שלכם, במיוחד עבור תכונות ה-AI שמסתמכות על Firebase AI Logic. מומלץ להגדיר את המגבלה הזו כך שתאפשר למשתמש יחיד לגשת לתכונות ה-AI, וגם תבטיח שאף משתמש לא יחרוג מהמגבלות של ספק Gemini API (שמיועד לשיתוף בין כל המשתמשים).

פרטים על הגבלת הקצב של יצירת בקשות לכל משתמש

אלה כמה פרטים חשובים על מגבלות הקצב (מכסות) של Firebase AI Logic API, ובמיוחד על בקשות לדקה (RPM):

  • הוא מבוסס על 'יצירת בקשות לתוכן' על בסיס משתמש, אזור ודקה, ולא על בסיס מודל.

  • היא חלה ברמת הפרויקט ועל כל האפליקציות וכתובות ה-IP שמשתמשות באותו פרויקט Firebase.

  • היא חלה על כל שיחה שמגיעה ספציפית מכל SDK של Firebase AI Logic.

  • הגבלת הקצב שמוגדרת כברירת מחדל היא 100 בקשות לדקה לכל משתמש.
    חשוב לזכור שעדיין צריך להתייחס למגבלות של ספק Gemini API (כפי שצוין למעלה), שקודמות למגבלות של Firebase AI Logic API.

שינוי הגבלת קצב של יצירת בקשות לכל משתמש

כדי לשנות את מגבלת הקצב (מכסה), צריך לקבל את ההרשאה serviceusage.quotas.update, שכלולה כברירת מחדל בתפקידים 'בעלים' ו'עריכה'.

כך עורכים את מגבלת הקצב (המכסה) או מבקשים להגדיל אותה:

  1. במסוף Google Cloud, עוברים לדף של Firebase AI Logic API.

  2. לוחצים על ניהול.

  3. בחלק התחתון של הדף, לוחצים על הכרטיסייה Quotas & System Limits (מכסות ומגבלות מערכת).

  4. מסננים את הטבלה כדי להציג את המכסות הרלוונטיות, כמו היכולת (בקשות ליצירת תוכן) והאזור.

    לדוגמה, כדי לראות את המכסות לכל משתמש לשליחת בקשות ליצירת תוכן בכל אחד מהאזורים הנתמכים באסיה, המסנן ייראה כך: Generate content requests + Dimension:region:asia

  5. מסמנים את התיבה שמימין לכל מכסה שרוצים לראות.

  6. בסוף השורה של המכסה, לוחצים על ואז על Edit quota.

  7. בטופס Quota changes (שינויים במכסת השימוש), מבצעים את הפעולות הבאות:

    1. בשדה ערך חדש, מזינים את המכסה המוגדלת.

      המכסה הזו חלה ברמת הפרויקט ומשותפת לכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

    2. ממלאים את שאר השדות בטופס ולוחצים על סיום.

    3. לוחצים על שליחת בקשה.