מעקב אחר העלויות, השימוש ומדדים אחרים של Gemini API

מעקב אחר העלויות, השימוש ומדדים אחרים של Gemini API הוא חלק חשוב מהפעלת אפליקציה בסביבת ייצור. חשוב לדעת איך נראים דפוסי השימוש הרגילים באפליקציה שלכם ולוודא שאתם לא חורגים מהסף שחשוב לכם.

מעקב אחרי העלויות

בלוח הבקרה Usage and Billing במסוף Firebase, אפשר לראות את העלויות של הקריאות ל-Vertex AI Gemini API בפרויקט.

העלויות שמוצגות במרכז הבקרה לא בהכרח ספציפיות לשיחות דרך ערכות ה-SDK של הלקוח של Vertex AI in Firebase. העלויות המוצגות משויכות לכל קריאה ל-Vertex AI Gemini API, בין אם היא מתבצעת באמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, ערכות ה-SDK של השרת Vertex AI, Firebase Genkit, Firebase Extensions ל-Gemini API, קריאות REST, Vertex AI Studio או לקוחות API אחרים.

אפשר גם לקבל אומדן של גודל האסימון והתווים לחיוב של הבקשות באמצעות Count Tokens API. מידע נוסף על מגבלות האסימונים לכל מודל ותמחור לכל מודל

הגדרת התראות

כדי להימנע מחיובים לא צפויים, חשוב להגדיר התראות לגבי תקציבים.

חשוב לזכור שהתראות תקציב הן לא תקרות תקציב. תקבלו התראות כשאתם מתקרבים לסף שהגדרתם או חורגים ממנו, כדי שתוכלו לבצע פעולות באפליקציה או בפרויקט.

מעקב אחר שימוש ומדדים אחרים

אפשר לראות את המדדים של הפרויקט לכל ממשק API, כמו השימוש בו, במסוף Google Cloud.

  1. במסוף Google Cloud, עוברים לכל דף API: Vertex AI API ו-Vertex AI in Firebase API.

    • דף ה-API של Vertex AI: זהו השימוש שמשויך לכל קריאה ל-Vertex AI Gemini API, בין שבאמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, בין שבאמצעות ערכות ה-SDK של השרת Vertex AI, בין שבאמצעות Firebase Genkit, בין שבאמצעות Firebase Extensions ל-Gemini API, בין שבאמצעות קריאות ל-REST, בין שבאמצעות Vertex AI Studio וכו'.

    • דף ה-API של Vertex AI in Firebase: זהו השימוש הספציפי לקריאות שמגיעות מ-SDK של Vertex AI in Firebase.

  2. לוחצים על ניהול.

  3. לוחצים על הכרטיסייה Metrics.

  4. בתפריטים הנפתחים אפשר לראות את המדדים הרלוונטיים, כמו תנועה לפי קוד תגובה, שגיאות לפי שיטת API, זמן אחזור כולל וזמן אחזור לפי שיטת API.