فهم الحصص وإدارتها

تتطلّب Vertex AI in Firebase واجهتَي برمجة تطبيقات مختلفتَين (لكل منهما حصة خاصة بها): Vertex AI API وVertex AI in Firebase API.

لكلّ من واجهات برمجة التطبيقات هذه حصة يتم قياسها حسب عدد الطلبات في الدقيقة (RPM)، ويشمل ذلك على وجه التحديد طلبات "إنشاء المحتوى" (سواءً من خلال البث أو بدونه). تشمل واجهة برمجة تطبيقات Vertex AI أيضًا حصة رموز مميّزة للإدخال في الدقيقة.

توضّح هذه الصفحة ما يلي:

يمكنك قراءة مستندات Google Cloud للحصول على معلومات عامة حول الحصص.

فهم الحصص لكل واجهة برمجة تطبيقات

يتم قياس حصة كل واجهة برمجة تطبيقات بشكل مختلف قليلاً، ما يعني أنّه يمكن استخدامها لأغراض مختلفة.

فهم حصص Vertex AI واجهة برمجة التطبيقات

تستند حصص Vertex AI لواجهة برمجة التطبيقات إلى "إنشاء طلبات المحتوى" لكل نموذج في كل منطقة في كل دقيقة.

في ما يلي بعض التفاصيل المهمة حول هذه الحصص (على وجه التحديد، الطلبات في الدقيقة ورموز الإدخال في الدقيقة):

  • تنطبق هذه السياسات على مستوى المشروع وتتم مشاركتها على جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.

  • وتنطبق هذه الأحكام على أي طلب موجَّه إلى Vertex AI Gemini API، سواء كان باستخدام حِزم تطوير البرامج (SDK) لعملاء Vertex AI in Firebase أو حِزم تطوير البرامج (SDK) لخوادم Vertex AI أو Firebase Genkit أو Firebase Extensions Gemini أو طلبات REST أو Vertex AI Studio أو عملاء واجهة برمجة التطبيقات الآخرين.

  • وتنطبق هذه الإعدادات على نموذج أساسي وجميع الإصدارات والمعرّفات والإصدارات المحسّنة من هذا النموذج. وإليك بعض الأمثلة:

    • يتم احتساب الطلب المُرسَل إلى gemini-1.0-pro وطلب gemini-1.0-pro-001 كطلبَين ضمن حصة الأرباح لكل ألف مشاهدة (RPM) في النموذج الأساسي gemini-1.0 pro.

    • يتم احتساب طلب موجَّه إلى gemini-1.0-pro-001 وطلب موجَّه إلى نموذج معدَّل يستند إلى gemini-1.0-pro-001 كطلبَين ضمن حصة RPM للنموذج الأساسي، gemini-1.0-pro.

  • يمكن العثور على الإعدادات التلقائية الحصص لكل نموذج ولكل منطقة في مستندات Google Cloud.

يمكنك اعتبار حصص واجهة برمجة التطبيقات هذه بشكل أساسي حصصك "الكلية" لجميع مستخدميك (الذين يستخدمون ميزات الذكاء الاصطناعي في تطبيقك التي تعتمد على نموذج معيّن وفي منطقة معيّنة).

يجب أن تكون هذه الحصص عالية بما يكفي لاستيعاب العدد الإجمالي للمستخدمين النهائيين في منطقة معيّنة الذين قد يصلون إلى ميزات الذكاء الاصطناعي التي تعتمد على نموذج معيّن. وبما أنّ هذه الحصص تُحدَّد لكل دقيقة، من غير المرجّح نسبيًا أن يستخدم جميع المستخدمين في منطقة معيّنة المجموعة نفسها من الميزات في الوقت نفسه ويستنفذون هذه الحصص. ولكن يختلف كل تطبيق عن الآخر، لذا عليك تعديل هذه الحصص وفقًا لذلك.

فهم حصة Vertex AI in Firebase لواجهة برمجة التطبيقات

تستند حصة واجهة برمجة التطبيقات "Vertex AI in Firebase" إلى "إنشاء طلبات المحتوى" على أساس كل مستخدم حسب المنطقة في الدقيقة.

في ما يلي بعض التفاصيل المهمة عن هذه الحصة (على وجه التحديد، الطلبات في الدقيقة):

  • وينطبق ذلك على مستوى المشروع وعلى جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.

  • وينطبق ذلك على أي مكالمة تمرّ تحديدًا من خلال أي Vertex AI in Firebase حزمة تطوير برامج (SDK).

  • الحصة التلقائية هي 100 دورة في الدقيقة لكل مستخدم.
    يُرجى العِلم أنّه لا يزال عليك مراعاة الحدّ الأقصى للحصة في Vertex AI واجهة برمجة التطبيقات، خاصةً إذا كانت أقل من 100 مرة في الساعة.

يمكنك اعتبار حصة واجهة برمجة التطبيقات هذه هي حصتك "لكل مستخدم" ل ميزات الذكاء الاصطناعي التي تعتمد على Vertex AI in Firebase.

يجب أن تكون هذه الحصة عالية بما يكفي لاستيعاب مستخدم واحد يستخدم ميزات الذكاء الاصطناعي التي تعتمد على Vertex AI in Firebase بشكل معقول. بما أنّ واجهة برمجة التطبيقات هذه تؤدي دور البوابة إلى واجهة برمجة التطبيقات Vertex AI، يمكنك استخدام حصة Vertex AI in Firebase واجهة برمجة التطبيقات لضمان عدم استنفاد أي مستخدم individual لحصة Vertex AI واجهة برمجة التطبيقات (التي من المفترض أن تتم مشاركتها بواسطة جميع المستخدمين).

عرض الحصص لكل واجهة برمجة تطبيقات

يمكنك الاطّلاع على الحصص لكل واجهة برمجة تطبيقات في وحدة تحكّم Google Cloud.

  1. في وحدة تحكّم Google Cloud، انتقِل إلى صفحة واجهة برمجة التطبيقات التي تهمّك: Vertex AI API أو Vertex AI in Firebase API.

  2. انقر على إدارة.

  3. في أسفل الصفحة، انقر على علامة التبويب الحصص وحدود النظام.

  4. فلتِر الجدول لعرض حصص الاهتمام.

    يُرجى العِلم أنّه لإنشاء فلتر Dimension، عليك استخدام أدوات الفلترة ، بدلاً من نسخ القيم في الأمثلة التالية ولصقها فقط.

    • بالنسبة إلى Vertex AI واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) واسم النموذج والمنطقة.

      على سبيل المثال، للاطّلاع على الحصص المحدّدة لإنشاء طلبات المحتوى باستخدام Gemini 1.5 Flash في أيّ من مناطق الاتحاد الأوروبي المتوافقة، سيظهر فلترك على النحو التالي:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • بالنسبة إلى Vertex AI in Firebase واجهة برمجة التطبيقات: حدِّد الإمكانات (طلبات إنشاء المحتوى) والمنطقة.

      على سبيل المثال، لعرض الحصص لكل مستخدم لإنشاء طلبات المحتوى في أي من المناطق الآسيوية المتوافقة، سيظهر الفلتر على النحو التالي:
      Generate content requests + Dimension:region:asia

      يُرجى العلم أنّ Vertex AI in Firebase الحصص المخصّصة لواجهات برمجة التطبيقات لا تستند إلى نموذج معيّن. بالإضافة إلى ذلك، لا ينطبق صف الحصة (default) على Vertex AI in Firebase.

تعديل الحصة أو طلب زيادة الحصة

قبل الانتقال إلى قناة الإصدار العلني أو إذا ظهرت لك 429 خطأ تم تجاوز الحدّ الأقصى للحصة، قد تحتاج إلى تعديل حصتك أو طلب زيادة الحصة. احرص على تعديل حصة كل واجهة برمجة تطبيقات وفقًا لذلك (اطّلِع على فهم الحصص لكل واجهة برمجة تطبيقات في وقت سابق من هذه الصفحة للحصول على اعتبارات).

لتعديل حصة، يجب أن يكون لديك إذن serviceusage.quotas.update، الذي يكون مضمّنًا تلقائيًا في دورَي "المالك" و"المحرِّر".

في ما يلي كيفية تعديل حصتك أو طلب زيادة الحصة:

  1. اتّبِع التعليمات الواردة في القسم الفرعي السابق لعرض الحصص لكل واجهة برمجة تطبيقات.

  2. ضع علامة في مربّع الاختيار على يمين كل حصة اهتمام.

  3. في نهاية صف الحصة، انقر على القائمة ذات النقاط الثلاث، ثم اختَر تعديل الحصة.

  4. في نموذج تغييرات الحصة، اتّبِع الخطوات التالية:

    1. أدخِل الحصة المتزايدة في حقل القيمة الجديدة.

      تنطبق هذه الحصة على مستوى المشروع وتتم مشاركتها على جميع التطبيقات وعناوين IP التي تستخدم مشروع Firebase هذا.

    2. أكمل أي حقول إضافية في النموذج، ثم انقر على تم.

    3. انقر على إرسال الطلب.