سهمیه های خود را درک و مدیریت کنید، سهمیه های خود را درک و مدیریت کنید

Vertex AI in Firebase به دو API مختلف (هر کدام سهمیه خاص خود) نیاز دارد: API Vertex AI و Vertex AI in Firebase .

هر یک از این API ها دارای سهمیه ای هستند که به عنوان درخواست در دقیقه (RPM) اندازه گیری می شود - به طور خاص درخواست های "تولید محتوا" (هم جریان و هم بدون پخش جریانی). API Vertex AI همچنین سهمیه ای برای نشانه های ورودی در دقیقه دارد.

این صفحه موارد زیر را شرح می دهد:

می توانید اطلاعات کلی در مورد سهمیه در مستندات Google Cloud را بیاموزید.

سهمیه های هر API را درک کنید

سهمیه هر API کمی متفاوت اندازه گیری می شود، به این معنی که می توان از آنها برای اهداف مختلف استفاده کرد.

سهمیه های Vertex AI API را درک کنید

سهمیه‌های Vertex AI API بر اساس «تولید درخواست‌های محتوا» بر اساس مدل در هر منطقه در دقیقه است.

در اینجا برخی از جزئیات مهم در مورد این سهمیه ها (به طور خاص، درخواست در دقیقه و نشانه های ورودی در دقیقه) آمده است:

  • آنها در سطح پروژه اعمال می شوند و در تمام برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند به اشتراک گذاشته می شوند.

  • آنها برای هر تماسی با Vertex AI Gemini API اعمال می‌شوند، خواه از Vertex AI in Firebase ، SDK سرور Vertex AI ، Firebase Genkit ، Firebase Extensions Gemini، تماس‌های REST، Vertex AI Studio یا سایر کلاینت‌های API استفاده شود.

  • آنها برای یک مدل پایه و همه نسخه ها، شناسه ها و نسخه های تنظیم شده آن مدل اعمال می شوند. در اینجا چند نمونه آورده شده است:

    • یک درخواست به gemini-1.0-pro و یک درخواست به gemini-1.0-pro-001 به عنوان دو درخواست برای سهمیه RPM مدل پایه، gemini-1.0 pro شمرده می شود.

    • یک درخواست به gemini-1.0-pro-001 و یک درخواست به یک مدل تنظیم شده که بر اساس gemini-1.0-pro-001 است، به عنوان دو درخواست برای سهمیه RPM مدل پایه، gemini-1.0-pro محاسبه می شود.

  • سهمیه های پیش فرض برای هر مدل و برای هر منطقه را می توان در اسناد Google Cloud یافت.

شما اساساً می‌توانید سهمیه‌های این API را به‌عنوان سهمیه‌های «کل» خود برای همه کاربران خود در نظر بگیرید (که از ویژگی‌های هوش مصنوعی در برنامه شما استفاده می‌کنند که به یک مدل خاص و در یک منطقه خاص متکی هستند).

این سهمیه ها باید به اندازه کافی بالا باشند تا به طور منطقی تعداد کل کاربران نهایی را در یک منطقه خاص که ممکن است به ویژگی های هوش مصنوعی شما که به یک مدل خاص وابسته است دسترسی داشته باشند، در خود جای دهد. از آنجایی که اینها سهمیه‌های هر دقیقه هستند، نسبتاً بعید است که همه کاربران شما در یک منطقه از مجموعه ویژگی‌های یکسانی در یک زمان استفاده کنند و این سهمیه‌ها را تخلیه کنند. اما هر برنامه متفاوت است، بنابراین این سهمیه ها را بر اساس آن تنظیم کنید.

Vertex AI in Firebase API درک کنید

Vertex AI in Firebase API بر اساس «تولید درخواست‌های محتوا» بر اساس هر کاربر در هر منطقه در دقیقه است.

در اینجا برخی از جزئیات مهم در مورد این سهمیه (به طور خاص، درخواست در دقیقه):

  • در سطح پروژه اعمال می شود و برای همه برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند اعمال می شود.

  • این برای هر تماسی که به طور خاص از طریق هر Vertex AI in Firebase SDK انجام می شود، اعمال می شود.

  • سهمیه پیش فرض 100 RPM برای هر کاربر است.
    توجه داشته باشید که همچنان باید محدودیت‌های سهمیه برای Vertex AI API را در نظر بگیرید، به خصوص اگر کمتر از این 100 RPM باشد.

شما اساساً می‌توانید سهمیه این API را سهمیه «به‌ازای هر کاربر» خود برای ویژگی‌های هوش مصنوعی در نظر بگیرید که به Vertex AI in Firebase متکی هستند.

این سهمیه باید به اندازه کافی بالا باشد تا بتواند به طور منطقی یک کاربر را که به ویژگی های هوش مصنوعی متکی بر Vertex AI in Firebase دسترسی دارد، در خود جای دهد. از آنجایی که این API به عنوان دروازه ای برای Vertex AI API عمل می کند، می توانید از Vertex AI in Firebase API استفاده کنید تا اطمینان حاصل کنید که هیچ کاربری سهمیه Vertex AI API شما را (که قرار است توسط همه کاربران به اشتراک گذاشته شود) تخلیه نمی کند.

مشاهده سهمیه برای هر API

می‌توانید سهمیه‌های هر API را در کنسول Google Cloud مشاهده کنید.

  1. در کنسول Google Cloud ، به صفحه API مورد علاقه بروید: Vertex AI API یا Vertex AI in Firebase API .

  2. روی Manage کلیک کنید.

  3. در پایین صفحه، روی برگه Quotas & System Limits کلیک کنید.

  4. جدول را برای نشان دادن سهمیه های مورد علاقه فیلتر کنید.

    توجه داشته باشید که برای ایجاد فیلتر Dimension ، به جای کپی پیست کردن مقادیر در مثال‌های زیر، باید از ابزار فیلتر استفاده کنید.

    • برای Vertex AI API: قابلیت (درخواست برای تولید محتوا)، نام مدل و منطقه را مشخص کنید.

      به عنوان مثال، برای مشاهده سهمیه‌های تولید درخواست‌های محتوا با Gemini 1.5 Flash در هر یک از مناطق پشتیبانی‌شده اتحادیه اروپا، فیلتر شما به شکل زیر است:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • برای Vertex AI in Firebase API: قابلیت (درخواست برای تولید محتوا) و منطقه را مشخص کنید.

      به عنوان مثال، برای مشاهده سهمیه‌های هر کاربر برای ایجاد درخواست‌های محتوا در هر یک از مناطق آسیایی پشتیبانی‌شده، فیلتر شما به شکل زیر است:
      Generate content requests + Dimension:region:asia

      توجه داشته باشید که Vertex AI in Firebase API بر اساس مدل خاصی نیست. همچنین، ردیف سهمیه (default) برای Vertex AI in Firebase اعمال نمی‌شود.

سهمیه را ویرایش کنید یا درخواست افزایش سهمیه کنید

قبل از اینکه به تولید بروید یا اگر 429 خطای بیش از سهمیه دریافت می‌کنید، ممکن است لازم باشد سهمیه خود را ویرایش کنید یا درخواست افزایش سهمیه کنید. مطمئن شوید که سهمیه هر API را بر اساس آن تنظیم کرده‌اید (برای ملاحظات به درک سهمیه‌های هر API در ابتدا در این صفحه مراجعه کنید).

برای ویرایش سهمیه، باید مجوز serviceusage.quotas.update را داشته باشید که به طور پیش فرض در نقش مالک و ویرایشگر گنجانده شده است.

در اینجا نحوه ویرایش سهمیه یا درخواست افزایش سهمیه آمده است:

  1. برای مشاهده سهمیه‌های هر API، دستورالعمل‌های زیربخش قبلی را دنبال کنید.

  2. کادر انتخاب سمت چپ هر سهمیه مورد علاقه را انتخاب کنید.

  3. در انتهای ردیف سهمیه، روی منوی سه نقطه کلیک کنید و سپس Edit quota را انتخاب کنید.

  4. در فرم تغییرات سهمیه موارد زیر را انجام دهید:

    1. سهمیه افزایش یافته را در قسمت New value وارد کنید.

      این سهمیه در سطح پروژه اعمال می شود و در همه برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند به اشتراک گذاشته می شود.

    2. هر فیلد اضافی را در فرم تکمیل کنید و سپس روی Done کلیک کنید.

    3. روی ارسال درخواست کلیک کنید.