Vertex AI in Firebase به دو API مختلف (هر کدام سهمیه خاص خود) نیاز دارد: API Vertex AI و Vertex AI in Firebase .
هر یک از این API ها دارای سهمیه ای هستند که به عنوان درخواست در دقیقه (RPM) اندازه گیری می شود - به طور خاص درخواست های "تولید محتوا" (هم جریان و هم بدون پخش جریانی). API Vertex AI همچنین سهمیه ای برای نشانه های ورودی در دقیقه دارد.
این صفحه موارد زیر را شرح می دهد:
درک سهمیه برای Vertex AI api و Vertex AI in Firebase
مشاهده سهمیه ها در کنسول Google Cloud
می توانید اطلاعات کلی در مورد سهمیه در مستندات Google Cloud را بیاموزید.
سهمیه های هر API را درک کنید
سهمیه هر API کمی متفاوت اندازه گیری می شود، به این معنی که می توان از آنها برای اهداف مختلف استفاده کرد.
سهمیه های Vertex AI API را درک کنید
سهمیههای Vertex AI API بر اساس «تولید درخواستهای محتوا» بر اساس مدل در هر منطقه در دقیقه است.
در اینجا برخی از جزئیات مهم در مورد این سهمیه ها (به طور خاص، درخواست در دقیقه و نشانه های ورودی در دقیقه) آمده است:
آنها در سطح پروژه اعمال می شوند و در تمام برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند به اشتراک گذاشته می شوند.
آنها برای هر تماسی با Vertex AI Gemini API اعمال میشوند، خواه از Vertex AI in Firebase ، SDK سرور Vertex AI ، Firebase Genkit ، Firebase Extensions Gemini، تماسهای REST، Vertex AI Studio یا سایر کلاینتهای API استفاده شود.
آنها برای یک مدل پایه و همه نسخه ها، شناسه ها و نسخه های تنظیم شده آن مدل اعمال می شوند. در اینجا چند نمونه آورده شده است:
یک درخواست به
gemini-1.0-pro
و یک درخواست بهgemini-1.0-pro-001
به عنوان دو درخواست برای سهمیه RPM مدل پایه،gemini-1.0 pro
شمرده می شود.یک درخواست به
gemini-1.0-pro-001
و یک درخواست به یک مدل تنظیم شده که بر اساسgemini-1.0-pro-001
است، به عنوان دو درخواست برای سهمیه RPM مدل پایه،gemini-1.0-pro
محاسبه می شود.
سهمیه های پیش فرض برای هر مدل و برای هر منطقه را می توان در اسناد Google Cloud یافت.
شما اساساً میتوانید سهمیههای این API را بهعنوان سهمیههای «کل» خود برای همه کاربران خود در نظر بگیرید (که از ویژگیهای هوش مصنوعی در برنامه شما استفاده میکنند که به یک مدل خاص و در یک منطقه خاص متکی هستند).
این سهمیه ها باید به اندازه کافی بالا باشند تا به طور منطقی تعداد کل کاربران نهایی را در یک منطقه خاص که ممکن است به ویژگی های هوش مصنوعی شما که به یک مدل خاص وابسته است دسترسی داشته باشند، در خود جای دهد. از آنجایی که اینها سهمیههای هر دقیقه هستند، نسبتاً بعید است که همه کاربران شما در یک منطقه از مجموعه ویژگیهای یکسانی در یک زمان استفاده کنند و این سهمیهها را تخلیه کنند. اما هر برنامه متفاوت است، بنابراین این سهمیه ها را بر اساس آن تنظیم کنید.
Vertex AI in Firebase API درک کنید
Vertex AI in Firebase API بر اساس «تولید درخواستهای محتوا» بر اساس هر کاربر در هر منطقه در دقیقه است.
در اینجا برخی از جزئیات مهم در مورد این سهمیه (به طور خاص، درخواست در دقیقه):
در سطح پروژه اعمال می شود و برای همه برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند اعمال می شود.
این برای هر تماسی که به طور خاص از طریق هر Vertex AI in Firebase SDK انجام می شود، اعمال می شود.
سهمیه پیش فرض 100 RPM برای هر کاربر است.
توجه داشته باشید که همچنان باید محدودیتهای سهمیه برای Vertex AI API را در نظر بگیرید، به خصوص اگر کمتر از این 100 RPM باشد.
شما اساساً میتوانید سهمیه این API را سهمیه «بهازای هر کاربر» خود برای ویژگیهای هوش مصنوعی در نظر بگیرید که به Vertex AI in Firebase متکی هستند.
این سهمیه باید به اندازه کافی بالا باشد تا بتواند به طور منطقی یک کاربر را که به ویژگی های هوش مصنوعی متکی بر Vertex AI in Firebase دسترسی دارد، در خود جای دهد. از آنجایی که این API به عنوان دروازه ای برای Vertex AI API عمل می کند، می توانید از Vertex AI in Firebase API استفاده کنید تا اطمینان حاصل کنید که هیچ کاربری سهمیه Vertex AI API شما را (که قرار است توسط همه کاربران به اشتراک گذاشته شود) تخلیه نمی کند.
مشاهده سهمیه برای هر API
میتوانید سهمیههای هر API را در کنسول Google Cloud مشاهده کنید.
در کنسول Google Cloud ، به صفحه API مورد علاقه بروید: Vertex AI API یا Vertex AI in Firebase API .
روی Manage کلیک کنید.
در پایین صفحه، روی برگه Quotas & System Limits کلیک کنید.
جدول را برای نشان دادن سهمیه های مورد علاقه فیلتر کنید.
توجه داشته باشید که برای ایجاد فیلتر
Dimension
، به جای کپی پیست کردن مقادیر در مثالهای زیر، باید از ابزار فیلتر استفاده کنید.برای Vertex AI API: قابلیت (درخواست برای تولید محتوا)، نام مدل و منطقه را مشخص کنید.
به عنوان مثال، برای مشاهده سهمیههای تولید درخواستهای محتوا با Gemini 1.5 Flash در هر یک از مناطق پشتیبانیشده اتحادیه اروپا، فیلتر شما به شکل زیر است:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
برای Vertex AI in Firebase API: قابلیت (درخواست برای تولید محتوا) و منطقه را مشخص کنید.
به عنوان مثال، برای مشاهده سهمیههای هر کاربر برای ایجاد درخواستهای محتوا در هر یک از مناطق آسیایی پشتیبانیشده، فیلتر شما به شکل زیر است:
Generate content requests
+Dimension:region:asia
توجه داشته باشید که Vertex AI in Firebase API بر اساس مدل خاصی نیست. همچنین، ردیف سهمیه
(default)
برای Vertex AI in Firebase اعمال نمیشود.
سهمیه را ویرایش کنید یا درخواست افزایش سهمیه کنید
قبل از اینکه به تولید بروید یا اگر 429 خطای بیش از سهمیه دریافت میکنید، ممکن است لازم باشد سهمیه خود را ویرایش کنید یا درخواست افزایش سهمیه کنید. مطمئن شوید که سهمیه هر API را بر اساس آن تنظیم کردهاید (برای ملاحظات به درک سهمیههای هر API در ابتدا در این صفحه مراجعه کنید).
برای ویرایش سهمیه، باید مجوز serviceusage.quotas.update
را داشته باشید که به طور پیش فرض در نقش مالک و ویرایشگر گنجانده شده است.
در اینجا نحوه ویرایش سهمیه یا درخواست افزایش سهمیه آمده است:
برای مشاهده سهمیههای هر API، دستورالعملهای زیربخش قبلی را دنبال کنید.
کادر انتخاب سمت چپ هر سهمیه مورد علاقه را انتخاب کنید.
در انتهای ردیف سهمیه، روی منوی سه نقطه کلیک کنید و سپس Edit quota را انتخاب کنید.
در فرم تغییرات سهمیه موارد زیر را انجام دهید:
سهمیه افزایش یافته را در قسمت New value وارد کنید.
این سهمیه در سطح پروژه اعمال می شود و در همه برنامه ها و آدرس های IP که از پروژه Firebase استفاده می کنند به اشتراک گذاشته می شود.
هر فیلد اضافی را در فرم تکمیل کنید و سپس روی Done کلیک کنید.
روی ارسال درخواست کلیک کنید.