ทำความเข้าใจและจัดการโควต้า

Vertex AI in Firebase ต้องใช้ API 2 รายการที่แตกต่างกัน (แต่ละรายการมีโควต้าของตัวเอง) ดังนี้ Vertex AI API และ Vertex AI in Firebase API

API แต่ละรายการมีโควต้าที่วัดเป็นคําขอต่อนาที (RPM) โดยเฉพาะอย่างยิ่งคําขอ "สร้างเนื้อหา" (ทั้งแบบสตรีมมิงและแบบไม่สตรีม) นอกจากนี้ Vertex AI API ยังมีโควต้าสำหรับโทเค็นอินพุตต่อนาทีด้วย

หน้านี้จะอธิบายข้อมูลต่อไปนี้

คุณสามารถดูข้อมูลทั่วไปเกี่ยวกับโควต้าได้ในเอกสารประกอบของ Google Cloud

ทำความเข้าใจโควต้าของ API แต่ละรายการ

โควต้าของ API แต่ละรายการจะวัดผลแตกต่างกันเล็กน้อย ซึ่งหมายความว่า API แต่ละรายการอาจใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน

ทําความเข้าใจVertex AI โควต้า API

โควต้า Vertex AI API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อโมเดลต่อภูมิภาคต่อนาที

รายละเอียดสำคัญเกี่ยวกับโควต้าเหล่านี้ (โดยเฉพาะคำขอต่อนาทีและโทเค็นอินพุตต่อนาที) มีดังนี้

  • โดยจะมีผลในระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • นโยบายนี้มีผลกับการเรียกใช้ Vertex AI Gemini API ไม่ว่าจะเป็นการเรียกใช้ SDK ของไคลเอ็นต์ Vertex AI in Firebase, SDK ของเซิร์ฟเวอร์ Vertex AI, Firebase Genkit, Gemini Firebase Extensions, การเรียก REST, Vertex AI Studio หรือไคลเอ็นต์ API อื่นๆ

  • ซึ่งจะมีผลกับโมเดลพื้นฐานและเวอร์ชัน ตัวระบุ และเวอร์ชันที่ปรับแต่งทั้งหมดของโมเดลนั้น โดยตัวอย่างมีดังนี้

    • คำขอไปยัง gemini-1.0-pro และคำขอไปยัง gemini-1.0-pro-001 จะนับเป็น 2 คำขอต่อโควต้า RPM ของรุ่นพื้นฐาน gemini-1.0 pro

    • คำขอ gemini-1.0-pro-001 และคำขอโมเดลที่ปรับแต่งซึ่งอิงตาม gemini-1.0-pro-001 จะนับเป็น 2 คำขอต่อโควต้า RPM ของโมเดลพื้นฐาน gemini-1.0-pro

  • ดูโควต้าเริ่มต้นสำหรับแต่ละรุ่นและแต่ละภูมิภาคได้ในเอกสารประกอบของ Google Cloud

โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ทั้งหมด" สําหรับผู้ใช้ทุกคน (ที่ใช้ฟีเจอร์ AI ในแอปซึ่งอาศัยโมเดลที่เฉพาะเจาะจงและในภูมิภาคที่เฉพาะเจาะจง)

โควต้าเหล่านี้ต้องสูงพอที่จะรองรับจํานวนผู้ใช้ปลายทางทั้งหมดในภูมิภาคหนึ่งๆ ที่อาจเข้าถึงฟีเจอร์ AI ของคุณซึ่งใช้โมเดลหนึ่งๆ เนื่องจากเป็นโควต้าต่อนาที จึงเป็นไปได้น้อยมากที่ผู้ใช้ทุกคนในภูมิภาคจะใช้ชุดฟีเจอร์เดียวกันพร้อมกันและทำให้โควต้าเหล่านี้หมดลง แต่แอปแต่ละแอปจะแตกต่างกันไป ดังนั้นโปรดปรับโควต้าเหล่านี้ตามความเหมาะสม

Vertex AI

ทําความเข้าใจโควต้า Vertex AI in Firebase API

Vertex AI in Firebase โควต้า API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อผู้ใช้ต่อภูมิภาคต่อนาที

รายละเอียดสำคัญเกี่ยวกับโควต้านี้ (โดยเฉพาะคำขอต่อนาที) มีดังนี้

  • โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • โดยจะมีผลกับการเรียกใช้ที่ผ่าน Vertex AI in FirebaseSDK ใดก็ตามโดยเฉพาะ

  • โควต้าเริ่มต้นคือ 100 RPM ต่อผู้ใช้ 1 คน
    โปรดทราบว่าคุณยังคงต้องพิจารณาขีดจํากัดโควต้าสําหรับ Vertex AI API โดยเฉพาะหากต่ำกว่า 100 RPM นี้

โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ต่อผู้ใช้" สำหรับฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase

โดยโควต้านี้ต้องสูงพอที่จะรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase เนื่องจาก API นี้ทำหน้าที่เป็นเกตเวย์ไปยัง Vertex AI API คุณจึงใช้โควต้า Vertex AI API ได้เพื่อให้มั่นใจว่าไม่มีผู้ใช้รายใดใช้โควต้า Vertex AI API ของคุณจนหมด (ซึ่งผู้ใช้ทุกคนควรใช้ร่วมกันได้)Vertex AI in Firebase

ดูโควต้าของ API แต่ละรายการ

คุณดูโควต้าของ API แต่ละรายการได้ในคอนโซล Google Cloud

  1. ในคอนโซล Google Cloud ให้ไปที่หน้าของ API ที่ต้องการ ซึ่งได้แก่ Vertex AI API หรือ Vertex AI in Firebase API

  2. คลิกจัดการ

  3. คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า

  4. กรองตารางเพื่อแสดงโควต้าความสนใจ

    โปรดทราบว่าหากต้องการสร้างตัวกรอง Dimension คุณต้องใช้เครื่องมือตัวกรองแทนการคัดลอกและวางค่าในตัวอย่างต่อไปนี้

    • สำหรับ Vertex AI API: ระบุความสามารถ (คำขอสร้างเนื้อหา), ชื่อรุ่น และภูมิภาค

      ตัวอย่างเช่น หากต้องการดูโควต้าในการสร้างคำขอเนื้อหาด้วย Gemini 1.5 Flash ในภูมิภาคใดก็ได้ของสหภาพยุโรป ตัวกรองจะมีลักษณะดังนี้
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • สำหรับ Vertex AI in Firebase API: ระบุความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค

      ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้ในการสร้างคำขอเนื้อหาในภูมิภาคเอเชียที่รองรับ ตัวกรองของคุณจะมีลักษณะดังนี้
      Generate content requests + Dimension:region:asia

      โปรดทราบว่าVertex AI in Firebase โควต้า API ไม่ได้อิงตามรูปแบบใดรูปแบบหนึ่ง นอกจากนี้ แถวโควต้า (default) จะไม่มีผลกับ Vertex AI in Firebase

แก้ไขโควต้าหรือขอเพิ่มโควต้า

ก่อนใช้งานจริงหรือหากได้รับข้อผิดพลาด 429 โควต้าเกิน คุณอาจต้องแก้ไขโควต้าหรือขอเพิ่มโควต้า โปรดปรับโควต้าของ API แต่ละรายการตามความเหมาะสม (ดูข้อควรพิจารณาในหัวข้อทําความเข้าใจโควต้าของ API แต่ละรายการก่อนหน้านี้ในหน้านี้)

หากต้องการแก้ไขโควต้า คุณต้องมีสิทธิ์ serviceusage.quotas.update ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น

วิธีแก้ไขโควต้าหรือขอเพิ่มโควต้ามีดังนี้

  1. ทําตามวิธีการในส่วนย่อยก่อนหน้าเพื่อดูโควต้าของ API แต่ละรายการ

  2. เลือกช่องทําเครื่องหมายทางด้านซ้ายของโควต้าความสนใจแต่ละรายการ

  3. คลิกเมนู 3 จุดที่ท้ายแถวโควต้า แล้วเลือกแก้ไขโควต้า

  4. ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทําดังนี้

    1. ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่

      โดยโควต้านี้จะมีผลในระดับโปรเจ็กต์และจะแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

    2. กรอกข้อมูลในช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น

    3. คลิกส่งคำขอ