ทำความเข้าใจและจัดการโควต้า

Vertex AI in Firebase ต้องใช้ API 2 รายการที่แตกต่างกัน (แต่ละรายการมีโควต้าของตัวเอง) ดังนี้ Vertex AI API และ Vertex AI in Firebase API

API แต่ละรายการมีโควต้าที่วัดเป็นคำขอต่อนาที (RPM) โดยเฉพาะคำขอ "สร้างเนื้อหา" (ทั้งสตรีมมิงและไม่สตรีมมิง) นอกจากนี้ Vertex AI API ยังมีโควต้าสำหรับโทเค็นอินพุตต่อนาทีด้วย

หน้านี้จะอธิบายข้อมูลต่อไปนี้

คุณสามารถดูข้อมูลทั่วไปเกี่ยวกับโควต้าได้ในเอกสารประกอบของ Google Cloud

ทำความเข้าใจโควต้าสำหรับ API แต่ละรายการ

โควต้าของ API แต่ละรายการจะวัดผลแตกต่างกันเล็กน้อย ซึ่งหมายความว่า API แต่ละรายการอาจใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน

ทำความเข้าใจโควต้า API Vertex AI รายการ

โควต้า Vertex AI API จะอิงตาม "สร้างคำขอเนื้อหา" ตามโมเดลต่อภูมิภาคต่อนาที

รายละเอียดสำคัญเกี่ยวกับโควต้าเหล่านี้ (โดยเฉพาะคำขอต่อนาทีและโทเค็นอินพุตต่อนาที) มีดังนี้

  • โดยจะมีผลในระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • โดยจะมีผลกับการเรียกใช้ใดก็ได้กับ Vertex AI Gemini API ไม่ว่าจะเป็นการใช้ SDK ของไคลเอ็นต์ Vertex AI in Firebase, SDK ของเซิร์ฟเวอร์ Vertex AI, Firebase Genkit, การเรียก Gemini Firebase Extensions, การเรียก REST, Vertex AI Studio หรือไคลเอ็นต์ API อื่นๆ

  • ซึ่งจะมีผลกับโมเดลพื้นฐานและเวอร์ชัน ตัวระบุ และเวอร์ชันที่ปรับแต่งทั้งหมดของโมเดลนั้น โดยตัวอย่างมีดังนี้

    • คำขอไปยัง gemini-1.0-pro และคำขอไปยัง gemini-1.0-pro-001 จะนับเป็นคำขอ 2 รายการในโควต้า RPM ของโมเดลฐาน gemini-1.0 pro

    • คำขอ gemini-1.0-pro-001 และคำขอโมเดลที่ปรับแต่งซึ่งอิงตาม gemini-1.0-pro-001 จะนับเป็น 2 คำขอสำหรับโควต้า RPM ของโมเดลพื้นฐาน gemini-1.0-pro

  • ดูโควต้าเริ่มต้นของแต่ละโมเดลและแต่ละภูมิภาคได้ในเอกสารประกอบ Google Cloud

โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ทั้งหมด" สําหรับผู้ใช้ทั้งหมด (ผู้ใช้ฟีเจอร์ AI ในแอปของคุณซึ่งใช้โมเดลที่เฉพาะเจาะจงและอยู่ในภูมิภาคที่เฉพาะเจาะจง)

โควต้าเหล่านี้ต้องสูงพอที่จะรองรับจํานวนผู้ใช้ปลายทางทั้งหมดในภูมิภาคหนึ่งๆ ที่อาจเข้าถึงฟีเจอร์ AI ของคุณซึ่งใช้โมเดลหนึ่งๆ เนื่องจากเป็นโควต้าต่อนาที จึงเป็นไปได้น้อยมากที่ผู้ใช้ทุกคนในภูมิภาคจะใช้ชุดฟีเจอร์เดียวกันพร้อมกันและทำให้โควต้าเหล่านี้หมดลง แต่แอปแต่ละอย่างมีความแตกต่างกัน ให้ปรับโควต้าเหล่านี้ให้เหมาะสม

Vertex AI

ทำความเข้าใจโควต้า API จำนวน Vertex AI in Firebase

Vertex AI in Firebase โควต้า API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อผู้ใช้ต่อภูมิภาคต่อนาที

รายละเอียดสำคัญเกี่ยวกับโควต้านี้ (โดยเฉพาะคำขอต่อนาที) มีดังนี้

  • โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • ซึ่งจะมีผลกับการเรียกใช้ที่ดำเนินการผ่าน SDK ของ Vertex AI in Firebase

  • โควต้าเริ่มต้นคือ 100 RPM ต่อผู้ใช้
    โปรดทราบว่าคุณยังคงต้องพิจารณาขีดจํากัดโควต้าสําหรับ Vertex AI API โดยเฉพาะหากต่ำกว่า 100 RPM นี้

โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ต่อผู้ใช้" สำหรับฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase

โดยโควต้านี้ต้องสูงพอที่จะรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase เนื่องจาก API นี้ทำหน้าที่เป็นเกตเวย์ไปยัง Vertex AI API คุณจึงใช้โควต้า Vertex AI API ได้เพื่อให้มั่นใจว่าไม่มีผู้ใช้รายใดใช้โควต้า Vertex AI API ของคุณจนหมด (ซึ่งผู้ใช้ทุกคนควรใช้ร่วมกันได้)Vertex AI in Firebase

ดูโควต้าสำหรับ API แต่ละรายการ

คุณดูโควต้าของ API แต่ละรายการได้ในคอนโซล Google Cloud

  1. ในคอนโซล Google Cloud ให้ไปที่หน้าของ API ที่ต้องการ ซึ่งได้แก่ Vertex AI API หรือ Vertex AI in Firebase API

  2. คลิกจัดการ

  3. คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า

  4. กรองตารางเพื่อแสดงโควต้าความสนใจ

    โปรดทราบว่าหากต้องการสร้างตัวกรอง Dimension คุณต้องใช้เครื่องมือตัวกรอง แทนการคัดลอกค่าในตัวอย่างต่อไปนี้

    • สำหรับ Vertex AI API: ระบุความสามารถ (คำขอสร้างเนื้อหา) ชื่อโมเดล และภูมิภาค

      เช่น หากต้องการดูโควต้าในการสร้างคำขอเนื้อหาด้วย Gemini 1.5 Flash ในภูมิภาคใดก็ได้ของสหภาพยุโรป ตัวกรองจะมีลักษณะดังนี้
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • สำหรับ Vertex AI in Firebase API: ระบุความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค

      ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้ในการสร้างคำขอเนื้อหาในภูมิภาคเอเชียที่รองรับ ตัวกรองของคุณจะมีลักษณะดังนี้
      Generate content requests + Dimension:region:asia

      โปรดทราบว่าโควต้า API ของ Vertex AI in Firebase ไม่ได้อิงตามโมเดลใดโมเดลหนึ่ง นอกจากนี้ แถวโควต้า (default) จะไม่มีผลกับ Vertex AI in Firebase

แก้ไขโควต้าหรือขอเพิ่มโควต้า

ก่อนจะเป็นเวอร์ชันที่ใช้งานจริงหรือหากได้รับข้อผิดพลาด 429 รายการซึ่งเกินโควต้า คุณอาจต้องแก้ไขโควต้าหรือขอเพิ่มโควต้า โปรดปรับโควต้าของ API แต่ละรายการตามความเหมาะสม (ดูข้อควรพิจารณาในหัวข้อทําความเข้าใจโควต้าของ API แต่ละรายการก่อนหน้านี้ในหน้านี้)

หากต้องการแก้ไขโควต้า คุณต้องมีสิทธิ์ serviceusage.quotas.update ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น

วิธีแก้ไขโควต้าหรือขอเพิ่มโควต้ามีดังนี้

  1. ทำตามวิธีการในส่วนย่อยก่อนหน้าเพื่อดูโควต้าของ API แต่ละรายการ

  2. เลือกช่องทําเครื่องหมายทางด้านซ้ายของโควต้าความสนใจแต่ละรายการ

  3. คลิกเมนู 3 จุดที่ท้ายแถวโควต้า แล้วเลือกแก้ไขโควต้า

  4. ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทําดังนี้

    1. ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่

      โควต้านี้จะใช้ที่ระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

    2. กรอกข้อมูลในช่องอื่นๆ ในแบบฟอร์ม แล้วคลิกเสร็จสิ้น

    3. คลิกส่งคำขอ