Vertex AI in Firebase ต้องใช้ API 2 รายการที่แตกต่างกัน (แต่ละรายการมีโควต้าของตัวเอง) ดังนี้ Vertex AI API และ Vertex AI in Firebase API
API แต่ละรายการมีโควต้าที่วัดเป็นคำขอต่อนาที (RPM) โดยเฉพาะคำขอ "สร้างเนื้อหา" (ทั้งสตรีมมิงและไม่สตรีมมิง) นอกจากนี้ Vertex AI API ยังมีโควต้าสำหรับโทเค็นอินพุตต่อนาทีด้วย
หน้านี้จะอธิบายข้อมูลต่อไปนี้
ทำความเข้าใจโควต้าสำหรับ Vertex AI API และ Vertex AI in Firebase API
การดูโควต้าในคอนโซล Google Cloud
คุณสามารถดูข้อมูลทั่วไปเกี่ยวกับโควต้าได้ในเอกสารประกอบของ Google Cloud
ทำความเข้าใจโควต้าสำหรับ API แต่ละรายการ
โควต้าของ API แต่ละรายการจะวัดผลแตกต่างกันเล็กน้อย ซึ่งหมายความว่า API แต่ละรายการอาจใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน
ทำความเข้าใจโควต้า API Vertex AI รายการ
โควต้า Vertex AI API จะอิงตาม "สร้างคำขอเนื้อหา" ตามโมเดลต่อภูมิภาคต่อนาที
รายละเอียดสำคัญเกี่ยวกับโควต้าเหล่านี้ (โดยเฉพาะคำขอต่อนาทีและโทเค็นอินพุตต่อนาที) มีดังนี้
โดยจะมีผลในระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
โดยจะมีผลกับการเรียกใช้ใดก็ได้กับ Vertex AI Gemini API ไม่ว่าจะเป็นการใช้ SDK ของไคลเอ็นต์ Vertex AI in Firebase, SDK ของเซิร์ฟเวอร์ Vertex AI, Firebase Genkit, การเรียก Gemini Firebase Extensions, การเรียก REST, Vertex AI Studio หรือไคลเอ็นต์ API อื่นๆ
ซึ่งจะมีผลกับโมเดลพื้นฐานและเวอร์ชัน ตัวระบุ และเวอร์ชันที่ปรับแต่งทั้งหมดของโมเดลนั้น โดยตัวอย่างมีดังนี้
คำขอไปยัง
gemini-1.0-pro
และคำขอไปยังgemini-1.0-pro-001
จะนับเป็นคำขอ 2 รายการในโควต้า RPM ของโมเดลฐานgemini-1.0 pro
คำขอ
gemini-1.0-pro-001
และคำขอโมเดลที่ปรับแต่งซึ่งอิงตามgemini-1.0-pro-001
จะนับเป็น 2 คำขอสำหรับโควต้า RPM ของโมเดลพื้นฐานgemini-1.0-pro
ดูโควต้าเริ่มต้นของแต่ละโมเดลและแต่ละภูมิภาคได้ในเอกสารประกอบ Google Cloud
โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ทั้งหมด" สําหรับผู้ใช้ทั้งหมด (ผู้ใช้ฟีเจอร์ AI ในแอปของคุณซึ่งใช้โมเดลที่เฉพาะเจาะจงและอยู่ในภูมิภาคที่เฉพาะเจาะจง)
โควต้าเหล่านี้ต้องสูงพอที่จะรองรับจํานวนผู้ใช้ปลายทางทั้งหมดในภูมิภาคหนึ่งๆ ที่อาจเข้าถึงฟีเจอร์ AI ของคุณซึ่งใช้โมเดลหนึ่งๆ เนื่องจากเป็นโควต้าต่อนาที จึงเป็นไปได้น้อยมากที่ผู้ใช้ทุกคนในภูมิภาคจะใช้ชุดฟีเจอร์เดียวกันพร้อมกันและทำให้โควต้าเหล่านี้หมดลง แต่แอปแต่ละอย่างมีความแตกต่างกัน ให้ปรับโควต้าเหล่านี้ให้เหมาะสม
Vertex AIทำความเข้าใจโควต้า API จำนวน Vertex AI in Firebase
Vertex AI in Firebase โควต้า API จะอิงตาม "สร้างคำขอเนื้อหา" ต่อผู้ใช้ต่อภูมิภาคต่อนาที
รายละเอียดสำคัญเกี่ยวกับโควต้านี้ (โดยเฉพาะคำขอต่อนาที) มีดังนี้
โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
ซึ่งจะมีผลกับการเรียกใช้ที่ดำเนินการผ่าน SDK ของ Vertex AI in Firebase
โควต้าเริ่มต้นคือ 100 RPM ต่อผู้ใช้
โปรดทราบว่าคุณยังคงต้องพิจารณาขีดจํากัดโควต้าสําหรับ Vertex AI API โดยเฉพาะหากต่ำกว่า 100 RPM นี้
โดยพื้นฐานแล้ว คุณอาจถือว่าโควต้าของ API นี้เป็นโควต้า "ต่อผู้ใช้" สำหรับฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase
โดยโควต้านี้ต้องสูงพอที่จะรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ที่ใช้ Vertex AI in Firebase เนื่องจาก API นี้ทำหน้าที่เป็นเกตเวย์ไปยัง Vertex AI API คุณจึงใช้โควต้า Vertex AI API ได้เพื่อให้มั่นใจว่าไม่มีผู้ใช้รายใดใช้โควต้า Vertex AI API ของคุณจนหมด (ซึ่งผู้ใช้ทุกคนควรใช้ร่วมกันได้)Vertex AI in Firebase
ดูโควต้าสำหรับ API แต่ละรายการ
คุณดูโควต้าของ API แต่ละรายการได้ในคอนโซล Google Cloud
ในคอนโซล Google Cloud ให้ไปที่หน้าของ API ที่ต้องการ ซึ่งได้แก่ Vertex AI API หรือ Vertex AI in Firebase API
คลิกจัดการ
คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า
กรองตารางเพื่อแสดงโควต้าความสนใจ
โปรดทราบว่าหากต้องการสร้างตัวกรอง
Dimension
คุณต้องใช้เครื่องมือตัวกรอง แทนการคัดลอกค่าในตัวอย่างต่อไปนี้สำหรับ Vertex AI API: ระบุความสามารถ (คำขอสร้างเนื้อหา) ชื่อโมเดล และภูมิภาค
เช่น หากต้องการดูโควต้าในการสร้างคำขอเนื้อหาด้วย Gemini 1.5 Flash ในภูมิภาคใดก็ได้ของสหภาพยุโรป ตัวกรองจะมีลักษณะดังนี้
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
สำหรับ Vertex AI in Firebase API: ระบุความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค
ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้ในการสร้างคำขอเนื้อหาในภูมิภาคเอเชียที่รองรับ ตัวกรองของคุณจะมีลักษณะดังนี้
Generate content requests
+Dimension:region:asia
โปรดทราบว่าโควต้า API ของ Vertex AI in Firebase ไม่ได้อิงตามโมเดลใดโมเดลหนึ่ง นอกจากนี้ แถวโควต้า
(default)
จะไม่มีผลกับ Vertex AI in Firebase
แก้ไขโควต้าหรือขอเพิ่มโควต้า
ก่อนจะเป็นเวอร์ชันที่ใช้งานจริงหรือหากได้รับข้อผิดพลาด 429 รายการซึ่งเกินโควต้า คุณอาจต้องแก้ไขโควต้าหรือขอเพิ่มโควต้า โปรดปรับโควต้าของ API แต่ละรายการตามความเหมาะสม (ดูข้อควรพิจารณาในหัวข้อทําความเข้าใจโควต้าของ API แต่ละรายการก่อนหน้านี้ในหน้านี้)
หากต้องการแก้ไขโควต้า คุณต้องมีสิทธิ์ serviceusage.quotas.update
ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น
วิธีแก้ไขโควต้าหรือขอเพิ่มโควต้ามีดังนี้
ทำตามวิธีการในส่วนย่อยก่อนหน้าเพื่อดูโควต้าของ API แต่ละรายการ
เลือกช่องทําเครื่องหมายทางด้านซ้ายของโควต้าความสนใจแต่ละรายการ
คลิกเมนู 3 จุดที่ท้ายแถวโควต้า แล้วเลือกแก้ไขโควต้า
ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทําดังนี้
ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่
โควต้านี้จะใช้ที่ระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น
กรอกข้อมูลในช่องอื่นๆ ในแบบฟอร์ม แล้วคลิกเสร็จสิ้น
คลิกส่งคำขอ