عند طلب واجهة برمجة تطبيقات Vertex AI Gemini من تطبيقك باستخدام حزمة تطوير برامج Vertex AI for Firebase: يمكنك أن تطلب من نموذج Gemini إنشاء نص استنادًا إلى إدخال متعدد الوسائط. يمكن أن تتضمّن الطلبات المتعددة الوسائط عدة وسائط. (أو أنواع الإدخال)، مثل النص مع الصور وملفات PDF والفيديو والصوت.
بالنسبة للأجزاء غير النصية من الإدخال (مثل ملفات الوسائط)، تحتاج إلى استخدام الملفات المتوافقة، وتحديد نوع MIME متوافق والتأكد من وتتطلب الملفات والطلبات متعددة الوسائط استيفاء المتطلبات واتّباع أفضل الممارسات.
تختلف ملفات الإدخال المدعومة حسب الطراز، ويمكن أن تتضمن الصور وملفات PDF ومقاطع الفيديو الصوت.
- لاحظ أن إدخال الفيديو المتوافق يختلف أيضًا حسب الطراز ويمكن أن يشمل الإطارات فقط أو الإطارات التي تتضمّن صوتًا
المتطلبات وأفضل الممارسات المتعلقة بملفات الإدخال والطلبات المتعددة الوسائط:
ضِمن مزيد من المعلومات عن نماذج Gemini يمكنك العثور على ملخّص سريع لمتطلبات الملفات المتوافقة استنادًا إلى على النموذج (مثل الحد الأقصى لعدد الملفات والحد الأقصى لحجم الملف).
في مستندات Google Cloud، يمكنك التعرّف على معلومات مفصّلة بشأن المتطلبات و أفضل الممارسات لملفات الإدخال والطلبات المتعددة الوسائط (على سبيل المثال، أنواع MIME المتوافقة ووقت تقديم ملف الإدخال في الطلب).
متطلبات خاصة بحِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase
بالنسبة إلى حِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase، يكون الحدّ الأقصى لحجم الطلب هو 20 ميغابايت. إذا كان الطلب كبيرًا جدًا، تظهر لك رسالة خطأ HTTP 413.
إذا أدّى حجم الملف إلى تجاوز إجمالي حجم الطلب 20 ميغابايت، استخدام عنوان URL خاص بخدمة Cloud Storage for Firebase من أجل تضمين الملف في طلبك المتعدّد الوسائط
إذا كان الملف صغيرًا، فيمكنك غالبًا تمريره مباشرةً كبيانات مضمنة. يُرجى العِلم أنّ الملف المقدَّم كبيانات مضمّنة تم ترميزه إلى base64 في النقل العام، مما يزيد من حجم الطلب. للحصول على أمثلة توضح كيفية تضمين الملفات كبيانات مضمنة، والاطلاع على إنشاء نص من طلبات متعدّدة الوسائط باستخدام Gemini API