يمكنك استخدام "حزمة تعلُّم الآلة" لرصد الوجوه في الصور والفيديوهات.
قبل البدء
- أضِف Firebase إلى مشروع Android، في حال لم يسبق لك إجراء ذلك.
- أضِف التبعيات لمكتبات ML Kit لنظام التشغيل Android إلى ملف Gradle
(على مستوى التطبيق) للوحدة (عادةً
app/build.gradle
):apply plugin: 'com.android.application' apply plugin: 'com.google.gms.google-services' dependencies { // ... implementation 'com.google.firebase:firebase-ml-vision:24.0.3' // If you want to detect face contours (landmark detection and classification // don't require this additional model): implementation 'com.google.firebase:firebase-ml-vision-face-model:20.0.1' }
-
إجراء اختياري ولكن يُنصح به: يمكنك ضبط تطبيقك لتنزيل ملف نموذج الذكاء الاصطناعي تلقائيًا
على الجهاز بعد تثبيت تطبيقك من "متجر Play".
لإجراء ذلك، أضِف البيان التالي إلى ملف
AndroidManifest.xml
في تطبيقك: في حال عدم تفعيل عمليات تنزيل النماذج في وقت التثبيت، سيتم تنزيل النموذج في المرة الأولى التي يتم فيها تشغيل أداة الكشف. ولن تؤدي الطلبات التي تقدّمها قبل اكتمال عملية التنزيل إلى أي نتائج.<application ...> ... <meta-data android:name="com.google.firebase.ml.vision.DEPENDENCIES" android:value="face" /> <!-- To use multiple models: android:value="face,model2,model3" --> </application>
إرشادات حول إدخال الصور
لكي تتمكّن حزمة ML Kit من رصد الوجوه بدقة، يجب أن تحتوي صور الإدخال على وجوه يتم تمثيلها ببيانات بكسل كافية. بشكل عام، يجب ألا يقلّ حجم كل وجه تريد رصده في الصورة عن 100×100 بكسل. إذا كنت تريد رصد ملامح الوجوه، تتطلّب حزمة ML Kit إدخالًا بدرجة دقة أعلى: يجب أن يكون كل وجه بدقة 200 × 200 بكسل على الأقل.
إذا كنت ترصد الوجوه في تطبيق يعمل في الوقت الفعلي، قد تحتاج أيضًا إلى مراعاة الأبعاد العامة للصور المُدخلة. يمكن معالجة الصور الأصغر حجمًا بشكل أسرع، لذا لتقليل وقت الاستجابة، يمكنك التقاط الصور بدرجة دقة أقل (مع مراعاة متطلبات الدقة المذكورة أعلاه) والتأكّد من أنّ وجه الشخص المعنيّ يشغل أكبر قدر ممكن من الصورة. اطّلِع أيضًا على نصائح لتحسين الأداء في الوقت الفعلي.
يمكن أن يؤثّر التركيز السيئ للصورة في الدقة. إذا لم تحصل على نتائج مقبولة، حاوِل أن تطلب من المستخدم إعادة التقاط الصورة.
يمكن أن يؤثر أيضًا اتجاه الوجه بالنسبة إلى الكاميرا في ميزات الوجه التي ترصدها حزمة ML Kit. يُرجى الاطّلاع على مفاهيم ميزة "التعرّف على الوجوه".
1. ضبط أداة رصد الوجوه
قبل تطبيق ميزة "اكتشاف الوجوه" على صورة، إذا أردت تغيير أي من الإعدادات التلقائية لميزة "اكتشاف الوجوه"، حدِّد هذه الإعدادات باستخدام عنصرFirebaseVisionFaceDetectorOptions
.
يمكنك تغيير الإعدادات التالية:
الإعدادات | |
---|---|
وضع الأداء |
FAST (تلقائي)
| ACCURATE
يمكنك تفضيل السرعة أو الدقة عند رصد الوجوه. |
رصد المعالم |
NO_LANDMARKS (تلقائي)
| ALL_LANDMARKS
ما إذا كان سيتم محاولة تحديد "النقاط الرئيسية" للوجه: العيون والأذنان والأنف والخدود والفم وما إلى ذلك |
رصد الخطوط المستقيمة |
NO_CONTOURS (تلقائي)
| ALL_CONTOURS
ما إذا كان سيتم رصد معالم ملامح الوجه يتم رصد المخططات للوجه الأكثر بروزًا في الصورة فقط. |
تصنيف الوجوه |
NO_CLASSIFICATIONS (تلقائي)
| ALL_CLASSIFICATIONS
ما إذا كان سيتم تصنيف الوجوه إلى فئات مثل "مبتسم" و "عيون مفتوحة" أم لا |
الحد الأدنى لحجم الوجه |
float (القيمة التلقائية: 0.1f )
الحد الأدنى لحجم الوجوه التي يجب رصدها، نسبةً إلى الصورة |
تفعيل ميزة "تتبُّع الوجوه" |
false (تلقائي) | true
ما إذا كنت تريد منح الوجوه رقم تعريف أم لا، والذي يمكن استخدامه لتتبُّع الوجوه في الصور يُرجى العِلم أنّه عند تفعيل ميزة "رصد الخطوط"، يتم رصد وجه واحد فقط، وبالتالي لا تؤدي ميزة "تتبُّع الوجه" إلى تحقيق نتائج مفيدة. لهذا السبب، ولمزيد من سرعة رصد الوجوه، لا تفعِّل ميزة رصد خطوط الالتفاف وميزة تتبُّع الوجوه في الوقت نفسه. |
على سبيل المثال:
Java
// High-accuracy landmark detection and face classification FirebaseVisionFaceDetectorOptions highAccuracyOpts = new FirebaseVisionFaceDetectorOptions.Builder() .setPerformanceMode(FirebaseVisionFaceDetectorOptions.ACCURATE) .setLandmarkMode(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) .setClassificationMode(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) .build(); // Real-time contour detection of multiple faces FirebaseVisionFaceDetectorOptions realTimeOpts = new FirebaseVisionFaceDetectorOptions.Builder() .setContourMode(FirebaseVisionFaceDetectorOptions.ALL_CONTOURS) .build();
Kotlin
// High-accuracy landmark detection and face classification val highAccuracyOpts = FirebaseVisionFaceDetectorOptions.Builder() .setPerformanceMode(FirebaseVisionFaceDetectorOptions.ACCURATE) .setLandmarkMode(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) .setClassificationMode(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) .build() // Real-time contour detection of multiple faces val realTimeOpts = FirebaseVisionFaceDetectorOptions.Builder() .setContourMode(FirebaseVisionFaceDetectorOptions.ALL_CONTOURS) .build()
2- تشغيل أداة رصد الوجوه
لرصد الوجوه في صورة، أنشئ عنصرًا من النوعFirebaseVisionImage
من Bitmap
أو media.Image
أو ByteBuffer
أو صفيف بايت أو ملف على
الجهاز. بعد ذلك، نقْل عنصر FirebaseVisionImage
إلى الطريقة detectInImage
في FirebaseVisionFaceDetector
.
لميزة التعرّف على الوجوه، يجب استخدام صورة أبعادها لا تقل عن 480×360 بكسل. إذا كنت تتعرّف على الوجوه في الوقت الفعلي، يمكن أن يساعد التقاط اللقطات بهذا الحد الأدنى من الدقة في تقليل وقت الاستجابة.
أنشئ عنصرًا
FirebaseVisionImage
من صورتك.-
لإنشاء عنصر
FirebaseVisionImage
منmedia.Image
، مثلاً عند التقاط صورة من كاميرا الجهاز، عليك تمرير عنصرmedia.Image
ودرجة دوران الصورة إلىFirebaseVisionImage.fromMediaImage()
.إذا كنت تستخدِم مكتبة CameraX، تحتسِب فئة
OnImageCapturedListener
وImageAnalysis.Analyzer
قيمة التدوير نيابةً عنك، لذا ما عليك سوى تحويل التدوير إلى أحد ثوابتROTATION_
في ML Kit قبل استدعاءFirebaseVisionImage.fromMediaImage()
:Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { private int degreesToFirebaseRotation(int degrees) { switch (degrees) { case 0: return FirebaseVisionImageMetadata.ROTATION_0; case 90: return FirebaseVisionImageMetadata.ROTATION_90; case 180: return FirebaseVisionImageMetadata.ROTATION_180; case 270: return FirebaseVisionImageMetadata.ROTATION_270; default: throw new IllegalArgumentException( "Rotation must be 0, 90, 180, or 270."); } } @Override public void analyze(ImageProxy imageProxy, int degrees) { if (imageProxy == null || imageProxy.getImage() == null) { return; } Image mediaImage = imageProxy.getImage(); int rotation = degreesToFirebaseRotation(degrees); FirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation); // Pass image to an ML Kit Vision API // ... } }
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { private fun degreesToFirebaseRotation(degrees: Int): Int = when(degrees) { 0 -> FirebaseVisionImageMetadata.ROTATION_0 90 -> FirebaseVisionImageMetadata.ROTATION_90 180 -> FirebaseVisionImageMetadata.ROTATION_180 270 -> FirebaseVisionImageMetadata.ROTATION_270 else -> throw Exception("Rotation must be 0, 90, 180, or 270.") } override fun analyze(imageProxy: ImageProxy?, degrees: Int) { val mediaImage = imageProxy?.image val imageRotation = degreesToFirebaseRotation(degrees) if (mediaImage != null) { val image = FirebaseVisionImage.fromMediaImage(mediaImage, imageRotation) // Pass image to an ML Kit Vision API // ... } } }
إذا كنت لا تستخدم مكتبة كاميرا تمنحك معلومات عن دوران الصورة، يمكنك احتسابها من خلال دوران الجهاز واتجاه كاميرا الاستشعار في الجهاز:
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 90); ORIENTATIONS.append(Surface.ROTATION_90, 0); ORIENTATIONS.append(Surface.ROTATION_180, 270); ORIENTATIONS.append(Surface.ROTATION_270, 180); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, Context context) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. CameraManager cameraManager = (CameraManager) context.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360; // Return the corresponding FirebaseVisionImageMetadata rotation value. int result; switch (rotationCompensation) { case 0: result = FirebaseVisionImageMetadata.ROTATION_0; break; case 90: result = FirebaseVisionImageMetadata.ROTATION_90; break; case 180: result = FirebaseVisionImageMetadata.ROTATION_180; break; case 270: result = FirebaseVisionImageMetadata.ROTATION_270; break; default: result = FirebaseVisionImageMetadata.ROTATION_0; Log.e(TAG, "Bad rotation value: " + rotationCompensation); } return result; }
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 90) ORIENTATIONS.append(Surface.ROTATION_90, 0) ORIENTATIONS.append(Surface.ROTATION_180, 270) ORIENTATIONS.append(Surface.ROTATION_270, 180) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, context: Context): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. val cameraManager = context.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360 // Return the corresponding FirebaseVisionImageMetadata rotation value. val result: Int when (rotationCompensation) { 0 -> result = FirebaseVisionImageMetadata.ROTATION_0 90 -> result = FirebaseVisionImageMetadata.ROTATION_90 180 -> result = FirebaseVisionImageMetadata.ROTATION_180 270 -> result = FirebaseVisionImageMetadata.ROTATION_270 else -> { result = FirebaseVisionImageMetadata.ROTATION_0 Log.e(TAG, "Bad rotation value: $rotationCompensation") } } return result }
بعد ذلك، مرِّر العنصر
media.Image
وقيمة الدوران إلىFirebaseVisionImage.fromMediaImage()
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation);
Kotlin
val image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation)
- لإنشاء عنصر
FirebaseVisionImage
من معرّف موارد منتظم لملف، عليك تمرير سياق التطبيق ومعرّف الموارد المنتظم للملف إلىFirebaseVisionImage.fromFilePath()
. يكون ذلك مفيدًا عند استخدام نيةACTION_GET_CONTENT
لطلب تحديد صورة من تطبيق معرض الصور.Java
FirebaseVisionImage image; try { image = FirebaseVisionImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Kotlin
val image: FirebaseVisionImage try { image = FirebaseVisionImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
- لإنشاء عنصر
FirebaseVisionImage
منByteBuffer
أو صفيف بايت، يجب أولاً احتساب ملفه الشخصي التدوير كما هو موضّح أعلاه لإدخالmedia.Image
.بعد ذلك، أنشئ عنصرًا من النوع
FirebaseVisionImageMetadata
يحتوي على ارتفاع الصورة وعرضها وتنسيق ترميز اللون وتدويرها:Java
FirebaseVisionImageMetadata metadata = new FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build();
Kotlin
val metadata = FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build()
استخدِم المخزن المؤقت أو الصفيف وعنصر البيانات الوصفية لإنشاء عنصر
FirebaseVisionImage
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromByteBuffer(buffer, metadata); // Or: FirebaseVisionImage image = FirebaseVisionImage.fromByteArray(byteArray, metadata);
Kotlin
val image = FirebaseVisionImage.fromByteBuffer(buffer, metadata) // Or: val image = FirebaseVisionImage.fromByteArray(byteArray, metadata)
- لإنشاء عنصر
FirebaseVisionImage
من عنصرBitmap
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromBitmap(bitmap);
Kotlin
val image = FirebaseVisionImage.fromBitmap(bitmap)
Bitmap
منتصبة، بدون الحاجة إلى إجراء أيّ دوران إضافي.
-
الحصول على مثيل من
FirebaseVisionFaceDetector
:Java
FirebaseVisionFaceDetector detector = FirebaseVision.getInstance() .getVisionFaceDetector(options);
Kotlin
val detector = FirebaseVision.getInstance() .getVisionFaceDetector(options)
أخيرًا، نقْل الصورة إلى طريقة
detectInImage
:Java
Task<List<FirebaseVisionFace>> result = detector.detectInImage(image) .addOnSuccessListener( new OnSuccessListener<List<FirebaseVisionFace>>() { @Override public void onSuccess(List<FirebaseVisionFace> faces) { // Task completed successfully // ... } }) .addOnFailureListener( new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } });
Kotlin
val result = detector.detectInImage(image) .addOnSuccessListener { faces -> // Task completed successfully // ... } .addOnFailureListener { e -> // Task failed with an exception // ... }
3- الحصول على معلومات عن الوجوه التي تم رصدها
في حال نجاح عملية التعرّف على الوجه، سيتم تمرير قائمة بعناصرFirebaseVisionFace
إلى معالج الحدث
"النجاح". يمثّل كل عنصر FirebaseVisionFace
وجهًا تم رصده
في الصورة. بالنسبة إلى كل وجه، يمكنك الحصول على إحداثيات حدوده في
صورة الإدخال، بالإضافة إلى أي معلومات أخرى أعددت ميزة "كاشف الوجوه" للعثور عليها. على سبيل المثال:
Java
for (FirebaseVisionFace face : faces) { Rect bounds = face.getBoundingBox(); float rotY = face.getHeadEulerAngleY(); // Head is rotated to the right rotY degrees float rotZ = face.getHeadEulerAngleZ(); // Head is tilted sideways rotZ degrees // If landmark detection was enabled (mouth, ears, eyes, cheeks, and // nose available): FirebaseVisionFaceLandmark leftEar = face.getLandmark(FirebaseVisionFaceLandmark.LEFT_EAR); if (leftEar != null) { FirebaseVisionPoint leftEarPos = leftEar.getPosition(); } // If contour detection was enabled: List<FirebaseVisionPoint> leftEyeContour = face.getContour(FirebaseVisionFaceContour.LEFT_EYE).getPoints(); List<FirebaseVisionPoint> upperLipBottomContour = face.getContour(FirebaseVisionFaceContour.UPPER_LIP_BOTTOM).getPoints(); // If classification was enabled: if (face.getSmilingProbability() != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { float smileProb = face.getSmilingProbability(); } if (face.getRightEyeOpenProbability() != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { float rightEyeOpenProb = face.getRightEyeOpenProbability(); } // If face tracking was enabled: if (face.getTrackingId() != FirebaseVisionFace.INVALID_ID) { int id = face.getTrackingId(); } }
Kotlin
for (face in faces) { val bounds = face.boundingBox val rotY = face.headEulerAngleY // Head is rotated to the right rotY degrees val rotZ = face.headEulerAngleZ // Head is tilted sideways rotZ degrees // If landmark detection was enabled (mouth, ears, eyes, cheeks, and // nose available): val leftEar = face.getLandmark(FirebaseVisionFaceLandmark.LEFT_EAR) leftEar?.let { val leftEarPos = leftEar.position } // If contour detection was enabled: val leftEyeContour = face.getContour(FirebaseVisionFaceContour.LEFT_EYE).points val upperLipBottomContour = face.getContour(FirebaseVisionFaceContour.UPPER_LIP_BOTTOM).points // If classification was enabled: if (face.smilingProbability != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { val smileProb = face.smilingProbability } if (face.rightEyeOpenProbability != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { val rightEyeOpenProb = face.rightEyeOpenProbability } // If face tracking was enabled: if (face.trackingId != FirebaseVisionFace.INVALID_ID) { val id = face.trackingId } }
مثال على ملامح الوجه
عند تفعيل ميزة "رصد ملامح الوجه"، ستحصل على قائمة بالنقاط المتعلّقة بكل ميزة من ميزات الوجه التي تم رصدها. تمثّل هذه النقاط شكل الميزة. اطّلِع على نظرة عامة على مفاهيم رصد الوجوه للحصول على تفاصيل عن كيفية تمثيل المنحنيات.
توضّح الصورة التالية كيفية ربط هذه النقاط بوجه (انقر على الصورة لتكبيرها):
ميزة "التعرّف على الوجوه" في الوقت الفعلي
إذا كنت تريد استخدام ميزة "اكتشاف الوجوه" في تطبيق يعمل في الوقت الفعلي، اتّبِع الإرشادات التالية لتحقيق أفضل معدّلات لإطارات الفيديو:
ضبط أداة رصد الوجوه لاستخدام إما رصد حدود الوجه أو التصنيف ورصد المعالم، وليس كليهما:
رصد الخطوط الخارجية
رصد المعالم
التصنيف
رصد المعالم وتصنيفها
رصد الخطوط الخارجية ورصد المعالم
رصد الخطوط الخارجية وتصنيفها
رصد الخطوط الخارجية ورصد المعالم وتصنيفهافعِّل وضع
FAST
(يكون مفعّلاً تلقائيًا).ننصحك بالتقاط الصور بدرجة دقة أقل. ومع ذلك، يجب أيضًا مراعاة متطلبات أبعاد الصور في واجهة برمجة التطبيقات هذه.
- الحد من عدد المكالمات إلى الكاشف إذا أصبح إطار فيديو جديد متاحًا أثناء تشغيل أداة رصد المحتوى، يمكنك إسقاط الإطار.
- إذا كنت تستخدِم ناتج أداة الكشف لوضع الرسومات فوق صورة الإدخال، احصل أولاً على النتيجة من ML Kit، ثم أعِد عرض الصورة وطبِّق الرسم عليها في خطوة واحدة. وبذلك، يتم عرض المحتوى على سطح العرض مرّة واحدة فقط لكل إطار إدخال.
-
إذا كنت تستخدم واجهة برمجة التطبيقات Camera2 API، يمكنك التقاط الصور بتنسيق
ImageFormat.YUV_420_888
.إذا كنت تستخدم الإصدار القديم من Camera API، يمكنك التقاط الصور بتنسيق
ImageFormat.NV21
.