Bạn có thể dùng Bộ công cụ học máy để nhận dạng và giải mã mã vạch.
Trước khi bắt đầu
- Nếu bạn chưa làm như vậy, thêm Firebase vào dự án Android của bạn.
- Thêm các phần phụ thuộc của thư viện Android cho Bộ công cụ học máy vào mô-đun của bạn
Tệp Gradle (cấp ứng dụng) (thường là
app/build.gradle
):apply plugin: 'com.android.application' apply plugin: 'com.google.gms.google-services' dependencies { // ... implementation 'com.google.firebase:firebase-ml-vision:24.0.3' implementation 'com.google.firebase:firebase-ml-vision-barcode-model:16.0.1' }
Nguyên tắc nhập hình ảnh
-
Để Bộ công cụ học máy đọc được mã vạch chính xác, hình ảnh đầu vào phải chứa mã vạch được thể hiện bằng đủ dữ liệu pixel.
Các yêu cầu cụ thể về dữ liệu pixel phụ thuộc vào cả loại mã vạch và số lượng dữ liệu được mã hoá trong đó (vì hầu hết các mã vạch có hỗ trợ tải trọng có độ dài thay đổi). Nhìn chung, biến thể nhỏ nhất có ý nghĩa đơn vị mã vạch phải có chiều rộng tối thiểu là 2 pixel (và Mã 2 chiều, cao 2 pixel).
Ví dụ: mã vạch EAN-13 được tạo thành từ các thanh và khoảng trắng là 1, 2, 3 hoặc 4 đơn vị rộng, vì vậy hình ảnh mã vạch EAN-13 lý tưởng là có các thanh và không gian rộng ít nhất 2, 4, 6 và 8 pixel. Vì EAN-13 mã vạch phải có tổng chiều rộng là 95 đơn vị, mã vạch phải tối thiểu là 190 pixel.
Các định dạng mật độ cao hơn, chẳng hạn như PDF417, cần kích thước pixel lớn hơn cho Bộ công cụ học máy để đọc các thông tin này một cách chính xác. Ví dụ: mã PDF417 có thể có tối đa 34 "từ" rộng 17 đơn vị trong một hàng duy nhất, tốt nhất là trong ít nhất một hàng Rộng 1156 pixel.
-
Tiêu điểm hình ảnh kém có thể ảnh hưởng đến độ chính xác của quét. Nếu bạn không nhận được kết quả có thể chấp nhận được, hãy thử yêu cầu người dùng chụp lại hình ảnh.
-
Đối với các ứng dụng thông thường, bạn nên cung cấp hình ảnh có độ phân giải (chẳng hạn như 1280x720 hoặc 1920x1080), tạo mã vạch phát hiện được ở khoảng cách xa máy ảnh hơn.
Tuy nhiên, trong các ứng dụng có độ trễ là rất quan trọng, bạn có thể cải thiện bằng cách chụp ảnh ở độ phân giải thấp hơn, nhưng đòi hỏi mã vạch chiếm phần lớn hình ảnh đầu vào. Xem thêm Mẹo cải thiện hiệu suất theo thời gian thực.
1. Định cấu hình trình phát hiện mã vạch
Nếu biết định dạng mã vạch nào bạn muốn đọc, bạn có thể cải thiện tốc độ của trình phát hiện mã vạch bằng cách định cấu hình để chỉ phát hiện các định dạng đó.Ví dụ: để chỉ phát hiện mã Aztec và mã QR, hãy tạo một
FirebaseVisionBarcodeDetectorOptions
như trong ví dụ sau:
Java
FirebaseVisionBarcodeDetectorOptions options = new FirebaseVisionBarcodeDetectorOptions.Builder() .setBarcodeFormats( FirebaseVisionBarcode.FORMAT_QR_CODE, FirebaseVisionBarcode.FORMAT_AZTEC) .build();
Kotlin+KTX
val options = FirebaseVisionBarcodeDetectorOptions.Builder() .setBarcodeFormats( FirebaseVisionBarcode.FORMAT_QR_CODE, FirebaseVisionBarcode.FORMAT_AZTEC) .build()
Các định dạng sau được hỗ trợ:
- Mã 128 (
FORMAT_CODE_128
) - Mã 39 (
FORMAT_CODE_39
) - Mã 93 (
FORMAT_CODE_93
) - Tiếng Codabar (
FORMAT_CODABAR
) - EAN-13 (
FORMAT_EAN_13
) - EAN-8 (
FORMAT_EAN_8
) - ITF (
FORMAT_ITF
) - UPC-A (
FORMAT_UPC_A
) - UPC-E (
FORMAT_UPC_E
) - Mã QR (
FORMAT_QR_CODE
) - PDF417 (
FORMAT_PDF417
) - Tiếng Aztec (
FORMAT_AZTEC
) - Ma trận dữ liệu (
FORMAT_DATA_MATRIX
)
2. Chạy trình phát hiện mã vạch
Để nhận dạng mã vạch trong hình ảnh, hãy tạo một đối tượngFirebaseVisionImage
từ một mảng Bitmap
, media.Image
, ByteBuffer
, byte hoặc một tệp trên
thiết bị. Sau đó, hãy truyền đối tượng FirebaseVisionImage
vào phương thức
Phương thức detectInImage
của FirebaseVisionBarcodeDetector
.
Tạo một đối tượng
FirebaseVisionImage
từ hình ảnh của bạn.-
Cách tạo đối tượng
FirebaseVisionImage
qua Đối tượngmedia.Image
, chẳng hạn như khi chụp ảnh từ camera của thiết bị, hãy truyền đối tượngmedia.Image
và xoay thànhFirebaseVisionImage.fromMediaImage()
.Nếu bạn sử dụng Thư viện CameraX,
OnImageCapturedListener
và Các lớpImageAnalysis.Analyzer
tính toán giá trị xoay cho bạn, nên bạn chỉ cần chuyển đổi chế độ xoay vòng thành một Hằng sốROTATION_
trước khi gọiFirebaseVisionImage.fromMediaImage()
:Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { private int degreesToFirebaseRotation(int degrees) { switch (degrees) { case 0: return FirebaseVisionImageMetadata.ROTATION_0; case 90: return FirebaseVisionImageMetadata.ROTATION_90; case 180: return FirebaseVisionImageMetadata.ROTATION_180; case 270: return FirebaseVisionImageMetadata.ROTATION_270; default: throw new IllegalArgumentException( "Rotation must be 0, 90, 180, or 270."); } } @Override public void analyze(ImageProxy imageProxy, int degrees) { if (imageProxy == null || imageProxy.getImage() == null) { return; } Image mediaImage = imageProxy.getImage(); int rotation = degreesToFirebaseRotation(degrees); FirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation); // Pass image to an ML Kit Vision API // ... } }
Kotlin+KTX
private class YourImageAnalyzer : ImageAnalysis.Analyzer { private fun degreesToFirebaseRotation(degrees: Int): Int = when(degrees) { 0 -> FirebaseVisionImageMetadata.ROTATION_0 90 -> FirebaseVisionImageMetadata.ROTATION_90 180 -> FirebaseVisionImageMetadata.ROTATION_180 270 -> FirebaseVisionImageMetadata.ROTATION_270 else -> throw Exception("Rotation must be 0, 90, 180, or 270.") } override fun analyze(imageProxy: ImageProxy?, degrees: Int) { val mediaImage = imageProxy?.image val imageRotation = degreesToFirebaseRotation(degrees) if (mediaImage != null) { val image = FirebaseVisionImage.fromMediaImage(mediaImage, imageRotation) // Pass image to an ML Kit Vision API // ... } } }
Nếu không sử dụng thư viện máy ảnh cho phép bạn xoay hình ảnh, có thể tính toán kích thước này dựa trên hướng xoay của thiết bị và hướng của máy ảnh cảm biến trong thiết bị:
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 90); ORIENTATIONS.append(Surface.ROTATION_90, 0); ORIENTATIONS.append(Surface.ROTATION_180, 270); ORIENTATIONS.append(Surface.ROTATION_270, 180); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, Context context) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. CameraManager cameraManager = (CameraManager) context.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360; // Return the corresponding FirebaseVisionImageMetadata rotation value. int result; switch (rotationCompensation) { case 0: result = FirebaseVisionImageMetadata.ROTATION_0; break; case 90: result = FirebaseVisionImageMetadata.ROTATION_90; break; case 180: result = FirebaseVisionImageMetadata.ROTATION_180; break; case 270: result = FirebaseVisionImageMetadata.ROTATION_270; break; default: result = FirebaseVisionImageMetadata.ROTATION_0; Log.e(TAG, "Bad rotation value: " + rotationCompensation); } return result; }
Kotlin+KTX
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 90) ORIENTATIONS.append(Surface.ROTATION_90, 0) ORIENTATIONS.append(Surface.ROTATION_180, 270) ORIENTATIONS.append(Surface.ROTATION_270, 180) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, context: Context): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. val cameraManager = context.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360 // Return the corresponding FirebaseVisionImageMetadata rotation value. val result: Int when (rotationCompensation) { 0 -> result = FirebaseVisionImageMetadata.ROTATION_0 90 -> result = FirebaseVisionImageMetadata.ROTATION_90 180 -> result = FirebaseVisionImageMetadata.ROTATION_180 270 -> result = FirebaseVisionImageMetadata.ROTATION_270 else -> { result = FirebaseVisionImageMetadata.ROTATION_0 Log.e(TAG, "Bad rotation value: $rotationCompensation") } } return result }
Sau đó, hãy truyền đối tượng
media.Image
và thànhFirebaseVisionImage.fromMediaImage()
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation);
Kotlin+KTX
val image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation)
- Để tạo đối tượng
FirebaseVisionImage
qua URI tệp, hãy truyền ngữ cảnh ứng dụng và URI tệp đểFirebaseVisionImage.fromFilePath()
Điều này rất hữu ích khi bạn sử dụng ý địnhACTION_GET_CONTENT
để nhắc người dùng chọn một bức ảnh trong ứng dụng thư viện của họ.Java
FirebaseVisionImage image; try { image = FirebaseVisionImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Kotlin+KTX
val image: FirebaseVisionImage try { image = FirebaseVisionImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
- Cách tạo đối tượng
FirebaseVisionImage
quaByteBuffer
hoặc một mảng byte, trước tiên, hãy tính hình ảnh như mô tả ở trên cho đầu vàomedia.Image
.Sau đó, hãy tạo một đối tượng
FirebaseVisionImageMetadata
có chứa chiều cao, chiều rộng, định dạng mã hoá màu của hình ảnh, và xoay:Java
FirebaseVisionImageMetadata metadata = new FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build();
Kotlin+KTX
val metadata = FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build()
Sử dụng vùng đệm hoặc mảng và đối tượng siêu dữ liệu để tạo một Đối tượng
FirebaseVisionImage
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromByteBuffer(buffer, metadata); // Or: FirebaseVisionImage image = FirebaseVisionImage.fromByteArray(byteArray, metadata);
Kotlin+KTX
val image = FirebaseVisionImage.fromByteBuffer(buffer, metadata) // Or: val image = FirebaseVisionImage.fromByteArray(byteArray, metadata)
- Cách tạo đối tượng
FirebaseVisionImage
qua Đối tượngBitmap
:Java
FirebaseVisionImage image = FirebaseVisionImage.fromBitmap(bitmap);
Kotlin+KTX
val image = FirebaseVisionImage.fromBitmap(bitmap)
Bitmap
đại diện phải thẳng đứng mà không cần xoay thêm.
-
Nhận một thực thể của
FirebaseVisionBarcodeDetector
:Java
FirebaseVisionBarcodeDetector detector = FirebaseVision.getInstance() .getVisionBarcodeDetector(); // Or, to specify the formats to recognize: // FirebaseVisionBarcodeDetector detector = FirebaseVision.getInstance() // .getVisionBarcodeDetector(options);
Kotlin+KTX
val detector = FirebaseVision.getInstance() .visionBarcodeDetector // Or, to specify the formats to recognize: // val detector = FirebaseVision.getInstance() // .getVisionBarcodeDetector(options)
Cuối cùng, hãy truyền hình ảnh vào phương thức
detectInImage
:Java
Task<List<FirebaseVisionBarcode>> result = detector.detectInImage(image) .addOnSuccessListener(new OnSuccessListener<List<FirebaseVisionBarcode>>() { @Override public void onSuccess(List<FirebaseVisionBarcode> barcodes) { // Task completed successfully // ... } }) .addOnFailureListener(new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } });
Kotlin+KTX
val result = detector.detectInImage(image) .addOnSuccessListener { barcodes -> // Task completed successfully // ... } .addOnFailureListener { // Task failed with an exception // ... }
3. Lấy thông tin từ mã vạch
Nếu thao tác nhận dạng mã vạch thành công, danh sách Các đối tượngFirebaseVisionBarcode
sẽ được chuyển đến trình nghe thành công. Một
Đối tượng FirebaseVisionBarcode
đại diện cho một mã vạch đã được phát hiện trong
hình ảnh. Đối với mỗi mã vạch, bạn có thể lấy toạ độ giới hạn trong thông tin đầu vào
hình ảnh cũng như dữ liệu thô được mã hoá bằng mã vạch. Ngoài ra, nếu mã vạch
trình phát hiện có thể xác định loại dữ liệu được mã hoá bằng mã vạch, bạn có thể
lấy một đối tượng chứa dữ liệu đã phân tích cú pháp.
Ví dụ:
Java
for (FirebaseVisionBarcode barcode: barcodes) { Rect bounds = barcode.getBoundingBox(); Point[] corners = barcode.getCornerPoints(); String rawValue = barcode.getRawValue(); int valueType = barcode.getValueType(); // See API reference for complete list of supported types switch (valueType) { case FirebaseVisionBarcode.TYPE_WIFI: String ssid = barcode.getWifi().getSsid(); String password = barcode.getWifi().getPassword(); int type = barcode.getWifi().getEncryptionType(); break; case FirebaseVisionBarcode.TYPE_URL: String title = barcode.getUrl().getTitle(); String url = barcode.getUrl().getUrl(); break; } }
Kotlin+KTX
for (barcode in barcodes) { val bounds = barcode.boundingBox val corners = barcode.cornerPoints val rawValue = barcode.rawValue val valueType = barcode.valueType // See API reference for complete list of supported types when (valueType) { FirebaseVisionBarcode.TYPE_WIFI -> { val ssid = barcode.wifi!!.ssid val password = barcode.wifi!!.password val type = barcode.wifi!!.encryptionType } FirebaseVisionBarcode.TYPE_URL -> { val title = barcode.url!!.title val url = barcode.url!!.url } } }
Mẹo cải thiện hiệu suất theo thời gian thực
Nếu bạn muốn quét mã vạch trong một ứng dụng theo thời gian thực, hãy làm theo các bước sau để đạt được tốc độ khung hình tốt nhất:
-
Đừng ghi lại dữ liệu đầu vào ở độ phân giải gốc của máy ảnh. Trên một số thiết bị, thu thập đầu vào ở độ phân giải gốc tạo ra kích thước cực lớn (10 megapixel), dẫn đến độ trễ rất thấp mà không mang lại lợi ích cho sự chính xác. Thay vào đó, chỉ yêu cầu kích thước từ máy ảnh bắt buộc để phát hiện mã vạch: thường không quá 2 megapixel.
Nếu tốc độ quét là quan trọng, bạn có thể giảm tốc độ chụp ảnh hơn nữa độ phân giải. Tuy nhiên, hãy lưu ý đến các yêu cầu tối thiểu về kích thước mã vạch nêu trên.
- Điều tiết lệnh gọi đến trình phát hiện. Nếu một khung video mới trong khi trình phát hiện đang chạy, hãy thả khung hình.
- Nếu bạn đang sử dụng đầu ra của trình phát hiện để phủ đồ hoạ lên hình ảnh đầu vào, trước tiên hãy lấy kết quả từ Bộ công cụ học máy, sau đó kết xuất hình ảnh và phủ lên trên trong một bước duy nhất. Khi làm vậy, bạn sẽ kết xuất lên giao diện màn hình một lần cho mỗi khung đầu vào.
-
Nếu bạn sử dụng API Camera2, hãy chụp ảnh trong Định dạng
ImageFormat.YUV_420_888
.Nếu bạn sử dụng API Máy ảnh cũ, hãy chụp ảnh trong Định dạng
ImageFormat.NV21
.