Phát hiện đối tượng trong hình ảnh bằng mô hình được huấn luyện bằng AutoML trên Android

Sau khi bạn huấn luyện mô hình của mình bằng AutoML Vision Edge, bạn có thể dùng mã này trong ứng dụng của mình để phát hiện đối tượng trong hình ảnh.

Có hai cách để tích hợp các mô hình được huấn luyện từ AutoML Vision Edge: Bạn có thể nhóm mô hình bằng cách đưa mô hình đó vào thư mục thành phần của ứng dụng, hoặc bạn có thể tự động tải xuống từ Firebase.

Tuỳ chọn nhóm mô hình
Được tích hợp trong ứng dụng của bạn
  • Mô hình này nằm trong tệp APK của ứng dụng
  • Mô hình này sẽ dùng được ngay lập tức, ngay cả khi thiết bị Android không có kết nối mạng
  • Không cần tạo dự án Firebase
Được lưu trữ bằng Firebase
  • Lưu trữ mô hình bằng cách tải mô hình lên Công nghệ học máy của Firebase
  • Giảm kích thước tệp APK
  • Mô hình này được tải xuống theo yêu cầu
  • Cập nhật mô hình mà không cần xuất bản lại ứng dụng
  • Thử nghiệm A/B dễ dàng bằng Cấu hình từ xa Firebase
  • Cần có một dự án Firebase

Trước khi bắt đầu

  1. Nếu bạn muốn tải một mô hình xuống, hãy đảm bảo bạn thêm Firebase vào dự án Android của bạn, nếu bạn chưa làm như vậy. Bạn không bắt buộc phải thực hiện việc này khi gói mô hình.

  2. Thêm các phần phụ thuộc cho thư viện TensorFlow Lite Task vào thư viện mô-đun của bạn tệp gradle cấp ứng dụng, thường là app/build.gradle:

    Để nhóm mô hình với ứng dụng của bạn:

    dependencies {
      // ...
      // Object detection with a bundled Auto ML model
      implementation 'org.tensorflow:tensorflow-lite-task-vision:0.0.0-nightly-SNAPSHOT'
    }
    

    Để tự động tải một mô hình xuống từ Firebase, bạn cũng nên thêm cả công nghệ học máy Firebase phần phụ thuộc:

    dependencies {
      // ...
      // Object detection with an Auto ML model deployed to Firebase
      implementation platform('com.google.firebase:firebase-bom:26.1.1')
      implementation 'com.google.firebase:firebase-ml-model-interpreter'
    
      implementation 'org.tensorflow:tensorflow-lite-task-vision:0.0.0-nightly'
    }
    

1. Tải mô hình

Định cấu hình nguồn mô hình cục bộ

Cách đóng gói mô hình với ứng dụng:

  1. Trích xuất mô hình từ tệp lưu trữ zip mà bạn đã tải xuống từ bảng điều khiển Google Cloud.
  2. Đưa mô hình của bạn vào gói ứng dụng:
    1. Nếu bạn không có thư mục thành phần trong dự án, hãy tạo một thư mục bằng cách nhấp chuột phải vào thư mục app/, rồi nhấp vào Mới > Thư mục > Thư mục Thành phần.
    2. Sao chép tệp mô hình tflite có siêu dữ liệu được nhúng vào tài sản .
  3. Hãy thêm đoạn mã sau vào tệp build.gradle của ứng dụng để đảm bảo Gradle không nén tệp mô hình khi tạo ứng dụng:

    android {
        // ...
        aaptOptions {
            noCompress "tflite"
        }
    }
    

    Tệp mô hình sẽ được đưa vào gói ứng dụng và có sẵn dưới dạng nội dung thô.

Định cấu hình nguồn mô hình được lưu trữ trên Firebase

Để sử dụng mô hình được lưu trữ từ xa, hãy tạo đối tượng RemoteModel, chỉ định tên mà bạn đã chỉ định cho mô hình khi xuất bản:

Java

// Specify the name you assigned when you deployed the model.
FirebaseCustomRemoteModel remoteModel =
        new FirebaseCustomRemoteModel.Builder("your_model").build();

Kotlin

// Specify the name you assigned when you deployed the model.
val remoteModel =
    FirebaseCustomRemoteModel.Builder("your_model_name").build()

Sau đó, bắt đầu tác vụ tải mô hình xuống, chỉ định các điều kiện mà theo đó mà bạn muốn cho phép tải xuống. Nếu kiểu máy này không có trên thiết bị hoặc nếu là kiểu máy mới hơn phiên bản của mô hình sẵn có, tác vụ sẽ tải xuống không đồng bộ mô hình từ Firebase:

Java

DownloadConditions downloadConditions = new DownloadConditions.Builder()
        .requireWifi()
        .build();
RemoteModelManager.getInstance().download(remoteModel, downloadConditions)
        .addOnSuccessListener(new OnSuccessListener<Void>() {
            @Override
            public void onSuccess(@NonNull Task<Void> task) {
                // Success.
            }
        });

Kotlin

val downloadConditions = DownloadConditions.Builder()
    .requireWifi()
    .build()
RemoteModelManager.getInstance().download(remoteModel, downloadConditions)
    .addOnSuccessListener {
        // Success.
    }

Nhiều ứng dụng bắt đầu tác vụ tải xuống trong mã khởi chạy, nhưng bạn có thể làm như vậy bất cứ lúc nào trước khi cần sử dụng mô hình.

Tạo trình phát hiện đối tượng từ mô hình của bạn

Sau khi bạn định cấu hình các nguồn mô hình, hãy tạo đối tượng ObjectDetector từ một đối tượng trong số chúng.

Nếu chỉ có mô hình được gói cục bộ, bạn chỉ cần tạo một trình phát hiện đối tượng từ tệp mô hình và định cấu hình điểm số tin cậy ngưỡng bạn muốn yêu cầu (xem Đánh giá mô hình của bạn):

Java

// Initialization
ObjectDetectorOptions options = ObjectDetectorOptions.builder()
    .setScoreThreshold(0)  // Evaluate your model in the Google Cloud console
                           // to determine an appropriate value.
    .build();
ObjectDetector objectDetector = ObjectDetector.createFromFileAndOptions(context, modelFile, options);

Kotlin

// Initialization
val options = ObjectDetectorOptions.builder()
    .setScoreThreshold(0)  // Evaluate your model in the Google Cloud console
                           // to determine an appropriate value.
    .build()
val objectDetector = ObjectDetector.createFromFileAndOptions(context, modelFile, options)

Nếu có mô hình được lưu trữ từ xa, bạn sẽ phải kiểm tra xem mô hình đó đã được tải xuống trước khi chạy nó. Bạn có thể kiểm tra trạng thái tải mô hình xuống bằng cách sử dụng phương thức isModelDownloaded() của trình quản lý mô hình.

Mặc dù bạn chỉ phải xác nhận điều này trước khi chạy trình phát hiện vật thể, nhưng nếu bạn có cả mô hình được lưu trữ từ xa và mô hình được gói cục bộ, ý nghĩa để thực hiện kiểm tra này khi tạo thực thể cho trình phát hiện đối tượng: tạo một trình phát hiện đối tượng từ mô hình từ xa nếu đã tải xuống và từ mô hình khác.

Java

FirebaseModelManager.getInstance().isModelDownloaded(remoteModel)
        .addOnSuccessListener(new OnSuccessListener<Boolean>() {
            @Override
            public void onSuccess(Boolean isDownloaded) {
            }
        });

Kotlin

FirebaseModelManager.getInstance().isModelDownloaded(remoteModel)
        .addOnSuccessListener { success ->

        }

Nếu chỉ có một mô hình được lưu trữ từ xa, bạn nên tắt tính năng liên quan đến mô hình đó chức năng (ví dụ: chuyển sang màu xám hoặc ẩn một phần giao diện người dùng) cho đến khi bạn xác nhận mô hình đã được tải xuống. Bạn có thể thực hiện việc này bằng cách đính kèm một trình nghe vào phương thức download() của trình quản lý mô hình.

Sau khi bạn biết mô hình đã được tải xuống, hãy tạo một trình phát hiện đối tượng từ tệp mô hình:

Java

FirebaseModelManager.getInstance().getLatestModelFile(remoteModel)
        .addOnCompleteListener(new OnCompleteListener<File>() {
            @Override
            public void onComplete(@NonNull Task<File> task) {
                File modelFile = task.getResult();
                if (modelFile != null) {
                    ObjectDetectorOptions options = ObjectDetectorOptions.builder()
                            .setScoreThreshold(0)
                            .build();
                    objectDetector = ObjectDetector.createFromFileAndOptions(
                            getApplicationContext(), modelFile.getPath(), options);
                }
            }
        });

Kotlin

FirebaseModelManager.getInstance().getLatestModelFile(remoteModel)
        .addOnSuccessListener { modelFile ->
            val options = ObjectDetectorOptions.builder()
                    .setScoreThreshold(0f)
                    .build()
            objectDetector = ObjectDetector.createFromFileAndOptions(
                    applicationContext, modelFile.path, options)
        }

2. Chuẩn bị hình ảnh đầu vào

Sau đó, đối với mỗi hình ảnh bạn muốn gắn nhãn, hãy tạo một đối tượng TensorImage từ hình ảnh. Bạn có thể tạo đối tượng TensorImage từ Bitmap bằng cách sử dụng phương thức Phương thức fromBitmap:

Java

TensorImage image = TensorImage.fromBitmap(bitmap);

Kotlin

val image = TensorImage.fromBitmap(bitmap)

Nếu dữ liệu hình ảnh của bạn không nằm trong Bitmap, bạn có thể tải một mảng pixel như minh hoạ trong tài liệu TensorFlow Lite.

3. Chạy trình phát hiện đối tượng

Để phát hiện đối tượng trong hình ảnh, hãy truyền đối tượng TensorImage đến phương thức Phương thức detect() của ObjectDetector.

Java

List<Detection> results = objectDetector.detect(image);

Kotlin

val results = objectDetector.detect(image)

4. Nhận thông tin về đối tượng được gắn nhãn

Nếu thành công, thao tác phát hiện đối tượng sẽ trả về danh sách Detection . Mỗi đối tượng Detection đại diện cho một nội dung đã được phát hiện trong hình ảnh. Bạn có thể lấy hộp giới hạn và nhãn của từng đối tượng.

Ví dụ:

Java

for (Detection result : results) {
    RectF bounds = result.getBoundingBox();
    List<Category> labels = result.getCategories();
}

Kotlin

for (result in results) {
    val bounds = result.getBoundingBox()
    val labels = result.getCategories()
}

Mẹo cải thiện hiệu suất theo thời gian thực

Nếu bạn muốn gắn nhãn cho hình ảnh trong một ứng dụng theo thời gian thực, hãy làm theo các bước sau để đạt được tốc độ khung hình tốt nhất:

  • Điều tiết các lệnh gọi đến công cụ gắn nhãn hình ảnh. Nếu một khung video mới khi trình gắn nhãn hình ảnh đang chạy, hãy thả khung. Hãy xem Ví dụ về lớp VisionProcessorBase trong ứng dụng mẫu khởi động nhanh.
  • Nếu bạn đang sử dụng đầu ra của công cụ gắn nhãn hình ảnh để phủ đồ hoạ lên hình ảnh đầu vào, trước tiên hãy lấy kết quả, sau đó kết xuất hình ảnh và phủ lên trên trong một bước duy nhất. Khi làm vậy, bạn sẽ kết xuất lên giao diện màn hình một lần cho mỗi khung đầu vào. Hãy xem CameraSourcePreview GraphicOverlay trong ứng dụng mẫu khởi động nhanh để có ví dụ:
  • Nếu bạn sử dụng API Camera2, hãy chụp ảnh trong Định dạng ImageFormat.YUV_420_888.

    Nếu bạn sử dụng API Camera cũ, hãy chụp ảnh trong Định dạng ImageFormat.NV21.