Mô hình phát hiện đối tượng tương tự như mô hình gắn nhãn hình ảnh, nhưng thay vì gán nhãn cho toàn bộ hình ảnh, nó chỉ định nhãn cho các vùng hình ảnh. Bạn có thể sử dụng các mô hình phát hiện đối tượng để nhận dạng và xác định vị trí của các đối tượng trong một hình ảnh hoặc theo dõi chuyển động của đối tượng qua một loạt hình ảnh.
Để huấn luyện một mô hình phát hiện đối tượng, bạn cung cấp cho AutoML Vision Edge một bộ hình ảnh có nhãn đối tượng và ranh giới đối tượng tương ứng. Tầm nhìn AutoML Edge sử dụng tập dữ liệu này để huấn luyện một mô hình mới trên đám mây mà bạn có thể dùng cho trên thiết bị.
Trước khi bắt đầu
Nếu bạn chưa có dự án Firebase, hãy tạo một dự án trong Bảng điều khiển Firebase.
Làm quen với các nguyên tắc được trình bày trong Hướng dẫn về học máy toàn diện – AutoML.
Nếu bạn chỉ muốn dùng thử AutoML Vision Edge mà không có chương trình đào tạo riêng hãy tải tập dữ liệu mẫu xuống, chẳng hạn như một trong các dữ liệu sau:
- Một trong các tập dữ liệu đề xuất của TensorFlow.
- Một tập dữ liệu được lưu trữ trên Kaggle.
1. Tập hợp dữ liệu huấn luyện
Trước tiên, bạn cần tập hợp một tập dữ liệu huấn luyện gồm những hình ảnh có gắn nhãn. Giữ nguyên hãy lưu ý các nguyên tắc sau:
Hình ảnh phải có một trong các định dạng sau: JPEG, PNG, GIF, BMP, ICO.
Mỗi hình ảnh phải có kích thước từ 30 MB trở xuống. Lưu ý rằng AutoML Vision Edge sẽ giảm quy mô hầu hết hình ảnh trong quá trình tiền xử lý, nên thường sẽ không có lợi cho độ chính xác cung cấp hình ảnh có độ phân giải rất cao.
Đưa vào ít nhất 10 và tốt nhất là 100 ví dụ trở lên về từng nhãn.
Thêm nhiều góc, độ phân giải và nền cho mỗi nhãn.
Dữ liệu huấn luyện phải gần với dữ liệu dự đoán nhất có thể. Ví dụ: nếu trường hợp sử dụng của bạn liên quan đến việc bị mờ và hình ảnh có độ phân giải thấp (chẳng hạn như từ camera an ninh), dữ liệu đào tạo của bạn nên bao gồm hình ảnh mờ, có độ phân giải thấp.
Các mô hình do AutoML Vision Edge tạo ra được tối ưu hoá cho ảnh chụp của đối tượng trong thế giới thực. Chúng có thể không phù hợp khi chụp X-quang, vẽ tay, tài liệu được quét, biên nhận, v.v.
Ngoài ra, các mô hình thường không thể dự đoán những nhãn mà con người không thể chỉ định. Vì vậy, nếu người dùng không thể gắn nhãn bằng cách nhìn vào hình ảnh trong 1-2 giây, mô hình nào cũng không thể được huấn luyện để làm điều đó.
Khi đã chuẩn bị xong hình ảnh đào tạo, hãy chuẩn bị để nhập hình ảnh đó vào Google Cloud. Bạn có hai tuỳ chọn:
Cách 1: Cloud Storage có chỉ mục CSV
Tải hình ảnh tập huấn lên Google Cloud Storage và chuẩn bị một tệp CSV liệt kê URL của mỗi hình ảnh và tuỳ ý chính xác nhãn đối tượng và vùng giới hạn cho từng hình ảnh. Tuỳ chọn này rất hữu ích khi sử dụng các tập dữ liệu lớn.
Ví dụ: tải hình ảnh của bạn lên Cloud Storage và chuẩn bị một tệp CSV như như sau:
gs://your-training-data-bucket/001.jpg,accordion,0.2,0.4,,,0.3,0.5,, gs://your-training-data-bucket/001.jpg,tuba,0.2,0.5,,,0.4,0.8,, gs://your-training-data-bucket/002.jpg,accordion,0.2,0.2,,,0.9,0.8,,
Hộp giới hạn đối tượng được chỉ định dưới dạng toạ độ tương đối trong hình ảnh. Xem Định dạng CSV dữ liệu huấn luyện.
Hình ảnh phải được lưu trữ trong một bộ chứa ở khu vực us-central1
và
thuộc dự án Google Cloud tương ứng của dự án Firebase.
Cách 2: Hình ảnh chưa được gắn nhãn
Gắn nhãn hình ảnh huấn luyện và vẽ ranh giới đối tượng trong Google Cloud bảng điều khiển sau khi bạn tải lên. Bạn chỉ nên sử dụng tính năng này cho các tập dữ liệu. Xem bước tiếp theo.
2. Huấn luyện mô hình
Tiếp theo, hãy huấn luyện một mô hình bằng hình ảnh của bạn:
Mở trang Vision Datasets (Tập dữ liệu thị giác) trong bảng điều khiển Google Cloud. Chọn dự án của bạn khi được nhắc.
Nhấp vào Tập dữ liệu mới, đặt tên cho tập dữ liệu, chọn loại mô hình mà bạn muốn huấn luyện rồi nhấp vào Tạo tập dữ liệu.
Trên thẻ Nhập của tập dữ liệu, hãy tải hình ảnh đào tạo của bạn lên, một tệp lưu trữ zip hình ảnh đào tạo của bạn hoặc tệp CSV chứa Cloud Storage vị trí mà bạn đã tải chúng lên. Xem phần Tập hợp dữ liệu huấn luyện.
Sau khi nhiệm vụ nhập hoàn tất, hãy sử dụng thẻ Hình ảnh để xác minh dữ liệu huấn luyện.
Nếu bạn không tải tệp CSV lên, đối với mỗi hình ảnh, hãy vẽ các hộp giới hạn xung quanh các đối tượng mà bạn muốn nhận dạng và gắn nhãn cho từng đối tượng.
Trên thẻ Huấn luyện, hãy nhấp vào Bắt đầu huấn luyện.
Đặt tên cho mô hình và chọn loại mô hình Edge.
Định cấu hình các chế độ cài đặt huấn luyện sau đây, giúp kiểm soát hiệu suất của mô hình được tạo:
Tối ưu hoá mô hình cho... Cấu hình mô hình sẽ sử dụng. Bạn có thể huấn luyện các mô hình nhanh hơn, nhỏ hơn khi độ trễ thấp hoặc kích thước gói nhỏ là quan trọng, hoặc các mô hình chậm hơn, lớn hơn khi độ chính xác là quan trọng nhất. Ngân sách giờ cho nút Thời gian tối đa (tính bằng giờ điện toán) để huấn luyện mô hình. Thời gian huấn luyện càng dài thì mô hình càng chính xác.
Xin lưu ý rằng quá trình huấn luyện có thể hoàn tất trong thời gian ngắn hơn thời gian được chỉ định nếu hệ thống xác định rằng mô hình đã được tối ưu hoá và việc huấn luyện thêm sẽ không cải thiện độ chính xác. Bạn chỉ phải trả phí cho số giờ thực sự sử dụng.
Thời gian đào tạo thông thường Tập hợp rất nhỏ 1 giờ 500 hình ảnh 2 giờ 1.000 hình ảnh 3 giờ 5.000 hình ảnh 6 giờ 10.000 hình ảnh 7 giờ 50.000 hình ảnh 11 giờ 100.000 hình ảnh 13 giờ 1.000.000 hình ảnh 18 giờ
3. Đánh giá mô hình
Khi quá trình đào tạo hoàn tất, bạn có thể nhấp vào thẻ Đánh giá để xem chỉ số hiệu suất cho mô hình.
Một mục đích sử dụng quan trọng của trang này là xác định ngưỡng tin cậy phù hợp phù hợp nhất với mô hình của bạn. Ngưỡng tin cậy là độ tin cậy tối thiểu mà mô hình cần phải có để gán nhãn cho hình ảnh. Bằng cách chuyển Ngưỡng tin cậy thanh trượt, bạn có thể xem các ngưỡng khác nhau ảnh hưởng như thế nào đến hiệu suất của mô hình. Hiệu suất của mô hình được đo lường bằng hai chỉ số: độ chính xác và mức độ ghi lại.
Trong ngữ cảnh phân loại hình ảnh, độ chính xác là tỷ lệ của số hình ảnh đã được gắn nhãn chính xác với số lượng hình ảnh mà mô hình đã gắn nhãn dựa trên ngưỡng đã chọn. Khi một mô hình có độ chính xác cao, mô hình đó sẽ gán nhãn không chính xác thường xuyên hơn (ít kết quả dương tính giả).
Recall là tỷ lệ số lượng hình ảnh được gắn nhãn chính xác với số lượng hình ảnh có nội dung mà mô hình có thể gắn nhãn. Thời gian một mô hình có mức truy lại cao, mô hình không gán bất kỳ nhãn nào ít thường xuyên hơn (ít sai hơn âm).
Việc bạn tối ưu hoá cho độ chính xác hay độ gợi nhắc sẽ phụ thuộc vào trường hợp sử dụng của bạn. Hãy xem hướng dẫn dành cho người mới bắt đầu về AutoML Vision và hướng dẫn về công nghệ học máy toàn diện – AutoML để biết thêm thông tin.
Khi thấy ngưỡng tin cậy tạo ra chỉ số mà bạn cảm thấy hài lòng, ghi lại thông tin đó; bạn sẽ dùng ngưỡng tin cậy để định cấu hình mô hình trong . (Bạn có thể sử dụng công cụ này bất cứ lúc nào để nhận giá trị ngưỡng phù hợp.)
4. Xuất bản hoặc tải mô hình xuống
Nếu bạn hài lòng với hiệu suất của mô hình và muốn sử dụng mô hình đó trong ứng dụng, bạn có 3 tuỳ chọn mà từ đó bạn có thể chọn bất kỳ kết hợp nào: triển khai mô hình dự đoán trực tuyến, xuất bản mô hình lên Firebase hoặc tải xuống tạo mô hình và kết hợp với ứng dụng của bạn.
Triển khai mô hình
Trên thẻ Kiểm thử và sử dụng của tập dữ liệu, bạn có thể triển khai mô hình để dự đoán trực tuyến. Mô hình này sẽ chạy trên đám mây. Lựa chọn này được đề cập trong phần Tài liệu Cloud AutoML. Chiến lược phát hành đĩa đơn Tài liệu trên trang web này xử lý hai tuỳ chọn còn lại.
Xuất bản mô hình
Bằng cách xuất bản mô hình này lên Firebase, bạn có thể cập nhật mô hình này mà không cần phát hành một phiên bản ứng dụng mới và bạn có thể sử dụng Remote Config và A/B Testing để phân phát linh động các mô hình khác nhau cho các nhóm người dùng khác nhau.
Nếu bạn chỉ chọn cung cấp mô hình bằng cách lưu trữ mô hình đó bằng Firebase, chứ không phải hãy kết hợp ứng dụng đó với ứng dụng, bạn có thể giảm kích thước tải xuống ban đầu của ứng dụng. Mặc dù vậy, hãy lưu ý rằng nếu mô hình không được đóng gói với ứng dụng của bạn, bất kỳ sẽ không có sẵn chức năng liên quan đến mô hình cho đến khi ứng dụng của bạn tải xuống mô hình lần đầu tiên.
Để xuất bản mô hình, bạn có thể sử dụng một trong hai phương pháp sau:
- Tải mô hình TF Lite xuống từ trang Kiểm thử và sử dụng của tập dữ liệu trong bảng điều khiển Google Cloud, sau đó tải mô hình lên trang Mô hình tuỳ chỉnh của bảng điều khiển Firebase. Việc này thường cách dễ nhất để xuất bản một mô hình.
- Xuất bản mô hình trực tiếp từ dự án Google Cloud lên Firebase bằng cách sử dụng SDK dành cho quản trị viên. Bạn có thể sử dụng phương thức này để xuất bản hàng loạt một số mô hình hoặc để giúp tạo quy trình xuất bản tự động.
Cách phát hành mô hình bằng API quản lý mô hình của SDK dành cho quản trị viên:
Xuất bản mô hình.
Bạn sẽ cần chỉ định giá trị nhận dạng tài nguyên của mô hình. Đây là một chuỗi có dạng như ví dụ sau:
projects/PROJECT_NUMBER/locations/us-central1/models/MODEL_ID
PROJECT_NUMBER
Số dự án của bộ chứa Cloud Storage chứa mô hình. Đây có thể là dự án Firebase của bạn hoặc Google Cloud khác dự án. Bạn có thể tìm thấy giá trị này trên trang Cài đặt của Bảng điều khiển của Firebase hoặc trang tổng quan của bảng điều khiển Google Cloud. MODEL_ID
Mã mô hình mà bạn nhận được từ AutoML Cloud API. Python
# First, import and initialize the SDK. # Get a reference to the AutoML model source = ml.TFLiteAutoMlSource('projects/{}/locations/us-central1/models/{}'.format( # See above for information on these values. project_number, model_id )) # Create the model object tflite_format = ml.TFLiteFormat(model_source=source) model = ml.Model( display_name="example_model", # This is the name you will use from your app to load the model. tags=["examples"], # Optional tags for easier management. model_format=tflite_format) # Add the model to your Firebase project and publish it new_model = ml.create_model(model) new_model.wait_for_unlocked() ml.publish_model(new_model.model_id)
Node.js
// First, import and initialize the SDK. (async () => { // Get a reference to the AutoML model. See above for information on these // values. const automlModel = `projects/${projectNumber}/locations/us-central1/models/${modelId}`; // Create the model object and add the model to your Firebase project. const model = await ml.createModel({ displayName: 'example_model', // This is the name you use from your app to load the model. tags: ['examples'], // Optional tags for easier management. tfliteModel: { automlModel: automlModel }, }); // Wait for the model to be ready. await model.waitForUnlocked(); // Publish the model. await ml.publishModel(model.modelId); process.exit(); })().catch(console.error);
Tải xuống và gói mô hình với ứng dụng
Bằng cách kết hợp mô hình với ứng dụng, bạn có thể đảm bảo các tính năng học máy của ứng dụng vẫn hoạt động khi không có mô hình lưu trữ trên Firebase.
Nếu bạn vừa xuất bản vừa đóng gói mô hình đó trong ứng dụng của mình, thì ứng dụng sẽ sử dụng phiên bản mới nhất hiện có.
Để tải mô hình của bạn xuống, hãy nhấp vào TF Lite trên mục Kiểm tra và sử dụng.
Các bước tiếp theo
Giờ đây, bạn đã xuất bản hoặc tải mô hình xuống, hãy tìm hiểu cách sử dụng mô hình trong iOS+ và Ứng dụng Android.