Phát hiện và theo dõi đối tượng

Với API theo dõi và phát hiện đối tượng trên thiết bị của Bộ công cụ học máy, bạn có thể bản địa hoá và theo dõi các đối tượng nổi bật nhất theo thời gian thực trong một hình ảnh hoặc nguồn cấp dữ liệu camera trực tiếp. Bạn cũng có thể tuỳ ý phân loại các đối tượng được phát hiện thành một trong số các danh mục chung.

Tính năng phát hiện và theo dõi đối tượng bằng cách phân loại thô rất hữu ích cho việc xây dựng trải nghiệm tìm kiếm bằng hình ảnh trực tiếp. Vì tính năng phát hiện và theo dõi đối tượng diễn ra nhanh chóng và hoàn toàn trên thiết bị, nên tính năng này hoạt động tốt như giao diện người dùng của quy trình tìm kiếm bằng hình ảnh dài hơn. Sau khi phát hiện và lọc đối tượng, bạn có thể truyền các đối tượng đó đến một phần phụ trợ trên đám mây, chẳng hạn như Cloud Vision Product Search hoặc tới một mô hình tuỳ chỉnh, chẳng hạn như mô hình bạn đã huấn luyện bằng AutoML Vision Edge.

iOS Android

Các chức năng chính

Phát hiện và theo dõi vật thể nhanh Phát hiện vật thể và biết vị trí của chúng trong hình ảnh. Theo dõi các đối tượng trên hình ảnh.
Mẫu trên thiết bị được tối ưu hoá Mô hình phát hiện và theo dõi đối tượng được tối ưu hoá cho thiết bị di động và dùng để sử dụng trong các ứng dụng theo thời gian thực, ngay cả trên thiết bị cấp thấp hơn.
Phát hiện đối tượng nổi bật Tự động xác định đối tượng nổi bật nhất trong một hình ảnh.
Phân loại thô Phân loại các đối tượng thành các danh mục mở rộng mà bạn có thể dùng để lọc ra những đối tượng mà mình không quan tâm. Sau đây là những danh mục được hỗ trợ: hàng gia dụng, hàng thời trang, thực phẩm, cây cối, địa điểm và không rõ nguồn gốc.

Kết quả mẫu

Theo dõi đối tượng nổi bật nhất trên các hình ảnh

Mã theo dõi 0
Giới hạn (95, 45), (496, 45), (496, 240), (95, 240)
Danh mục ĐỊA ĐIỂM
Độ tin cậy của hoạt động phân loại 0,9296875
Mã theo dõi 0
Giới hạn (84, 46), (478, 46), (478, 247), (84, 247)
Danh mục ĐỊA ĐIỂM
Độ tin cậy của hoạt động phân loại 0,8710938
Mã theo dõi 0
Giới hạn (53, 45), (519, 45), (519, 240), (53, 240)
Danh mục ĐỊA ĐIỂM
Độ tin cậy của hoạt động phân loại 0,8828125

Ảnh: Christian Ferrer [CC BY-SA 4.0]

Nhiều đối tượng trong một ảnh tĩnh

Đối tượng 0
Giới hạn (1, 97), (332, 97), (332, 332), (1, 332)
Danh mục FASHION_GOOD
Độ tin cậy của hoạt động phân loại 0,95703125
Đối tượng 1
Giới hạn (186, 80), (337, 80), (337, 226), (186, 226)
Danh mục FASHION_GOOD
Độ tin cậy của hoạt động phân loại 0,84375
Đối tượng 2
Giới hạn (296, 80), (472, 80), (472, 388), (296, 388)
Danh mục FASHION_GOOD
Độ tin cậy của hoạt động phân loại 0,94921875
Đối tượng 3
Giới hạn (439, 83), (615, 83), (615, 306), (439, 306)
Danh mục FASHION_GOOD
Độ tin cậy của hoạt động phân loại 0,9375