了解 2023 年 Google I/O 大会上介绍的 Firebase 亮点。了解详情

目標檢測和跟踪

借助 ML Kit 的設備上對象檢測和跟踪 API,您可以實時定位和跟踪圖像或實時攝像頭饋送中最突出的對象。您還可以選擇將檢測到的對象分類為幾個常規類別之一。

粗分類的對象檢測和跟踪對於構建實時視覺搜索體驗很有用。因為對象檢測和跟踪在設備上快速而完整地發生,所以它可以很好地作為更長的視覺搜索管道的前端。檢測和過濾對像後,您可以將它們傳遞到雲後端,例如Cloud Vision Product Search或自定義模型,例如您使用AutoML Vision Edge訓練的模型。

iOS安卓

關鍵能力

快速目標檢測和跟踪檢測對象並獲取它們在圖像中的位置。跨圖像跟踪對象。
優化的設備端模型對象檢測和跟踪模型針對移動設備進行了優化,旨在用於實時應用程序,即使在低端設備上也是如此。
突出物體檢測自動確定圖像中最突出的對象。
粗分類將對象分類為廣泛的類別,您可以使用這些類別過濾掉您不感興趣的對象。支持以下類別:家居用品、時尚商品、食品、植物、地點和未知。

示例結果

跨圖像跟踪最突出的對象

跟踪號碼0
界限(95, 45), (496, 45), (496, 240), (95, 240)
類別地方
分類置信度0.9296875
跟踪號碼0
界限(84, 46), (478, 46), (478, 247), (84, 247)
類別地方
分類置信度0.8710938
跟踪號碼0
界限(53, 45), (519, 45), (519, 240), (53, 240)
類別地方
分類置信度0.8828125

照片:克里斯蒂安·費雷爾 [CC BY-SA 4.0]

靜態圖像中的多個對象

對象 0
界限(1, 97), (332, 97), (332, 332), (1, 332)
類別FASHION_GOOD
分類置信度0.95703125
對象 1
界限(186, 80), (337, 80), (337, 226), (186, 226)
類別FASHION_GOOD
分類置信度0.84375
對象 2
界限(296, 80), (472, 80), (472, 388), (296, 388)
類別FASHION_GOOD
分類置信度0.94921875
對象 3
界限(439, 83), (615, 83), (615, 306), (439, 306)
類別FASHION_GOOD
分類置信度0.9375