在 iOS 上使用機器學習套件掃描條碼

您可以使用 ML Kit 來識別和解碼條形碼。

在你開始之前

  1. 如果您尚未將 Firebase 添加到您的應用,請按照入門指南中的步驟進行操作。
  2. 在您的 Podfile 中包含 ML Kit 庫:
    pod 'Firebase/MLVision'
    pod 'Firebase/MLVisionBarcodeModel'
    
    安裝或更新項目的 Pod 後,請務必使用其.xcworkspace打開您的 Xcode 項目。
  3. 在您的應用中,導入 Firebase:

    迅速

    import Firebase

    Objective-C

    @import Firebase;

輸入圖像指南

  • 為了讓 ML Kit 準確讀取條形碼,輸入圖像必須包含由足夠像素數據表示的條形碼。

    特定的像素數據要求取決於條形碼的類型和其中編碼的數據量(因為大多數條形碼支持可變長度的有效負載)。一般而言,條碼的最小有意義單位應至少為 2 個像素寬(對於二維碼,為 2 個像素高)。

    例如,EAN-13 條碼由寬度為 1、2、3 或 4 個單位的條形和空格組成,因此 EAN-13 條碼圖像理想情況下具有至少 2、4、6 和8 像素寬。因為 EAN-13 條碼總共有 95 個單位寬,所以條碼應至少有 190 像素寬。

    更密集的格式(例如 PDF417)需要更大的像素尺寸,機器學習套件才能可靠地讀取它們。例如,一個 PDF417 代碼在單行中最多可以有 34 個 17 單位寬的“單詞”,理想情況下至少為 1156 像素寬。

  • 圖像聚焦不佳會影響掃描精度。如果您沒有得到可接受的結果,請嘗試要求用戶重新捕獲圖像。

  • 對於典型應用,建議提供更高分辨率的圖像(例如 1280x720 或 1920x1080),這樣可以在距離攝像頭更遠的地方檢測到條碼。

    但是,在延遲至關重要的應用程序中,您可以通過以較低分辨率捕獲圖像來提高性能,但要求條形碼構成輸入圖像的大部分。另請參閱提高實時性能的技巧

1.配置條碼檢測器

如果您知道您希望讀取哪些條碼格式,則可以通過將條碼檢測器配置為僅檢測這些格式來提高條碼檢測器的速度。

例如,要僅檢測 Aztec 碼和 QR 碼,請構建VisionBarcodeDetectorOptions對象,如下例所示:

迅速

let format = VisionBarcodeFormat.all
let barcodeOptions = VisionBarcodeDetectorOptions(formats: format)

支持以下格式:

  • 代碼128
  • 代碼 39
  • 代碼93
  • CodaBar
  • EAN13
  • EAN8
  • 國際乒聯
  • UPCA
  • UPCE
  • 二維碼
  • PDF417
  • 阿茲台克人
  • 數據矩陣

Objective-C

FIRVisionBarcodeDetectorOptions *options =
    [[FIRVisionBarcodeDetectorOptions alloc]
     initWithFormats: FIRVisionBarcodeFormatQRCode | FIRVisionBarcodeFormatAztec];

支持以下格式:

  • 代碼 128 ( FIRVisionBarcodeFormatCode128 )
  • 代碼 39 ( FIRVisionBarcodeFormatCode39 )
  • 代碼 93 ( FIRVisionBarcodeFormatCode93 )
  • Codabar ( FIRVisionBarcodeFormatCodaBar )
  • EAN-13 ( FIRVisionBarcodeFormatEAN13 )
  • EAN-8 ( FIRVisionBarcodeFormatEAN8 )
  • ITF ( FIRVisionBarcodeFormatITF )
  • UPC-A ( FIRVisionBarcodeFormatUPCA )
  • UPC-E ( FIRVisionBarcodeFormatUPCE )
  • 二維碼 ( FIRVisionBarcodeFormatQRCode )
  • PDF417 ( FIRVisionBarcodeFormatPDF417 )
  • Aztec ( FIRVisionBarcodeFormatAztec )
  • 數據矩陣 ( FIRVisionBarcodeFormatDataMatrix )

2.運行條碼檢測器

要掃描圖像中的條形碼,請將圖像作為UIImageCMSampleBufferRef傳遞給VisionBarcodeDetectordetect(in:)方法:

  1. 獲取VisionBarcodeDetector的實例:

    迅速

    lazy var vision = Vision.vision()
    
    let barcodeDetector = vision.barcodeDetector(options: barcodeOptions)
    

    Objective-C

    FIRVision *vision = [FIRVision vision];
    FIRVisionBarcodeDetector *barcodeDetector = [vision barcodeDetector];
    // Or, to change the default settings:
    // FIRVisionBarcodeDetector *barcodeDetector =
    //     [vision barcodeDetectorWithOptions:options];
    
  2. 使用UIImageCMSampleBufferRef創建VisionImage對象。

    要使用UIImage

    1. 如有必要,旋轉圖像,使其imageOrientation屬性為.up
    2. 使用正確旋轉的UIImage創建一個VisionImage對象。不要指定任何旋轉元數據——必須使用默認值.topLeft

      迅速

      let image = VisionImage(image: uiImage)

      Objective-C

      FIRVisionImage *image = [[FIRVisionImage alloc] initWithImage:uiImage];

    要使用CMSampleBufferRef

    1. 創建一個VisionImageMetadata對象,該對象指定CMSampleBufferRef緩衝區中包含的圖像數據的方向。

      要獲取圖像方向:

      迅速

      func imageOrientation(
          deviceOrientation: UIDeviceOrientation,
          cameraPosition: AVCaptureDevice.Position
          ) -> VisionDetectorImageOrientation {
          switch deviceOrientation {
          case .portrait:
              return cameraPosition == .front ? .leftTop : .rightTop
          case .landscapeLeft:
              return cameraPosition == .front ? .bottomLeft : .topLeft
          case .portraitUpsideDown:
              return cameraPosition == .front ? .rightBottom : .leftBottom
          case .landscapeRight:
              return cameraPosition == .front ? .topRight : .bottomRight
          case .faceDown, .faceUp, .unknown:
              return .leftTop
          }
      }

      Objective-C

      - (FIRVisionDetectorImageOrientation)
          imageOrientationFromDeviceOrientation:(UIDeviceOrientation)deviceOrientation
                                 cameraPosition:(AVCaptureDevicePosition)cameraPosition {
        switch (deviceOrientation) {
          case UIDeviceOrientationPortrait:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationLeftTop;
            } else {
              return FIRVisionDetectorImageOrientationRightTop;
            }
          case UIDeviceOrientationLandscapeLeft:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationBottomLeft;
            } else {
              return FIRVisionDetectorImageOrientationTopLeft;
            }
          case UIDeviceOrientationPortraitUpsideDown:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationRightBottom;
            } else {
              return FIRVisionDetectorImageOrientationLeftBottom;
            }
          case UIDeviceOrientationLandscapeRight:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationTopRight;
            } else {
              return FIRVisionDetectorImageOrientationBottomRight;
            }
          default:
            return FIRVisionDetectorImageOrientationTopLeft;
        }
      }

      然後,創建元數據對象:

      迅速

      let cameraPosition = AVCaptureDevice.Position.back  // Set to the capture device you used.
      let metadata = VisionImageMetadata()
      metadata.orientation = imageOrientation(
          deviceOrientation: UIDevice.current.orientation,
          cameraPosition: cameraPosition
      )

      Objective-C

      FIRVisionImageMetadata *metadata = [[FIRVisionImageMetadata alloc] init];
      AVCaptureDevicePosition cameraPosition =
          AVCaptureDevicePositionBack;  // Set to the capture device you used.
      metadata.orientation =
          [self imageOrientationFromDeviceOrientation:UIDevice.currentDevice.orientation
                                       cameraPosition:cameraPosition];
    2. 使用CMSampleBufferRef對象和旋轉元數據創建一個VisionImage對象:

      迅速

      let image = VisionImage(buffer: sampleBuffer)
      image.metadata = metadata

      Objective-C

      FIRVisionImage *image = [[FIRVisionImage alloc] initWithBuffer:sampleBuffer];
      image.metadata = metadata;
  3. 然後,將圖像傳遞給detect(in:)方法:

    迅速

    barcodeDetector.detect(in: visionImage) { features, error in
      guard error == nil, let features = features, !features.isEmpty else {
        // ...
        return
      }
    
      // ...
    }
    

    Objective-C

    [barcodeDetector detectInImage:image
                        completion:^(NSArray<FIRVisionBarcode *> *barcodes,
                                     NSError *error) {
      if (error != nil) {
        return;
      } else if (barcodes != nil) {
        // Recognized barcodes
        // ...
      }
    }];
    

3. 從條碼中獲取信息

如果條碼識別操作成功,檢測器會返回一個VisionBarcode對像數組。每個VisionBarcode對象代表在圖像中檢測到的條形碼。對於每個條碼,您可以獲取其在輸入圖像中的邊界坐標,以及條碼編碼的原始數據。此外,如果條形碼檢測器能夠確定條形碼編碼的數據類型,您可以獲得包含解析數據的對象。

例如:

迅速

for barcode in barcodes {
  let corners = barcode.cornerPoints

  let displayValue = barcode.displayValue
  let rawValue = barcode.rawValue

  let valueType = barcode.valueType
  switch valueType {
  case .wiFi:
    let ssid = barcode.wifi!.ssid
    let password = barcode.wifi!.password
    let encryptionType = barcode.wifi!.type
  case .URL:
    let title = barcode.url!.title
    let url = barcode.url!.url
  default:
    // See API reference for all supported value types
  }
}

Objective-C

 for (FIRVisionBarcode *barcode in barcodes) {
   NSArray *corners = barcode.cornerPoints;

   NSString *displayValue = barcode.displayValue;
   NSString *rawValue = barcode.rawValue;

   FIRVisionBarcodeValueType valueType = barcode.valueType;
   switch (valueType) {
     case FIRVisionBarcodeValueTypeWiFi:
       // ssid = barcode.wifi.ssid;
       // password = barcode.wifi.password;
       // encryptionType = barcode.wifi.type;
       break;
     case FIRVisionBarcodeValueTypeURL:
       // url = barcode.URL.url;
       // title = barcode.URL.title;
       break;
     // ...
     default:
       break;
   }
 }

提高實時性能的技巧

如果您想在實時應用程序中掃描條形碼,請遵循以下指南以獲得最佳幀率:

  • 不要以相機的原始分辨率捕獲輸入。在某些設備上,以原始分辨率捕獲輸入會產生非常大的(10+ 百萬像素)圖像,這會導致非常差的延遲,並且不會提高準確性。相反,只向相機請求條碼檢測所需的尺寸:通常不超過 2 兆像素。

    但是,不推薦使用命名的捕獲會話預設( AVCaptureSessionPresetDefaultAVCaptureSessionPresetLowAVCaptureSessionPresetMedium等),因為它們可能會映射到某些設備上不合適的分辨率。相反,請使用特定的預設,例如AVCaptureSessionPreset1280x720

    如果掃描速度很重要,您可以進一步降低圖像捕獲分辨率。但是,請記住上述最低條碼尺寸要求。

  • 限制對檢測器的調用。如果在檢測器運行時有新的視頻幀可用,請丟棄該幀。
  • 如果您使用檢測器的輸出在輸入圖像上疊加圖形,首先從 ML Kit 中獲取結果,然後在一個步驟中渲染圖像並疊加。通過這樣做,您只為每個輸入幀渲染到顯示表面一次。有關示例,請參閱展示示例應用程序中的previewOverlayViewFIRDetectionOverlayView類。