Catch up on everthing we announced at this year's Firebase Summit. Learn more

आईओएस पर एमएल किट के साथ लैंडमार्क्स को पहचानें

आप किसी छवि में प्रसिद्ध स्थलों को पहचानने के लिए एमएल किट का उपयोग कर सकते हैं।

शुरू करने से पहले

  1. आप नहीं पहले से आपका ऐप्लिकेशन को Firebase जोड़ा है, तो में दिए चरणों का पालन करके ऐसा कर आरंभ करने की मार्गदर्शिका
  2. : अपने Podfile में एमएल किट पुस्तकालयों को शामिल करें
    pod 'Firebase/MLVision', '6.25.0'
    
    आप स्थापित करने या अपने प्रोजेक्ट की फलियाँ अद्यतन करते हैं, इसके उपयोग करते हुए अपने Xcode प्रोजेक्ट को खोलने के लिए यकीन है कि हो के बाद .xcworkspace
  3. अपने ऐप्लिकेशन में, Firebase आयात करें:

    तीव्र

    import Firebase

    उद्देश्य सी

    @import Firebase;
  4. यदि आपने अपने प्रोजेक्ट के लिए पहले से क्लाउड-आधारित API सक्षम नहीं किया है, तो अभी करें:

    1. खोलें एमएल किट एपीआई पेज Firebase सांत्वना की।
    2. आप पहले से ही एक ब्लेज़ मूल्य निर्धारण योजना पर अपनी परियोजना अपग्रेड नहीं किए हैं, ऐसा करने के लिए अपग्रेड क्लिक करें। (आपको केवल तभी अपग्रेड करने के लिए कहा जाएगा जब आपका प्रोजेक्ट ब्लेज़ प्लान पर न हो।)

      केवल ब्लेज़-स्तरीय प्रोजेक्ट ही क्लाउड-आधारित API का उपयोग कर सकते हैं।

    3. क्लाउड-आधारित एपीआई पहले से सक्षम नहीं रहे हैं, तो क्लिक करें क्लाउड-आधारित API सक्षम करें।

लैंडमार्क डिटेक्टर को कॉन्फ़िगर करें

डिफ़ॉल्ट रूप से, क्लाउड डिटेक्टर मॉडल के स्थिर संस्करण का उपयोग करता है और अधिकतम 10 परिणाम देता है। आप इन सेटिंग्स में से किसी को बदलना चाहते हैं, उनके साथ एक निर्दिष्ट VisionCloudDetectorOptions निम्न उदाहरण में वस्तु:

तीव्र

let options = VisionCloudDetectorOptions()
options.modelType = .latest
options.maxResults = 20

उद्देश्य सी

  FIRVisionCloudDetectorOptions *options =
      [[FIRVisionCloudDetectorOptions alloc] init];
  options.modelType = FIRVisionCloudModelTypeLatest;
  options.maxResults = 20;
  

अगले चरण में, पारित VisionCloudDetectorOptions आपत्ति जब आप बादल डिटेक्टर वस्तु बनाने के।

लैंडमार्क डिटेक्टर चलाएँ

एक छवि में स्थलों को पहचान करने के लिए, एक के रूप में छवि पारित UIImage या एक CMSampleBufferRef को VisionCloudLandmarkDetector के detect(in:) विधि:

  1. का एक उदाहरण हो जाओ VisionCloudLandmarkDetector :

    तीव्र

    lazy var vision = Vision.vision()
    
    let cloudDetector = vision.cloudLandmarkDetector(options: options)
    // Or, to use the default settings:
    // let cloudDetector = vision.cloudLandmarkDetector()
    

    उद्देश्य सी

    FIRVision *vision = [FIRVision vision];
    FIRVisionCloudLandmarkDetector *landmarkDetector = [vision cloudLandmarkDetector];
    // Or, to change the default settings:
    // FIRVisionCloudLandmarkDetector *landmarkDetector =
    //     [vision cloudLandmarkDetectorWithOptions:options];
    
  2. एक बनाएं VisionImage एक का उपयोग कर वस्तु UIImage या एक CMSampleBufferRef

    एक का उपयोग करने के UIImage :

    1. यदि आवश्यक हो, छवि को घुमाने के लिए इतना है कि इसके imageOrientation संपत्ति है .up
    2. एक बनाएं VisionImage सही ढंग से घुमाया का उपयोग कर वस्तु UIImage । किसी भी रोटेशन मेटाडाटा-सामान्य मान, निर्दिष्ट नहीं करते .topLeft , इस्तेमाल किया जाना चाहिए।

      तीव्र

      let image = VisionImage(image: uiImage)

      उद्देश्य सी

      FIRVisionImage *image = [[FIRVisionImage alloc] initWithImage:uiImage];

    एक का उपयोग करने के CMSampleBufferRef :

    1. एक बनाएं VisionImageMetadata उद्देश्य यह है कि निर्दिष्ट करता है में निहित छवि डेटा के उन्मुखीकरण CMSampleBufferRef बफर।

      छवि अभिविन्यास प्राप्त करने के लिए:

      तीव्र

      func imageOrientation(
          deviceOrientation: UIDeviceOrientation,
          cameraPosition: AVCaptureDevice.Position
          ) -> VisionDetectorImageOrientation {
          switch deviceOrientation {
          case .portrait:
              return cameraPosition == .front ? .leftTop : .rightTop
          case .landscapeLeft:
              return cameraPosition == .front ? .bottomLeft : .topLeft
          case .portraitUpsideDown:
              return cameraPosition == .front ? .rightBottom : .leftBottom
          case .landscapeRight:
              return cameraPosition == .front ? .topRight : .bottomRight
          case .faceDown, .faceUp, .unknown:
              return .leftTop
          }
      }

      उद्देश्य सी

      - (FIRVisionDetectorImageOrientation)
          imageOrientationFromDeviceOrientation:(UIDeviceOrientation)deviceOrientation
                                 cameraPosition:(AVCaptureDevicePosition)cameraPosition {
        switch (deviceOrientation) {
          case UIDeviceOrientationPortrait:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationLeftTop;
            } else {
              return FIRVisionDetectorImageOrientationRightTop;
            }
          case UIDeviceOrientationLandscapeLeft:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationBottomLeft;
            } else {
              return FIRVisionDetectorImageOrientationTopLeft;
            }
          case UIDeviceOrientationPortraitUpsideDown:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationRightBottom;
            } else {
              return FIRVisionDetectorImageOrientationLeftBottom;
            }
          case UIDeviceOrientationLandscapeRight:
            if (cameraPosition == AVCaptureDevicePositionFront) {
              return FIRVisionDetectorImageOrientationTopRight;
            } else {
              return FIRVisionDetectorImageOrientationBottomRight;
            }
          default:
            return FIRVisionDetectorImageOrientationTopLeft;
        }
      }

      फिर, मेटाडेटा ऑब्जेक्ट बनाएं:

      तीव्र

      let cameraPosition = AVCaptureDevice.Position.back  // Set to the capture device you used.
      let metadata = VisionImageMetadata()
      metadata.orientation = imageOrientation(
          deviceOrientation: UIDevice.current.orientation,
          cameraPosition: cameraPosition
      )

      उद्देश्य सी

      FIRVisionImageMetadata *metadata = [[FIRVisionImageMetadata alloc] init];
      AVCaptureDevicePosition cameraPosition =
          AVCaptureDevicePositionBack;  // Set to the capture device you used.
      metadata.orientation =
          [self imageOrientationFromDeviceOrientation:UIDevice.currentDevice.orientation
                                       cameraPosition:cameraPosition];
    2. एक बनाएं VisionImage का उपयोग कर वस्तु CMSampleBufferRef वस्तु और रोटेशन मेटाडाटा:

      तीव्र

      let image = VisionImage(buffer: sampleBuffer)
      image.metadata = metadata

      उद्देश्य सी

      FIRVisionImage *image = [[FIRVisionImage alloc] initWithBuffer:sampleBuffer];
      image.metadata = metadata;
  3. फिर, उस छवि से पारित detect(in:) विधि:

    तीव्र

    cloudDetector.detect(in: visionImage) { landmarks, error in
      guard error == nil, let landmarks = landmarks, !landmarks.isEmpty else {
        // ...
        return
      }
    
      // Recognized landmarks
      // ...
    }
    

    उद्देश्य सी

    [landmarkDetector detectInImage:image
                         completion:^(NSArray<FIRVisionCloudLandmark *> *landmarks,
                                      NSError *error) {
      if (error != nil) {
        return;
      } else if (landmarks != nil) {
        // Got landmarks
      }
    }];
    

मान्यता प्राप्त स्थलों के बारे में जानकारी प्राप्त करें

मील का पत्थर मान्यता सफल होती है, की एक सरणी VisionCloudLandmark वस्तुओं पूरा होने हैंडलर को दे दिया जाएगा। प्रत्येक वस्तु से, आप छवि में पहचाने गए लैंडमार्क के बारे में जानकारी प्राप्त कर सकते हैं।

उदाहरण के लिए:

तीव्र

for landmark in landmarks {
  let landmarkDesc = landmark.landmark
  let boundingPoly = landmark.frame
  let entityId = landmark.entityId

  // A landmark can have multiple locations: for example, the location the image
  // was taken, and the location of the landmark depicted.
  for location in landmark.locations {
    let latitude = location.latitude
    let longitude = location.longitude
  }

  let confidence = landmark.confidence
}

उद्देश्य सी

for (FIRVisionCloudLandmark *landmark in landmarks) {
   NSString *landmarkDesc = landmark.landmark;
   CGRect frame = landmark.frame;
   NSString *entityId = landmark.entityId;

   // A landmark can have multiple locations: for example, the location the image
   // was taken, and the location of the landmark depicted.
   for (FIRVisionLatitudeLongitude *location in landmark.locations) {
     double latitude = [location.latitude doubleValue];
     double longitude = [location.longitude doubleValue];
   }

   float confidence = [landmark.confidence floatValue];
}

अगला कदम