Để gọi một API Google Cloud từ ứng dụng, bạn cần tạo một API REST trung gian để xử lý việc uỷ quyền và bảo vệ các giá trị bí mật như khoá API. Sau đó, bạn cần viết mã trong ứng dụng di động để xác thực và giao tiếp với dịch vụ trung gian này.
Một cách để tạo API REST này là sử dụng Xác thực Firebase và Functions. Cách này cung cấp cho bạn một cổng được quản lý, không máy chủ đến các Cloud APIs của Google, xử lý việc xác thực và có thể được gọi từ ứng dụng di động bằng các SDK dựng sẵn.
Hướng dẫn này minh hoạ cách sử dụng kỹ thuật này để gọi Cloud Vision API từ ứng dụng. Phương thức này sẽ cho phép tất cả người dùng đã xác thực truy cập vào các dịch vụ được tính phí của Cloud Vision thông qua dự án trên đám mây. Vì vậy, hãy cân nhắc xem cơ chế xác thực này có đủ cho trường hợp sử dụng của bạn hay không trước khi tiếp tục.
Trước khi bắt đầu
Định cấu hình dự án
- Nếu bạn chưa thực hiện, hãy thêm Firebase vào dự án Android.
-
Nếu bạn chưa bật API dựa trên đám mây cho dự án, hãy bật ngay:
- Mở trang Firebase ML APIs trong bảng điều khiển Firebase.
-
Nếu bạn chưa nâng cấp dự án lên gói giá Blaze, hãy nhấp vào Nâng cấp để nâng cấp. (Bạn sẽ chỉ được nhắc nâng cấp nếu dự án của bạn không thuộc gói giá Blaze).
Chỉ những dự án thuộc gói giá Blaze mới có thể sử dụng API dựa trên đám mây.
- Nếu API dựa trên đám mây chưa được bật, hãy nhấp vào Bật API dựa trên đám mây.
- Định cấu hình các khoá API Firebase hiện có để không cho phép truy cập vào Cloud
Vision API:
- Mở trang Thông tin xác thực của bảng điều khiển Cloud.
- Đối với mỗi khoá API trong danh sách, hãy mở chế độ xem chỉnh sửa và trong phần Key Restrictions (Quy tắc hạn chế về khoá), hãy thêm tất cả các API có sẵn ngoại trừ Cloud Vision API vào danh sách.
Triển khai hàm có thể gọi
Tiếp theo, hãy triển khai Cloud Function mà bạn sẽ dùng để kết nối ứng dụng và Cloud
Vision API. Kho lưu trữ functions-samples chứa một ví dụ
mà bạn có thể sử dụng.
Theo mặc định, việc truy cập vào Cloud Vision API thông qua hàm này sẽ cho phép chỉ người dùng đã xác thực của ứng dụng truy cập vào Cloud Vision API. Bạn có thể sửa đổi hàm cho các yêu cầu khác nhau.
Cách triển khai hàm:
- Sao chép hoặc tải kho lưu trữ functions-samples xuống
và chuyển sang thư mục
Node-1st-gen/vision-annotate-imageđó:git clone https://github.com/firebase/functions-samplescd Node-1st-gen/vision-annotate-image - Cài đặt các phần phụ thuộc:
cd functionsnpm installcd .. - Nếu bạn chưa có Firebase CLI, hãy cài đặt.
- Khởi chạy một dự án Firebase trong thư mục
vision-annotate-image. Khi được nhắc, hãy chọn dự án của bạn trong danh sách.firebase init
- Triển khai hàm:
firebase deploy --only functions:annotateImage
Thêm Firebase Auth vào ứng dụng
Hàm có thể gọi được triển khai ở trên sẽ từ chối mọi yêu cầu từ những người dùng chưa xác thực của ứng dụng. Nếu chưa thực hiện, bạn cần thêm Firebase Auth vào ứng dụng.
Thêm các phần phụ thuộc cần thiết vào ứng dụng
<project>/<app-module>/build.gradle.kts hoặc
<project>/<app-module>/build.gradle):
implementation("com.google.firebase:firebase-functions:22.1.0") implementation("com.google.code.gson:gson:2.8.6")
1. Chuẩn bị hình ảnh đầu vào
Để gọi Cloud Vision, hình ảnh phải được định dạng dưới dạng chuỗi được mã hoá base64. Cách xử lý hình ảnh từ URI tệp đã lưu:- Lấy hình ảnh dưới dạng đối tượng
Bitmap:Kotlin
var bitmap: Bitmap = MediaStore.Images.Media.getBitmap(contentResolver, uri)
Java
Bitmap bitmap = MediaStore.Images.Media.getBitmap(getContentResolver(), uri);
- Bạn có thể thu nhỏ hình ảnh để tiết kiệm băng thông.
Xem kích thước hình ảnh được đề xuất của Cloud Vision.
Kotlin
private fun scaleBitmapDown(bitmap: Bitmap, maxDimension: Int): Bitmap { val originalWidth = bitmap.width val originalHeight = bitmap.height var resizedWidth = maxDimension var resizedHeight = maxDimension if (originalHeight > originalWidth) { resizedHeight = maxDimension resizedWidth = (resizedHeight * originalWidth.toFloat() / originalHeight.toFloat()).toInt() } else if (originalWidth > originalHeight) { resizedWidth = maxDimension resizedHeight = (resizedWidth * originalHeight.toFloat() / originalWidth.toFloat()).toInt() } else if (originalHeight == originalWidth) { resizedHeight = maxDimension resizedWidth = maxDimension } return Bitmap.createScaledBitmap(bitmap, resizedWidth, resizedHeight, false) }
Java
private Bitmap scaleBitmapDown(Bitmap bitmap, int maxDimension) { int originalWidth = bitmap.getWidth(); int originalHeight = bitmap.getHeight(); int resizedWidth = maxDimension; int resizedHeight = maxDimension; if (originalHeight > originalWidth) { resizedHeight = maxDimension; resizedWidth = (int) (resizedHeight * (float) originalWidth / (float) originalHeight); } else if (originalWidth > originalHeight) { resizedWidth = maxDimension; resizedHeight = (int) (resizedWidth * (float) originalHeight / (float) originalWidth); } else if (originalHeight == originalWidth) { resizedHeight = maxDimension; resizedWidth = maxDimension; } return Bitmap.createScaledBitmap(bitmap, resizedWidth, resizedHeight, false); }
Kotlin
// Scale down bitmap size bitmap = scaleBitmapDown(bitmap, 640)
Java
// Scale down bitmap size bitmap = scaleBitmapDown(bitmap, 640);
- Chuyển đổi đối tượng bitmap thành chuỗi được mã hoá base64:
Kotlin
// Convert bitmap to base64 encoded string val byteArrayOutputStream = ByteArrayOutputStream() bitmap.compress(Bitmap.CompressFormat.JPEG, 100, byteArrayOutputStream) val imageBytes: ByteArray = byteArrayOutputStream.toByteArray() val base64encoded = Base64.encodeToString(imageBytes, Base64.NO_WRAP)
Java
// Convert bitmap to base64 encoded string ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream(); bitmap.compress(Bitmap.CompressFormat.JPEG, 100, byteArrayOutputStream); byte[] imageBytes = byteArrayOutputStream.toByteArray(); String base64encoded = Base64.encodeToString(imageBytes, Base64.NO_WRAP);
Hình ảnh được biểu thị bằng đối tượng
Bitmap phải
ở dạng thẳng đứng, không cần xoay thêm.
2. Gọi hàm có thể gọi để nhận dạng các địa danh
Để nhận dạng các địa danh trong một hình ảnh, hãy gọi hàm có thể gọi, truyền một yêu cầu JSON Cloud Vision.Trước tiên, hãy khởi chạy một thực thể của Cloud Functions:
Kotlin
private lateinit var functions: FirebaseFunctions // ... functions = Firebase.functionsJava
private FirebaseFunctions mFunctions; // ... mFunctions = FirebaseFunctions.getInstance();Xác định một phương thức để gọi hàm:
Kotlin
private fun annotateImage(requestJson: String): Task<JsonElement> { return functions .getHttpsCallable("annotateImage") .call(requestJson) .continueWith { task -> // This continuation runs on either success or failure, but if the task // has failed then result will throw an Exception which will be // propagated down. val result = task.result?.data JsonParser.parseString(Gson().toJson(result)) } }Java
private Task<JsonElement> annotateImage(String requestJson) { return mFunctions .getHttpsCallable("annotateImage") .call(requestJson) .continueWith(new Continuation<HttpsCallableResult, JsonElement>() { @Override public JsonElement then(@NonNull Task<HttpsCallableResult> task) { // This continuation runs on either success or failure, but if the task // has failed then getResult() will throw an Exception which will be // propagated down. return JsonParser.parseString(new Gson().toJson(task.getResult().getData())); } }); }Tạo yêu cầu JSON có Loại
LANDMARK_DETECTION:Kotlin
// Create json request to cloud vision val request = JsonObject() // Add image to request val image = JsonObject() image.add("content", JsonPrimitive(base64encoded)) request.add("image", image) // Add features to the request val feature = JsonObject() feature.add("maxResults", JsonPrimitive(5)) feature.add("type", JsonPrimitive("LANDMARK_DETECTION")) val features = JsonArray() features.add(feature) request.add("features", features)Java
// Create json request to cloud vision JsonObject request = new JsonObject(); // Add image to request JsonObject image = new JsonObject(); image.add("content", new JsonPrimitive(base64encoded)); request.add("image", image); //Add features to the request JsonObject feature = new JsonObject(); feature.add("maxResults", new JsonPrimitive(5)); feature.add("type", new JsonPrimitive("LANDMARK_DETECTION")); JsonArray features = new JsonArray(); features.add(feature); request.add("features", features);Cuối cùng, hãy gọi hàm:
Kotlin
annotateImage(request.toString()) .addOnCompleteListener { task -> if (!task.isSuccessful) { // Task failed with an exception // ... } else { // Task completed successfully // ... } }Java
annotateImage(request.toString()) .addOnCompleteListener(new OnCompleteListener<JsonElement>() { @Override public void onComplete(@NonNull Task<JsonElement> task) { if (!task.isSuccessful()) { // Task failed with an exception // ... } else { // Task completed successfully // ... } } });
3. Xem thông tin về các địa danh được nhận dạng
Nếu thao tác nhận dạng địa danh thành công, một phản hồi JSON của BatchAnnotateImagesResponse sẽ được trả về trong kết quả của tác vụ. Mỗi đối tượng trong mảnglandmarkAnnotations đại diện cho một địa danh được nhận dạng trong hình ảnh. Đối với mỗi địa danh, bạn có thể lấy toạ độ giới hạn của địa danh trong hình ảnh đầu vào, tên của địa danh, vĩ độ và kinh độ của địa danh, mã nhận dạng thực thể Sơ đồ tri thức (nếu có) và điểm tin cậy của kết quả khớp. Ví dụ:
Kotlin
for (label in task.result!!.asJsonArray[0].asJsonObject["landmarkAnnotations"].asJsonArray) {
val labelObj = label.asJsonObject
val landmarkName = labelObj["description"]
val entityId = labelObj["mid"]
val score = labelObj["score"]
val bounds = labelObj["boundingPoly"]
// Multiple locations are possible, e.g., the location of the depicted
// landmark and the location the picture was taken.
for (loc in labelObj["locations"].asJsonArray) {
val latitude = loc.asJsonObject["latLng"].asJsonObject["latitude"]
val longitude = loc.asJsonObject["latLng"].asJsonObject["longitude"]
}
}
Java
for (JsonElement label : task.getResult().getAsJsonArray().get(0).getAsJsonObject().get("landmarkAnnotations").getAsJsonArray()) {
JsonObject labelObj = label.getAsJsonObject();
String landmarkName = labelObj.get("description").getAsString();
String entityId = labelObj.get("mid").getAsString();
float score = labelObj.get("score").getAsFloat();
JsonObject bounds = labelObj.get("boundingPoly").getAsJsonObject();
// Multiple locations are possible, e.g., the location of the depicted
// landmark and the location the picture was taken.
for (JsonElement loc : labelObj.get("locations").getAsJsonArray()) {
JsonObject latLng = loc.getAsJsonObject().get("latLng").getAsJsonObject();
double latitude = latLng.get("latitude").getAsDouble();
double longitude = latLng.get("longitude").getAsDouble();
}
}