Mẹo và thủ thuật

Tài liệu này mô tả các phương pháp hay nhất để thiết kế, triển khai, kiểm thử và triển khai Chức năng đám mây.

Tính chính xác

Phần này mô tả các phương pháp chung hay nhất để thiết kế và triển khai các Hàm đám mây.

Viết các hàm giá trị giống nhau

Các hàm của bạn phải cho ra cùng một kết quả ngay cả khi chúng được gọi nhiều lần. Điều này cho phép bạn thử gọi lại nếu lệnh gọi trước đó không thành công một phần thông qua mã của bạn. Để biết thêm thông tin, hãy xem thử lại các hàm dựa trên sự kiện.

Không bắt đầu hoạt động trong nền

Hoạt động ở chế độ nền là mọi hoạt động xảy ra sau khi hàm của bạn kết thúc. Lệnh gọi hàm kết thúc sau khi hàm trả về hoặc báo hiệu việc hoàn tất, chẳng hạn như bằng cách gọi đối số callback trong các hàm dựa trên sự kiện Node.js. Mọi mã chạy sau khi kết thúc linh hoạt đều không thể truy cập vào CPU và sẽ không có tiến trình nào.

Ngoài ra, khi lệnh gọi tiếp theo được thực thi trong cùng một môi trường, hoạt động ở chế độ nền của bạn sẽ tiếp tục và cản trở lệnh gọi mới. Điều này có thể dẫn đến hành vi không mong muốn và các lỗi khó chẩn đoán. Việc truy cập mạng sau khi một chức năng chấm dứt thường dẫn đến việc kết nối bị đặt lại (mã lỗi ECONNRESET).

Thường thì bạn có thể phát hiện hoạt động ở chế độ nền trong nhật ký của các lệnh gọi riêng lẻ, bằng cách tìm mọi nội dung được ghi lại sau dòng cho biết lệnh gọi đã hoàn tất. Hoạt động ở chế độ nền đôi khi có thể được tập trung sâu hơn trong mã, đặc biệt là khi có các thao tác không đồng bộ như lệnh gọi lại hoặc bộ tính giờ. Xem lại mã của bạn để đảm bảo tất cả các thao tác không đồng bộ đều kết thúc trước khi bạn chấm dứt hàm đó.

Luôn xoá các tệp tạm thời

Lưu trữ ổ đĩa trên máy trong thư mục tạm thời là một hệ thống tệp trong bộ nhớ. Các tệp bạn ghi chiếm bộ nhớ có sẵn cho hàm và đôi khi vẫn tồn tại giữa các lệnh gọi. Việc không xoá rõ ràng các tệp này cuối cùng có thể dẫn đến lỗi hết bộ nhớ và khởi động nguội tiếp theo.

Bạn có thể xem bộ nhớ mà một hàm riêng lẻ sử dụng bằng cách chọn bộ nhớ đó trong danh sách hàm trong GCP Console rồi chọn biểu đồ Mức sử dụng bộ nhớ.

Đừng tìm cách ghi bên ngoài thư mục tạm thời và đảm bảo sử dụng các phương thức độc lập với nền tảng/hệ điều hành để tạo đường dẫn tệp.

Bạn có thể giảm yêu cầu về bộ nhớ khi xử lý các tệp lớn hơn bằng cách sử dụng tính năng quy trình (pipeline). Ví dụ: bạn có thể xử lý một tệp trên Cloud Storage bằng cách tạo một luồng đọc, truyền tệp đó thông qua một quy trình dựa trên luồng và ghi luồng đầu ra trực tiếp vào Cloud Storage.

Khung hàm

Khi bạn triển khai một hàm, Khung hàm sẽ tự động được thêm dưới dạng phần phụ thuộc dựa trên phiên bản hiện tại của hàm đó. Để đảm bảo các phần phụ thuộc giống nhau được cài đặt nhất quán trên nhiều môi trường, bạn nên ghim hàm của mình vào một phiên bản cụ thể của Khung hàm.

Để thực hiện việc này, hãy thêm phiên bản bạn muốn vào tệp khoá phù hợp (ví dụ: package-lock.json đối với Node.js hoặc requirements.txt đối với Python).

Công cụ

Phần này đưa ra hướng dẫn về cách sử dụng các công cụ để triển khai, kiểm thử và tương tác với Cloud Functions.

Phát triển cục bộ

Việc triển khai hàm mất một chút thời gian nên thường sẽ nhanh hơn nếu bạn kiểm thử mã của hàm cục bộ.

Nhà phát triển Firebase có thể sử dụng Trình mô phỏng chức năng đám mây CLI của Firebase.

Sử dụng Sendgrid để gửi email

Cloud Functions không cho phép các kết nối đi trên cổng 25, vì vậy, bạn không thể thực hiện các kết nối không an toàn tới máy chủ SMTP. Bạn nên gửi email bằng SendGrid. Bạn có thể tìm các tuỳ chọn khác để gửi email trong hướng dẫn về Gửi email từ thực thể dành cho Google Compute Engine.

Hiệu suất

Phần này mô tả các phương pháp hay nhất để tối ưu hoá hiệu suất.

Sử dụng phần phụ thuộc một cách khôn ngoan

Vì các hàm không có trạng thái, nên môi trường thực thi thường được khởi chạy từ đầu (trong quá trình gọi là khởi động nguội). Khi quá trình khởi động nguội xảy ra, ngữ cảnh chung của hàm sẽ được đánh giá.

Nếu các hàm của bạn nhập mô-đun, thì thời gian tải cho các mô-đun đó có thể thêm vào độ trễ gọi trong khi khởi động nguội. Bạn có thể giảm độ trễ này cũng như thời gian cần thiết để triển khai hàm bằng cách tải các phần phụ thuộc đúng cách và không tải các phần phụ thuộc mà hàm của bạn không sử dụng.

Dùng biến toàn cục để sử dụng lại đối tượng trong các lệnh gọi trong tương lai

Không có gì đảm bảo rằng trạng thái của Hàm đám mây sẽ được giữ nguyên cho các lệnh gọi trong tương lai. Tuy nhiên, Cloud Functions thường tái chế môi trường thực thi của lệnh gọi trước đó. Nếu bạn khai báo một biến ở phạm vi toàn cục, thì giá trị của biến đó có thể được sử dụng lại trong các lệnh gọi tiếp theo mà không cần phải tính toán lại.

Bằng cách này, bạn có thể lưu các đối tượng có thể tốn kém vào bộ nhớ đệm trong mỗi lệnh gọi hàm. Việc di chuyển các đối tượng như vậy từ phần nội dung hàm sang phạm vi toàn cục có thể cải thiện đáng kể hiệu suất. Ví dụ sau đây chỉ tạo một đối tượng nặng một lần cho mỗi thực thể hàm và chia sẻ đối tượng đó trên tất cả các lệnh gọi hàm đến thực thể đó:

Node.js

console.log('Global scope');
const perInstance = heavyComputation();
const functions = require('firebase-functions');

exports.function = functions.https.onRequest((req, res) => {
  console.log('Function invocation');
  const perFunction = lightweightComputation();

  res.send(`Per instance: ${perInstance}, per function: ${perFunction}`);
});

Python

import time

from firebase_functions import https_fn

# Placeholder
def heavy_computation():
  return time.time()

# Placeholder
def light_computation():
  return time.time()

# Global (instance-wide) scope
# This computation runs at instance cold-start
instance_var = heavy_computation()

@https_fn.on_request()
def scope_demo(request):

  # Per-function scope
  # This computation runs every time this function is called
  function_var = light_computation()
  return https_fn.Response(f"Instance: {instance_var}; function: {function_var}")
  

Hàm HTTP này nhận một đối tượng yêu cầu (flask.Request) và trả về văn bản phản hồi hoặc bất kỳ tập hợp giá trị nào có thể chuyển thành đối tượng Response bằng cách sử dụng make_response.

Điều đặc biệt quan trọng là lưu các kết nối mạng, tệp tham chiếu thư viện và đối tượng ứng dụng API vào bộ nhớ đệm trong phạm vi toàn cầu. Hãy xem bài viết Tối ưu hoá mạng để biết thêm ví dụ.

Thực hiện khởi chạy từng phần các biến toàn cục

Nếu bạn khởi tạo các biến trong phạm vi toàn cục, thì mã khởi chạy sẽ luôn được thực thi thông qua lệnh gọi khởi động nguội, làm tăng độ trễ của hàm. Trong một số trường hợp, việc này sẽ dẫn đến thời gian chờ gián đoạn đối với các dịch vụ được gọi nếu chúng không được xử lý phù hợp trong khối try/catch. Nếu một số đối tượng không được dùng trong tất cả đường dẫn mã, hãy cân nhắc khởi chạy từng đối tượng theo yêu cầu:

Node.js

const functions = require('firebase-functions');
let myCostlyVariable;

exports.function = functions.https.onRequest((req, res) => {
  doUsualWork();
  if(unlikelyCondition()){
      myCostlyVariable = myCostlyVariable || buildCostlyVariable();
  }
  res.status(200).send('OK');
});

Python

from firebase_functions import https_fn

# Always initialized (at cold-start)
non_lazy_global = file_wide_computation()

# Declared at cold-start, but only initialized if/when the function executes
lazy_global = None

@https_fn.on_request()
def lazy_globals(request):

  global lazy_global, non_lazy_global

  # This value is initialized only if (and when) the function is called
  if not lazy_global:
      lazy_global = function_specific_computation()

  return https_fn.Response(f"Lazy: {lazy_global}, non-lazy: {non_lazy_global}.")
  

Hàm HTTP này sử dụng các tập lệnh toàn cục được khởi tạo từng phần. Phương thức này lấy một đối tượng yêu cầu (flask.Request) và trả về văn bản phản hồi hoặc bất kỳ tập hợp giá trị nào có thể chuyển thành đối tượng Response bằng cách sử dụng make_response.

Điều này đặc biệt quan trọng nếu bạn xác định nhiều hàm trong một tệp và các hàm khác nhau sử dụng các biến khác nhau. Trừ phi sử dụng tính năng khởi chạy từng phần, bạn có thể lãng phí tài nguyên trên các biến được khởi tạo nhưng không bao giờ được sử dụng.

Giảm số lượt khởi động nguội bằng cách thiết lập số lượng thực thể tối thiểu

Theo mặc định, Cloud Functions sẽ tăng số lượng thực thể dựa trên số lượng yêu cầu gửi đến. Bạn có thể thay đổi hành vi mặc định này bằng cách đặt số lượng thực thể tối thiểu mà Cloud Functions phải luôn sẵn sàng phân phát yêu cầu. Việc đặt số lượng thực thể tối thiểu sẽ giảm tình trạng khởi động nguội ứng dụng. Bạn nên đặt số lượng thực thể tối thiểu nếu ứng dụng nhạy cảm về độ trễ.

Hãy xem phần Kiểm soát hành vi điều chỉnh tỷ lệ để biết thêm thông tin về các tuỳ chọn thời gian chạy này.

Tài nguyên khác

Tìm hiểu thêm về cách tối ưu hoá hiệu suất trong video "Google Cloud Performance Atlas" – Thời gian khởi động nguội của Chức năng đám mây.