Xoá dữ liệu hàng loạt

Sử dụng dịch vụ xoá hàng loạt được quản lý để xoá dữ liệu khỏi cơ sở dữ liệu. Tính năng này hỗ trợ việc xoá đối với một hoặc nhiều nhóm bộ sưu tập.

Trang này mô tả cách xoá hàng loạt tài liệu bằng dịch vụ xoá hàng loạt được quản lý. Dịch vụ xoá hàng loạt được quản lý Cloud Firestore có sẵn thông qua công cụ dòng lệnh gcloudAPI REST Cloud Firestore.

Trước khi bắt đầu

Để có thể sử dụng dịch vụ xoá hàng loạt được quản lý, bạn phải hoàn tất các việc sau:

  1. Bật tính năng thanh toán cho dự án Google Cloud của bạn. Chỉ những dự án Google Cloud đã bật tính năng thanh toán mới có thể sử dụng chức năng xoá hàng loạt.
  2. Đảm bảo rằng tài khoản của bạn có các quyền cần thiết cho Cloud Firestore. Nếu là chủ sở hữu dự án, thì tài khoản của bạn có các quyền cần thiết. Nếu không, các vai trò sau đây sẽ cấp các quyền cần thiết cho các thao tác xoá hàng loạt:

    • Vai trò Cloud Firestore: Owner, Cloud Datastore Owner hoặc Cloud Datastore Bulk Admin

Thiết lập gcloud cho dự án của bạn

Bạn có thể bắt đầu các thao tác xoá hàng loạt thông qua bảng điều khiển Google Cloud hoặc công cụ dòng lệnh gcloud. Để sử dụng gcloud, hãy thiết lập công cụ dòng lệnh và kết nối với dự án của bạn theo một trong những cách sau:

Xoá hàng loạt dữ liệu

Thao tác xoá hàng loạt trước tiên sẽ tìm tất cả các tài liệu áp dụng trong cơ sở dữ liệu của bạn rồi xoá chúng theo lô. Bạn vẫn có thể truy vấn hoặc đọc những tài liệu này, mặc dù kết quả có thể khác nhau tuỳ thuộc vào tiến trình đã đạt được. Thao tác xoá hàng loạt sẽ không xoá bất kỳ tài liệu nào được thêm hoặc sửa đổi sau khi thao tác bắt đầu.

Xoá nhiều nhóm bộ sưu tập cụ thể

gcloud

Để xoá hàng loạt các nhóm bộ sưu tập cụ thể, hãy sử dụng cờ --collection-ids. Thao tác này chỉ xoá các nhóm bộ sưu tập có mã nhận dạng đã cho. Một nhóm bộ sưu tập bao gồm tất cả các tài liệu và tài liệu lồng nhau (ở bất kỳ đường dẫn nào) có các nhóm bộ sưu tập được chỉ định.

gcloud firestore bulk-delete \
--collection-ids=[COLLECTION_GROUP_ID_1_OR_KIND_1],[COLLECTION_GROUP_ID_2_OR_KIND_2],[SUBCOLLECTION_GROUP_ID_1_OR_KIND_3] \
--database=[DATABASE]
Ví dụ: hãy tưởng tượng có nhiều tài liệu đại diện cho các nhà hàng trong bộ sưu tập restaurants cấp cao nhất của cơ sở dữ liệu cymbal. Trong mỗi tài liệu nhà hàng, có nhiều bộ sưu tập con lồng nhau, chẳng hạn như ratings, reviewsoutlets. Để xoá hàng loạt các nhóm bộ sưu tập restaurantsreviews, lệnh của bạn sẽ có dạng như sau:

gcloud firestore bulk-delete \
--collection-ids=restaurants,reviews \
--database='cymbal'

Quản lý các thao tác xoá hàng loạt

Sau khi bạn bắt đầu một thao tác xoá hàng loạt, Cloud Firestore sẽ chỉ định cho thao tác đó một tên riêng biệt. Bạn có thể sử dụng tên thao tác để xoá, huỷ hoặc kiểm tra trạng thái của thao tác.

Tên thao tác có tiền tố là projects/[PROJECT_ID]/databases/[DATABASE_ID]/operations/, ví dụ:

projects/my-project/databases/(default)/operations/ASA1MTAwNDQxNAgadGx1YWZlZAcSeWx0aGdpbi1zYm9qLW5pbWRhEgopEg

Tuy nhiên, bạn có thể bỏ qua tiền tố khi chỉ định tên thao tác cho các lệnh describe, canceldelete.

Liệt kê tất cả các thao tác xoá hàng loạt

gcloud

Sử dụng lệnh operations list để xem tất cả các thao tác đang chạy và đã hoàn tất gần đây, bao gồm cả các thao tác xoá hàng loạt:

gcloud firestore operations list

Kiểm tra trạng thái hoạt động

gcloud

Sử dụng lệnh operations describe để cho biết trạng thái của thao tác xoá hàng loạt.

gcloud firestore operations describe [OPERATION_NAME]

Ước tính thời gian hoàn thành

Yêu cầu về trạng thái của một thao tác diễn ra trong thời gian dài sẽ trả về các chỉ số workEstimatedworkCompleted. Mỗi chỉ số này được trả về theo cả số lượng byte và số lượng tài liệu:

  • workEstimated cho biết tổng số byte và tài liệu ước tính mà một thao tác sẽ xử lý. Cloud Firestore có thể bỏ qua chỉ số này nếu không thể ước tính.

  • workCompleted cho biết số lượng byte và tài liệu đã xoá cho đến thời điểm hiện tại. Sau khi thao tác hoàn tất, giá trị này cho biết tổng số byte và tài liệu đã được xử lý thực tế, có thể lớn hơn giá trị của workEstimated.

Chia workCompleted cho workEstimated để ước tính tiến trình một cách sơ bộ. Số liệu ước tính này có thể không chính xác vì phụ thuộc vào việc thu thập số liệu thống kê bị trì hoãn.

Huỷ thao tác

gcloud

Sử dụng lệnh operations cancel để dừng một thao tác đang diễn ra:

gcloud firestore operations cancel [OPERATION_NAME]

Việc huỷ một thao tác đang chạy sẽ không huỷ thao tác đó. Thao tác xoá hàng loạt bị huỷ sẽ không khôi phục các tài liệu đã xoá.

Xoá một thao tác

Sử dụng lệnh gcloud firestore operations delete để xoá một thao tác đã hoàn tất khỏi danh sách các thao tác gần đây. Để huỷ một thao tác đang chạy, hãy sử dụng thao tác huỷ trước đó.

gcloud firestore operations delete [OPERATION_NAME]

Thanh toán và định giá cho các thao tác xoá hàng loạt

Bạn phải bật tính năng thanh toán cho dự án Google Cloud thì mới có thể sử dụng dịch vụ xoá hàng loạt được quản lý.

Các thao tác xoá hàng loạt sẽ bị tính phí cho các thao tác đọc và xoá tài liệu theo mức giá được nêu trong phần Cloud Firestore định giá. Thao tác xoá hàng loạt sẽ phát sinh một lần đọc mục nhập chỉ mục cho mỗi tài liệu tìm thấy và một thao tác xoá cho mỗi tài liệu bị xoá. Bạn sẽ bị tính một thao tác đọc cho tối đa 1.000 mục chỉ mục được đọc. Ví dụ: đối với một thao tác xoá hàng loạt đã xoá 1.500 tài liệu, bạn sẽ bị tính phí 2 lượt đọc tài liệu và 1.500 lượt xoá tài liệu.

Xin lưu ý rằng Cloud Firestore tính phí cho công việc thực tế đã hoàn thành. Nếu thao tác bị huỷ hoặc không thành công do lỗi của người dùng, bạn sẽ bị tính phí theo tiến trình đã thực hiện. Cloud Firestore sẽ không tính phí cho các thao tác đọc hoặc xoá đối với những tài liệu không bị xoá sau cùng, chẳng hạn như những tài liệu được sửa đổi sau khi thao tác xoá bắt đầu. Chi phí sẽ được tính vào ngày hoàn tất hoạt động.

Các thao tác xoá hàng loạt sẽ không kích hoạt cảnh báo Google Cloudngân sách cho đến khi hoàn tất. Tương tự, các thao tác đọc và xoá được thực hiện trong một thao tác xoá hàng loạt sẽ được áp dụng cho mức sử dụng bậc miễn phí của bạn sau khi thao tác hoàn tất. Các thao tác xoá hàng loạt không ảnh hưởng đến mức sử dụng xuất hiện trong phần mức sử dụng của bảng điều khiển.

Xem chi phí xoá hàng loạt

Các thao tác xoá hàng loạt sẽ áp dụng nhãn goog-firestoremanaged:bulkdelete cho các thao tác được tính phí. Trên trang Báo cáo thanh toán qua đám mây, bạn có thể sử dụng nhãn này để xem chi phí liên quan đến các thao tác xoá hàng loạt.

Các phương pháp hay nhất

Tránh bỏ qua dữ liệu đã xoá vì điều này có thể làm chậm các truy vấn.