Planifier les exportations de données

Cette page explique comment planifier l'exportation de vos Données Cloud Firestore. Pour planifier les exportations, nous vous recommandons à l'aide de Cloud Functions et Cloud Scheduler.

Avant de commencer

Avant de planifier l'exportation des données gérées, vous devez effectuer les tâches suivantes :

  1. Activer la facturation de votre projet Google Cloud. Seuls les projets Google Cloud pour lesquels la facturation est activée peuvent utiliser la fonctionnalité d'exportation et d'importation.
  2. Les opérations d'exportation nécessitent un bucket Cloud Storage de destination. Créer un bucket Cloud Storage dans un emplacement proche votre Cloud Firestore emplacement de la base de données. Vous ne pouvez pas utiliser un bucket Requester Pays pour les opérations d'exportation.

Créer une fonction Cloud et un job Cloud Scheduler

Pour créer une fonction Cloud Node.js qui déclenche une exportation de données Cloud Firestore et une tâche Cloud Scheduler pour appeler cette fonction, procédez comme suit :

CLI Firebase
  1. Installez la CLI Firebase. Dans un nouveau répertoire, initialisez la CLI pour Cloud Functions:

    firebase init functions --project PROJECT_ID
    1. Sélectionnez le langage JavaScript.
    2. Vous pouvez également activer ESLint.
    3. Saisissez y pour installer les dépendances.
  2. Remplacez le code du fichier functions/index.js par le code suivant :

    const functions = require('firebase-functions');
    const firestore = require('@google-cloud/firestore');
    const client = new firestore.v1.FirestoreAdminClient();
    
    // Replace BUCKET_NAME
    const bucket = 'gs://BUCKET_NAME';
    
    exports.scheduledFirestoreExport = functions.pubsub
                                                .schedule('every 24 hours')
                                                .onRun((context) => {
    
      const projectId = process.env.GCP_PROJECT;
      const databaseName = 
        client.databasePath(projectId, '(default)');
    
      return client.exportDocuments({
        name: databaseName,
        outputUriPrefix: bucket,
        // Leave collectionIds empty to export all collections
        // or set to a list of collection IDs to export,
        // collectionIds: ['users', 'posts']
        collectionIds: []
        })
      .then(responses => {
        const response = responses[0];
        console.log(`Operation Name: ${response['name']}`);
      })
      .catch(err => {
        console.error(err);
        throw new Error('Export operation failed');
      });
    });
  3. Dans le code ci-dessus, modifiez les éléments suivants :
    • Remplacez BUCKET_NAME par le nom de votre bucket.
    • Modifiez every 24 hours pour définir votre calendrier d'exportation. Utilisez la syntaxe AppEngine cron.yaml ou le format unix-cron (* * * * *).
    • Modifiez collectionIds: [] pour n'exporter que les groupes de collections spécifiés. Laissez tel quel pour exporter toutes les collections.

  4. Déployez la fonction planifiée :

    firebase deploy --only functions
console Google Cloud
Créer une fonction Cloud
  1. Accédez à la page Cloud Functions de la console Google Cloud:

    Accéder à Cloud Functions

  2. Cliquez sur Créer une fonction
  3. Saisissez un nom de fonction tel que firestoreExport
  4. Sous Déclencheur, sélectionnez Cloud Pub/Sub
  5. Sous Sujet, sélectionnez Créer un sujet. Saisissez un nom pour le sujet Pub/Sub, par exemple initiateFirestoreExport. Notez le nom du sujet comme vous en avez besoin pour créer votre job Cloud Scheduler.
  6. Sous Code source, sélectionnez Éditeur intégré. Saisissez le code suivant sous index.js :
    const firestore = require('@google-cloud/firestore');
    const client = new firestore.v1.FirestoreAdminClient();
    // Replace BUCKET_NAME
    const bucket = 'gs://BUCKET_NAME'
    
    exports.scheduledFirestoreExport = (event, context) => {
      const databaseName = client.databasePath(
        process.env.GCP_PROJECT,
        '(default)'
      );
    
      return client
        .exportDocuments({
          name: databaseName,
          outputUriPrefix: bucket,
          // Leave collectionIds empty to export all collections
          // or define a list of collection IDs:
          // collectionIds: ['users', 'posts']
          collectionIds: [],
        })
        .then(responses => {
          const response = responses[0];
          console.log(`Operation Name: ${response['name']}`);
          return response;
        })
        .catch(err => {
          console.error(err);
        });
    };
    Dans le code ci-dessus, modifiez les éléments suivants :
    • Remplacez BUCKET_NAME par le nom de votre bucket.
    • Modifiez collectionIds: [] pour n'exporter que les groupes de collections spécifiés. Laissez tel quel pour exporter toutes les collections.

  7. Sous package.json, ajoutez la dépendance suivante :
    {
      "dependencies": {
        "@google-cloud/firestore": "^1.3.0"
      }
    }
  8. Sous Fonction à exécuter, saisissez scheduledFirestoreExport, le nom de la fonction dans index.js.
  9. Cliquez sur Créer pour déployer la fonction Cloud.
Créer un job Cloud Scheduler

Ensuite, créez une tâche Cloud Scheduler qui appelle votre fonction Cloud:

  1. Accédez à la page Cloud Scheduler de la console Google Cloud :

    Accéder à Cloud Scheduler

  2. Cliquez sur Créer une tâche.
  3. Saisissez un Nom pour la tâche, par exemple scheduledFirestoreExport.
  4. Saisissez une Fréquence, par exemple, every 24 hours.
  5. Sélectionnez un Fuseau horaire.
  6. Sous Cible, sélectionnez Pub/Sub. Dans le champ Sujet, saisissez le nom du sujet Pub/Sub que vous avez défini à côté de votre fonction Cloud, initiateFirestoreExport dans l'exemple ci-dessus.
  7. Dans le champ Charge utile, saisissez start export. La tâche demande de définir une charge utile, mais la fonction Cloud ci-dessus n'utilise pas cette valeur en réalité.
  8. Cliquez sur Créer.
À ce stade, vous avez déployé votre fonction Cloud et Cloud Scheduler. mais votre fonction Cloud a besoin d'autorisations d'accès pour s'exécuter des opérations d'exportation.

Configurer les autorisations d'accès

Vous devez ensuite attribuer une autorisation à la fonction Cloud pour lancer les opérations d'exportation et écrire dans votre bucket GCS.

Cette fonction Cloud utilise le compte de service par défaut de votre projet pour authentifier et autoriser ses opérations d'exportation. Lorsque vous créez un projet, un compte de service par défaut est créé pour vous avec le nom suivant :

PROJECT_ID@appspot.gserviceaccount.com

Ce compte de service nécessite une autorisation pour démarrer une exportation opération et pour écrire dans votre bucket Cloud Storage. Pour accorder ces autorisations, attribuez les rôles IAM suivants au compte de service par défaut :

  • Cloud Datastore Import Export Admin
  • Rôle Owner ou Storage Admin dans le bucket

Vous pouvez utiliser les outils de ligne de commande gcloud et gsutil pour attribuer ces rôles.

Si ce n'est pas déjà fait, vous pouvez accéder à ces depuis Cloud Shell dans la console Google Cloud:
Démarrer le Cloud Shell

  1. Attribuez le rôle Administrateur des importations et des exportations Cloud Datastore. Remplacez l'élément PROJECT_ID et exécutez la commande suivante :

    gcloud projects add-iam-policy-binding PROJECT_ID \
        --member serviceAccount:PROJECT_ID@appspot.gserviceaccount.com \
        --role roles/datastore.importExportAdmin
  2. Attribuez le rôle Administrateur de l'espace de stockage sur votre bucket. Remplacez les éléments PROJECT_ID et BUCKET_NAME, puis exécutez la commande suivante :

    gsutil iam ch serviceAccount:PROJECT_ID@appspot.gserviceaccount.com:admin \
        gs://BUCKET_NAME

Si vous désactivez ou supprimez votre compte de service par défaut App Engine, votre App Engine appli n'aura plus accès à votre base de données Cloud Firestore. Si vous avez désactivé votre compte de service App Engine, vous pouvez le réactiver. consultez la section Activer un compte de service. Si vous avez supprimé votre compte de service App Engine au cours des 30 derniers jours, vous pouvez le restaurer, comme décrit dans la section Annuler la suppression d'un compte de service.

Tester votre job Cloud Scheduler et la fonction Cloud

Vous pouvez tester votre tâche Cloud Scheduler sur la page Cloud Scheduler de la console Google Cloud.

  1. Accédez à la page Cloud Scheduler de la console Google Cloud.
    Accéder à Cloud Scheduler

  2. Sur la ligne de votre nouveau job Cloud Scheduler, cliquez sur Exécuter.

    Après quelques secondes, la tâche Cloud Scheduler devrait mettre à jour le résultat. la colonne Success (Opération réussie) et Last run (Dernière exécution) à l'heure actuelle. Vous devrez peut-être cliquer sur Actualiser.

La page Cloud Scheduler confirme seulement que la tâche a appelé votre Cloud Functions. Ouvrez la page Fonction Cloud pour afficher les journaux de votre fonction.

Afficher les journaux Cloud Functions

Pour vérifier si la fonction Cloud a correctement démarré une opération d'exportation, ouvrez les journaux de la fonction :

Console Firebase

Accédez à la page Cloud Functions dans la console Firebase.

Accéder aux journaux de la fonction

Console GCP

Accédez à la page Cloud Functions de la console Google Cloud.

Accéder à la visionneuse de journaux

Afficher la progression de l'exportation

Vous pouvez utiliser la commande gcloud firestore operations list pour afficher la progression de vos opérations d'exportation. Voir Gestion des opérations d'exportation et d'importation.

Une fois l'exportation terminée, vous pouvez afficher les fichiers de sortie dans votre Bucket Cloud Storage:

Ouvrez le navigateur Cloud Storage.