0 / 0
Retourner à la version anglaise de la documentation
Exécution des travaux de flux de masquage
Dernière mise à jour : 28 janv. 2025
Exécution des travaux de flux de masquage

Lors du masquage des travaux de flux, les utilisateurs de données définissent la destination cible des copies de données masquées. Les travaux peuvent être planifiés, et à la fin d'un travail réussi, vous pouvez afficher le récapitulatif du rapport de travail.

Il existe deux manières de créer des travaux de flux de masquage :

  • Après avoir créé un flux de masquage, cliquez sur Configurer le travail.
  • Cliquez sur le menu Options sur un actif de données individuel pour ignorer la création d'un flux de masquage et configurer un travail de masquage directement pour cet actif de données.
Remarque: Au cours d'un travail de flux de masquage, des erreurs peuvent se produire lorsqu'il n'y a pas assez de mémoire pour prendre en charge le travail. Pour éviter les erreurs, la taille maximale des données ne peut pas être supérieure à 12Go.

Création d'un environnement de flux de masquage

Droits requis

Pour créer un modèle d'environnement, les deux conditions suivantes doivent être remplies :

  • Vous devez avoir le rôle d' administrateur ou d' éditeur dans le projet.
  • Vous devez appartenir au compte IBM Cloud du créateur du projet.

Pour créer un modèle d'environnement pour votre projet :

  1. Dans votre projet, cliquez sur l'onglet Gérer, puis sur la page Environnements.
  2. Dans la page Environnements, cliquez sur l'onglet Modèles, puis sur Nouveau modèle.
  3. Définissez les détails de l'environnement en saisissant un nom et une description (facultatif).
  4. Sous Type, cliquez sur Spark.
  5. Sous Configuration matérielle, spécifiez la configuration du pilote et de l'exécuteur en fonction de la taille de la table dans le travail de flux de masquage.
  6. Sous Nombre d'exécuteurs, augmentez le nombre d'exécuteurs pour améliorer les performances du flux de masquage lorsque les travaux sont configurés pour s'exécuter avec des partitions. Pour plus d'informations, voir la section Meilleures pratiques de la rubrique Gestion des performances professionnelles.
  7. Dans la liste des versions du logiciel, sélectionnez Masking Flow Spark.
  8. Cliquez sur Créer.

Utilisation des travaux

Pour configurer un travail :

  1. Entrez le nom du travail et ajoutez une description facultative du travail.
  2. Ajoutez la connexion cible dans laquelle vous voulez insérer une copie de données masquées. La connexion source est utilisée pour lire les données.
  3. Cliquez sur + pour ajouter une nouvelle connexion. Le schéma mappe le tableau source au tableau cible. Les définitions de table doivent déjà être configurées dans le schéma cible.
Astuce: Lorsque l'actif source est Apache Hive, utilisez Apache HDFS comme connexion cible.
  1. (Facultatif) Dans la page Partition, vous pouvez éventuellement modifier les détails de la partition de l'actif :
    • Si vous créez des flux de masquage avec l'option Définir l'échantillonnage, vous pouvez ignorer l'édition de la page Partition en réglant l'option Éditer les détails de la partition sur Désactivé.
    • Si vous avez des tables contenant de grandes quantités de données, envisagez de modifier les détails de la partition en spécifiant une colonne comme colonne de partition. Pour améliorer les performances du travail, vous pouvez augmenter le nombre de partitions. Pour plus d'informations, voir la section Meilleures pratiques de la rubrique Gestion des performances professionnelles.
  2. (Facultatif) Planifier un travail ou planifier un travail récurrent.
  3. Vérifiez et exécutez le travail.

En savoir plus

Rubrique parent: Masquage des données avec le flux Masquage