Divisez les ressources de données en ressources plus petites et plus ciblées en les segmentant sur la base des valeurs des colonnes.
Pour ajouter des actifs de données pour les données segmentées :
Sur la page du projet, cliquez sur l'onglet Actifs, puis sur Nouvel actif > Créer une vue dynamique des données.
Sélectionner la méthode de sélection des données Données de la colonne du segment.
Sélectionnez la colonne que vous souhaitez utiliser pour segmenter les données. Vous pouvez sélectionner une colonne à partir d'une ressource de données disponible dans votre projet ou sélectionner une colonne à partir d'une connexion dans votre projet sans créer de ressource de données connectée au préalable. Dans les deux cas, la connexion à la source de données doit prendre en charge les requêtes SQL.
Cependant, vous ne pouvez pas sélectionner les ressources de données qui ont été ajoutées au projet en tant que tables de sortie pour les règles de qualité des données. Si vous devez segmenter de telles tables, vous devez les importer explicitement à partir de la source de données.
Il faut également tenir compte du fait que certains types de données ne sont pas pris en charge dans les clauses WHERE. Les colonnes comportant de tels types de données sont exclues de la liste des colonnes parmi lesquelles vous pouvez faire votre choix.
S'il existe un profil de données pour la ressource, le nombre de valeurs distinctes dans la colonne sélectionnée est indiqué en fonction de l'échantillon profilé. Ce nombre peut ne pas correspondre au décompte réel si la base de données contient plus d'enregistrements que l'échantillon. Le décompte réel est disponible lorsque les valeurs sont extraites de la source.
Par défaut, le nombre maximum de valeurs distinctes extraites est de 100.
Selon les performances d'interrogation de la source de données, l'extraction des valeurs peut prendre un certain temps.
Si des actifs sont ajoutés au projet alors que vous consultez la liste des actifs de données pour sélectionner la colonne de segmentation, ces nouveaux actifs sont répertoriés, mais vous ne pouvez pas les sélectionner. Si vous souhaitez travailler avec l'un de ces actifs, annulez le processus de création et recommencez.
- Examinez les valeurs des colonnes et sélectionnez celles pour lesquelles vous souhaitez créer des ressources de données distinctes.
Cliquez sur Créer.
Une ressource de données pour chaque valeur sélectionnée est ajoutée à la page " Actifs du projet avec la convention de dénomination suivante : " nom de l'actif de données source "nom de la colonne "valeur distincte"
Pour différencier ces vues dynamiques des autres ressources de données, les ressources sont marquées par l'icône de données de référence (). Si les dossiers sont activés dans le projet, une vue dynamique est toujours créée dans le dossier racine, mais vous pouvez la déplacer dans n'importe quel sous-répertoire pour organiser vos vues dynamiques.
Etapes suivantes
- Affinage des données
- Enrichir les données avec davantage de métadonnées
- évaluer la qualité des données
Sujet parent : Ajouter une vue dynamique des données d'une connexion