Le profilage avancé fournit des résultats plus précis que le profilage normal, mais il prend plus de temps car de grandes quantités de données doivent être traitées.
Le service DataStage doit être déployé pour exécuter le profilage avancé.
Toutes les opérations exécutées dans le cadre d'un enrichissement de métadonnées requièrent des données d'identification pour une autorisation sécurisée. En règle générale, votre clé d'API utilisateur est utilisée pour exécuter ces opérations de longue durée sans interruption. Si les données d'identification ne sont pas disponibles lorsque vous tentez d'exécuter un profilage avancé, vous êtes invité à créer une clé d'API. Cette clé d'API est ensuite sauvegardée en tant que données d'identification de la tâche. Voir Gestion de la clé d'API utilisateur.
Si l'une des connexions aux sources de données est verrouillée, vous êtes invité à entrer vos données d'identification personnelles. Il s'agit d'une étape unique qui déverrouille définitivement les connexions pour vous.
Pour exécuter le profilage de données avancé sur un ou plusieurs actifs:
Ouvrez l'actif d'enrichissement des métadonnées.
Dans l'onglet Actifs , sélectionnez les actifs requis.
Sélectionnez Enrichir > Exécuter un profilage de données avancé dans la barre d'outils.
Facultatif: personnalisez les paramètres.
Indiquez si vous souhaitez écrire les informations de distribution de fréquence dans une table de base de données et déterminer le nombre de valeurs distinctes que vous souhaitez capturer.
Sans table de sortie, les 100 premières valeurs distinctes sont capturées et stockées en interne. Vous pouvez afficher et télécharger ces informations à partir de la page Statistiques d'un profil de colonne.
Si vous choisissez d'écrire des informations de distribution de fréquence dans une table, activez l'option Sortie externe . La section est préremplie avec les paramètres d'enrichissement par défaut. Voir Paramètres de profilage avancés. Vous pouvez modifier les paramètres selon les besoins pour cette exécution de profilage avancée individuelle. Si vous modifiez la table de sortie, vous pouvez également définir cette table comme nouvel emplacement par défaut, écrasant ainsi le paramètre par défaut précédent.
Vous pouvez accéder à cette table en utilisant des requêtes de base de données standard ou par le biais du profil de colonne détaillé. Pour plus d'informations, voir Répartition des fréquences.
Sélectionnez un type d'échantillonnage. Voir Création d'un actif d'enrichissement de métadonnées.
Cliquez sur le bouton Exécuter. Vous êtes averti lorsque l'analyse est terminée.
En savoir plus
Rubrique parent : Enrichissement de vos données