Exécutez une analyse de clé primaire pour identifier des clés primaires uniques ou composées dans les actifs de données d'une base de données relationnelle. Une clé primaire identifie de manière unique chaque enregistrement d'un actif de données. Chaque actif de données ne peut avoir qu'une seule clé primaire.
Validez les clés primaires qui sont déjà définies dans vos données et identifiez les colonnes qui sont candidates pour les clés primaires. Une clé primaire doit être unique et ne peut pas contenir de valeurs NULL.
Ce type d'analyse identifie les clés primaires à une seule colonne pour un actif de données en localisant une colonne qui se qualifie en tant qu'identificateur unique pour vos données. Pour identifier une clé primaire à plusieurs colonnes ou composée , l'analyse détermine quelles combinaisons de colonnes contiennent des valeurs uniques, ce qui les rend candidates pour les clés primaires. Les valeurs des différentes combinaisons de colonnes sont évaluées et l'unicité des valeurs concaténées est calculée. Seules les colonnes adjacentes sont vérifiées.
Seules les colonnes et les combinaisons de colonnes dont le niveau de fiabilité dépasse le seuil défini, que ce soit dans les paramètres d'enrichissement ou pour une exécution individuelle, sont suggérées en tant que clés primaires. Si une clé primaire est déjà définie dans vos données, elle est automatiquement affectée. Ces informations doivent être explicitement incluses dans une importation de métadonnées. Vous pouvez toujours utiliser les résultats d'une analyse de clé primaire pour valider les clés primaires définies.
- Prérequis
- Définition manuelle des clés primaires
- Exécution d'une analyse de clé primaire
- Vérification des résultats d'analyse et affectation de touches
- Annulation de l'affectation ou de la suppression de clés
- Accès aux détails d'exécution de travail
Prérequis
Le service DataStage doit être déployé pour exécuter l'analyse de clé primaire.
Toutes les opérations exécutées dans le cadre d'un enrichissement de métadonnées requièrent des données d'identification pour une autorisation sécurisée. En règle générale, votre clé d'API utilisateur est utilisée pour exécuter ces opérations de longue durée sans interruption. Si les données d'identification ne sont pas disponibles lorsque vous tentez d'exécuter une analyse de clé primaire, vous êtes invité à créer une clé d'API. Cette clé d'API est ensuite sauvegardée en tant que données d'identification de la tâche. Voir Gestion de la clé d'API utilisateur.
Si l'une des connexions aux sources de données est verrouillée, vous êtes invité à entrer vos données d'identification personnelles. Il s'agit d'une étape unique qui déverrouille définitivement les connexions pour vous.
Vous pouvez exécuter une analyse de clé primaire sans créer de profils d'actif au préalable. L'analyse ne repose pas sur des informations de profil telles que la distribution de fréquence des valeurs de colonne. A la place, les données de colonne sont analysées directement.
Définition manuelle des clés primaires
Si vos données ont déjà été analysées avec l'option Données de profil , vous pouvez définir une clé primaire sans exécuter d'analyse de clé ou de relation, ou vous pouvez modifier une affectation. Ouvrez la vue de colonne d'un actif en cliquant sur le nom de l'actif ou en sélectionnant Afficher les colonnes dans le menu déroulant dynamique.
- Pour définir une clé primaire à une seule colonne, sélectionnez une colonne et sélectionnez Plus > Affecter en tant que clé primaire dans la barre d'outils.
- Pour définir une clé primaire à plusieurs colonnes, sélectionnez les colonnes que vous souhaitez définir comme clé primaire et sélectionnez Plus > Affecter en tant que clé primaire composée dans la barre d'outils.
Lorsque vous remplacez une clé primaire, les relations de l'ancienne clé primaire ne sont pas affectées. Vous devez définir de nouvelles relations.
Exécution d'une analyse de clé primaire
Pour exécuter une analyse de clé primaire pour un ou plusieurs actifs:
Ouvrez l'actif d'enrichissement des métadonnées.
Dans l'onglet Actifs , sélectionnez les actifs requis.
Sélectionnez Enrichir > Identifier les clés primaires dans la barre d'outils.
Par défaut, cette analyse est exécutée sur une seule colonne. Toutefois, une seule colonne peut ne pas répondre aux critères d'une clé primaire. Dans ce cas, vous pouvez choisir d'exécuter l'analyse sur plusieurs colonnes pour créer une clé primaire composée. L'analyse concatène les valeurs des différentes combinaisons de colonnes, calcule l'unicité des valeurs concaténées et détermine ainsi les combinaisons de colonnes qui contiennent des valeurs uniques, ce qui en fait des candidats à la clé primaire. Cette analyse peut prendre beaucoup de temps en fonction de la taille d'un actif de données.
Cliquez sur le bouton Exécuter. Vous êtes averti lorsque l'analyse est terminée, mais vous devrez peut-être actualiser les résultats d'enrichissement pour voir les nouvelles clés primaires.
Par défaut, toutes les clés primaires qui sont identifiées lors de l'analyse ont le statut de candidat, ce qui signifie qu'elles sont affichées en tant que clés suggérées, sauf si vos données contiennent déjà des clés primaires définies. Dans ce cas, ces colonnes sont affectées en tant que clés primaires lors de l'analyse.
L'exécution d'une autre analyse de clé primaire supprime toutes les clés primaires précédemment suggérées qui n'ont pas été trouvées lors de l'analyse en cours. Par exemple, l'exécution d'une analyse de clé primaire à une seule colonne supprime tous les candidats de clé primaire composée identifiés lors d'une analyse précédente.
Vérification des résultats d'analyse et affectation de touches
Passez en revue les clés d'un actif dans l'onglet Clés du panneau des détails de l'actif. Si vos données contiennent déjà une clé primaire, elles sont affichées ici comme affectées. En outre, toutes les clés suggérées sont répertoriées ici. Pour modifier la clé primaire attribuée, cliquez sur l'icône Editer .
La liste complète des clés fournit les informations suivantes:
- Nom d'une colonne suggérée ou affectée en tant que clé primaire ou liste de noms de colonne pour une clé primaire composée
- Nombre de colonnes constituant la clé primaire affectée ou candidate
- Type de données de la ou des colonnes constituant la clé primaire affectée ou candidate
- Cote de confiance pour l'affectation ou la suggestion d'une clé
- Nombre et pourcentage de valeurs distinctes, uniques et nulles pour chaque clé
- Statut de la clé, qui peut être Affecté ou Suggéré
- Date à laquelle la colonne a été modifiée pour la dernière fois
Pour affecter une clé primaire ou remplacer la clé affectée, sélectionnez Affecter dans le menu déroulant dynamique de la clé. Si vous remplacez la clé primaire existante, toutes les relations de l'ancienne clé primaire ne sont pas affectées. Vous pouvez ensuite définir de nouvelles relations.
Annulation de l'affectation ou suppression de clés
Vous pouvez annuler l'affectation d'une clé affectée. Dans ce cas, toutes les relations de cette clé primaire sont également non affectées et le statut de la clé est suggéré. Vous pouvez ensuite affecter une nouvelle clé primaire et définir les relations correspondantes.
Vous pouvez également supprimer entièrement une clé affectée ou suggérée. Les relations de cette clé ne sont pas affectées. Une clé supprimée peut être suggérée ou affectée à nouveau lors de la réexécution de l'analyse de la clé primaire.
Accès aux détails d'exécution de travail
Vous pouvez accéder aux détails du travail pour l'enrichissement des métadonnées générales à partir du panneau latéral, mais vous devez accéder à l'onglet Travaux du projet pour voir les travaux d'analyse de clé primaire. Le travail est de type Key Analysis for Metadata Enrichment Assets. Le nom de travail suit le modèle metadata_enrichment_name (PK Detection).
En savoir plus
Rubrique parent : Enrichissement de vos données