0 / 0
Retourner à la version anglaise de la documentation
Examen et mise à jour des résultats de l'enrichissement dans le cadre d'un programme externe
Dernière mise à jour : 16 oct. 2024
Examen et mise à jour des résultats de l'enrichissement dans le cadre d'un programme externe

Vous souhaitez utiliser un environnement de feuille de calcul familier pour réviser et gérer les affectations de classes de données et de termes pour les actifs de données dans le cadre d'un enrichissement de métadonnées unique.

Exigences et restrictions

Pour la gestion des affectations de classes de données et de termes dans une feuille de calcul, les exigences et restrictions suivantes existent.

Configuration prérequise

Le module d'extension Review metadata Office doit être déployé dans votre organisation et vous devez disposer d'une copie du modèle de classeur Microsoft Excel fourni avec le module d'extension.

Un administrateur Microsoft peut télécharger le fichier manifest.xml et le modèle de classeur Review metadata - IBM Knowledge Catalog.xlsx à partir du dossier metadata-enrichment dans le dépôt IBM Knowledge Catalog samples GitHub à l'adresse suivante : https://github.com/IBM/knowledge-catalog-samples

Les instructions de personnalisation du fichier manifest.xml sont fournies dans le fichier Readme qui accompagne le fichier manifeste et le modèle Excel.

L'administrateur doit déployer et publier le module complémentaire comme décrit dans la documentation Microsoft Deploy and publish Office Add-ins.

Vous devez activer le module d'extension Review metadata Excel. Pour plus d'informations sur la procédure à suivre, consultez la documentation qui s'applique à votre version d'Excel.

Restrictions

Avant de commencer à utiliser le classeur et le module complémentaire, passez en revue les informations de la rubrique Problèmes liés au module complémentaire Microsoft Excel.

A quoi ressemble le classeur

Les classeurs se composent de 5 feuilles protégées:

Réviser le classeur de métadonnées
Feuille Contenu
Actifs de données Colonnes:
Connexion
Chemin de données
Actif de données
Colonne
Type
Description
Classes de données affectées / suggérées
Classe de données
Termes métier affectés / suggérés
Colonnes de termes métier. Par défaut, 3 colonnes sont fournies. Vous pouvez ajouter d'autres colonnes. Voir Révision et mise à jour des affectations.
Termes métier Colonnes:
Nom
Abbr. Liste des abréviations définies pour le terme.
Chemin de catégorie
Nom distinctif. S'il existe plusieurs termes portant le même nom, le nom et le chemin de la catégorie sont répertoriés ici pour aider à distinguer les termes.
Description
Catégories secondaires
Etiquettes
Classifications
Début effectif
Fin effective
Classes de données Colonnes:
Nom
Chemin de la catégorie
Nom distinctif. S'il existe plusieurs classes de données portant le même nom, le nom et le chemin de la catégorie sont répertoriés ici pour aider à distinguer les classes de données.
Description
Catégories secondaires
Etiquettes
Classifications
Début effectif
Fin effective
Catégories Colonnes:
Nom
Chemin
Description
Balises
Classifications
Knowledge Catalog Informations de téléchargement
Informations de téléchargement

Extraction de données depuis Cloud Pak for Data

Pour charger les données dans le classeur:

  1. Créez une copie du modèle de classeur pour chaque enrichissement de métadonnées sur lequel vous souhaitez travailler. Attribuez à chaque copie un nom significatif, par exemple, incluez le nom du projet et le nom de l'enrichissement des métadonnées. Ainsi, vous pouvez facilement identifier où les données appartiennent.

  2. Ouvrez un classeur. Si vous avez déjà activé le complément, le ruban Excel Home contient le bouton Réviser les métadonnéesIBM Knowledge Catalog Réviser les métadonnées). Si vous ne voyez pas ce bouton, activez le complément maintenant en suivant les instructions qui s'appliquent à votre version d'Excel.

    Pour ouvrir le panneau des tâches complémentaires, cliquez sur le bouton Vérifier les métadonnées .

  3. Connectez-vous avec vos données d'identification Cloud Pak for Data .

  4. Extrayez les artefacts de gouvernance et les actifs de données. Vous pouvez télécharger ces informations en deux étapes distinctes. Toutefois, vous devez télécharger les artefacts de gouvernance avant de télécharger les actifs de données. Sinon, les affectations ne peuvent pas être affichées.

    • Extraire les artefacts de gouvernance

      Ajoutez des informations sur toutes les classes de données et les termes commerciaux définis dans Cloud Pak for Data aux feuilles correspondantes du classeur. Ajoutez également des informations sur les catégories auxquelles appartiennent les classes de données et les termes.

    • Extraire des actifs de données

      Sélectionnez un projet et un enrichissement de métadonnées, puis téléchargez les actifs de données qui se trouvent dans la portée de l'enrichissement de métadonnées sélectionné. Si vous ne voyez pas de projet nouvellement créé dans la liste des projets, rechargez le module complémentaire.

    Important: Pour éviter toute non-concordance de données potentielle, utilisez toujours un nouveau classeur pour l'extraction de données, même si vous extrayez des données d'un enrichissement de métadonnées sur lequel vous avez travaillé précédemment.

Une fois que vous avez correctement extrait les informations, la feuille Knowledge Catalog est remplie avec les informations suivantes:

  • Nom d'hôte Cloud Pak for Data
  • Noms du projet et enrichissement des métadonnées à partir desquels les données ont été chargées. La feuille de calcul reflète toujours les noms d'affichage lors de l'extraction initiale. Elles ne sont pas mises à jour lorsque le nom du projet ou l'enrichissement des métadonnées est modifié dans IBM Knowledge Catalog. Toutefois, cela n'a pas d'impact sur les mises à jour lors du téléchargement car elles sont effectuées à l'aide des ID de ressource, qui sont non modifiables.
  • Date et heure de téléchargement des artefacts de gouvernance et des actifs de données

En outre, l'option de téléchargement est activée dans le panneau des tâches complémentaires.

Les feuilles Termes métier, Classes de donnéeset Catégories contiennent les informations répertoriées dans la rubrique A quoi ressemble le classeur.

La feuille Actifs de données contient une liste alphabétique des actifs de données, suivie d'une liste alphabétique de toutes les colonnes. Les colonnes de la feuille Actifs de données sont renseignées comme suit:

Colonne de feuille Modifiable Actif de données Colonne d'actif
connexion Non Nom de connexion Nom de connexion
Data path Non Schéma Schéma
Actif de données Non Nom de l'actif Nom de l'actif
Colonne Non
Nom de colonne
Type Non Défini sur Dataset Défini sur Field
description Oui Toute description pouvant être disponible pour l'actif de données Toute description pouvant être disponible pour la colonne d'actif
Classes de données affectées / suggérées Non Classes de données affectées et suggérées
Une classe de données affectée est également répertoriée dans la colonne Classe de données .
Classes de données affectées et suggérées
Une classe de données affectée est également répertoriée dans la colonne Classe de données .
Classe de données Non pour l'actif de données
Oui pour les colonnes d'actif
Classe de données affectée Classe de données affectée
Termes métier affectés/suggérés Non Termes affectés et termes suggérés
Les termes affectés sont également répertoriés dans des colonnes Terme métier distinctes.
Termes affectés et termes suggérés
Les termes affectés sont également répertoriés dans des colonnes Terme métier distinctes.
Terme métier
Le nombre de colonnes peut varier. La valeur par défaut est 3 colonnes. Si des termes supplémentaires sont affectés à l'actif de données ou à la colonne d'actif, des colonnes sont ajoutées selon les besoins. Vous pouvez ajouter d'autres colonnes si nécessaire. Voir Révision et mise à jour des affectations.
Oui Terme affecté Terme affecté

Vérification et mise à jour des affectations

Pour passer en revue et mettre à jour les métadonnées:

  1. Vérifiez les colonnes Classe de données et Termes métier .

  2. Ne modifiez pas les affectations correctes. Remplacez ou supprimez les affectations incorrectes. Pour les termes métier, vous pouvez en ajouter autant que nécessaire. Chaque terme doit se trouver dans une colonne distincte. Par défaut, la feuille contient 3 colonnes pour les termes métier. Vous pouvez ajouter des colonnes supplémentaires comme suit:

    1. Déprotégez la feuille Actif de données .
    2. Sélectionnez la dernière colonne Terme métier .
    3. Cliquez avec le bouton droit de la souris n'importe où dans cette colonne et sélectionnez Insérer.
    4. Facultatif: ajoutez l'en-tête de colonne Terme métier.
    5. Protégez à nouveau la feuille.

    Vous pouvez maintenant utiliser cette nouvelle colonne pour affecter des termes métier.

Téléchargement des résultats révisés

Une fois votre revue terminée, téléchargez les métadonnées mises à jour dans Cloud Pak for Data. Il n'est pas nécessaire de sauvegarder le classeur avant de commencer le téléchargement.

Les données que vous téléchargez écrasent les résultats de l'enrichissement dans le projet. Toutes les classes de données précédemment affectées sont désaffectées et marquées comme des suggestions. Ensuite, les affectations des classes de données et des termes commerciaux sont mises à jour comme spécifié dans la feuille de calcul. Les descriptions de la feuille de calcul remplacent les descriptions d'actif et de colonne dans le projet. Toutes les colonnes et tous les actifs sont marqués comme révisés.

En savoir plus

Rubrique parent : Gestion de l'enrichissement des métadonnées

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus