0 / 0
Retourner à la version anglaise de la documentation
Importation de fichiers pour des jeux de données de référence
Dernière mise à jour : 09 déc. 2024
Importation de fichiers pour des jeux de données de référence

Vous pouvez créer des ensembles de données de référence en dehors du catalogue dans le format CSV (valeurs séparées par des virgules), puis importer ou réimporter des valeurs. Vous pouvez également importer des relations de mappage de valeur entre des valeurs dans plusieurs jeux de données de référence.

Utilisez l'une des méthodes suivantes pour importer des jeux de données de référence:

  • Importez un ou plusieurs jeux de données de référence à partir d'un fichier ZIP précédemment exporté à l'aide d'une demande d'API.

    Lors de l'importation d'ensembles de données de référence dans un fichier ZIP, comme décrit dans Importation de tous les artefacts de gouvernance d'une instance avec un fichier ZIP, vous devez toujours utiliser " merge_option=all dans l'appel API.

  • Importer la définition d'un ensemble de données de référence à partir d'un fichier CSV à l'aide de l'interface utilisateur ou d'une requête API. Plusieurs définitions d'ensembles de données de référence peuvent être importées dans un seul fichier. Cette méthode n'inclut pas les valeurs des données de référence - les valeurs doivent être importées séparément.

  • Importez les valeurs de données de référence à partir d'un fichier CSV pour un ensemble spécifique à l'aide de l'interface utilisateur ou d'une demande d'API.

  • Importez des valeurs de données de référence associées à partir d'un fichier CSV dans un jeu de données de référence existant à l'aide de l'interface utilisateur ou d'une demande d'API.

Remarque: le nombre maximal de valeurs pouvant être importées est 5000.

Les plansIBM Knowledge Catalog limitent le nombre et la taille des ensembles de données de référence que vous pouvez créer.

Lorsque vous importez ou exportez un jeu de données de référence dans un fichier ZIP, le fichier contient un fichier CSV qui définit les jeux de données de référence inclus dans ce fichier ZIP et, dans un dossier distinct, un fichier CSV par jeu avec ses valeurs de données de référence. Ces fichiers CSV ont un format différent.

Le fichier CSV de définition des ensembles de données de référence contient des informations sur les propriétés de chaque ensemble inclus, telles que son ID d'artefact, un nom, une description, la catégorie à laquelle il appartient et le type d'ensemble de données de référence. Il peut avoir le format suivant:

artifact_id,Name,Artifact Type,Category,Description,Secondary Categories,Related Terms,Data Set Type
026df326-74f2-4dce-8d6b-7d2f36b09d98,Customer Non Performing Loan Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,Distinguishes between Customers according to their number of outstanding non-performing loans.,ecf8fade-4956-4e92-9a56-308949f0cb58,a9a63e90-94df-4b00-95ec-a951189d2183,TEXT
0544a0b7-07b7-4509-8cbe-22e36caa218b,Household Life Cycle Status,reference_data,8a72919e-8c40-4a73-b190-4803deb2160d,Distinguishes between Households according to the state of existence of the Household.,ecf8fade-4956-4e92-9a56-308949f0cb58,3a6f0d98-64fc-4166-b3e4-7f2ebcbeac9f,TEXT
07cf348c-76a3-482c-9614-2b89edabbaaf,Financial Legal Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,"Distinguishes between Individuals or Organizations according to whether they are undergoing proceedings that affect their financial standing; for example, (US) Chapter 11 status, In Liquidation, In Receivership, Bankrupt.",ecf8fade-4956-4e92-9a56-308949f0cb58,03976617-abe9-4e5a-88cf-57193b22cce1,TEXT

Le fichier CSV pour les valeurs des données de référence se compose au minimum des colonnes suivantes qui sont définies pour l'ensemble des données de référence :

  1. Coder
  2. Valeur
  3. Description (facultatif)
  4. Parent (facultatif)

Il peut également contenir d'autres informations, telles que des valeurs de données de référence associées ou des colonnes personnalisées.

Par exemple, les premières lignes d'un jeu de données de référence pour des codes NAICS se présentent comme suit :

Code,value,description,parent
11,Agriculture, Forestry, Fishing and Hunting
111,Crop Production,Crop Produ,11
1111,Oilseed and Grain Farming,111
11111,Soybean Farming,Soybean Farming,1111
111110,Soybean Farming,Soybean Farming,1111
11112,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111
111120,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111

Pour plus d'informations sur le formatage des fichiers CSV, voir Format de fichier CSV pour l'importation d'artefacts de gouvernance. Les différentes méthodes d'importation sont décrites dans la rubrique Importation de méthodes pour les artefacts de gouvernance.

Les sections suivantes décrivent comment importer des fichiers CSV pour des jeux de données de référence à l'aide de l'interface utilisateur. Dans l'interface utilisateur, vous pouvez voir la barre de progression de la tâche d'importation, vous pouvez également afficher le récapitulatif de l'importation, avec des descriptions d'erreur. Notez que lors de l'importation de valeurs de données de référence, le nombre de valeurs enregistrées répertoriées dans le récapitulatif d'importation peut être différent du nombre de valeurs réellement importées. En effet, tous les doublons du fichier CSV sont comptés comme des valeurs sauvegardées, alors qu'un seul de ces doublons est finalement importé (en fonction de la méthode de traitement des doublons que vous choisissez).

Importation de fichiers avec définition d'un ensemble de données de référence

  1. Cliquez sur Gouvernance > Données de référence dans le menu principal.
  2. Cliquez sur Ajouter un ensemble de données de référence et sélectionnez Importer à partir d'un fichier.
  3. Sélectionnez un fichier CSV qui contient la définition de l'ensemble de données de référence comme décrit ci-dessus.
  4. Sélectionnez l'option de fusion. Notez que les options se rapportent à la définition de l'ensemble de données de référence, et non à ses valeurs. Les valeurs doivent être importées dans une étape distincte.
  5. Cliquez sur Suivant

En conséquence, une nouvelle définition de l'ensemble de données de référence est créée. Une fois créé, vous pouvez y ajouter des valeurs manuellement ou les importer à partir d'un autre fichier CSV, comme décrit dans la tâche suivante.

Importation de fichiers avec des valeurs de données de référence

Dans le jeu de données de référence sélectionné, cliquez sur Télécharger le fichier pour sélectionner un fichier CSV à partir duquel importer les valeurs:

  • Les lignes du fichier comportant des codes existants mettent à jour les lignes existantes.
  • Les lignes comportant de nouveaux codes sont ajoutées.

Lorsque vous importez des valeurs à partir du fichier CSV, vous mappez les colonnes du fichier vers des colonnes par défaut ou personnalisées. Si les colonnes n'existent pas, vous pouvez les créer.

Importation de colonnes personnalisées

Les valeurs d'un jeu de données de référence comportent par défaut les colonnes suivantes: code, valeur, description (facultatif) et parent (facultatif). Toutefois, vous souhaiterez peut-être capturer des informations supplémentaires liées au code dans des colonnes personnalisées. Par exemple, il se peut que vous disposiez d'un jeu de données de référence de codes pays et que vous souhaitiez capturer d'autres attributs tels que le premier ministre du pays, la langue ou des variantes du nom.

Vous pouvez ajouter des colonnes personnalisées lors de la création d'un jeu de données de référence à partir d'un fichier CSV dans lequel ces colonnes sont définies, ou lors de l'importation ou de la réimportation de valeurs à partir d'un fichier CSV dans un jeu de données de référence existant.

Voir l'exemple suivant d'une partie d'un fichier CSV avec des colonnes personnalisées. Ce fichier peut être utilisé pour importer ou réimporter des valeurs.

code,value,description,Capital City,National Day,Official Language,Population
AFG,Afghanistan,The Islamic Republic of Afghanistan,Kabul,19/08/1919,دری,37200000
ALA,Åland Islands,Åland,Mariehamn,07/05/1920,svɛ̂nːska,28007
ALB,Albania,The Republic of Albania,Tirana,28/11/1912,Albanian,2850000
DZA,Algeria,The People's Democratic Republic of Algeria,Algiers,05/07/1962,الجزائر‎,42200000
ASM,American Samoa,The Territory of American Samoa,Pago Pago,14/06/1889,English,55465

Pour importer des colonnes personnalisées dans le jeu de données de référence:

  1. Ouvrez le jeu de données de référence et cliquez sur Télécharger le fichier. Indiquez le fichier CSV et cliquez sur Suivant.
  2. Mappez les colonnes de votre fichier vers les colonnes par défaut ou existantes du jeu de données de référence. Pour ajouter une nouvelle colonne personnalisée, dans la liste déroulante Colonne cible , sélectionnez + Ajouter une colonne personnalisée (facultatif).
  3. Indiquez le nom de colonne, la description, le nombre maximal de caractères et indiquez si les valeurs de colonne doivent être validées par rapport au code d'un autre jeu de données de référence.
  4. Vous pouvez marquer la colonne personnalisée comme faisant partie de la clé composite. Les colonnes personnalisées qui font partie de la clé composite sont obligatoires par défaut.
  5. Répétez les étapes pour chaque colonne du fichier CSV que vous souhaitez mapper.
  6. Lorsque vous mappez toutes les colonnes, passez en revue les informations, réorganisez les colonnes si nécessaire, puis cliquez sur Sauvegarder.

Importation de valeurs associées

Vous pouvez importer des relations entre des valeurs dans des jeux de données de référence à l'aide d'un fichier CSV. Les valeurs des jeux de données de référence source et cible doivent exister dans le système pour créer des relations, sinon les relations ne sont pas importées. Commencez par importer les deux jeux de données de référence associés, puis utilisez les mêmes fichiers CSV pour importer les relations.

Consultez l'exemple suivant illustrant un fichier CSV contenant des mappages de valeurs :

code,value,description,map_1_n_to_states,map_1_1_continents
IND,India,Asian country,"KA,AP,MP,DL,GJ",ASIA
USA,America,North American Country,"CA,FL,NY,TX",NorthAmerica
GER,Germany,European Country,,Europe

Pour ajouter des valeurs associées en important un fichier CSV, procédez comme suit:

  1. Ouvrez le jeu de données de référence pour lequel vous souhaitez ajouter des valeurs associées.
  2. Dans le menu à trois points, cliquez sur Télécharger les valeurs associées.
  3. Ajoutez le fichier que vous souhaitez télécharger en le faisant glisser dans la fenêtre Importer des valeurs associées ou en parcourant le fichier. Cliquez ensuite sur Suivant.
  4. Choisissez dans votre fichier la colonne qui contient les valeurs de code que vous souhaitez mapper à une ou plusieurs autres valeurs de code.
  5. Choisissez le type de relation (un à un ou un à plusieurs) que vous souhaitez établir entre chaque valeur et valeur associée.
  6. Choisissez dans votre fichier la colonne contenant les codes associés des valeurs de référence que vous souhaitez mapper et le jeu de données de référence auquel appartiennent les valeurs associées.
  7. Cliquez sur Sauvegarder.

Remarque: Lorsque vous utilisez les fichiers CSV avec des valeurs de données de référence définies par une clé composite, assurez-vous que la relation parent entre les valeurs et les valeurs associées à mappage unique et à mappage multiple est représentée par la concaténation des valeurs de colonne personnalisées de clé CODE et de clé composite délimitées par |. Le code passe toujours en premier, puis les valeurs de colonne de clé composite, par exemple: CODE|CC1|CC2|CC3.

En savoir plus

Rubrique parent : Données de référence

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus