0 / 0

Importazione di file per i dataset di riferimento

Ultimo aggiornamento: 05 apr 2025
Importazione di file per i dataset di riferimento

È possibile creare dataset di riferimento al di fuori del catalogo in formato CSV (valore separato da virgola), quindi importare o reimportare valori. È inoltre possibile importare le relazioni di mappatura del valore tra i valori in più dataset di riferimento.

Utilizzare uno dei seguenti metodi per importare i dataset di riferimento:

  • Importare uno o più dataset di riferimento da un file ZIP precedentemente esportato utilizzando una richiesta API.

    Quando si importano set di dati di riferimento in un file ZIP, come descritto in Importazione di tutti gli artefatti di governance da un'istanza con un file ZIP, è necessario utilizzare sempre 'merge_option=all nella chiamata API.

  • Importare la definizione del set di dati di riferimento da un file CSV utilizzando l'interfaccia utente o una richiesta API. È possibile importare più definizioni di set di dati di riferimento in un unico file. Questo metodo non include i valori dei dati di riferimento: i valori devono essere importati separatamente.

  • Importare i valori dei dati di riferimento da un file CSV per una serie specifica utilizzando l'interfaccia utente o una richiesta API.

  • Importare i valori dei dati di riferimento correlati da un file CSV in un dataset di riferimento esistente utilizzando l'interfaccia utente o una richiesta API.

Nota: il numero massimo di valori che è possibile importare è 5000.

I piani diIBM Knowledge Catalog hanno dei limiti sul numero e sulle dimensioni dei set di dati di riferimento che è possibile creare.

Quando si importa o si esporta un dataset di riferimento in un file ZIP, il file contiene un file CSV che definisce i dataset di riferimento inclusi in tale file ZIP e, in una cartella separata, un file CSV per serie con i relativi valori dei dati di riferimento. Questi file CSV hanno un formato diverso.

Il file CSV di definizione del set di dati di riferimento contiene informazioni sulle proprietà di ciascun set incluso, come l'ID dell'artefatto, il nome, la descrizione, la categoria di appartenenza e il tipo di set di dati di riferimento. Potrebbe avere il seguente formato:

artifact_id,Name,Artifact Type,Category,Description,Secondary Categories,Related Terms,Data Set Type
026df326-74f2-4dce-8d6b-7d2f36b09d98,Customer Non Performing Loan Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,Distinguishes between Customers according to their number of outstanding non-performing loans.,ecf8fade-4956-4e92-9a56-308949f0cb58,a9a63e90-94df-4b00-95ec-a951189d2183,TEXT
0544a0b7-07b7-4509-8cbe-22e36caa218b,Household Life Cycle Status,reference_data,8a72919e-8c40-4a73-b190-4803deb2160d,Distinguishes between Households according to the state of existence of the Household.,ecf8fade-4956-4e92-9a56-308949f0cb58,3a6f0d98-64fc-4166-b3e4-7f2ebcbeac9f,TEXT
07cf348c-76a3-482c-9614-2b89edabbaaf,Financial Legal Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,"Distinguishes between Individuals or Organizations according to whether they are undergoing proceedings that affect their financial standing; for example, (US) Chapter 11 status, In Liquidation, In Receivership, Bankrupt.",ecf8fade-4956-4e92-9a56-308949f0cb58,03976617-abe9-4e5a-88cf-57193b22cce1,TEXT

Il file CSV per i valori dei dati di riferimento è composto almeno dalle seguenti colonne definite per il set di dati di riferimento:

  1. Codice
  2. Valore
  3. Descrizione (facoltativa)
  4. Elemento principale (facoltativo)

Potrebbe contenere anche altre informazioni, come i valori dei dati di riferimento correlati o le colonne personalizzate.

Ad esempio, le prime diverse righe di un dataset di riferimento per i codici NAICS assomigli a questo:

Code,value,description,parent
11,Agriculture, Forestry, Fishing and Hunting
111,Crop Production,Crop Produ,11
1111,Oilseed and Grain Farming,111
11111,Soybean Farming,Soybean Farming,1111
111110,Soybean Farming,Soybean Farming,1111
11112,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111
111120,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111

Per ulteriori informazioni sulla formattazione dei file CSV in Formato file CSV per l'importazione di risorse di governance. I differenti metodi di importazione sono descritti in Metodi di importazione per le risorse di governance.

Le sezioni riportate di seguito descrivono come importare i file CSV per i dataset di riferimento utilizzando la UI. Nella UI, è possibile visualizzare la barra di avanzamento dell'attività di importazione, è anche possibile visualizzare il riepilogo dell'importazione, con le descrizioni degli errori. Notare che quando si importano i valori dei dati di riferimento, il numero di valori salvati elencati nel riepilogo di importazione potrebbe essere diverso dal numero di valori effettivamente importati. Questo perché tutti i duplicati del file CSV vengono conteggiati come valori salvati, mentre solo uno di questi duplicati viene eventualmente importato (a seconda del metodo di gestione dei duplicati scelto).

Importazione di file con definizione di set di dati di riferimento

  1. Fare clic su Governance > Dati di riferimento nel menu principale.
  2. Fare clic su Aggiungi set di dati di riferimento e selezionare Importa da file.
  3. Selezionare un file CSV contenente la definizione del set di dati di riferimento come descritto sopra.
  4. Selezionare l'opzione di fusione. Si noti che le opzioni riguardano la definizione del set di dati di riferimento, non i suoi valori. I valori devono essere importati in una fase separata.
  5. Fare clic su Avanti

Di conseguenza, viene creata una nuova definizione di set di dati di riferimento. Una volta creato, è possibile aggiungere i valori manualmente o importarli da un altro file CSV, come descritto nella seguente attività.

Importazione di file con valori di dati di riferimento

Nel dataset di riferimento selezionato, fare clic su Carica file per selezionare un file CSV da cui importare i valori:

  • Le righe nel file con codici esistenti aggiornano le righe esistenti.
  • Le righe con nuovi codici vengono aggiunte.

Quando si importano i valori dal file CSV, si associano le colonne dal file ad eventuali colonne predefinite o personalizzate. Se le colonne non esistono, è possibile crearle.

Importazione di colonne personalizzate

I valori in un dataset di riferimento impostati per impostazione predefinita hanno le seguenti colonne: codice, valore, descrizione (opzionale) e principale (opzionale). Tuttavia, è possibile che si desideri acquisire ulteriori informazioni correlate al codice in colonne personalizzate. Ad esempio, potresti avere un dataset di riferimento di codici di paese e voler catturare alcuni altri attributi come primo ministro del paese, lingua o nomi alternativi.

È possibile aggiungere colonne personalizzate durante la creazione di un dataset di riferimento da un file CSV in cui sono definite tali colonne oppure durante l'importazione o la reimportazione di valori da un file CSV in un dataset di riferimento esistente.

Vedere il seguente esempio di una porzione di un file CSV con colonne personalizzate. Questo file può essere utilizzato per importare o reimportare i valori.

code,value,description,Capital City,National Day,Official Language,Population
AFG,Afghanistan,The Islamic Republic of Afghanistan,Kabul,19/08/1919,دری,37200000
ALA,Åland Islands,Åland,Mariehamn,07/05/1920,svɛ̂nːska,28007
ALB,Albania,The Republic of Albania,Tirana,28/11/1912,Albanian,2850000
DZA,Algeria,The People's Democratic Republic of Algeria,Algiers,05/07/1962,الجزائر‎,42200000
ASM,American Samoa,The Territory of American Samoa,Pago Pago,14/06/1889,English,55465

Per importare le colonne personalizzate nel dataset di riferimento:

  1. Aprire il dataset di riferimento e fare clic su Carica file. Fornire il file CSV e fare clic su Avanti.
  2. Mappare le colonne del proprio file con le colonne predefinite o esistenti nel set di dati di riferimento. Per aggiungere una nuova colonna personalizzata, dall'elenco a discesa Colonna di destinazione , selezionare + Aggiungi colonna personalizzata (facoltativo).
  3. Fornire il nome colonna, la descrizione, il numero massimo di caratteri e specificare se convalidare i valori della colonna rispetto al codice di un altro dataset di riferimento.
  4. È possibile contrassegnare la colonna personalizzata come parte della chiave composta. Le colonne personalizzate che fanno parte della chiave composta sono obbligatorie per impostazione predefinita.
  5. Ripetere i passaggi per ogni colonna dal file CSV che si desidera mappare.
  6. Quando si associano tutte le colonne, rivedere le informazioni, riorganizzare le colonne se necessario e fare clic su Salva.

Importazione di valori correlati

È possibile importare relazioni tra valori in dataset di riferimento utilizzando un file CSV. I valori nei dataset di riferimento di origine e di destinazione devono esistere nel sistema per creare le relazioni, altrimenti le relazioni non vengono importate. Prima importare entrambi i dataset di riferimento correlati, quindi utilizzare gli stessi file CSV per importare relazioni.

Consultare il seguente esempio di un file CSV con associazioni di valori.

code,value,description,map_1_n_to_states,map_1_1_continents
IND,India,Asian country,"KA,AP,MP,DL,GJ",ASIA
USA,America,North American Country,"CA,FL,NY,TX",NorthAmerica
GER,Germany,European Country,,Europe

Per aggiungere valori correlati importando un file CSV, completare la seguente procedura:

  1. Aprire la serie di dati di riferimento per cui si desidera aggiungere valori correlati.
  2. Dal menu a tre punti, fare clic su Carica valori correlati.
  3. Aggiungere il file che si desidera caricare trascinandolo nella finestra Importa valori correlati o ricercando il file. Fare clic su Avanti.
  4. Scegliere la colonna dal file che contiene i valori di codice che si desidera associare a uno o più altri valori di codice.
  5. Scegliere il tipo di relazione (uno - a - uno o uno - a - molti) che si desidera tra ciascun valore e il valore correlato.
  6. Scegliere la colonna dal file che ha i relativi codici dei valori di riferimento a cui si desidera associare e a quale dataset di riferimento appartengono i valori correlati.
  7. Fare clic su Salva.

Nota: quando si utilizzano i file CSV con i valori dei dati di riferimento definiti da una chiave composita, assicurarsi che la relazione principale tra i valori e i valori correlati singoli e multipli siano rappresentati come concatenazione dei valori delle colonne personalizzate CODE e delle chiavi composite delimitati da |. Il codice va sempre per primo, quindi i valori delle colonne delle chiavi composite, ad esempio: CODE|CC1|CC2|CC3.

Ulteriori informazioni

Argomento principale: Dati di riferimento