I dataset di riferimento forniscono raggruppamenti logici di valori di codice (valori di dati di riferimento), ad esempio codici prodotto e codici paese. Questi codici sono generalmente serie di valori consentiti associati a campi di dati e che possono essere assegnati a termini di business.
Si creano dataset di riferimento in IBM Knowledge Catalog in modo che gli standard aziendali possano essere acceduti centralmente dagli utenti o utilizzando le applicazioni tramite le API. Gli insiemi di dati di riferimento possono essere utilizzati anche per fornire il pattern di corrispondenza per le classi di dati, consentendo la classificazione automatica dei campi di dati tramite la creazione di profili e il rilevamento dei dati. Queste classi di dati possono quindi essere utilizzate nell'analisi della qualità dei dati per valutare la qualità e la coerenza dei valori nelle colonne di dati.
I dati di riferimento consentono, ad esempio, di definire una serie standard di valori per determinati campi. Può essere utile creare una definizione standard di codici paese e utilizzare questi dati di riferimento per garantire la conformità dei campi di codici paese. Diverse designazioni come "US", "USA", "Stati Uniti" e "America" possono essere risolte sullo stesso valore di dati di riferimento. Di conseguenza, è possibile ottenere dati molto più coerenti.
Vengono forniti anche dataset di riferimento predefiniti . Includono i valori di ubicazione fisica e di ubicazione sovrana per gli asset di dati in modo che sia possibile controllare l'accesso ai dati in base alla posizione con regole di ubicazione dati.
È possibile creare gerarchie per dataset di riferimento. Le gerarchie semplificano e velocizzano le ricerche dei dataset di riferimento. Ad esempio, se si stavano ricercando i dataset ma non erano disponibili informazioni sulla relazione, è necessario ricordare il contesto del dataset e ricercare i dataset uno alla volta. Tuttavia, con le informazioni sulla gerarchia, è possibile iniziare con un dataset specifico e navigare attraverso tutti i relativi insiemi correlati solo nel contesto di tale dataset.
È inoltre possibile creare relazioni tra valori in un dataset di riferimento e valori in uno o più dataset di riferimento differenti. Queste relazioni sono note come mappature di valori o cross - walk.
L'impostazione delle relazioni in questo modo consente di comprendere più facilmente in che modo i valori si interconnettono tra i dataset di riferimento e di ridurre il tempo che è possibile utilizzare per la ricerca manuale di tali valori. Ad esempio, nella seguente immagine è possibile vedere che il valore Stati Uniti d'America si associa a due valori differenti in un dataset di riferimento differente (agricoltura e agricoltura di soia) e il valore di un altro paese dell'India si associa a un valore di valuta in un altro dataset di riferimento.
Per informazioni sull'impostazione di valori correlati, vedere Importazione di file per dataset di riferimento.
Visualizzazione dei dataset di riferimento
Se si conosce il nome del dataset di riferimento che si sta cercando, è possibile utilizzare la barra di ricerca nella parte superiore per ricercare il nome. In caso contrario, passare a Governance > Dati di riferimento e fare clic sul nome della serie che si desidera visualizzare.
La tag Non sensibile al maiuscolo / minuscolo accanto al nome della serie contrassegna le serie per le quali la colonna del codice non è sensibile al maiuscolo / minuscolo e viene sempre salvata in maiuscolo. Per ulteriori informazioni, consultare Codice sensibile al maiuscolo / minuscolo.
Il pannello a sinistra Valori consente di visualizzare tutti i valori del dataset di riferimento selezionato. Quando si visualizza un elenco di valori dei dati di riferimento, è possibile utilizzare i seguenti metodi per individuare più rapidamente i valori richiesti:
- Utilizzare una barra di ricerca per immettere una query per un codice, un valore o un valore di colonna personalizzato.
- Utilizzare una delle 6 opzioni di filtro avanzate.
- Utilizzare la funzione di ordinamento.
Le opzioni di ricerca, filtro e ordinamento possono essere combinate.
Per utilizzare le opzioni di filtro:
- Aprire un dataset di riferimento e fare clic sull'icona Filtro nel campo di ricerca.
- Definire la prima condizione:
- Selezionare la colonna in base alla quale si desidera filtrare: Codice, Valore, Descrizione, Valore principale o qualsiasi altra colonna definita nel dataset di riferimento.
- Selezionare uno degli operatori condizione. Le opzioni disponibili dipendono dal tipo di colonna selezionato: Uguale, Non uguale, Contiene, Non contiene, Inizia con, Non inizia con, Termina con, Non termina con, Tra.
- Seleziona Value.
- Fare clic su E per definire un'altra condizione, se necessario.
- Fai clic su Applica.
Per ordinare l'elenco dei valori dei dati di riferimento:
- Fare clic sull'icona Ordina nella barra di ricerca e selezionare la colonna in base alla quale ordinare i valori.
- Selezionare il metodo di ordinamento. I metodi di ordinamento dipendono dal tipo di colonna selezionato.
- Fai clic su Applica.
Ulteriori informazioni
Argomento principale Risorse di governance (nuovo)