È possibile creare e gestire definizioni di qualità dei dati per definire la logica utile per l'analisi della qualità dei dati negli asset di dati.
Se si dispone delle autorizzazioni richieste, è possibile gestire le definizioni della qualità dei dati nei seguenti modi:
- Crea una definizione della qualità dei dati
- Pubblicare una definizione di qualità dei dati
- Modificare le proprietà di una definizione di qualità dei dati
- Eliminare una definizione di qualità dei dati non più necessaria
È anche possibile completare queste attività con le API invece che con l'interfaccia utente. I collegamenti a queste API sono elencati in Ulteriori informazioni .
Autorizzazioni richieste
Per visualizzare le definizioni della qualità dei dati, è necessario disporre almeno del ruolo Visualizzatore nel progetto.
Per creare, modificare o eliminare le definizioni di qualità dei dati, è necessario disporre dell' autorizzazione utente Gestisci asset di qualità dei dati e del ruolo Amministratore o Editor nel progetto.
Creazione di una definizione di qualità dei dati
Per creare una definizione di qualità dei dati:
Apri un progetto, fai clic Nuovo asset > Definisci come misurare la qualità dei dati .
Definisci dettagli:
- Specificare un nome per la definizione di qualità dei dati.
- Facoltativo: fornire una descrizione.
- Facoltativo: selezionare una dimensione di qualità dei dati per descrivere la metrica di qualità dei dati primaria per la logica della regola in questo asset. La dimensione selezionata può essere utilizzata come categoria di report, per il filtro o per la visualizzazione dei dati selezionati.
Definire la logica della regola. È possibile utilizzare l'editor in formato libero per creare la logica della regola. Immettere un'espressione nel campo Espressione regola . Per un elenco di espressioni che è possibile utilizzare, vedere Blocchi di generazione per la logica della regola. Controllare anche la serie di espressioni di regole di esempio. Questi esempi dimostrano come combinare i blocchi di creazione per la logica delle regole. È possibile copiare le espressioni fornite nelle proprie definizioni di qualità dei dati e utilizzarle come fornito o modificarle in base alle necessità.
Considerazioni speciali si applicano quando l'espressione contiene stringhe racchiuse tra doppi apici, ad esempio:
ucase(trim(var_first_name)) NOT contains "YOU'RE"
Tali valori vengono trattati come valori letterali stringa. Tuttavia, se si desidera che tali valori siano trattati come variabili, è possibile modificare l'impostazione del progetto
allow_quoted_variables
intrue
utilizzando l'API IBM Knowledge Catalog Sostituisci impostazioni del progetto per le regole di qualità dei dati.In alternativa alla scrittura delle proprie espressioni nell'editor in formato libero, è possibile utilizzare gli elementi di blocco per creare la logica della regola:
Seleziona un elemento dal gruppo Logic , ad esempio IF THEN. È possibile espandere la logica della regola con gli operatori AND, ORe NOT .
Selezionare Controlli, scegliere il tipo di controllo che si desidera utilizzare e collegarlo al blocco IF .
Selezionare tutte le condizioni necessarie per il controllo dai gruppi Variabili e letterali, Operazioni, Data e ora, Generale, Matematicoo Stringa e trascinarli nella logica Verifiche .
Selezionare uno o più tipi di controlli dal gruppo Controlli e collegarli al blocco THEN .
Selezionare tutte le condizioni necessarie per il controllo dai gruppi Variabili e letterali, Operazioni, Data e ora, Generale, Matematicoo Stringa e trascinarli nella logica Verifiche .
Ulteriori azioni diventano disponibili quando si fa clic con il pulsante destro del mouse sull'area di disegno o su un singolo blocco. Ad esempio, è possibile duplicare il blocco o aggiungere un commento.
Suggerimento:Aggiungere sempre commenti nella sezione del blocco. L'immissione o l'aggiornamento di commenti nell'area di testo Espressione della regola potrebbe non funzionare sempre come previsto.
È possibile eliminare un elemento di blocco o l'intero costrutto trascinandolo nel cestino.
Rivedere la logica della regola nel campo Espressione regola .
Quando si fa clic su Crea, la sintassi dell'espressione viene controllata. Se è valido, viene creata la definizione della qualità dei dati. È ora possibile creare regole di qualità dei dati da questa definizione.
Pubblicazione di una definizione di qualità dei dati
È possibile rendere disponibile qualsiasi definizione di qualità dei dati per il riutilizzo in altri progetti pubblicandola in un catalogo da cui è possibile aggiungerla a qualsiasi numero di progetti. Prima di farlo, assicurarsi che la descrizione della definizione della qualità dei dati fornisca informazioni significative. Tali informazioni aiutano altri utenti a scegliere la definizione di qualità dei dati corretta da utilizzare nel loro progetto.
Per pubblicare una definizione di qualità dei dati:
Selezionare la definizione di qualità dei dati dall'elenco di asset e fare clic su Pubblica nel catalogo. In alternativa, è possibile selezionare Pubblica nel catalogo dal menu di overflow dell'asset.
Selezionare il catalogo e inserire le proprietà dell'asset.
Se un duplicato di asset esiste già nel catalogo, è possibile specificare l'azione da intraprendere in questo caso. Le scelte disponibili sono determinate dall'impostazione predefinita del catalogo. Per ulteriori informazioni sulla gestione degli asset duplicati, consultare Gestione degli asset duplicati nei cataloghi.
Fare clic su Pubblica. Gli asset vengono aggiunti al catalogo e l'utente ne è il proprietario. I termini di business e i tag assegnati vengono pubblicati con l'asset. Le regole di governance assegnate non sono pubblicate. È necessario ricreare manualmente tali relazioni dopo la pubblicazione della definizione.
Anche l'espressione della regola e la dimensione di qualità dei dati selezionata sono pubblicate e disponibili nell'anteprima dell'asset nel catalogo.
Se una definizione di qualità dei dati ha un termine assegnato, la sezione Definizioni di qualità dei dati nella pagina Contenuto correlato del termine contiene una voce per ogni contenitore in cui risiede la definizione con tale relazione. Lo stesso vale per le relazioni con le regole di governance.
Quando si aggiunge una definizione di qualità dei dati da un catalogo a un progetto, le classificazioni assegnate e le relazioni eventualmente definite non vengono copiate nel progetto.
Modifica di una definizione di qualità dei dati
È possibile modificare una definizione di qualità dei dati per aggiornarne il nome, la descrizione, la dimensione di qualità dei dati selezionata, l'espressione della regola o qualsiasi termine di business o assegnazione di regole di governance.
Per modificare una definizione di qualità dei dati, aprire l'asset ed eseguire l'azione appropriata:
- Fare clic sull'icona Modifica ' accanto alla proprietà che si desidera modificare.
- Selezionare un'opzione dal menu di overflow accanto al nome dell'asset. Ad esempio, è possibile selezionare Rinomina per modificare il nome dell'asset.
Tenere presente che qualsiasi modifica all'espressione della regola influisce su tutte le regole derivate da questa definizione di qualità dei dati. Per vedere quali regole sono collegate a questa definizione di qualità dei dati, se ce ne sono, fare clic sull'icona Info '.
Eliminazione di una definizione di qualità dei dati
È possibile eliminare una definizione di qualità dei dati in uno dei seguenti modi:
- Nel progetto, selezionare la definizione di qualità dei dati e fare clic su Elimina.
- Aprire la definizione di qualità dei dati e selezionare Elimina dal menu di overflow accanto al nome della definizione di qualità dei dati.
Se le regole di qualità dei dati si basano su questa definizione di qualità dei dati, è necessario eliminare tali regole prima di poter eliminare la definizione.
Ulteriori informazioni
- Asset di qualità dei dati
- Blocchi di creazione per la logica della regola
- Esempio di espressioni di regole
- Gestione delle regole di qualità dei dati
- Gestione degli asset duplicati nei cataloghi
- IBM Knowledge Catalog API: Creazione di una definizione di qualità dei dati
- API IBM Knowledge Catalog : Convalida dell'espressione di definizione della qualità dei dati
- API IBM Knowledge Catalog : Pubblicare una risorsa
- IBM Knowledge Catalog API: Aggiornamento della definizione di qualità dei dati
- API di IBM Knowledge Catalog : Eliminare le definizioni di qualità dei dati non più necessarie
Argomento principale: Gestione della qualità dei dati