Le dimensioni della qualità dei dati descrivono una caratteristica misurabile dei dati e aiutano a definirne i requisiti. Utilizzare le dimensioni della qualità dei dati per determinare i risultati previsti della valutazione della qualità dei dati, sia che si tratti di una valutazione iniziale o di un monitoraggio in corso.
Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.
L'associazione Data Management (DAMA) International ha pubblicato un articolo che descrive 6 dimensioni principali della qualità dei dati:
Dimensione | Descrizione | Controlli di qualità dei dati predefiniti che identificano i problemi associati a questa dimensione |
---|---|---|
Accuratezza | I valori dei dati sono il più vicini possibile ai valori reali. | Nessuno. |
Completezza | Sono presenti tutti i valori dei dati richiesti. | Valori mancanti imprevisti |
Costanza | I valori dei dati all'interno di una colonna sono compatibili con una regola. | Incongruenza tra maiuscole e minuscole Incongruenza nella rappresentazione dei valori mancanti Valori sospetti |
Tempestività | I dati rappresentano la realtà da un punto nel tempo richiesto. | Nessuno. |
Univocità | I valori distinti vengono visualizzati una sola volta. | Valori duplicati imprevisti |
Validità | I dati sono conformi al formato, al tipo o all'intervallo della definizione. | Violazioni di classi dati Violazioni di tipi di dati Violazioni di formato Valori fuori intervallo |
È possibile creare le proprie dimensioni di qualità dei dati utilizzando l'API di IBM Knowledge Catalog Crea una dimensione di qualità dei dati.
Ulteriori informazioni
- Risultati dell'analisi della qualità dei dati
- Controlli di qualità dei dati predefiniti
- Configurazione dei flussi di lavoro dei dati master
- IBM Knowledge Catalog API: Elenco di tutte le dimensioni della qualità dei dati
- API di IBM Knowledge Catalog : Creare una dimensione di qualità dei dati
Argomento principale: Gestione della qualità dei dati