Dimensioni qualità dati
Le dimensioni della qualità dei dati descrivono una caratteristica misurabile dei dati e aiutano a definirne i requisiti. Utilizzare le dimensioni della qualità dei dati per determinare i risultati previsti della valutazione della qualità dei dati, sia che si tratti di una valutazione iniziale o di un monitoraggio in corso.
Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.
L'associazione Data Management (DAMA) International ha pubblicato un articolo che descrive 6 dimensioni principali della qualità dei dati:
Dimensione | Descrizione | Controlli di qualità dei dati predefiniti che identificano i problemi associati a questa dimensione |
---|---|---|
Accuratezza | I valori dei dati sono il più vicini possibile ai valori reali. | Nessuno. |
Completezza | Sono presenti tutti i valori dei dati richiesti. | Valori mancanti imprevisti |
Costanza | I valori dei dati all'interno di una colonna sono compatibili con una regola. | Incongruenza tra maiuscole e minuscole Incongruenza nella rappresentazione dei valori mancanti Valori sospetti |
Tempestività | I dati rappresentano la realtà da un punto nel tempo richiesto. | Nessuno. |
Univocità | I valori distinti vengono visualizzati una sola volta. | Valori duplicati imprevisti |
Validità | I dati sono conformi al formato, al tipo o all'intervallo della definizione. | Violazioni di classi dati Violazioni di tipi di dati Violazioni di formato Valori fuori intervallo |
È possibile creare le proprie dimensioni di qualità dei dati utilizzando l'API di IBM Knowledge Catalog Crea una dimensione di qualità dei dati.
Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.
L'Associazione Data Management (DAMA ) International ha pubblicato un documento che descrive 6 dimensioni fondamentali della qualità dei dati: Accuratezza, Completezza, Coerenza, Tempestività, Unicità, Validità
Inoltre, IBM Knowledge Catalog fornisce la dimensione Omogeneità.
Tutte queste dimensioni possono essere valutate eseguendo controlli di qualità dei dati come parte dell'arricchimento dei metadati o eseguendo regole di qualità dei dati individuali.
La tabella seguente descrive le dimensioni della qualità dei dati ed elenca i controlli della qualità dei dati nell'arricchimento dei metadati che possono identificare i problemi associati a una dimensione specifica:
Dimensione | Descrizione | Tipi di controlli di qualità dei dati |
---|---|---|
Accuratezza | I valori dei dati sono il più vicini possibile ai valori reali. | Nessuno. |
Completezza | Sono presenti tutti i valori dei dati richiesti. | Controllo di completezza |
Costanza | I valori dei dati all'interno di una colonna sono compatibili con una regola. | Controllo dello stile delle maiuscole Controllo della rappresentazione dei valori mancanti Controllo di integrità referenziale ( IBM Knowledge Catalog Premium ) Controllo dei valori sospetti |
Omogeneità | I dati sono simili e coerenti nel tempo. | Stabilità storica ( IBM Knowledge Catalog Premium ) |
Tempestività | I dati rappresentano la realtà da un punto nel tempo richiesto. | Nessuno. |
Univocità | I valori distinti vengono visualizzati una sola volta. | Controllo dell'unicità |
Validità | I dati sono conformi al formato, al tipo o all'intervallo della definizione. | Controllo della classe di dati Controllo del tipo di dati Controllo del formato Controllo della lunghezza Controllo dei valori possibili Controllo della portata Controllo regex |
Ulteriori informazioni
- Risultati dell'analisi della qualità dei dati
- Controlli di qualità dei dati predefiniti
- Configurazione dei flussi di lavoro dei dati master
- IBM Knowledge Catalog API: Elenco di tutte le dimensioni della qualità dei dati
- API di IBM Knowledge Catalog : Creare una dimensione di qualità dei dati
Argomento principale: Gestione della qualità dei dati