Dimensioni qualità dati

Ultimo aggiornamento: 21 feb 2025
Dimensioni qualità dati

Le dimensioni della qualità dei dati descrivono una caratteristica misurabile dei dati e aiutano a definirne i requisiti. Utilizzare le dimensioni della qualità dei dati per determinare i risultati previsti della valutazione della qualità dei dati, sia che si tratti di una valutazione iniziale o di un monitoraggio in corso.

Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.

L'associazione Data Management (DAMA) International ha pubblicato un articolo che descrive 6 dimensioni principali della qualità dei dati:

Dimensioni di qualità dei dati di base
Dimensione Descrizione Controlli di qualità dei dati predefiniti che identificano i problemi associati a questa dimensione
Accuratezza I valori dei dati sono il più vicini possibile ai valori reali. Nessuno.
Completezza Sono presenti tutti i valori dei dati richiesti. Valori mancanti imprevisti
Costanza I valori dei dati all'interno di una colonna sono compatibili con una regola. Incongruenza tra maiuscole e minuscole
Incongruenza nella rappresentazione dei valori mancanti
Valori sospetti
Tempestività I dati rappresentano la realtà da un punto nel tempo richiesto. Nessuno.
Univocità I valori distinti vengono visualizzati una sola volta. Valori duplicati imprevisti
Validità I dati sono conformi al formato, al tipo o all'intervallo della definizione. Violazioni di classi dati
Violazioni di tipi di dati
Violazioni di formato
Valori fuori intervallo

È possibile creare le proprie dimensioni di qualità dei dati utilizzando l'API di IBM Knowledge Catalog Crea una dimensione di qualità dei dati.

Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.

L'Associazione Data Management (DAMA ) International ha pubblicato un documento che descrive 6 dimensioni fondamentali della qualità dei dati: Accuratezza, Completezza, Coerenza, Tempestività, Unicità, Validità

Inoltre, IBM Knowledge Catalog fornisce la dimensione Omogeneità.

Tutte queste dimensioni possono essere valutate eseguendo controlli di qualità dei dati come parte dell'arricchimento dei metadati o eseguendo regole di qualità dei dati individuali.

La tabella seguente descrive le dimensioni della qualità dei dati ed elenca i controlli della qualità dei dati nell'arricchimento dei metadati che possono identificare i problemi associati a una dimensione specifica:

Dimensioni qualità dati
Dimensione Descrizione Tipi di controlli di qualità dei dati
Accuratezza I valori dei dati sono il più vicini possibile ai valori reali. Nessuno.
Completezza Sono presenti tutti i valori dei dati richiesti. Controllo di completezza
Costanza I valori dei dati all'interno di una colonna sono compatibili con una regola. Controllo dello stile delle maiuscole
Controllo della rappresentazione dei valori mancanti
Controllo di integrità referenziale ( IBM Knowledge Catalog Premium )
Controllo dei valori sospetti
Omogeneità I dati sono simili e coerenti nel tempo. Stabilità storica ( IBM Knowledge Catalog Premium )
Tempestività I dati rappresentano la realtà da un punto nel tempo richiesto. Nessuno.
Univocità I valori distinti vengono visualizzati una sola volta. Controllo dell'unicità
Validità I dati sono conformi al formato, al tipo o all'intervallo della definizione. Controllo della classe di dati
Controllo del tipo di dati
Controllo del formato
Controllo della lunghezza
Controllo dei valori possibili
Controllo della portata
Controllo regex

Ulteriori informazioni

Argomento principale: Gestione della qualità dei dati