0 / 0

Dimensioni qualità dati

Ultimo aggiornamento: 04 lug 2025
Dimensioni qualità dati

Le dimensioni della qualità dei dati descrivono una caratteristica misurabile dei dati e aiutano a definirne i requisiti. Utilizzare le dimensioni della qualità dei dati per determinare i risultati previsti della valutazione della qualità dei dati, sia che si tratti di una valutazione iniziale o di un monitoraggio in corso.

Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.

L'Associazione Data Management (DAMA ) International ha pubblicato un documento che descrive 6 dimensioni fondamentali della qualità dei dati: Accuratezza, Completezza, Coerenza, Tempestività, Unicità, Validità

Oltre a queste dimensioni fondamentali, IBM Knowledge Catalog fornisce la dimensione Omogeneità.

Tutte queste dimensioni possono essere valutate eseguendo controlli di qualità dei dati come parte dell'arricchimento dei metadati o eseguendo regole di qualità dei dati individuali.

Dimensioni di qualità dei dati di base
Dimensione Descrizione Controlli di qualità dei dati predefiniti che identificano i problemi associati a questa dimensione
Accuratezza I valori dei dati sono il più vicini possibile ai valori reali. Nessuno.
Completezza Sono presenti tutti i valori dei dati richiesti. Valori mancanti imprevisti
Costanza I valori dei dati all'interno di una colonna sono compatibili con una regola. Incongruenza tra maiuscole e minuscole
Incongruenza nella rappresentazione dei valori mancanti
Valori sospetti
Omogeneità I dati all'interno di un asset di dati sono uniformi e coerenti nel tempo. Tutti i punti dati hanno caratteristiche, formati o strutture simili. Nessuno.
Tempestività I dati rappresentano la realtà da un punto nel tempo richiesto. Nessuno.
Univocità I valori distinti vengono visualizzati una sola volta. Valori duplicati imprevisti
Validità I dati sono conformi al formato, al tipo o all'intervallo della definizione. Violazioni di classi dati
Violazioni di tipi di dati
Violazioni di formato
Valori fuori intervallo

È possibile creare le proprie dimensioni di qualità dei dati utilizzando l'API di IBM Knowledge Catalog Crea una dimensione di qualità dei dati.

Ulteriori informazioni

Argomento principale: Gestione della qualità dei dati