0 / 0
Torna alla versione inglese della documentazione
Dimensioni qualità dati
Ultimo aggiornamento: 13 dic 2024
Dimensioni qualità dati

Le dimensioni della qualità dei dati descrivono una caratteristica misurabile dei dati e aiutano a definirne i requisiti. Utilizzare le dimensioni della qualità dei dati per determinare i risultati previsti della valutazione della qualità dei dati, sia che si tratti di una valutazione iniziale o di un monitoraggio in corso.

Lo stato in cui si desidera che i dati siano in genere può essere definito come adatto all'uso, privo di difetti, corrisponde alla specificao conforme alle aspettative e ai requisiti. Quando si misura la qualità dei dati, si confronta lo stato effettivo dei dati con quello desiderato. Gli standard, le aspettative e i requisiti importanti per i processi di business vengono espressi come caratteristiche o dimensioni dei dati.

L'associazione Data Management (DAMA) International ha pubblicato un articolo che descrive 6 dimensioni principali della qualità dei dati:

Dimensioni di qualità dei dati di base
Dimensione Descrizione Controlli di qualità dei dati predefiniti che identificano i problemi associati a questa dimensione
Accuratezza I valori dei dati sono il più vicini possibile ai valori reali. Nessuno.
Completezza Sono presenti tutti i valori dei dati richiesti. Valori mancanti imprevisti
Costanza I valori dei dati all'interno di una colonna sono compatibili con una regola. Incongruenza tra maiuscole e minuscole
Incongruenza nella rappresentazione dei valori mancanti
Valori sospetti
Tempestività I dati rappresentano la realtà da un punto nel tempo richiesto. Nessuno.
Univocità I valori distinti vengono visualizzati una sola volta. Valori duplicati imprevisti
Validità I dati sono conformi al formato, al tipo o all'intervallo della definizione. Violazioni di classi dati
Violazioni di tipi di dati
Violazioni di formato
Valori fuori intervallo

È possibile creare le proprie dimensioni di qualità dei dati utilizzando l'API di IBM Knowledge Catalog Crea una dimensione di qualità dei dati.

Ulteriori informazioni

Argomento principale: Gestione della qualità dei dati

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni