Gestione delle regole di qualità dei dati
È possibile creare e gestire regole di qualità dei dati per valutare la qualità dei dati nel progetto.
Se si dispone delle autorizzazioni richieste, è possibile gestire le regole di qualità dei dati nei seguenti modi:
- Crea regole di qualità dei dati
- Modifica di una regola di qualità dei dati
- Eliminare le regole di qualità dei dati non più necessarie
È anche possibile completare queste attività con le API invece che con l'interfaccia utente. I collegamenti a queste API sono elencati in Ulteriori informazioni .
- Servizi richiesti
- IBM Knowledge Catalog
- DataStage o DataStage as a Service Anywhere '
Con DataStage, è possibile eseguire regole di qualità dei dati nelle regioni supportate. Con DataStage as a Service Anywhere, è possibile eseguire le regole di qualità dei dati al di fuori di IBM Cloud utilizzando motori remoti. Per ulteriori informazioni sull'impostazione dei motori remoti, vedere il documento ' documentazione DataStage as a Service Anywhere .
Autorizzazioni richieste
Per visualizzare le regole di qualità dei dati, è necessario avere almeno il ruolo Visualizzatore nel progetto.
Per creare, modificare o eliminare le regole di qualità dei dati, è necessario disporre del ruolo Gestisci asset di qualità dei dati autorizzazione utente e del ruolo Amministratore o Editor nel progetto.
Impostazioni del progetto per l'esecuzione della regola
Le impostazioni a livello di progetto determinano alcuni aspetti dell'esecuzione della regola di qualità dei dati, ad esempio, se gli spazi finali nei valori stringa vengono ignorati nei controlli di uguaglianza. Queste impostazioni si applicano a tutte le regole di qualità dei dati per un determinato progetto. È possibile controllare o aggiornare queste impostazioni per ogni progetto utilizzando le API di IBM Knowledge Catalog Ottieni impostazioni del progetto per le regole di qualità dei dati e Sostituisci impostazioni del progetto per le regole di qualità dei dati.
Crea regole di qualità dei dati
È possibile creare diversi tipi di regole di qualità dei dati:
Modifica delle regole di qualità dei dati
È possibile modificare una regola di qualità dei dati per aggiornarne la descrizione, la dimensione di qualità dei dati selezionata, qualsiasi assegnazione di termini di business o la configurazione della regola. È anche possibile gestire l'elenco di elementi correlati.
Per modificare una regola di qualità dei dati, aprire l'asset ed eseguire le azioni appropriate:
- Per aggiornare la descrizione o le dimensioni della qualità dei dati, fare clic sull'icona Modifica
, accanto alla proprietà.
- Per gestire i termini di business, andare alla sezione Risorse di governance dell'asset e aggiungere o rimuovere i termini in base alle necessità.
- Per assegnare o eliminare le regole di governance, andare nella sezione Risorse di governance dell'asset e aggiungere o rimuovere le regole di governance in base alle esigenze.
- Per aggiungere o rimuovere artefatti, risorse o colonne correlate, vai alla sezione Elementi correlati della risorsa e aggiungi o rimuovi gli elementi secondo necessità.
- Per aggiornare la configurazione della regola, fare clic su Modifica regola. Per tutti i tipi di regole, è possibile modificare il tipo di output. A seconda della nuova selezione, tutte le impostazioni di output configurate vengono reimpostate o sovrascritte. L'output della regola scritto prima della modifica non viene modificato. Per le regole basate su SQL, è possibile modificare l'istruzione SQL. Per le regole basate sulle definizioni, è possibile modificare le definizioni della qualità dei dati utilizzate e le impostazioni di campionamento. Non è possibile modificare il modo in cui vengono gestiti gli attacchi.
Per le regole di qualità dei dati che legano i dati direttamente, alla sezione Elementi correlati viene aggiunto un valore Convalida la qualità dei dati della relazione con ciascuna colonna associata. È possibile aggiungere manualmente colonne con questo tipo di relazione alle regole di qualità dei dati con associazioni gestite esternamente o regole di qualità dei dati basate su SQL. Quindi, questo tipo di regole contribuisce ai punteggi di qualità dei dati della colonna corrispondente.
Quando visualizzi una regola di qualità dei dati, puoi fare clic sull'icona Informazioni per visualizzare ulteriori dettagli, come le impostazioni di output o le risorse correlate.
Eliminazione delle regole di qualità dei dati
È possibile eliminare una regola di qualità dei dati in uno dei seguenti modi:
- Nel progetto, selezionare la regola di qualità dei dati e fare clic su Elimina.
- Aprire la regola di qualità dei dati e selezionare Elimina dal menu di overflow accanto al nome della regola di qualità dei dati.
Quando si elimina una regola di qualità dei dati, la relativa cronologia di esecuzione, tutti i job e il flusso DataStage associati vengono eliminati anche dal progetto. Le tabelle di output nel progetto e nel database vengono conservate. I problemi che sono stati restituiti da questa regola di qualità dei dati vengono rimossi e la qualità dei dati e i punteggi della dimensione vengono ricalcolati.
Ulteriori informazioni
Passi successivi
Argomento principale: Gestione della qualità dei dati