È possibile creare e gestire regole di qualità dei dati per valutare la qualità dei dati nel progetto.
Se si dispone delle autorizzazioni richieste, è possibile gestire le regole di qualità dei dati nei seguenti modi:
- Crea regole di qualità dei dati
- Modifica di una regola di qualità dei dati
- Eliminare le regole di qualità dei dati non più necessarie
È anche possibile completare queste attività con le API invece che con l'interfaccia utente. I collegamenti a queste API sono elencati in Ulteriori informazioni .
- Servizi richiesti
- IBM Knowledge Catalog
- DataStage o DataStage as a Service Anywhere '
Con DataStage, è possibile eseguire regole di qualità dei dati nelle regioni supportate. Con DataStage as a Service Anywhere, è possibile eseguire le regole di qualità dei dati al di fuori di IBM Cloud utilizzando motori remoti. Per ulteriori informazioni sull'impostazione dei motori remoti, vedere il documento ' documentazione DataStage as a Service Anywhere .
Autorizzazioni richieste
Per visualizzare le regole di qualità dei dati, è necessario avere almeno il ruolo Visualizzatore nel progetto.
Per creare, modificare o eliminare le regole di qualità dei dati, è necessario disporre del ruolo Gestisci asset di qualità dei dati autorizzazione utente e del ruolo Amministratore o Editor nel progetto.
Impostazioni del progetto per l'esecuzione della regola
Le impostazioni a livello di progetto determinano alcuni aspetti dell'esecuzione della regola di qualità dei dati, ad esempio, se gli spazi finali nei valori stringa vengono ignorati nei controlli di uguaglianza. Queste impostazioni si applicano a tutte le regole di qualità dei dati per un determinato progetto. È possibile controllare o aggiornare queste impostazioni per ogni progetto utilizzando le API di IBM Knowledge Catalog Ottieni impostazioni del progetto per le regole di qualità dei dati e Sostituisci impostazioni del progetto per le regole di qualità dei dati.
Crea regole di qualità dei dati
È possibile creare diversi tipi di regole di qualità dei dati:
Modifica delle regole di qualità dei dati
È possibile modificare una regola di qualità dei dati per aggiornarne la descrizione, la dimensione di qualità dei dati selezionata, qualsiasi assegnazione di termini di business o la configurazione della regola. È anche possibile gestire l'elenco di elementi correlati.
Per modificare una regola di qualità dei dati, aprire l'asset ed eseguire le azioni appropriate:
Per aggiornare la descrizione o le dimensioni della qualità dei dati, fare clic sull'icona Modifica ' accanto alla proprietà.
Per gestire i termini di business, andare alla sezione Risorse di governance dell'asset e aggiungere o rimuovere i termini in base alle necessità.
Per assegnare o eliminare le regole di governance, andare nella sezione Risorse di governance dell'asset e aggiungere o rimuovere le regole di governance in base alle esigenze.
Per aggiornare la configurazione della regola, fare clic su Modifica regola. Quando si modifica la configurazione della regola, è possibile anche modificare il modo in cui la regola viene creata: dall'utilizzo delle definizioni di qualità dei dati all'utilizzo delle istruzioni SQL e viceversa. Tuttavia, quando si esegue questa operazione, tutta la configurazione della regola esistente viene eliminata ed è necessario iniziare da zero.
È anche possibile modificare il tipo di output. A seconda della nuova selezione, tutte le impostazioni di output configurate vengono reimpostate o sovrascritte. L'output della regola scritto prima della modifica non viene modificato.
Per le regole di qualità dei dati che collegano direttamente i dati, una relazione Convalida la qualità dei dati di con ogni colonna associata e con l'asset contenente la colonna viene aggiunta alla sezione Elementi correlati . È possibile aggiungere manualmente asset e colonne con questo tipo di relazioni a tutti i tipi di regole di qualità dei dati. Quando si aggiungono asset e colonne alle regole di qualità dei dati con bind gestiti esternamente o regole di qualità dei dati basate su SQL con questa relazione, questi tipi di regole contribuiscono ai punteggi di qualità dei dati dell'asset o della colonna corrispondente. Il punteggio e i problemi prodotti dalla regola vengono riportati per tutti gli asset e le colonne collegati al tipo di rapporto Convalida la qualità dei dati di .
Quando si visualizza una regola di qualità dei dati, è possibile fare clic sull'icona Info ' per visualizzare ulteriori dettagli, come le impostazioni di output o le risorse correlate.
Eliminazione delle regole di qualità dei dati
È possibile eliminare una regola di qualità dei dati in uno dei seguenti modi:
- Nel progetto, selezionare la regola di qualità dei dati e fare clic su Elimina.
- Aprire la regola di qualità dei dati e selezionare Elimina dal menu di overflow accanto al nome della regola di qualità dei dati.
Quando si elimina una regola di qualità dei dati, la relativa cronologia di esecuzione, tutti i job e il flusso DataStage associati vengono eliminati anche dal progetto. Le tabelle di output nel progetto e nel database vengono conservate. I problemi che sono stati restituiti da questa regola di qualità dei dati vengono rimossi e la qualità dei dati e i punteggi della dimensione vengono ricalcolati.
Ulteriori informazioni
Passi successivi
Argomento principale: Gestione della qualità dei dati