Come parte della configurazione di un'istanza del servizio IBM Match 360 , puoi configurare i flussi di lavoro per consentire agli steward di dati di completare la correzione della qualità dei dati per attività relative alla gestione dei dati master, come potenziali problemi di corrispondenza.
Puoi facoltativamente impostare una configurazione del workflow nel momento in cui configuri intimamente la tua istanza del servizio IBM Match 360 . Per informazioni sul completamento della configurazione iniziale, consultare Creazione di un asset di configurazione dati master per IBM Match 360.
Se non si configura un flusso di lavoro durante l'impostazione iniziale, è possibile configurarlo in un secondo momento dalla scheda Home dati master > Gestisci . Per ulteriori informazioni, consultare Configurazione di un flusso di lavoro di potenziali corrispondenze.
Una volta configurato il flusso di lavoro, è possibile esaminarlo dalla scheda Gestisci , ma non è possibile modificarlo. Non è possibile riutilizzare una configurazione di flusso di lavoro esistente.
- Autorizzazioni richieste
- Per configurare i flussi di lavoro di dati master, è necessario essere un membro del gruppo utenti DataEngineer per il servizio IBM Match 360 .
Puoi utilizzare i flussi di lavoro per gestire i processi di business in Cloud Pak for Data. Per ulteriori informazioni sui flussi di lavoro, consultare Flussi di lavoro per le risorse di governance.
Il tipo di flusso di lavoro IBM Match 360 potenziali corrispondenze fornisce il framework per gli utenti di data steward per:
- Genera le attività di governance di Cloud Pak for Data per risolvere i potenziali problemi di corrispondenza nei tuoi dati o in un sottoinsieme dei tuoi dati.
- Esaminare e correggere le attività generate prendendo decisioni di corrispondenza o non corrispondenza sui record per i quali l'algoritmo di corrispondenza non può prendere una decisione di corrispondenza sicura.
Ogni confronto di corrispondenza record - record completato da IBM Match 360 genera un punteggio di corrispondenza. Questo punteggio può essere preso come un valore percentuale da 0 a 100, con 0 che è una non - corrispondenza definita e 100 che è una corrispondenza definita. Come parte della configurazione dell'algoritmo di corrispondenza, un data engineer può definire due valori di soglia:
- La soglia di collegamento automatico definisce il punteggio di corrispondenza minimo per l'algoritmo per prendere una decisione di corrispondenza automatica tra due record.
- La soglia di revisione di base definisce il punteggio minimo di corrispondenza per una potenziale corrispondenza. I punteggi al di sotto della soglia di revisione di base sono considerati non corrispondenze. I punteggi che rientrano nell'intervallo tra la soglia di revisione di base e la soglia di collegamento automatico possono essere inviati attraverso il flusso di lavoro delle potenziali corrispondenze per essere corretti da un utente steward di dati.
Se l'intervallo di base non è abilitato nelle impostazioni di corrispondenza, il flusso di lavoro delle potenziali corrispondenze non può generare alcuna attività. Per informazioni su come abilitare l'intervallo di base e configurare le soglie di corrispondenza, consultare Personalizzazione e rafforzamento dell'algoritmo di corrispondenza.
Configurazione di un flusso di lavoro di potenziali corrispondenze
Se il potenziale flusso di lavoro di corrispondenza non è stato configurato durante la configurazione iniziale dell'istanza del servizio IBM Match 360 , configurarlo dalla scheda Master data home > Gestisci .
Per configurare un nuovo flusso di lavoro di potenziali corrispondenze dalla scheda Gestisci :
- Dal menu di navigazione dei dati anagrafici, fare clic su Impostazioni istanza '.
- In Configurazione del flusso di lavoro, è possibile visualizzare tutti i flussi di lavoro associati a questa istanza del servizio.
Fare clic sul nome del tipo di flusso di lavoro collegato (Corrispondenze potenziali) per visualizzare i dettagli del template del flusso di lavoro, insieme a tutte le istanze di configurazione di questo tipo di flusso di lavoro.
Fare clic sul nome della configurazione del workflow collegato per visualizzare i dettagli della propria configurazione del flusso di lavoro specifica. Come parte della potenziale configurazione del flusso di lavoro delle corrispondenze, è possibile:
- Attivare o disattivare questo flusso di lavoro.
- Definire quali utenti o gruppi ricevono le potenziali attività di corrispondenza assegnate.
- Definire quali utenti o gruppi vengono avvisati delle potenziali attività di corrispondenza.
- Ridenominare la configurazione del flusso di lavoro per questa istanza.
Ulteriori informazioni
- Personalizzazione e rafforzamento dell'algoritmo di corrispondenza
- Correzione di potenziali corrispondenze per migliorare la qualità dei dati
- Monitoraggio delle attività del workflow
Argomento principale Configurazione dei dati master