Eseguire un'analisi della chiave primaria per identificare le chiavi primarie singole o composte negli asset di dati in un database relazionale. Una chiave primaria identifica in modo univoco ogni record in un asset di dati. Ogni asset di dati può avere solo una chiave principale.
Convalidare le chiavi primarie già definite nei dati e identificare le colonne che sono candidate per le chiavi primarie. Una chiave primaria deve essere univoca e non può contenere valori null.
Questo tipo di analisi identifica le chiavi primarie a colonna singola per un asset di dati individuando una colonna che si qualifica come identificativo univoco per i propri dati. Per identificare una chiave primaria a più colonne o composta , l'analisi determina quali combinazioni di colonne contengono valori univoci, rendendoli candidati per le chiavi primarie. Vengono valutati i valori per diverse combinazioni di colonne e viene calcolata l'univocità dei valori concatenati. Vengono controllate solo le colonne adiacenti.
Solo le colonne e le combinazioni di colonne con una confidenza che supera la soglia definita, nelle impostazioni di arricchimento o per una singola esecuzione, vengono suggerite come chiavi primarie. Se una chiave primaria è già definita nei dati, questa chiave viene assegnata automaticamente. Queste informazioni devono essere incluse esplicitamente in un'importazione di metadati. È ancora possibile utilizzare i risultati di un'analisi della chiave primaria per convalidare chiavi primarie definite.
- Prerequisiti
- Impostazione manuale delle chiavi primarie
- Esecuzione di un'analisi della chiave primaria
- Verifica dei risultati dell'analisi e assegnazione delle chiavi
- Annullamento dell'assegnazione o rimozione delle chiavi
- Accesso ai dettagli di esecuzione lavoro
Prerequisiti
Il servizio DataStage deve essere distribuito per l'esecuzione dell'analisi della chiave primaria.
Tutte le operazioni eseguite come parte di un arricchimento dei metadati richiedono credenziali per l'autorizzazione sicura. In genere, la tua chiave API utente viene utilizzata per eseguire tali operazioni di lunga durata senza interruzioni. Se le credenziali non sono disponibili quando si tenta di eseguire un'analisi della chiave primaria, viene richiesto di creare una chiave API. Tale chiave API viene quindi salvata come credenziali dell'attività. Vedi Gestione della chiave API utente.
Se una delle connessioni alle origini dati è bloccata, viene richiesto di immettere le proprie credenziali personali. Si tratta di un passo da eseguire una sola volta che sblocca in modo permanente le connessioni.
È possibile eseguire l'analisi della chiave primaria senza creare prima i profili asset. L'analisi non si basa su informazioni di profilo quali la distribuzione della frequenza dei valori delle colonne. I dati delle colonne vengono invece analizzati direttamente.
Impostazione manuale delle chiavi primarie
Se i dati sono già stati analizzati con l'opzione Dati profilo , è possibile impostare una chiave primaria senza eseguire un'analisi della chiave o della relazione oppure è possibile modificare un'assegnazione. Aprire la vista colonna di un asset facendo clic sul nome dell'asset o selezionando Visualizza colonne dal menu di overflow.
- Per impostare una chiave primaria a colonna singola, selezionare una colonna e selezionare Altro> Assegna come chiave primaria dalla barra degli strumenti.
- Per impostare una chiave primaria a più colonne, selezionare le colonne che si desidera creare e selezionare Altro> Assegna come chiave primaria composta dalla barra degli strumenti.
Quando si sostituisce una chiave primaria, tutte le relazioni per la vecchia chiave primaria non vengono assegnate. È necessario impostare nuove relazioni.
Esecuzione di un'analisi della chiave primaria
Per eseguire un'analisi della chiave primaria per uno o più asset:
Aprire l'asset di arricchimento metadati.
Nella scheda Asset , selezionare gli asset come richiesto.
Selezionare arricchisci> Identifica chiavi primarie dalla barra degli strumenti.
Per impostazione predefinita, questa analisi viene eseguita su una singola colonna. Tuttavia, una singola colonna potrebbe non soddisfare i criteri per una chiave primaria. In questo caso, è possibile scegliere di eseguire l'analisi su più colonne per creare una chiave primaria composta. L'analisi concatena i valori per diverse combinazioni di colonne, calcola l'univocità dei valori concatenati e quindi determina quali combinazioni di colonne contengono valori univoci, rendendoli candidati chiave primaria. Tale analisi può richiedere molto tempo a seconda della dimensione di un asset di dati.
Fare clic su Esegui. Ricevi una notifica quando l'analisi è completa, ma potresti dover aggiornare i risultati dell'arricchimento per visualizzare eventuali nuove chiavi primarie.
Per impostazione predefinita, tutte le chiavi primarie identificate durante l'analisi hanno lo stato candidato, il che significa che vengono visualizzate come chiavi suggerite, a meno che i dati non contengano già chiavi primarie definite. In questo caso, queste colonne vengono assegnate come chiavi primarie durante l'analisi.
L'esecuzione di un'altra analisi della chiave primaria elimina tutte le chiavi primarie suggerite precedentemente che non sono state trovate durante l'analisi corrente. Ad esempio, l'esecuzione di un'analisi della chiave primaria a colonna singola rimuove tutti i candidati della chiave primaria composta identificati in un'analisi precedente.
Verifica dei risultati dell'analisi e assegnazione delle chiavi
Esaminare le chiavi per un asset nella scheda Chiavi del riquadro dei dettagli dell'asset. Se i dati contengono già una chiave primaria, viene visualizzata qui come assegnata. Inoltre, tutte le chiavi suggerite sono elencati di seguito. Per modificare la chiave primaria assegnata, fare clic sull'icona Modifica .
L'elenco completo delle chiavi fornisce le seguenti informazioni:
- Il nome di una colonna suggerita o assegnata come chiave primaria o un elenco di nomi di colonna per una chiave primaria composta
- Il numero di colonne che costituiscono la chiave primaria assegnata o candidata
- Il tipo di dati della colonna o delle colonne che costituiscono la chiave primaria assegnata o candidata
- Il punteggio di confidenza per assegnare o suggerire una chiave
- Il numero e la percentuale di valori distinti, univoci e null per ogni chiave
- Lo stato della chiave, che può essere Assegnato o Suggerito
- La data dell'ultima modifica della colonna
Per assegnare una chiave primaria o sostituire la chiave assegnata, selezionare Assegna dal menu di overflow della chiave. Se si sostituisce la chiave primaria esistente, tutte le relazioni per la vecchia chiave primaria non vengono assegnate. È quindi possibile impostare nuove relazioni.
Annullamento dell'assegnazione o rimozione delle chiavi
È possibile annullare l'assegnazione di una chiave assegnata. In questo caso, anche tutte le relazioni per questa chiave primaria non sono assegnate e lo stato della chiave è impostato su suggerito. È quindi possibile assegnare una nuova chiave primaria e impostare le relazioni corrispondenti.
È anche possibile rimuovere completamente una chiave assegnata o suggerita. Tutte le relazioni per questa chiave non sono assegnate. Una chiave rimossa potrebbe essere suggerita o assegnata nuovamente quando si riesegue l'analisi della chiave primaria.
Accesso ai dettagli di esecuzione del job
Mentre puoi accedere ai dettagli del job per l'arricchimento dei metadati generali dal pannello laterale, devi andare alla scheda Jobs del progetto per vedere i job per l'analisi della chiave primaria. Il lavoro è di tipo Analisi chiave per gli asset di arricchimento metadati. Il nome del lavoro segue il modello nome_arricchimento_metadati (rilevamento PK).
Ulteriori informazioni
Argomento principale: Arricchimento degli asset di dati