0 / 0
Torna alla versione inglese della documentazione
Monitoraggio dei lavori di arricchimento
Ultimo aggiornamento: 05 dic 2024
Monitoraggio dei lavori di arricchimento

Esaminate i dettagli delle esecuzioni di arricchimento dei metadati o monitorate un lavoro attivo visualizzando le metriche dell'esecuzione.

È possibile controllare i dettagli di qualsiasi lavoro di arricchimento dei metadati. Le metriche delle esecuzioni sono disponibili per qualsiasi esecuzione di un lavoro di arricchimento dei metadati avvenuto in Cloud Pak for Data 5.1.

Visualizzazione dei dettagli dell'esecuzione del lavoro

In generale, è possibile accedere a tutti i dettagli dell'esecuzione del lavoro dalla pagina Lavori di un progetto:

  1. Da questa pagina è possibile selezionare il lavoro per il quale si desidera rivedere le informazioni e i dettagli della corsa. Se avete molti lavori, potete ampliare la vista:

    • Lavori con corse attive
    • Esecuzioni attive
    • Lavori con corse finite
    • Esecuzioni terminate

    È possibile restringere ulteriormente i risultati della ricerca per l'ambito di visualizzazione selezionato applicando altri filtri.

  2. Fare clic sul nome del lavoro. La pagina dei dettagli del lavoro mostra il numero di esecuzioni completate e fallite e la pianificazione del lavoro configurata.

  3. Selezionare una corsa particolare ed esaminarne i dettagli. Per l'esecuzione di un lavoro vengono forniti i seguenti dettagli:

    • Lo stato di esecuzione del lavoro
    • La durata, gli orari di inizio e fine
    • Chi ha iniziato la corsa
    • Un link al lavoro associato
    • Un link all'arricchimento di metadati associato
    • Informazioni di base sulla configurazione dell'arricchimento:
      • Le opzioni di arricchimento selezionate
      • Il numero di categorie da utilizzare per l'assegnazione di classi, termini e classificazioni ai dati
      • Il metodo di campionamento utilizzato
      • Gli algoritmi utilizzati per l'assegnazione dei termini

    Qui è anche possibile mettere in pausa e riprendere l'esecuzione del lavoro} in base alle finestre di esecuzione del lavoro configurate.

A seconda del tipo di lavoro, nelle schede Metriche di esecuzione e Registro vengono fornite ulteriori informazioni sull'esecuzione effettiva.

È inoltre possibile accedere ai dettagli dell'ultimo lavoro di arricchimento dei metadati eseguito dall'asset di arricchimento dei metadati. È possibile fare clic sul link Visualizza metriche nella sezione Dettagli del lavoro nel pannello delle informazioni o sul link Dettagli dell'esecuzione del lavoro nel pannello dei dettagli dell'asset.

Visualizzazione delle metriche di esecuzione

Le metriche di esecuzione sono fornite per i lavori di arricchimento dei metadati che vengono eseguiti come configurati o che vengono eseguiti per la profilazione avanzata dei dati. Nella scheda Metriche dell'esecuzione nei dettagli dell'esecuzione del lavoro, è possibile monitorare l'avanzamento di un'esecuzione attiva del lavoro di arricchimento dei metadati o controllare le informazioni sullo stato di un'esecuzione completata.

Le metriche di esecuzione sono disponibili solo per i lavori eseguiti dopo il 21 novembre 2025. Per i lavori più vecchi, è possibile controllare il registro di esecuzione del lavoro.

La sezione Riepilogo mostra l'andamento complessivo dell'arricchimento:

  • Il numero totale di attività arricchite.
  • Il numero di attività completate, in corso e fallite. Per gli asset falliti, viene fornito un link ai dettagli del fallimento.
  • La percentuale di beni per i quali viene effettuato l'arricchimento.

Le metriche dell'attività Analizza relazioni sono calcolate in modo diverso rispetto alle altre metriche dell'attività. Pertanto, non sono riportati nel riepilogo.

La sezione Obiettivi mostra l'avanzamento delle singole opzioni di arricchimento nell'ordine in cui vengono elaborate. L'analisi della qualità dei dati, se selezionata, viene eseguita come parte del profilo e non viene mostrata separatamente.

Oltre alla barra di avanzamento del processo complessivo di ogni attività di arricchimento, è possibile vedere quante risorse di dati si trovano in quale stato durante l'elaborazione dell'attività. Ad eccezione dell'attività Analizza relazioni, una risorsa di dati ha questi stati:

  • In progress: l'asset è in fase di elaborazione o in attesa di essere elaborato.
  • Completed: l'attività di arricchimento è stata completata con successo per l'asset.
  • Skipped: La risorsa non è stata elaborata perché un'attività di arricchimento preliminare non è riuscita. Ad esempio, l'assegnazione dei termini potrebbe richiedere una profilazione a seconda degli algoritmi selezionati. Durante la profilazione, gli asset non possono avere questo stato perché la profilazione è di solito la prima fase di un processo di arricchimento.
  • Failed: l'attività di arricchimento non è riuscita per l'asset. Se il conteggio non è pari a zero, è possibile fare clic sul numero per visualizzare i dettagli dei guasti.

Per l'obiettivo di arricchimento " Analizzare le relazioni, vengono mostrati il numero totale di compiti, il numero di compiti completati e il numero di compiti con errori. Il numero totale di attività di analisi dipende dal numero di asset di dati analizzati. Per ogni 1.000 asset di dati, viene creato un task di analisi per calcolare le relazioni potenziali.

Per gli arricchimenti in pausa, le metriche sul dashboard sono nascoste per il tempo della pausa. Alla ripresa dell'arricchimento, le metriche iniziali riflettono lo stato dell'arricchimento al momento della pausa. Mentre l'esecuzione di un lavoro è in pausa, il log potrebbe fornire informazioni più dettagliate sullo stato attuale rispetto al dashboard delle metriche.

Per gli arricchimenti annullati, le metriche riflettono lo stato dell'arricchimento al momento dell'annullamento della corsa. Il risultato effettivo dell'arricchimento può differire dalle metriche mostrate, perché l'arricchimento delle risorse con lo stato " in progress potrebbe essere ancora completato dopo l'annullamento del lavoro. L'annullamento o il completamento dell'arricchimento di un'attività in corso dipende dallo stato di lavorazione interna dell'attività. Il log potrebbe fornire informazioni più dettagliate sullo stato attuale rispetto al dashboard delle metriche.

Comprendere il log di esecuzione del lavoro

I registri sono forniti per tutti i tipi di lavori di arricchimento dei metadati. Per visualizzare il registro di un'esecuzione del lavoro, passare alla scheda Registro nella pagina dei dettagli dell'esecuzione del lavoro. Il registro mostra il tipo di lavoro, l'ID di esecuzione del lavoro e i dettagli relativi alle attività di arricchimento.

  • La voce Esecuzione completa del lavoro di arricchimento dei metadati o Esecuzione del lavoro di arricchimento dei metadati Delta indica un lavoro di arricchimento dei metadati di base che viene eseguito con le opzioni di arricchimento configurate. Completo significa che l'arricchimento viene eseguito su tutti gli asset di dati dell'ambito o su un insieme di asset di dati selezionati manualmente. Delta significa che vengono arricchiti solo gli asset di dati aggiunti o modificati dopo l'ultima esecuzione dell'arricchimento o per i quali l'arricchimento precedente non è riuscito o è stato annullato. L'ambito dei dati delle ripetizioni determina l'esecuzione di un arricchimento completo o delta dei metadati.

    Per un lavoro di arricchimento dei metadati, vengono mostrate informazioni simili a quelle del dashboard delle metriche, come il riepilogo delle risorse e le statistiche per ogni attività di arricchimento. Inoltre, se l'assegnazione dei termini fa parte dell'arricchimento, sono inclusi alcuni dettagli sul modello di assegnazione dei termini utilizzato.

    È possibile interrompere e riprendere le esecuzioni di questo tipo di lavoro. Il registro di esecuzione del lavoro contiene quindi una voce che indica l'ora di inizio e di fine della pausa. Nel registro viene elencata solo l'ultima pausa, anche se l'esecuzione del lavoro è stata interrotta più volte.

  • La voce Esecuzione avanzata del lavoro di arricchimento dei metadati di profilazione indica un lavoro per la generazione di risultati di profilazione più accurati. Nella dashboard delle metriche, questo tipo di lavoro viene visualizzato come task Dati profilo.

  • La voce Esecuzione del lavoro di analisi delle chiavi indica un lavoro di analisi delle chiavi o delle relazioni. Il tipo di analisi è identificato da una di queste voci:

    • Chiave primaria per il rilevamento dell'attività<taskID>) di tipo 'pk_deep'
    • Relazione a chiave esterna di rilevazione dell'attività<taskID>) di tipo 'fk_deep'
    • Attività di rilevamento delle chiavi di sovrapposizione<taskID>) di tipo 'overlap'

    Per questo tipo di lavoro non vengono fornite metriche di esecuzione.

  • La voce Metadata publish job run indica un lavoro di pubblicazione.

Ulteriori informazioni

Argomento per i genitori: Gestione dei lavori di arricchimento

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni