0 / 0
Torna alla versione inglese della documentazione
Arricchire i dati
Ultimo aggiornamento: 13 dic 2024
Arricchire i dati

Arricchire gli asset di dati con informazioni che aiutino gli utenti a trovare i dati più velocemente, a decidere se i dati sono appropriati per il compito da svolgere, se possono fidarsi dei dati e come lavorare con i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni.

Gli steward di dati creano profili di asset per comprendere il significato dei dati e valutarne la qualità. Inoltre, aggiungono il contesto aziendale ai dati assegnando i termini e identificando le relazioni tra le tabelle. L'arricchimento dei metadati automatizza questo processo, aumentando la produttività dello steward dei dati.

I dati sono utili solo se il contesto, il contenuto e la qualità sono affidabili. Per mantenerlo in questo modo, i dati devono essere continuamente valutati e, se necessario, devono essere prese le opportune misure correttive. Gli steward di dati possono configurare i lavori ricorrenti per tenere continuamente traccia delle modifiche al contenuto e alla struttura dei dati e quindi analizzare solo i dati modificati.

Le informazioni che vengono aggiunte agli asset tramite l'arricchimento dei metadati aiutano anche a proteggere i dati perché possono essere utilizzate nelle politiche di protezione dei dati per mascherare i dati o limitare l'accesso.

Servizi richiesti

IBM Knowledge Catalog
DataStage per l'analisi avanzata delle chiavi o delle relazioni e la creazione di profili avanzati

Formato dati

Tabelle da origini dati relazionali e non relazionali

File caricati dal file system locale o da connessioni basate su file alle origini dati, con i seguenti formati: CSV, TSV, Avro, Parquet, Microsoft Excel (xls, xlsm e xlsx; solo il primo foglio di una cartella di lavoro è profilato per i file caricati dal file system locale). Non viene creato il profilo per questi file di dati strutturati:

  • File all'interno di una risorsa cartella connessa. I file a cui è possibile accedere da un asset della cartella connessa non vengono considerati come asset e non vengono creati profili.
  • File all'interno di un file di archivio, ad esempio, un file .zip. L'asset di dati fa riferimento al file di archivio e non viene creato il profilo dei file compressi.

È possibile arricchire gli asset di dati dalle origini dati elencate in Origini dati supportate per la cura e la qualità dei dati.

Dimensione dati

Qualsiasi; i dataset da connessioni basate su file non possono avere più di 4.999 colonne

Autorizzazioni richieste

Per creare, gestire ed eseguire un arricchimento dei metadati, devi disporre del ruolo Admin o Editor nel progetto e devi disporre almeno dell'accesso di visualizzazione per le categorie che vuoi utilizzare nell'arricchimento. Inoltre, è necessario essere autorizzati ad accedere alle connessioni alle origini dati degli asset di dati da arricchire.

Se una di queste connessioni è bloccata, viene richiesto di inserire le proprie credenziali personali. Si tratta di un'operazione una tantum che sblocca in modo permanente le connessioni.

Tutte le operazioni eseguite come parte di un arricchimento dei metadati richiedono credenziali per l'autorizzazione sicura. In genere, la tua chiave API utente viene utilizzata per eseguire tali operazioni di lunga durata senza interruzioni. Se le credenziali non sono disponibili quando crei un arricchimento dei metadati o tenti di eseguire un qualsiasi tipo di arricchimento, ti viene richiesto di creare una chiave API. Tale chiave API viene quindi salvata come credenziali dell'attività. Vedi Gestione della chiave API utente.

Puoi anche creare, modificare, eseguire o eliminare arricchimenti di metadati con le API invece che con l'interfaccia utente. I collegamenti a queste API sono elencati in Ulteriori informazioni .

Panoramica sull'arricchimento dei metadati

L'arricchimento degli asset di dati implica il seguente processo:

  1. Identificare gli asset di dati che si desidera arricchire.

  2. In un progetto, crea un asset di arricchimento dei metadati per configurare i dettagli dell'arricchimento come l'ambito e l'obiettivo dell'arricchimento e la pianificazione per il lavoro dell'arricchimento.

  3. Eseguire il lavoro di arricchimento.

  4. Per ogni asset di dati inclusi nell'arricchimento, utilizzare i risultati nell'asset di arricchimento dei metadati:

    1. Identificare anomalie e problemi di qualità e adottare le misure appropriate per risolvere eventuali problemi.
    2. Esaminare il contenuto generato, ad esempio i nomi di visualizzazione o le descrizioni generate dall'intelligenza artificiale.
    3. Controllare le assegnazioni dei termini e valutare e agire sui suggerimenti dei termini.
    4. Gestire le assegnazioni delle classi di dati a livello di colonna.
    5. Gestire le classificazioni.
    6. Identificare e impostare le chiavi primarie e le relazioni.
    7. Rileva dati sovrapposti o ridondanti.

    Puoi anche accedere ai risultati dell'arricchimento e utilizzarli nel profilo di ogni singolo asset. Vedere Profili asset. Le informazioni dettagliate sulla qualità sono disponibili nella scheda Qualità dati di un asset.

  5. Rivalutare gli asset in questione.

  6. Pubblicare gli asset di dati con i risultati come richiesto.

È possibile eseguire la maggior parte delle attività con le API invece che con l'interfaccia utente. I link alle API IBM Knowledge Catalog sono elencati per ogni attività applicabile.

Mentre è possibile aggiungere singoli asset connessi a un arricchimento metadati, l'arricchimento dei metadati è destinato all'elaborazione in massa degli asset di dati aggiunti al progetto tramite l'importazione dei metadati.

Per garantire un utilizzo congruente delle opzioni di arricchimento, puoi configurare impostazioni predefinite per tutti gli asset di arricchimento dei metadati in un progetto. Per aprire la pagina delle impostazioni, andare su Gestione > Arricchimento dei metadati. In alternativa, è possibile aprire una risorsa di arricchimento dei metadati esistente e fare clic su Impostazioni predefinite.

Per la gestione del carico di lavoro, l'esecuzione dei lavori di arricchimento dei metadati può essere limitata alle finestre di esecuzione dei lavori. L'amministratore del progetto può definire tali finestre in Gestione > Finestre di esecuzione del lavoro.

Ulteriori informazioni

Passi successivi

Argomento principale Curazione dati

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni