Watson Knowledge Catalog su Cloud Pak for Data as a Service

 

Descrizione

Watson Knowledge Catalog, un servizio principale di Cloud Pak for Data as a Service, include una piattaforma di gestione del catalogo aziendale sicura che fornisce asset di dati di alta qualità facili da trovare. La piattaforma è supportata da un framework di governance dei dati che si utilizza per arricchire gli asset con metadati.

Watson Knowledge Catalog fa parte di Cloud Pak for Data as a Service e fornisce le funzioni di governance dei dati e privacy dell'architettura del data fabric.

Si sviluppa un knowledge base curando gli asset di dati e arricchendoli con risorse di governance che ne descrivono le proprietà e il significato. Gli steward di dati e i data engineer curano i dati importando metadati, preparando gli asset di dati, arricchendo gli asset di dati assegnando le risorse di governance e pubblicando gli asset nei cataloghi. Alcune risorse utente di governance sono predefinite e vengono assegnate automaticamente agli asset di dati. I data steward possono creare o importare un vocabolario di business per arricchire ulteriormente gli asset di dati durante la data curation. Knowledge Accelerators fornisce una serie di vocabolari di business pronti per l'uso per settori specifici. Utilizzare le categorie per controllare chi può creare e utilizzare le risorse utente di governance per quale scopo.

È possibile creare regole di protezione dei dati che definiscono come proteggere i dati. Le regole di protezione dei dati vengono applicate automaticamente in modo uniforme nei cataloghi gestiti. È possibile configurare le regole di protezione dei dati per mascherare i dati sensibili in base al contenuto, al formato o al significato dei dati o all'identificazione degli utenti che accedono ai dati. Quando si mascherano i dati, si sbloccano i dati per gli utenti che non sono autorizzati a visualizzare i dati sensibili ed evitare la necessità di conservare più copie dei dati.

Si fornisce un modo self-service per trovare e condividere gli asset nell'azienda con i cataloghi:

  • I collaboratori in un catalogo hanno accesso agli asset di dati senza la necessità di credenziali separate o la possibilità di visualizzare le credenziali. I collaboratori hanno ruoli che controllano le attività che possono eseguire nel catalogo.
  • Gli asset di dati contengono informazioni su come accedere ai dati, classificazioni di dati, termini di business assegnati e altre risorse utente di governance, relazioni con altri asset e valutazione e revisioni. Gli asset di dati possono essere dati relazionali o dati non strutturati, come documenti PDF o Microsoft Office.
  • Altri tipi di asset nei cataloghi includono asset operativi, che i data scientist creano con strumenti per gestire i dati, come modelli, notebook e dashboard.
  • La ricerca semantica basata su proprietà e metadati di asset di dati e suggerimenti basati sull'intelligenza artificiale consente agli utenti di trovare i dati di cui hanno bisogno.

I data scientist trovano gli asset nei cataloghi e quindi li copiano nei progetti in cui analizzano i dati e creano modelli con gli strumenti Watson Studio e Watson Machine Learning .

Link rapidi

Servizi integrati

Tabella 1. Servizi supplementari. È possibile estendere la funzionalità di questo servizio con i seguenti servizi supplementari, ciascuno dei quali richiede l'installazione di questo servizio.
Servizio Funzionalità
Watson Query Integrare le origini dati in più tipi e ubicazioni in un'unica vista di dati logici.
IBM Match 360 with Watson (Beta) Ottieni una vista centrale e consolidata dei dati di business chiave della tua organizzazione e gestisci i dati master per tutto il ciclo di vita.
Tabella 2. Servizi correlati. I seguenti servizi correlati sono spesso utilizzati con questo servizio e forniscono funzioni complementari, ma non sono richiesti.
Servizio Funzionalità
Watson Studio Prepara, analizza e modella i dati in un ambiente collaborativo con strumenti per data scientist, sviluppatori ed esperti di dominio.
   
DataStage® Utilizzare la ricerca integrata, la propagazione automatica dei metadati e l'evidenziazione simultanea degli errori di compilazione per creare, modificare, caricare ed eseguire lavori che trasformano e personalizzano le informazioni per l'azienda.

Origini dati compatibili

Consultare Tipo di connessione per un elenco di servizi di origine dati compatibili.