Si crea un framework di governance per gestire e arricchire i dati implementando le risorse di governance negli spazi di lavoro collaborativi denominati categorie. Alcuni tipi di risorse utente di governance agiscono come metadati per arricchire gli asset di dati. Altri tipi di risorse utente di governance controllano l'accesso agli asset di dati o ad altre risorse utente.
Servizio richiesto
IBM Knowledge Catalog
Le risorse utente di governance vengono utilizzate per questi scopi:
Arricchimento : le risorse utente possono aggiungere conoscenza e significato agli asset.
Accesso di controllo: le risorse utente possono controllare chi visualizza quali dati o quali risorse utente.
Identificazione: le risorse utente possono agire come criteri per identificare gli asset o i dati per altre risorse utente.
Qualità: le risorse utente possono essere utilizzate per monitorare la qualità dei dati.
È possibile utilizzare le categorie e le risorse utente di governance da una o tutte le seguenti origini:
Risorse di governance predefinite fornite con IBM Knowledge Catalog
Risorse di governance personalizzate create dal team di governance
La seguente tabella descrive brevemente le categorie e ciascun tipo di risorsa utente di governance e indica se uno degli elementi è predefinito o disponibile in Knowledge Accelerators.
Le categorie organizzano le risorse utente di governance in una struttura gerarchica simile alle cartelle. È possibile utilizzare ruoli di categoria per definire la proprietà delle risorse utente, controllare il loro autore e limitare la loro visibilità.
Esempi: Business Performance Indicator, Ambiti di business
I termini di business implementano un vocabolario aziendale comune per descrivere il significato dei dati. È possibile creare termini di business per garantire la chiarezza e la compatibilità tra i dipartimenti, i progetti o i prodotti. I termini di business sono il nucleo del quadro di governance e tipicamente formano la maggior parte delle risorse utente di governance. È possibile assegnare manualmente i termini di business alle colonne di dati, alle tabelle o ai file o assegnarli automaticamente durante lo sviluppo dei metadati. È possibile utilizzare i termini di business nelle regole di governance e nelle regole applicabili per identificare i dati interessati.
Esempi: valore di durata del cliente, numero di telefono del lavoro
Limitato: i termini di business predefiniti e la categoria Knowledge Accelerator Sample Personal Data che li include sono disponibili solo se crei un'istanza del servizio Watson Knowledge Catalog con un piano Lite o Standard dopo il 7 ottobre 2022. Per ulteriori informazioni, consultare Termini di business predefiniti.
Ogni Knowledge Accelerator fornisce molti termini di business.
Le classi di dati classificano i dati in base alla struttura, al formato e alla gamma di valori dei dati. Le classi di dati vengono assegnate automaticamente alle colonne dati corrispondenti durante il profiling e la valorizzazione dei metadati. È possibile creare classi di dati definendo criteri di corrispondenza con un'espressione o una serie di dati di riferimento. È possibile creare relazioni tra le classi di dati e i termini di business per collegare il formato dati con il significato di business. I termini di business correlati vengono automaticamente assegnati ai dati insieme alle relative classi di dati. La conformità delle colonne ai criteri della loro classe di dati contribuisce all'analisi della qualità dei dati. Prima di avere una serie robusta di termini di business, è possibile utilizzare le classi di dati in regole esecutive per identificare i dati interessati.
Le serie di dati di riferimento definiscono valori standard per tipi specifici di dati per classificare i dati e misurare la coerenza. Le serie di dati di riferimento agiscono come tabelle di ricerca che mappano codici e valori. È possibile includere una serie di dati di riferimento nella definizione di una classe di dati come parte dei criteri di corrispondenza dei dati. Alcune serie di dati di riferimento sono standardizzate da organizzazioni come l'International Organization for Standardization (ISO). I dati di riferimento possono essere gerarchici o mappati su serie correlate.
Le classificazioni descrivono caratteristiche specifiche del significato dei dati. Le classificazioni predefinite descrivono la sensibilità dei dati. È possibile creare classificazioni per descrivere altre caratteristiche di dati o altri elementi di governance. Ad esempio, Knowledge Accelerators utilizza le classificazione per classificare i termini di business. È possibile utilizzare le classificazioni per costruire politiche e regole di governance. Di solito, si relazionano più termini di business ad ogni classificazione e poi i dati vengono indirettamente classificati attraverso i relativi termini di business assegnati. È anche possibile assegnare manualmente una classificazione a un asset di dati.
Le politiche descrivono come gestire e proteggere gli asset di dati. Le politiche vengono create combinando regole e politiche secondarie. È possibile includere le regole di protezione dei dati nelle politiche per controllare e gestire i dati. Tuttavia, le politiche non influenzano l'applicazione delle regole di protezione dei dati. È possibile includere regole di governance nelle politiche per documentare standard e procedure.
Le regole di governance descrivono come applicare una politica. Le regole di governance forniscono una descrizione in linguaggio naturale dei criteri utilizzati per determinare se gli asset di dati sono conformi agli obiettivi di business. Le regole di governance non vengono applicate da IBM Knowledge Catalog. Tuttavia, è possibile correlare le regole di governance a regole esecutive, come le regole di protezione dei dati e le regole di qualità dei dati.
Le regole di protezione dei dati definiscono come controllare l'accesso ai dati in base alle proprietà degli utenti e degli asset e alle risorse utente di governance assegnate. Le regole di protezione dati definiscono chi può visualizzare quali dati. All'interno delle regole di protezione dei dati, è possibile includere classificazioni, classi di dati, termini di business o tag per identificare i dati da controllare. Si specifica di negare l'accesso ai dati o di mascherare i valori dei dati sensibili. Le regole di protezione dei dati vengono applicate automaticamente solo nei cataloghi gestiti. Le regole di protezione dei dati non sono organizzate o controllate dalle categorie.
Esempio: colonne di maschera assegnate al termine di business Identificativo passaporto.
Le regole SLA sulla qualità dei dati monitorano la qualità dei dati degli elementi critici per verificare la conformità a determinati criteri di qualità e possono attivare flussi di lavoro di correzione in caso di violazioni. Si selezionano le risorse di dati e le colonne da monitorare per nome o per termini aziendali assegnati. La conformità e le violazioni degli SLA sono segnalate nella pagina Qualità dei dati di un asset. Le regole SLA sulla qualità dei dati non sono organizzate o controllate per categorie.
Esempio: Segnalare una violazione se il punteggio della dimensione di completezza per la colonna ACCOUNT_ID nella risorsa dati BANK_ACCOUNT scende al di sotto del 99% e attivare il flusso di lavoro predefinito di correzione.
Nessuna
Nessuna
Le risorse di governance si trovano nell'ambito dei cataloghi IBM Knowledge Catalog nello stesso account IBM Cloud .
Devi disporre delle autorizzazioni del servizio Cloud Pak for Data specifiche per utilizzare le risorse di governance. Vedere Permessi richiesti.
Alcuni piani diIBM Knowledge Catalog hanno dei limiti sul numero di risorse utente di governance di uno specifico tipo che è possibile creare.
Guarda questo breve video per scoprire le funzioni delle politiche.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.
Informazioni sui cookie del presente sitoPer il corretto funzionamento, i nostri siti Web richiedono alcuni cookie (richiesto). Inoltre, con il suo consenso, potrebbero essere utilizzati altri cookie per l'analisi dell'utilizzo del sito, per migliorare l'esperienza utente e per scopi pubblicitari.Per ulteriori informazioni, consultare le Preferenze cookie. Visitando il nostro sito web, accettate il trattamento delle informazioni da parte nostra come descritto nelladichiarazione sulla privacy di IBM.Per consentire una corretta navigazione, le preferenze per i cookie dell'utente verranno condivise sui domini Web IBM qui elencati.