Cree una infraestructura de gobierno para gobernar y enriquecer los datos implementando artefactos de gobierno en espacios de trabajo de colaboración denominados categorías. Algunos tipos de artefactos de gobierno actúan como metadatos para enriquecer los activos de datos. Otros tipos de artefactos de gobierno controlan el acceso a los activos de datos o a otros artefactos.
Servicio necesario
IBM Knowledge Catalog
Utilice artefactos de gobierno para estos fines:
Enriquecimiento: Los artefactos pueden añadir conocimiento y significado a los activos.
Acceso de control: Los artefactos pueden controlar quién ve qué datos o qué artefactos.
Identificación: Los artefactos pueden actuar como criterios para identificar activos o datos para otros artefactos.
Calidad: Los artefactos se pueden utilizar para supervisar la calidad de los datos.
Puede utilizar categorías y artefactos de gobierno procedentes de cualquiera de estos orígenes o de todos ellos:
Artefactos de gobernabilidad predefinidos que se proporcionan con IBM Knowledge Catalog
Artefactos de gobierno personalizados que crea el equipo de gobierno
La tabla siguiente describe brevemente las categorías y cada tipo de artefacto de gobierno e indica si alguno de los elementos está predefinido o está disponible en Knowledge Accelerators.
Las categorías organizan los artefactos de gobierno en una estructura jerárquica similar a las carpetas. Puede utilizar roles de categoría para definir la propiedad de artefactos, controlar su creación y restringir su visibilidad.
Ejemplos: Indicadores de rendimiento empresarial, ámbitos empresariales
La categoría [sin categorizar], que contiene las clases de datos y clasificaciones predefinidas.
La categoría Ubicaciones, que contiene los conjuntos de datos de referencia predefinidos.
Los términos empresariales implementan un vocabulario empresarial común para describir el significado de los datos. Cree términos empresariales para garantizar la claridad y la compatibilidad entre departamentos, proyectos o productos. Los términos empresariales son el núcleo de la infraestructura de gobierno y normalmente forman el grueso de los artefactos de gobierno. Puede asignar manualmente términos empresariales a columnas de datos, tablas o archivos o asignarlos automáticamente durante el enriquecimiento de metadatos. Puede utilizar términos empresariales en reglas de gobierno y en reglas aplicables ara identificar los datos afectados.
Ejemplos: Valor de tiempo de vida del cliente, Número de teléfono del trabajo
Limitado: los términos de negocio predefinidos y la categoría Datos personales de ejemplo de Knowledge Accelerator que los incluye solo están disponibles si crea una instancia de servicio de Watson Knowledge Catalog con un plan Lite o Estándar después del 7 de octubre de 2022. Para obtener más información, consulte Términos de negocio predefinidos.
Cada acelerador de conocimientos proporciona muchos términos empresariales.
Las clases de datos clasifican los datos en función de la estructura, el formato y el rango de valores de los datos. Las clases de datos se asignan automáticamente a las columnas de datos coincidentes durante el enriquecimiento de metadatos y la creación de perfiles. Puede crear clases de datos definiendo criterios de coincidencia con una expresión o un conjunto de datos de referencia. Puede crear relaciones entre clases de datos y términos empresariales para enlazar el formato de datos con el significado empresarial. Los términos empresariales relacionados se asignan automáticamente a los datos junto con sus clases de datos relacionadas. La conformidad de las columnas con sus criterios de clase de datos contribuye al análisis de calidad de los datos. Antes de tener un conjunto robusto de términos empresariales, puede utilizar clases de datos en reglas ejecutables para identificar los datos afectados.
Ejemplos: Número de teléfono, Dirección de correo electrónico
Los conjuntos de datos de referencia definen valores estándar para tipos específicos de datos para clasificar datos y medir la coherencia. Los conjuntos de datos de referencia actúan como tablas de búsqueda que correlacionan códigos y valores. Puede incluir un conjunto de datos de referencia en la definición de una clase de datos como parte de los criterios de coincidencia de datos. Algunos conjuntos de datos de referencia son estandarizados por organizaciones, como la International Organization for Standardization (ISO). Los datos de referencia pueden ser jerárquicos o correlacionados entre conjuntos relacionados.
Las clasificaciones describen características específicas del significado de los datos. Las clasificaciones predefinidas describen la confidencialidad de los datos. Puede crear clasificaciones para describir otras características de datos u otros elementos de gobierno. Por ejemplo, Knowledge Accelerators utiliza clasificaciones para clasificar los términos empresariales. Puede utilizar clasificaciones para crear políticas y reglas de gobierno. Normalmente, se relacionan varios términos empresariales con cada clasificación y, a continuación, los datos se clasifican indirectamente mediante sus términos empresariales asignados. También puede asignar una clasificación manualmente a un activo de datos.
Las políticas describen cómo gestionar y proteger los activos de datos. El usuario vrea políticas combinando reglas y subpolíticas. Puede incluir reglas de protección de datos en las políticas para controlar y gestionar los datos. Sin embargo, las políticas no afectan a la aplicación de las reglas de protección de datos. Puede incluir reglas de gobierno en políticas para documentar estándares y procedimientos.
Las reglas de gobernabilidad describen cómo aplicar una política. Las reglas de gobernabilidad proporcionan una descripción en lenguaje natural de los criterios que se utilizan para determinar si los activos de datos cumplen los objetivos empresariales. IBM Knowledge Catalog no aplica las reglas de gobernabilidad. Sin embargo, puede relacionar reglas de gobierno con reglas ejecutables, como reglas de protección de datos y reglas de calidad de datos.
Las reglas de protección de datos definen cómo controlar el acceso a los datos basándose en las propiedades de usuarios y activos y en los artefactos de gobernabilidad asignados. Las reglas de protección de datos definen quién puede ver qué datos. Dentro de las reglas de protección de datos, puede incluir clasificaciones, clases de datos, términos empresariales o etiquetas para identificar los datos que se deben controlar. Puede especificar que se deniegue el acceso a los datos o que se enmascaren los valores de datos confidenciales. Las reglas de protección de datos se aplican automáticamente sólo en los catálogos gobernados. Las reglas de protección de datos no se organizan ni se controlan por categorías.
Ejemplo: Enmascarar columnas que se asignan al término empresarial Identificador de pasaporte.
Las reglas SLA de calidad de datos supervisan la calidad de los elementos de datos críticos para comprobar si cumplen determinados criterios de calidad y pueden activar flujos de trabajo de corrección en caso de infracción. Seleccione los activos de datos y las columnas que desea supervisar por nombre o por términos empresariales asignados. El cumplimiento y las infracciones de los SLA se notifican en la página Calidad de los datos de un activo de datos. Las reglas de SLA de calidad de datos no están organizadas ni controladas por categorías.
Ejemplo: Informar de una infracción si la puntuación de la dimensión de integridad de la columna ACCOUNT_ID en el activo de datos BANK_ACCOUNT es inferior al 99% y activar el flujo de trabajo de corrección predeterminado.
Ninguna
Ninguna
Los artefactos de gobernabilidad se circunscriben a los catálogos de IBM Knowledge Catalog en la misma cuenta de IBM Cloud .
Debe tener permisos específicos del servicio de Cloud Pak for Data para poder trabajar con artefactos de gobernabilidad. Consulte Permisos necesarios.
Algunos planes de IBM Knowledge Catalog tienen límites en el número de artefactos de gobernabilidad de un tipo específico que puede crear.
Vea este breve vídeo para conocer las características de las políticas.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.