Watson Knowledge Catalog en Cloud Pak for Data as a Service

 

Descripción

Watson Knowledge Catalog, un servicio básico de Cloud Pak for Data como servicio, incluye una plataforma de gestión de catálogos de empresa segura que proporciona activos de datos de alta calidad que son fáciles de encontrar. La plataforma está soportada por una infraestructura de gobierno de datos que se utiliza para enriquecer activos con metadatos.

Watson Knowledge Catalog forma parte de Cloud Pak for Data as a Service y proporciona las prestaciones de gobierno y privacidad de datos de la arquitectura de entramado de datos.

Desarrolle un núcleo de conocimientos ordenando los activos de datos y enriqueciéndolos con artefactos de gobernabilidad que describan las propiedades y el significado. Los representantes de datos y los ingenieros de datos ordenan los datos importando metadatos, preparando los activos de datos, enriqueciendo los activos de datos mediante la asignación de artefactos de gobernabilidad y publicando los activos en catálogos. Algunos artefactos de gobernabilidad están predefinidos y se asignan automáticamente a los activos de datos. Los representantes de datos pueden crear o importar un glosario empresarial para enriquecer más los activos de datos durante la conservación de datos. Knowledge Accelerators proporciona glosarios empresariales listos para usar en sectores específicos. Puede utilizar categorías para controlar quién puede crear y utilizar artefactos de gobernabilidad y con qué finalidad.

Puede crear reglas de protección de datos que definan cómo proteger los datos. Las reglas de protección de datos se aplican automáticamente de forma uniforme en los catálogos gobernados. Puede configurar reglas de protección de datos para enmascarar datos confidenciales en función del contenido, el formato o el significado de los datos, o la identidad de los usuarios que acceden a los datos. Cuando se enmascaran los datos, se desbloquean para los usuarios que no están autorizados a ver datos confidenciales y se evita la necesidad de mantener varias copias de los datos.

Se proporciona una forma de autoservicio para buscar y compartir activos en su empresa con catálogos:

  • Los colaboradores de un catálogo tienen acceso a los activos de datos sin necesidad de tener credenciales separadas o poder ver las credenciales. Los colaboradores tienen roles que controlan qué actividades pueden realizar en el catálogo.
  • Los activos de datos contienen información sobre cómo acceder a los datos, las clasificaciones de datos, los términos empresariales asignados y otros artefactos de gobernabilidad, las relaciones con otros activos y la calificación y revisiones. Los activos de datos pueden ser datos relacionales os datos no estructurados, como, por ejemplo, documentos PDF o de Microsoft Office.
  • Otros tipos de activos en catálogos incluyen activos operativos, que los científicos de datos crean con herramientas para trabajar con datos como, por ejemplo, modelos, cuadernos y paneles de control.
  • La búsqueda semántica basada en metadatos y propiedades de activos de datos y recomendaciones basadas en IA ayudan a los usuarios a encontrar los datos que necesitan.

Los expertos en datos encuentran activos en catálogos y, a continuación, copian los activos en proyectos donde analizan datos y crean modelos con las herramientas Watson Studio y Watson Machine Learning.

Enlaces rápidos

Servicios integrados

Tabla 1. Servicios suplementarios. Puede ampliar la funcionalidad de este servicio con los siguientes servicios suplementarios, cada uno de los cuales requiere que se instale este servicio.
Servicio Prestación
Watson Query Integre orígenes de datos de varios tipos y ubicaciones en una vista de datos lógica.
IBM Match 360 with Watson (Beta) Obtenga una vista central y consolidada de hechos empresariales clave de la organización y gestione datos maestros durante todo su ciclo de vida.
Tabla 2. Servicios relacionados. Los siguientes servicios relacionados se utilizan a menudo con este servicio y proporcionan características complementarias, pero no son necesarios.
Servicio Prestación
Watson Studio Prepare, analice y modele datos en un entorno de colaboración con herramientas para científicos de datos, desarrolladores y expertos del dominio.
DataStage® Utilice la búsqueda incorporada, la propagación automática de metadatos y el resaltado simultáneo de los errores de compilación para crear, editar, cargar y ejecutar trabajos que transforman y adaptan información para su empresa.

Orígenes de datos compatibles

Consulte Tipos de conexión para obtener una lista de los servicios de orígenes de datos que son compatibles.