Watson Knowledge Catalog en Cloud Pak for Data as a Service

Descripción

Watson Knowledge Catalog, un servicio básico de Cloud Pak for Data como servicio, incluye una plataforma de gestión de catálogos de empresa segura que proporciona activos de datos de alta calidad que son fáciles de encontrar. La plataforma está soportada por una infraestructura de gobierno de datos que se utiliza para garantizar que el acceso a los datos sea compatible con las reglas y estándares empresariales impidiendo el acceso a información confidencial por parte de usuarios no autorizados.

Desarrolle un núcleo de conocimientos ordenando los activos de datos y enriqueciéndolos con artefactos de gobernabilidad que describan las propiedades y el significado. Los representantes de datos y los ingenieros de datos ordenan los datos importando metadatos, preparando los activos de datos, enriqueciendo los activos de datos mediante la asignación de artefactos de gobernabilidad y publicando los activos en catálogos. Algunos artefactos de gobernabilidad están predefinidos y se asignan automáticamente a los activos de datos. Los representantes de datos pueden crear o importar un glosario empresarial para enriquecer más los activos de datos durante la conservación de datos. Knowledge Accelerators proporciona glosarios empresariales listos para usar en sectores específicos. Puede utilizar categorías para controlar quién puede crear y utilizar artefactos de gobernabilidad y con qué finalidad.

Puede crear reglas de protección de datos que protejan los datos en toda la plataforma. Las reglas de protección de datos se aplican automáticamente de manera uniforme. Puede configurar reglas de protección de datos para enmascarar datos confidenciales en función del contenido, el formato o el significado de los datos, o la identidad de los usuarios que acceden a los datos. Cuando se enmascaran los datos, se desbloquean para los usuarios que no están autorizados a ver datos confidenciales y se evita la necesidad de mantener varias copias de los datos.

Se proporciona una forma de autoservicio para buscar y compartir activos en su empresa con catálogos:

  • Los colaboradores de un catálogo tienen acceso a los activos de datos sin necesidad de tener credenciales separadas o poder ver las credenciales. Los colaboradores tienen roles que controlan qué actividades pueden realizar en el catálogo.
  • Los activos de datos contienen información sobre cómo acceder a los datos, las clasificaciones de datos, los términos empresariales asignados y otros artefactos de gobernabilidad, las relaciones con otros activos y la calificación y revisiones. Los activos de datos pueden ser datos relacionales os datos no estructurados, como, por ejemplo, documentos PDF o de Microsoft Office.
  • Otros tipos de activos en catálogos incluyen activos operativos, que los científicos de datos crean con herramientas para trabajar con datos como, por ejemplo, modelos, cuadernos y paneles de control.
  • La búsqueda semántica basada en metadatos y propiedades de activos de datos y recomendaciones basadas en IA ayudan a los usuarios a encontrar los datos que necesitan.

Los expertos en datos encuentran activos en catálogos y, a continuación, copian los activos en proyectos donde analizan datos y crean modelos con las herramientas Watson Studio y Watson Machine Learning.

Enlaces rápidos

Servicios integrados

Tabla 1. Servicios complementarios
Servicio Prestación
Watson Query Integre orígenes de datos de varios tipos y ubicaciones en una vista de datos lógica.
IBM Match 360 con Watson (Beta) Obtenga una vista central y consolidada de hechos empresariales clave de la organización y gestione datos maestros durante todo su ciclo de vida.
Tabla 2. Servicios relacionados
Servicio Prestación
Watson Studio Prepare, analice y modele datos en un entorno de colaboración con herramientas para científicos de datos, desarrolladores y expertos del dominio.

Orígenes de datos compatibles

Consulte Tipos de conexión para obtener una lista de los servicios de orígenes de datos que son compatibles.