0 / 0
Volver a la versión inglesa de la documentación
Gobierno de datos (IBM Knowledge Catalog)
Última actualización: 13 dic 2024
Gobierno de datos (IBM Knowledge Catalog)

El gobierno de datos es el proceso de seguimiento y control de activos de datos basados en metadatos de activos. Los catálogos son espacios de trabajo en los que se proporciona acceso controlado a los activos gobernados.

Servicio necesario
IBM Knowledge Catalog

Un catálogo contiene activos y colaboradores. Los colaboradores son las personas que añaden activos al catálogo y las personas que necesitan utilizar los activos. Puede personalizar el gobierno de datos para enriquecer y controlar activos de datos en catálogos.

Obtenga más información sobre el gobierno o empiece con los catálogos y el gobierno:

Enfoques de gobierno de datos

Puede configurar el gobierno de datos de forma iterativa. Puede empezar con una implementación simple de gobierno de datos que se basa en artefactos predefinidos y características predeterminadas. A continuación, a medida que cambien sus necesidades, puede personalizar la infraestructura de gobierno de datos para describir y proteger mejor sus activos de datos.

Para ver las herramientas que puede utilizar para controlar los datos, abra la correlación de herramientas y servicios y pulse Gobernabilidad en la sección de tareas.

Implementación más sencilla del gobierno de datos

Puede utilizar un catálogo para compartir activos en toda la organización. Un catálogo puede actuar como almacén de características conteniendo conjuntos de datos con columnas que se utilizan como características (entradas) en modelos de aprendizaje automático. Un administrador de IBM Knowledge Catalog crea el catálogo para compartir activos y añade ingenieros de datos, científicos de datos y analistas de negocio como colaboradores. Los colaboradores de catálogo pueden trabajar con activos de catálogo copiándolos en proyectos y pueden publicar activos que crean en proyectos en el catálogo.

Los catálogos almacenan y realizan un seguimiento de los elementos. Los proyectos son donde los usuarios preparan activos de datos y modelos de compilación. Los activos se mueven entre el catálogo y los proyectos.

Los colaboradores del catálogo pueden añadir activos al catálogo para compartirlos con otros o buscar y utilizar activos de las formas siguientes:

  • Los ingenieros de datos crean datos limpios, datos virtualizados y activos de datos integrados en proyectos y, a continuación, publican los activos en el catálogo.
  • Los ingenieros de datos importan tablas o archivos de un origen de datos en el catálogo.
  • Los expertos en datos y los analistas de negocio encuentran activos de datos en catálogos y, a continuación, añaden los activos a los proyectos para trabajar con los datos.

Los activos de datos acumulan metadatos a lo largo del tiempo de las siguientes maneras:

  • Los activos de datos se perfilan, lo que asigna automáticamente clases de datos predefinidas que describen el formato de los datos.
  • Los colaboradores del catálogo añaden etiquetas, términos empresariales predefinidos, clases de datos y clasificaciones, relaciones y evaluaciones a los activos.
  • Todas las acciones en activos se guardan automáticamente en el historial de activos.

Consulte Creación de un catálogo.

Opciones de personalización para el gobierno de datos

Puede añadir o actualizar cualquiera de las opciones personalizadas a la implementación de gobierno de datos en cualquier momento. Su equipo de gobierno puede establecer su vocabulario de negocio, importar y enriquecer datos con su vocabulario, analizar la calidad de los datos, definir reglas para proteger los datos y, a continuación, publicar los activos de datos en un catálogo donde los consumidores de datos puedan encontrarlos. Cuando los datos cambian, puede volver a importar metadatos sobre las tablas o archivos y enriquecer los activos de datos con su vocabulario empresarial y análisis de calidad de datos. Puede crear reglas cada vez más precisas para proteger los datos a medida que amplía su vocabulario empresarial. A lo largo del ciclo de gobierno de datos, los científicos de datos y otros consumidores de datos pueden encontrar datos de confianza en los catálogos. La siguiente ilustración muestra cómo el gobierno de datos es un ciclo continuo de renovación de los metadatos para que los activos de datos reflejen los cambios en los datos y los cambios en el vocabulario empresarial.

El ciclo de las tareas de gobierno de datos

Establezca su vocabulario de negocio

  • El equipo de gobierno puede establecer un vocabulario empresarial que describa el significado de los datos con términos empresariales y el formato de los datos con clases de datos. Un vocabulario de negocio ayuda a los usuarios de negocio a encontrar más fácilmente lo que buscan utilizando términos no técnicos.
  • Su equipo puede establecer rápidamente su vocabulario de negocio importando su vocabulario de negocio existente o importando Knowledge Accelerators que proporcionan entre docenas y miles de artefactos de gobernabilidad.
  • El administrador de IBM Knowledge Catalog puede personalizar el flujo de trabajo, la organización, las propiedades y las relaciones de los artefactos de gobernabilidad.

Consulte Planificación de la implementación de una infraestructura de gobierno.

Importar y enriquecer activos de datos con su vocabulario empresarial

  • Los encargados de datos pueden ejecutar regularmente trabajos de importación y enriquecimiento de metadatos que actualizan el catálogo con cambios en tablas o archivos de los orígenes de datos y asignan automáticamente los términos empresariales y las clases de datos adecuados.
  • Cuando el equipo añade artefactos de gobernabilidad, los trabajos de enriquecimiento de metadatos sugieren los nuevos artefactos a los activos de datos nuevos o actualizados.
  • Cuando los encargados de datos confirman o ajustan las asignaciones de términos empresariales durante el enriquecimiento de metadatos, los algoritmos de aprendizaje automático para la asignación de términos se vuelven más precisos para los datos.
  • Los encargados de datos pueden configurar la importación y el enriquecimiento de metadatos para que se ejecuten sólo cuando se detecten cambios.
  • Puede utilizar las funciones de enriquecimiento gen AI para generar nombres descriptivos de activos y columnas, para generar descripciones significativas de activos y columnas y para asignar términos empresariales.

Consulte Planificación de la ordenación de activos de datos para compartir en catálogos.

Analizar calidad de datos

  • Los encargados de datos pueden analizar la calidad de los datos con los valores predeterminados durante el enriquecimiento de metadatos. El análisis de calidad de datos se aplica a cada activo en su conjunto y a las columnas de las tablas.
  • Los encargados de datos pueden crear definiciones de calidad de datos personalizadas y aplicarlas en reglas de calidad de datos, o aplicar reglas de calidad de datos basadas en SQL.

Consulte Planificación de la ordenación de activos de datos para compartir en catálogos.

Proteja sus datos con reglas

  • El equipo de gobierno puede crear un plan para las reglas de protección de datos escribiendo políticas que documenten los estándares y directrices de la organización para proteger y gestionar los datos. Por ejemplo, una política puede describir una normativa específica y cómo una regla de protección de datos garantiza el cumplimiento de dicha normativa.
  • El equipo de gobierno puede crear reglas de protección de datos que definan cómo mantener privada la información privada. Las reglas de protección de datos se evalúan automáticamente para su aplicación cada vez que un usuario intenta acceder a un activo de datos en cualquier catálogo gobernado en la plataforma. Las reglas de protección de datos pueden definir cómo controlar el acceso a los datos, enmascarar valores confidenciales o filtrar filas de activos de datos.
  • Su equipo puede empezar con reglas de protección de datos basadas en etiquetas personalizadas, usuarios o clases de datos predefinidas, términos empresariales y clasificaciones. Cuando el equipo de gobierno añade artefactos de gobernabilidad, el equipo puede definir reglas de protección de datos basadas en su vocabulario empresarial.
  • Los ingenieros de datos pueden aplicar reglas de protección de datos en datos virtualizados.
  • Los ingenieros de datos pueden enmascarar permanentemente datos en activos de datos con flujos de enmascaramiento.

Consulte Planificación de la protección de datos con reglas.

Iniciación a IBM Knowledge Catalog

Las tareas para empezar con IBM Knowledge Catalog dependen de su objetivo. Las acciones que puede realizar las definen los roles de acceso al servicio de Cloud Pak for Data . Algunas acciones también tienen requisitos de rol de espacio de trabajo, como ser un colaborador en un catálogo o categoría.

Para comprobar los roles de acceso al servicio, consulte Determinación de la cuenta de IBM Cloud y los roles de acceso al servicio. Para comprender los roles de IBM Knowledge Catalog , consulte roles y permisos de usuario.

En la tabla siguiente se muestran los objetivos comunes, los roles de acceso al servicio de Cloud Pak for Data necesarios y los enlaces a la información para empezar.

Objetivo Rol de acceso al servicio de Cloud Pak for Data necesario Más información
Configurar o administrar IBM Knowledge Catalog Gestor Planificación de la implementación del gobierno de datos
Configuración de IBM Knowledge Catalog
Gestión de IBM Knowledge Catalog
Buscar activos o características en un catálogo Cualquier rol Búsqueda de activos en un catálogo
Búsqueda de activos en toda la plataforma
Adición de un activo de catálogo a un proyecto
Organizar datos CloudPak Data Steward o
CloudPak Data Engineer
Curación de datos
Planificación de la ordenación de datos
Gestionar calidad de datos CloudPak Data Steward o
CloudPak Data Engineer
Gestión de la calidad de datos
Crear artefactos de gobernabilidad CloudPak Data Steward o
CloudPak Data Engineer
Gestión de artefactos de gobernabilidad
Importación de Knowledge Accelerators
Planificación de la implementación de una infraestructura de gobernabilidad
Creación de reglas de protección de datos CloudPak Data Steward o
CloudPak Data Engineer
Reglas de protección de datos
Planificación de la protección de datos con reglas
Ejecutar las API de IBM Knowledge Catalog El mismo rol para realizar la tarea en la interfaz de usuario. - API IBM Knowledge Catalog
Generar informes en IBM Knowledge Catalog Administrador de informes Configuración de la creación de informes

Más información

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información