Caso de uso de inteligencia de datos

Última actualización: 05 mar 2025
Caso de uso de inteligencia de datos

Confíe en la calidad de sus datos y en la información que generan con la inteligencia de datos. Muchas empresas luchan por equilibrar las ventajas de proporcionar acceso a los datos con la necesidad de proteger los datos confidenciales. Cloud Pak for Data as a Service proporciona los métodos que su empresa necesita para automatizar la inteligencia de datos, de modo que pueda asegurarse de que los datos son accesibles y están protegidos.

La gobernanza de datos es una parte fundamental del caso de uso de inteligencia de datos en Cloud Pak for Data. Vea este vídeo para ver un caso de uso típico de la gobernanza de datos.

Este vídeo ofrece un método visual para aprender los conceptos y tareas de esta documentación.

Desafíos

Muchas empresas se enfrentan a los siguientes desafíos de inteligencia de datos:

Proporcionar privacidad de datos a escala
Las organizaciones deben cumplir con las normativas de privacidad de datos para los datos en fuentes de datos en múltiples plataformas en la nube y en las instalaciones.
Acceso a datos de alta calidad
Las organizaciones deben proporcionar acceso a datos empresariales de alta calidad a través de múltiples equipos.
Creación de un perfil de cliente completo
Los equipos necesitan crear vistas precisas de los clientes a escala, rápidamente, para optimizar los procesos de autoservicio y la administración de datos.
Seguimiento del recorrido de sus datos
Los equipos deben garantizar la precisión, la confianza y el cumplimiento mediante la asignación del recorrido de sus datos.
Proporcionar consumo de datos de autoservicio
Los consumidores de datos, como los científicos de datos, tienen dificultades para encontrar y utilizar los datos que necesitan.

Puede resolver estos desafíos implementando una estructura de datos con Cloud Pak for Data as a Service.

Ejemplo: Desafíos de Golden Bank

Siga la historia de Golden Bank mientras el equipo de gobernanza implementa una solución de inteligencia de datos. Golden Bank tiene una gran cantidad de datos de clientes e hipotecas que incluyen datos confidenciales.El banco quiere garantizar la calidad de los datos, ocultar los datos confidenciales y hacerlos disponibles para su uso en varios departamentos.

Proceso

La forma de implementar la gobernanza de datos depende de las necesidades de su organización. Puede implementar la gobernanza de datos de manera lineal o iterativa. Puede confiar en las funciones predeterminadas y los artefactos predefinidos, o personalizar su solución.

Para implementar la gobernanza de datos, su organización podría seguir este proceso:

  1. Establezca su vocabulario empresarial
  2. Defina reglas para proteger sus datos
  3. Organizar y consolidar sus datos
  4. Compartir sus datos en catálogos

El servicio de Inteligencia de datos ( IBM Knowledge Catalog ) en Cloud Pak for Data proporciona las herramientas y los procesos que su organización necesita para implementar una solución de Inteligencia de datos.

Imagen que muestra el flujo de activos en el caso de uso de inteligencia de datos

1. Establezca su vocabulario empresarial

Para hacer frente a los desafíos, su equipo necesita establecer un vocabulario empresarial importando o creando artefactos de gobernanza que actúen como metadatos para clasificar y describir los datos:

  • Antes de poder automatizar la privacidad de los datos, su equipo debe asegurarse de que los datos que se van a controlar están identificados con precisión.
  • Antes de poder analizar la calidad de los datos, es necesario identificar el formato de los mismos.
  • Para que los datos sean fáciles de encontrar, su equipo debe asegurarse de que el contenido de los datos se describe con precisión.

En este primer paso del proceso, su equipo de gobernanza puede construir sobre la base de los artefactos de gobernanza predefinidos y crear artefactos de gobernanza personalizados que sean específicos para su organización. Puede crear artefactos para describir el formato, el significado comercial, la confidencialidad, el rango de valores y las políticas de gobernanza de los datos.

Lo que puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Categorías Utilice la categoría predefinida para almacenar sus artefactos de gobernanza.

Cree categorías para organizar los artefactos de gobernanza en una estructura jerárquica similar a las carpetas.

Añada colaboradores con roles que definan sus permisos sobre los artefactos de la categoría.
Necesita más que la categoría predefinida.

Desea un control preciso de quién puede poseer, crear y ver artefactos de gobernanza.
flujos de trabajo Utilice la configuración de flujo de trabajo predeterminada que no restringe quién crea artefactos de gobernanza ni requiere revisiones.

Configure flujos de trabajo para artefactos de gobernanza y designe quién puede crear qué tipos de artefactos de gobernanza en qué categorías.
Quiere controlar quién crea artefactos de gobernanza.

Quiere que los borradores de artefactos de gobernanza se revisen antes de publicarlos.
Artefactos de gobernabilidad Utilice los términos comerciales, las clases de datos y las clasificaciones predefinidos.

Cree artefactos de gobernanza que actúen como metadatos para enriquecer, definir y controlar los activos de datos.
Desea añadir conocimiento y significado a los activos para ayudar a las personas a comprender los datos.

Desea mejorar el análisis de la calidad de los datos.
Knowledge Accelerators Importe un conjunto de artefactos de gobernanza predefinidos para mejorar la clasificación de datos, el cumplimiento normativo, el análisis de autoservicio y otras operaciones de gobernanza. Necesita un vocabulario estándar para describir cuestiones empresariales, rendimiento empresarial, estándares del sector y normativas.

Quiere ahorrar tiempo importando artefactos de gobernanza creados previamente.

Ejemplo: vocabulario comercial de Golden Bank

El líder del equipo de gobernanza del Golden Bank comienza creando una categoría, Banca, para albergar los artefactos de gobernanza que el equipo planea crear. El líder del equipo añade al resto de miembros del equipo de gobernanza como colaboradores a la categoría Banca con el rol de Editor para que tengan permiso para crear artefactos de gobernanza. A continuación, el jefe de equipo configura los flujos de trabajo de modo que un miembro diferente del equipo sea responsable de crear cada tipo de artefacto. Todos los flujos de trabajo requieren una aprobación por parte del jefe de equipo.

Un miembro del equipo de gobernanza importa un conjunto de términos comerciales desde una hoja de cálculo. Algunos de los términos comerciales están asociados con las ocupaciones de los clientes personales. Otro miembro del equipo crea un conjunto de datos de referencia, «Profesiones», que contiene una lista de ocupaciones, donde cada ocupación tiene un número de identificación. Un tercer miembro del equipo crea una clase de datos personalizada, «Profesión», para identificar la profesión de los clientes personales, basada en el conjunto de datos de referencia.

2. Defina reglas para proteger sus datos

En el siguiente paso del proceso, su equipo define reglas para garantizar el cumplimiento de las normativas de privacidad de datos controlando quién puede ver qué datos. Su equipo crea reglas de protección de datos para definir cómo proteger los datos en catálogos gobernados. Su equipo puede utilizar estas reglas de protección de datos para enmascarar datos confidenciales basados en el contenido, formato o significado de los datos, o la identidad de los usuarios que acceden a los datos.

Lo que puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Reglas de protección de datos Proteja la información confidencial del acceso no autorizado en catálogos regulados denegando el acceso a los datos, enmascarando los valores de los datos o filtrando las filas en los activos de datos.

Enmascare de forma dinámica y coherente los datos en catálogos regulados a un nivel granular definido por el usuario.
Necesita aplicar automáticamente la privacidad de los datos en todos sus catálogos gestionados.

Desea mantener la disponibilidad y utilidad de los datos y, al mismo tiempo, cumplir con las normativas de privacidad.
Flujos de enmascaramiento Utilice funciones avanzadas de enmascaramiento de datos que preservan el formato cuando extraiga copias o subconjuntos de datos de producción. Necesita datos de entrenamiento anonimizados y conjuntos de prueba que conserven la integridad de los datos.
Políticas y normas de gobernanza Describa y documente las directrices, normativas, estándares o procedimientos de su organización en materia de seguridad de datos.

Describa el comportamiento o las acciones necesarias para aplicar la política de gobernanza.
Usted quiere que las personas que utilizan los datos comprendan las políticas de gestión de datos.

Ejemplo: Normas de protección de datos de Golden Bank

Para crear un modelo predictivo para la aprobación de hipotecas, los científicos de datos de Golden Bank necesitan acceder a conjuntos de datos que incluyen datos confidenciales. Por ejemplo, los científicos de datos quieren acceder a la tabla con datos sobre solicitantes de hipotecas, que incluye una columna con números de la seguridad social.

Un miembro del equipo de gobernanza crea una regla de protección de datos que oculta los números de la seguridad social. Si la clase de datos asignada a una columna en un activo de datos es «Número de la Seguridad Social de EE. UU.», los valores de esa columna se sustituyen por 10 X.

Un miembro del equipo de gobernanza crea una política que incluye la norma de protección de datos. La política describe las razones comerciales para implementar la regla.

3. Organizar datos para compartirlos en catálogos

Los administradores de datos seleccionan activos de datos de alta calidad en proyectos y los publican en catálogos donde las personas que necesitan los datos pueden encontrarlos. Los administradores de datos enriquecen los activos de datos asignando artefactos de gobernanza como metadatos que describen los datos e informan la búsqueda semántica de datos.

Lo que puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Metadata import Importar automáticamente metadatos técnicos para los datos asociados a una conexión para crear activos de datos. Necesita crear muchos activos de datos a partir de una fuente de datos.

Necesita actualizar los activos de datos que importó anteriormente.
Enriquecimiento de metadatos Perfile múltiples activos de datos en una sola ejecución para asignar automáticamente clases de datos e identificar tipos de datos y formatos de columnas.

Asigne automáticamente términos comerciales a los activos y genere sugerencias de términos basadas en la clasificación de datos.

Vuelva a ejecutar los trabajos de importación y enriquecimiento a intervalos para descubrir y evaluar los cambios en los activos de datos.
Debe seleccionar y publicar muchos activos de datos que ha importado.
Análisis de calidad de datos Realizar controles de calidad de datos en sus conjuntos de datos para detectar problemas de calidad en sus datos.
Realizar un seguimiento continuo de los cambios en el contenido y la estructura de los datos, y analizar periódicamente los datos modificados.
Necesita saber si la calidad de sus datos podría afectar a la precisión de sus análisis o modelos de datos.

Sus usuarios necesitan identificar qué conjuntos de datos deben corregirse.
Linaje de datos Realice un seguimiento, visualice, transforme y optimice su flujo de datos desde el origen hasta el consumo. Debe garantizar la precisión, la confianza y el cumplimiento trazando el recorrido de sus datos.
IBM Match 360 Con las herramientas de configuración de IBM Match 360, los ingenieros de datos pueden recopilar datos de clientes de diferentes sistemas de su empresa y ver un modelo de datos personalizable generado automáticamente sin tener que asignar manualmente miles de atributos.

Una vez que los datos se cargan en IBM Match 360, los ingenieros de datos pueden ejecutar un algoritmo de coincidencia para crear entidades de datos maestros enriquecidas.
Desea utilizar un algoritmo de correspondencia inteligente que pueda ajustar y entrenar para establecer una vista única, fiable y consolidada de los datos.

Ejemplo: Gestión de datos de Golden Bank

Los administradores de datos del equipo de gobernanza empiezan a importar metadatos para crear activos de datos en un proyecto. Después de la importación de metadatos, Golden Bank tiene dos activos de datos que representan tablas con una columna llamada "ID". Después del enriquecimiento de metadatos, esas columnas se diferencian claramente por los metadatos que se les han asignado:

  • A una columna se le asignan los términos comerciales «Ocupación» y «Profesión», y la clase de datos «Profesión».
  • A la otra columna se le asignan los términos comerciales «Identificador personal» y «Particular» y la clase de datos «Número de la Seguridad Social de EE. UU.».

Los administradores de datos realizan análisis de calidad de los datos sobre los activos de datos para asegurarse de que la puntuación global de calidad de los datos supere el umbral del 95 % del Golden Bank.

El líder del equipo de gobernanza crea un catálogo, «Catálogo de aprobación de hipotecas», y añade a los administradores de datos y a los científicos de datos como colaboradores del catálogo. Los administradores de datos publican en el catálogo los activos de datos que han creado en el proyecto.

4. Compartir o trabajar con sus datos

El catálogo ayuda a sus equipos a comprender sus datos y pone a disposición los datos adecuados para el uso correcto. Los científicos de datos y otros tipos de usuarios pueden servirse de los datos que necesiten mientras cumplan con las políticas corporativas de acceso y protección de datos. Pueden agregar activos de datos de un catálogo a un proyecto, donde colaboran para preparar, analizar y modelar los datos.

Lo que puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Catálogos Organice sus activos para compartirlos entre los colaboradores de su organización.

Aproveche la búsqueda semántica y las recomendaciones basadas en inteligencia artificial para ayudar a los usuarios a encontrar lo que necesitan.
Sus usuarios necesitan comprender, colaborar, enriquecer y acceder fácilmente a datos de alta calidad.

Desea aumentar la visibilidad de los datos y la colaboración entre los usuarios empresariales.

Necesita que los usuarios vean, accedan, manipulen y analicen datos sin comprender su formato físico o ubicación, y sin tener que moverlos o copiarlos.

Desea que los usuarios mejoren los activos mediante su calificación y revisión.
Búsqueda global Buscar activos en todos los proyectos, catálogos y espacios de implementación a los que tenga acceso.

Buscar artefactos de gobernanza en las categorías a las que tenga acceso.
Necesita encontrar datos u otro tipo de activo, o un artefacto de gobernanza.
Data Product Hub Compartir productos de datos; los productores de datos pueden publicar productos de datos seleccionados para compartirlos con los consumidores de datos de su comunidad, y los consumidores de datos pueden acceder fácilmente a los productos de datos para sus necesidades empresariales. Debe empaquetar, producir y compartir sus activos ricos en datos.
Data Refinery Limpiar datos para corregir o eliminar datos que sean incorrectos, incompletos, con formato incorrecto o duplicados.

Dar forma a los datos para personalizarlos filtrando, ordenando, combinando o eliminando columnas.
Debe mejorar la calidad o la utilidad de los datos.

Ejemplo: Catálogo de Golden Bank

Los científicos de datos encuentran los activos de datos que necesitan en el catálogo y los copian en un proyecto. En su proyecto, los científicos de datos pueden refinar los datos para prepararlos para entrenar un modelo.

Tutoriales para inteligencia de datos

Guía de aprendizaje Descripción Experiencia para guía de aprendizaje
Conservar datos de alta calidad Cree activos de datos de alta calidad enriqueciendo sus datos y realizando análisis de calidad de datos. Ejecute las herramientas de enriquecimiento de metadatos y de Metadata import.
Proteja sus datos Controle el acceso a los datos en Cloud Pak for Data as a Service. Crear reglas de protección de datos.
Consumir sus datos Buscar, dar forma y analizar datos. Explore un catálogo y ejecute la herramienta " Data Refinery ".
Administrar datos virtualizados Enriquece los datos virtualizados y asegúrate de que los datos virtuales estén protegidos. Utilice la interfaz, los proyectos y los catálogos de Data Virtualization para gestionar los datos virtualizados.
Configurar una vista de 360 grados Configure, mapee y modele sus datos para crear una vista consolidada de sus clientes. Utilice la interfaz de arrastrar y soltar de Match 360 para configurar su vista consolidada.

Más información sobre inteligencia de datos

Tema principal: Casos de uso