Puede utilizar Cloud Pak for Data con distintos servicios para implementar casos de uso que le ayuden a crear una base de datos de confianza para sus operaciones de IA.
Visión general de solución de entramado de datos
Al implementar la solución de entramado de datos en Cloud Pak for Data, puede resolver los retos del acceso a los datos, la calidad de los datos, el gobierno de los datos y la gestión de los ciclos de vida de los datos.
La solución de entramado de datos en Cloud Pak for Data proporciona estas prestaciones principales para gestionar y automatizar los ciclos de vida de los datos:
- Acceso a los datos
- Acceda a sus datos a través de varias nubes y en local en su arquitectura de datos existente.
- Consumo de autoservicio
- Compartir y utilizar datos y otros activos de toda la empresa en catálogos.
- Conocimientos acumulados
- Comprenda sus datos a través de un vocabulario empresarial común. Confíe en sus datos a través del historial, el linaje y el análisis de calidad.
- Innovación colaborativa
- Colabore con otros para descubrir información de valor. Prepare y analice los datos con un conjunto de herramientas integradas para todos los niveles de experiencia.
- Gobierno y conformidad
- Defina reglas para imponer la privacidad de los datos.
- Ciclo de vida unificado
- Automatice la creación, prueba, despliegue y supervisión de interconexiones de datos.
La siguiente ilustración muestra cómo el entramado de datos da soporte a casos de uso en la plataforma Cloud Pak for Data (tanto en la nube como en local) integrando el acceso a orígenes de datos híbridos (como, por ejemplo, data lakehouse, data warehouse, data lake, database o aplicación empresarial) con prestaciones en una única experiencia de interfaz de usuario.
El valor de los activos
Con el entramado de datos, puede transformar los datos en activos que acumulen significado y valor. Los activos son algo más que datos. Cuando crea por primera vez una conexión con un origen de datos, tiene información básica sobre cómo acceder a los datos, las tablas, los esquemas y los valores de datos. Puede empezar a añadir valor mientras ingiere datos virtualizándolos, transformándolos o replicándolos en espacios de trabajo denominados proyectos.
Cuando se conservan los datos, se añaden metadatos a los activos de datos. Los datos se perfilan para clasificarlos y compilar estadísticas sobre los valores. Enriquece los activos con vocabulario de negocio que describe el significado semántico de los datos para su organización. Analiza la calidad de los datos. Los metadatos que añada durante la ordenación se consideran metadatos activos porque se generan automáticamente mediante procesos de aprendizaje automático. Cuando vuelve a ejecutar la ordenación después de que los datos cambien, los metadatos se actualizan basándose en el análisis de datos automatizado.
A medida que los usuarios utilizan los activos en proyectos, crean el tercer nivel de significado que describe el historial de cómo se utiliza el activo y las relaciones entre activos. Los usuarios pueden analizar los datos en cuadernos o paneles de control, o entrenar modelos de aprendizaje automático.
Los usuarios también pueden añadir información a activos como, por ejemplo, evaluaciones y revisiones, visualizaciones de los datos, etiquetas y otras relaciones.
La imagen siguiente muestra cómo los activos de datos acumulan valor en un entramado de datos añadiendo información descriptiva (perfil de datos, calidad de datos y vocabulario empresarial), información de uso (acciones sobre los datos y las relaciones) e información añadida por el usuario (evaluaciones y revisiones, visualizaciones y relaciones) a la información básica (tipo de datos, formato y esquema, y donde residen los datos) sobre el activo de datos.
Casos de uso de entramado de datos
Cloud Pak for Data proporciona varios casos de uso como parte de la solución de entramado de datos. Puede implementar el entramado de datos tal como se representa en cada caso de uso instalando uno o más servicios que proporcionan características y herramientas. Algunos servicios se incluyen en varios casos de uso.
Los casos de uso representan formas de implementar parte de la solución de entramado de datos para que su equipo pueda empezar a trabajar mientras crea otras partes. Puede empezar con cualquier caso de uso y añadir los demás según sea necesario:
- Si tiene un modelo de gobierno de datos más maduro, empiece estableciendo su vocabulario empresarial, tal como se describe en el caso de uso de gobierno de datos.
- Si desea un tiempo de generación de valor más rápido, empiece con la virtualización de datos o la réplica de datos, tal como se describe en el caso de uso de integración de datos.
- Si necesita asegurarse de que los usuarios y sistemas tienen una vista total, fiable y unificada de los datos de cliente, empiece por emparejar y consolidar los datos de registro en entidades discretas, tal como se describe en el caso de uso de gestión de datos maestros.
Explore cada caso de uso para obtener información sobre lo que puede lograr y las herramientas que puede utilizar.
Gobierno de datos
Implemente el gobierno basado en metadatos que proporcionan conocimientos empresariales y definen la protección de datos. Proporcione activos de datos de alta calidad en catálogos de autoservicio. Automatice la aplicación del gobierno de datos para la conformidad normativa.
Servicio para este caso de uso: IBM Knowledge Catalog.
Consulte Caso de uso de gobierno de datos.
Integración de datos
Simplifique y automatice el acceso a todos sus datos, sin moverlos. Orquesta los datos en un entorno distribuido para crear una red de información disponible al instante para los consumidores de datos.
Servicios para este caso de uso: Data Virtualization, DataStage, e IBM Knowledge Catalog.
Consulte Caso de uso de integración de datos.
Master Data Management
Cree una vista consolidada de los clientes y registre los datos conectando los datos entre dominios y emparejándolos para crear entidades de datos maestros.
Servicio para este caso de uso: IBM Match 360 with Watson.
Véase el caso práctico deMaster Data Management.
Cree y controle casos de uso de IA
Al implementar la creación y el gobierno de casos de uso de IA, puede resolver los retos de la creación de modelos, el gobierno de IA y la gestión de sus ciclos de vida de IA.
La creación y el gobierno de casos de uso de IA en Cloud Pak for Data proporcionan estas prestaciones principales para gestionar y automatizar los ciclos de vida de IA:
- Innovación colaborativa
- Colabore con otros para descubrir información de valor. Prepare datos, analice datos y cree modelos con un conjunto de herramientas integradas para todos los niveles de experiencia.
- Gobierno y conformidad
- Realice un seguimiento y documente el historial detallado de los modelos de IA para garantizar la conformidad.
- Ciclo de vida unificado
- Automatice la creación, las pruebas, el despliegue y la supervisión de modelos de IA.
Cloud Pak for Data ofrece dos casos de uso de IA para construir y gobernar. Implemente cada caso de uso creando una o más instancias de servicio que proporcionen características y herramientas. Algunos servicios se incluyen en varios casos de uso.
Puede empezar con cualquier caso de uso y añadir el otro según sea necesario:
- Si desea un tiempo de generación de valor más rápido, empiece con la ciencia de datos, tal como se describe en el caso de uso de Ciencia de datos y MLOps.
- Si necesita asegurarse de que los modelos cumplen los objetivos y las normativas de su organización, empiece a realizar el seguimiento de los modelos, tal como se describe en el caso de uso de gobierno de IA.
Explore cada caso de uso para obtener información sobre lo que puede lograr y las herramientas que puede utilizar.
Ciencia de datos y MLOps
Operacionalice el análisis de datos y la creación de modelos con un flujo de trabajo automatizado que prepara datos, compila, despliega, supervisa y vuelve a entrenar modelos.
Servicios para este caso de uso: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog.
Consulte Caso de uso de Data Science y MLOps.
Gobierno de IA
Operacionalice el gobierno de IA con un flujo de trabajo automatizado que aplique equidad, calidad y explicabilidad en sus modelos.
Servicios para este caso de uso: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog.
Más información
- ¿Qué es un tejido de datos?
- Registrarse para las pruebas de entramado de datos
- Caso de uso de gobierno de datos
- Caso de uso de integración de datos
- Master Data Management
- Caso de uso de gobierno de IA
- Caso de uso de Data Science y MLOps
- ¿Qué es la observabilidad de los datos?
- Guías de aprendizaje de casos de uso
Tema principal: Visión general de Cloud Pak for Data as a Service