Visión general de Cloud Pak for Data as a Service
Cloud Pak for Data como servicio es una plataforma de servicio en la nube para todas las tareas de gobierno de datos, ingeniería de datos, análisis de datos y ciclo de vida de IA. Cloud Pak for Data como Servicio implementa una solución de tejido de datos para que pueda proporcionar acceso instantáneo y seguro a los datos de confianza a su organización, automatizar procesos y la conformidad y ofrecer una IA fiable en sus aplicaciones.
Cloud Pak for Data as a Service es una plataforma de servicio en la nube totalmente gestionada con las siguientes ventajas:
- Sin instalación, gestión ni actualización de software o hardware
- Fácil de ampliar o reducir
- Seguro y compatible
- Arquitectura de servicios de composición
- Facturación mensual basada en la suscripción o en el consumo
Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.
La solución de tejido de datos de Cloud Pak for Data como Servicio
Una arquitectura de tejido de datos permite a la empresa desbloquear el valor de los datos en un entorno de datos híbrido de varias nubes. El paso a una arquitectura de tejido de datos transforma la forma en la que la empresa integra, gobierna y utiliza los datos para el análisis, la ciencia de datos, los datos maestros del cliente y la conformidad.
Con un entramado de datos, puede tener una forma segura y coherente de acceder a los datos desde orígenes dispares. Puede eliminar procesos de integración y acceso a datos ineficaces, repetitivos y manuales. Una arquitectura de entramado de datos cubre la brecha entre los orígenes y proporciona datos listos para el negocio para dar soporte a las necesidades de su empresa. Puede trabajar con datos de varios tipos de orígenes en un entorno híbrido y multicloud, al tiempo que mantiene esos datos seguros y de confianza con la amplia gama de funcionalidades de gestión de datos integradas.
Sus ingenieros de datos necesitan herramientas para preparar, transformar y virtualizar los datos. Los analistas de calidad de datos necesitan herramientas para medir la calidad de los datos. Su equipo de gobierno necesita herramientas para controlar, proteger y enriquecer sus datos. Los consumidores de datos, como los analistas de negocio y los científicos de datos, necesitan herramientas para desarrollar de forma colaborativa conocimientos y modelos. Con la plataforma Cloud Pak for Data de herramientas integradas, su organización puede trabajar conjuntamente de forma eficiente para utilizar los datos para mejorar su negocio.
Para obtener más información sobre la solución de entramado de datos, consulte Visión general de la solución de entramado de datos. Para experimentar la implementación del entramado de datos, siga las guías de aprendizaje de entramado de datos.
Arquitectura de servicios y plataforma
Puede añadir características y herramientas a la plataforma Cloud Pak for Data como Servicio suministrando servicios. Un conjunto de servicios básicos se integra en la plataforma común. Otros servicios asociados trabajan con la plataforma pero se ejecutan fuera de ella. En función de cómo se registre en Cloud Pak for Data como servicio, puede empezar con un subconjunto de los servicios principales que representan un único caso de uso de solución de tejido de datos.
Puede suministrar estos tipos de servicios desde el catálogo de servicios de Cloud Pak for Data como servicio:
Servicios básicos Los servicios básicos se integran fácilmente y añaden herramientas, espacios de trabajo y potencia de cálculo a la interfaz de usuario de la plataforma:
- Watson Studio para analizar datos
- Watson Machine Learning para crear y desplegar modelos
- Watson OpenScale para evaluar modelos
- Watson Knowledge Catalog para gobernar y catalogar datos y otros activos
- DataStage para integrar datos
- Watson Query para virtualizar y consultar datos
- Match 360 para crear datos maestros
- Data Replication para replicar datos
- Cognos Dashboard Embedded para visualizar datos
Servicios asociados Servicios de la base de datos de IBM Cloud que puede utilizar para acceder a datos desde dentro de la plataforma, pero que almacenan y gestionan los datos fuera de la plataforma.
Servicios Watson que tienen sus propias interfaces de usuario o proporcionan API para analizar datos.
Espacios de trabajo y activos
Cloud Pak for Data as a Service se organiza como un conjunto de espacios de trabajo colaborativos donde puede trabajar con su equipo u organización. Cada espacio de trabajo tiene un conjunto de miembros con roles que proporcionan permisos para realizar acciones. La mayoría de los usuarios trabajan con activos. Los activos de datos contienen metadatos que representan datos, mientras que los activos operativos, como las interconexiones y los modelos de datos, ejecutan código para trabajar con datos. El diagrama siguiente muestra los espacios de trabajo principales, sus propósitos y cómo se mueven los activos y otros elementos alrededor de la plataforma.
Proyectos
Los proyectos son donde los equipos de ciencia de datos, ingeniería de datos u ordenación de datos trabajan con datos para crear activos, tales como cuadernos, paneles de control, modelos, interconexiones de datos o activos de datos enriquecidos. La mayoría de los servicios principales proporcionan herramientas de proyecto:
- Watson Studio proporciona Data Refinery, el editor de cuadernos Jupyter, SPSS Modeler, Decision Optimization, interconexiones y herramientas de RStudio
- Watson Machine Learning proporciona IA automática y herramientas de aprendizaje federado
- Watson Knowledge Catalog proporciona Data Refinery, importación de metadatos, enriquecimiento de metadatos y herramientas de flujos de enmascaramiento
- DataStage proporciona el editor de interconexiones de datos de DataStage
- Cognos Dashboard Embedded proporciona el editor del panel de control
- Data Replication proporciona la herramienta Data Replication
- Match 360 proporciona la herramienta de configuración de datos maestros
La imagen siguiente muestra el aspecto que podría tener la página Visión general de un proyecto.
Catálogos
Los catálogos son donde su organización encuentra y almacena datos de alta calidad y de confianza y otros activos, como las hojas de datos de modelos. Puede encontrar activos de datos en un catálogo y moverlos a un proyecto para trabajar con los datos. O bien puede conservar los datos en proyectos y publicar los activos de datos de alta calidad en un catálogo para que los utilicen otros. Los catálogos requieren el servicio de Watson Knowledge Catalog.
La imagen siguiente muestra el aspecto que podría tener la página Activos de un catálogo.
Espacios de despliegue
Los espacios de despliegue son el lugar donde el equipo de ModelOps despliega modelos para la producción y, a continuación, prueba y gestiona los modelos en producción. Después de crear modelos en proyectos, los promociona a espacios de despliegue. Los espacios de despliegue requieren el servicio Watson Machine Learning.
La imagen siguiente muestra el aspecto que podría tener la página Visión general de un espacio de despliegue.
Categorías
Las categorías son donde el equipo de gobierno crea y gestiona artefactos de gobierno que enriquecen los activos de datos en catálogos. Las categorías requieren el servicio de Watson Knowledge Catalog.
La imagen siguiente muestra el aspecto que podría tener una categoría.
Otros espacios de trabajo
Puede crear activos de datos especializados en otros espacios de trabajo y moverlos a proyectos y catálogos:
- El servicio Watson Query proporciona un espacio de trabajo para virtualizar activos de datos en muchos orígenes de datos.
- El servicio Match360 proporciona un espacio de trabajo para configurar y explorar una vista de 360 grados de los datos del cliente.
La galería de ejemplos
La plataforma incluye una Galería integrada de ejemplos que proporciona activos de datos, cuadernos y proyectos de ejemplo. Los cuadernos de ejemplo proporcionan ejemplos de ciencia de datos y código de aprendizaje automático. Los proyectos de ejemplo, incluidos los aceleradores del sector, contienen conjuntos de datos, modelos, otros activos e instrucciones detalladas sobre cómo resolver un problema empresarial determinado. La Galería también proporciona Knowledge Accelerators, que contienen conjuntos de artefactos de gobierno que puede importar para proporcionar vocabularios empresariales para sectores específicos.
La siguiente imagen muestra el aspecto que tiene la Galería.
Más información
- Acerca del producto Cloud Pak for Data as a Service
- Servicios para Cloud Pak for Data as a Service
- Conexiones soportadas
- Relaciones entre los servicios básicos y Cloud Pak para los datos como servicio
- Diferencias de características entre despliegues de Cloud Pak for Data
- Tipos de activos y propiedades
Tema principal: Cloud Pak for Data como servicio