0 / 0
Volver a la versión inglesa de la documentación
Visión general de Cloud Pak for Data as a Service
Visión general de Cloud Pak for Data as a Service

Visión general de Cloud Pak for Data as a Service

Cloud Pak for Data como servicio es una plataforma de servicio en la nube para todas las tareas de gobierno de datos, ingeniería de datos, análisis de datos y ciclo de vida de IA. Cloud Pak for Data como Servicio implementa una solución de tejido de datos para que pueda proporcionar acceso instantáneo y seguro a los datos de confianza a su organización, automatizar procesos y la conformidad y ofrecer una IA fiable en sus aplicaciones.

Cloud Pak for Data as a Service es una plataforma de servicio en la nube totalmente gestionada con las siguientes ventajas:

  • Sin instalación, gestión ni actualización de software o hardware
  • Fácil de ampliar o reducir
  • Seguro y compatible
  • Arquitectura de servicios de composición
  • Facturación mensual basada en la suscripción o en el consumo

La solución de tejido de datos de Cloud Pak for Data como Servicio

Una arquitectura de tejido de datos permite a la empresa desbloquear el valor de los datos en un entorno de datos híbrido de varias nubes. El paso a una arquitectura de tejido de datos transforma la forma en la que la empresa integra, gobierna y utiliza los datos para el análisis, la ciencia de datos, los datos maestros del cliente y la conformidad.

Con un entramado de datos, puede tener una forma segura y coherente de acceder a los datos desde orígenes dispares. Puede eliminar procesos de integración y acceso a datos ineficaces, repetitivos y manuales. Una arquitectura de entramado de datos cubre la brecha entre los orígenes y proporciona datos listos para el negocio para dar soporte a las necesidades de su empresa. Puede trabajar con datos de varios tipos de orígenes en un entorno híbrido y multicloud, al tiempo que mantiene esos datos seguros y de confianza con la amplia gama de funcionalidades de gestión de datos integradas.

Imagen que muestra un entramado de datos con varios orígenes de datos

Sus ingenieros de datos necesitan herramientas para preparar, transformar y virtualizar los datos. Los analistas de calidad de datos necesitan herramientas para medir la calidad de los datos. Su equipo de gobierno necesita herramientas para controlar, proteger y enriquecer sus datos. Los consumidores de datos, como los analistas de negocio y los científicos de datos, necesitan herramientas para desarrollar de forma colaborativa conocimientos y modelos. Con la plataforma Cloud Pak for Data de herramientas integradas, su organización puede trabajar conjuntamente de forma eficiente para utilizar los datos para mejorar su negocio.

Para obtener más información sobre la solución de entramado de datos, consulte Visión general de la solución de entramado de datos. Para experimentar la implementación del entramado de datos, siga las guías de aprendizaje de entramado de datos.

Arquitectura de servicios y plataforma

Puede añadir características y herramientas a la plataforma Cloud Pak for Data como Servicio suministrando servicios. Un conjunto de servicios básicos se integra en la plataforma común. Otros servicios asociados trabajan con la plataforma pero se ejecutan fuera de ella. En función de cómo se registre en Cloud Pak for Data como servicio, puede empezar con un subconjunto de los servicios principales que representan un único caso de uso de solución de tejido de datos.

Arquitectura de servicios

Puede suministrar estos tipos de servicios desde el catálogo de servicios de Cloud Pak for Data como servicio:

Servicios básicos Los servicios básicos se integran fácilmente y añaden herramientas, espacios de trabajo y potencia de cálculo a la interfaz de usuario de la plataforma:

  • Watson Studio para analizar datos
  • Watson Machine Learning para crear y desplegar modelos
  • Watson OpenScale para evaluar modelos
  • Watson Knowledge Catalog para gobernar y catalogar datos y otros activos
  • DataStage para integrar datos
  • Watson Query para virtualizar y consultar datos
  • Match 360 para crear datos maestros
  • Cognos Dashboard Embedded para visualizar datos

Servicios asociados Servicios de la base de datos de IBM Cloud que puede utilizar para acceder a datos desde dentro de la plataforma, pero que almacenan y gestionan los datos fuera de la plataforma.

Servicios Watson que tienen sus propias interfaces de usuario o proporcionan API para analizar datos.

Espacios de trabajo y activos

Cloud Pak for Data as a Service se organiza como un conjunto de espacios de trabajo colaborativos donde puede trabajar con su equipo u organización. Cada espacio de trabajo tiene un conjunto de miembros con roles que proporcionan permisos para realizar acciones. La mayoría de los usuarios trabajan con activos. Los activos de datos contienen metadatos que representan datos, mientras que los activos operativos, como las interconexiones y los modelos de datos, ejecutan código para trabajar con datos. El diagrama siguiente muestra los espacios de trabajo principales, sus propósitos y cómo se mueven los activos y otros elementos alrededor de la plataforma.

Los espacios de trabajo principales son proyectos, catálogos, espacios de despliegue y categorías. Los activos se mueven entre proyectos y espacios de despliegue y catálogos. Los artefactos de gobernabilidad se crean en categorías y se añaden como metadatos a los activos de los catálogos.

Proyectos

Los proyectos son donde los equipos de ciencia de datos, ingeniería de datos u ordenación de datos trabajan con datos para crear activos, tales como cuadernos, paneles de control, modelos, interconexiones de datos o activos de datos enriquecidos. La mayoría de los servicios principales proporcionan herramientas de proyecto:

  • Watson Studio proporciona Data Refinery, el editor de cuadernos Jupyter, SPSS Modeler, Decision Optimization, interconexiones y herramientas de RStudio
  • Watson Machine Learning proporciona IA automática y herramientas de aprendizaje federado
  • Watson Knowledge Catalog proporciona Data Refinery, importación de metadatos, enriquecimiento de metadatos y herramientas de flujos de enmascaramiento
  • DataStage proporciona el editor de interconexiones de datos de DataStage
  • Cognos Dashboard Embedded proporciona el editor del panel de control
  • Match 360 proporciona la herramienta de configuración de datos maestros

La imagen siguiente muestra el aspecto que podría tener la página Visión general de un proyecto.

Un proyecto contiene activos y colaboradores.

Catálogos

Los catálogos son donde su organización encuentra y almacena datos de alta calidad y de confianza y otros activos, como las hojas de datos de modelos. Puede encontrar activos de datos en un catálogo y moverlos a un proyecto para trabajar con los datos. O bien puede conservar los datos en proyectos y publicar los activos de datos de alta calidad en un catálogo para que los utilicen otros. Los catálogos requieren el servicio de Watson Knowledge Catalog.

La imagen siguiente muestra el aspecto que podría tener la página Activos de un catálogo.

Un catálogo contiene una vista de activos.

Espacios de despliegue

Los espacios de despliegue son el lugar donde el equipo de ModelOps despliega modelos para la producción y, a continuación, prueba y gestiona los modelos en producción. Después de crear modelos en proyectos, los promociona a espacios de despliegue. Los espacios de despliegue requieren el servicio Watson Machine Learning.

La imagen siguiente muestra el aspecto que podría tener la página Visión general de un espacio de despliegue.

Un espacio de despliegue contiene activos y colaboradores.

Categorías

Las categorías son donde el equipo de gobierno crea y gestiona artefactos de gobierno que enriquecen los activos de datos en catálogos. Las categorías requieren el servicio de Watson Knowledge Catalog.

La imagen siguiente muestra el aspecto que podría tener una categoría.

Una categoría contiene artefactos de gobernabilidad.

Otros espacios de trabajo

Puede crear activos de datos especializados en otros espacios de trabajo y moverlos a proyectos y catálogos:

  • El servicio Watson Query proporciona un espacio de trabajo para virtualizar activos de datos en muchos orígenes de datos.
  • El servicio Match360 proporciona un espacio de trabajo para configurar y explorar una vista de 360 grados de los datos del cliente.

La plataforma incluye una Galería integrada de ejemplos que proporciona activos de datos, cuadernos y proyectos de ejemplo. Los cuadernos de ejemplo proporcionan ejemplos de ciencia de datos y código de aprendizaje automático. Los proyectos de ejemplo, incluidos los aceleradores del sector, contienen conjuntos de datos, modelos, otros activos e instrucciones detalladas sobre cómo resolver un problema empresarial determinado. La Galería también proporciona Knowledge Accelerators, que contienen conjuntos de artefactos de gobierno que puede importar para proporcionar vocabularios empresariales para sectores específicos.

La siguiente imagen muestra el aspecto que tiene la Galería.

La galería contiene ejemplos.

Más información

Tema principal: Cloud Pak for Data como servicio