0 / 0
Volver a la versión inglesa de la documentación
Visión general de Cloud Pak for Data as a Service
Última actualización: 28 nov 2024
Visión general de Cloud Pak for Data as a Service

Cloud Pak for Data como servicio es una plataforma de servicio en la nube para todas las tareas de gobierno de datos, ingeniería de datos, análisis de datos y ciclo de vida de IA. Cloud Pak for Data como Servicio implementa una solución de tejido de datos para que pueda proporcionar acceso instantáneo y seguro a los datos de confianza a su organización, automatizar procesos y la conformidad y ofrecer una IA fiable en sus aplicaciones.

Cloud Pak for Data as a Service es una plataforma de servicio en la nube totalmente gestionada con las siguientes ventajas:

  • Sin instalación, gestión ni actualización de software o hardware
  • Fácil de ampliar o reducir
  • Seguro y compatible
  • Arquitectura de servicios de composición
  • Facturación mensual basada en la suscripción o en el consumo

Vea este vídeo para ver una visión general de Cloud Pak for Data as a Service

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.


La solución de tejido de datos de Cloud Pak for Data como Servicio

Una arquitectura de tejido de datos permite a la empresa desbloquear el valor de los datos en un entorno de datos híbrido de varias nubes. El paso a una arquitectura de tejido de datos transforma la forma en la que la empresa integra, gobierna y utiliza los datos para el análisis, la ciencia de datos, los datos maestros del cliente y la conformidad.

Con un entramado de datos, puede tener una forma segura y coherente de acceder a los datos desde orígenes dispares. Puede eliminar procesos de integración y acceso a datos ineficaces, repetitivos y manuales. Una arquitectura de entramado de datos cubre la brecha entre los orígenes y proporciona datos listos para el negocio para dar soporte a las necesidades de su empresa. Puede trabajar con datos de varios tipos de orígenes en un entorno híbrido y multicloud, al tiempo que mantiene esos datos seguros y de confianza con la amplia gama de funcionalidades de gestión de datos integradas.

Imagen que muestra un entramado de datos con varios orígenes de datos

Sus ingenieros de datos necesitan herramientas para preparar, transformar y virtualizar los datos. Los analistas de calidad de datos necesitan herramientas para medir la calidad de los datos. Su equipo de gobierno necesita herramientas para controlar, proteger y enriquecer sus datos. Los consumidores de datos, como los analistas de negocio y los científicos de datos, necesitan herramientas para desarrollar de forma colaborativa conocimientos y modelos. Con la plataforma Cloud Pak for Data de herramientas integradas, su organización puede trabajar conjuntamente de forma eficiente para utilizar los datos para mejorar su negocio.

Una arquitectura de entramado de datos implementa la gestión de metadatos activa, que utiliza el aprendizaje automático para automatizar el procesamiento de metadatos. Los resultados del análisis de metadatos facilitan el descubrimiento de datos automatizado, mejoran la confianza en los datos y habilitan la protección de datos y el gobierno de datos a escala.

Para obtener más información sobre la solución de entramado de datos, consulte Casos de uso. Para experimentar la implementación del entramado de datos, siga las guías de aprendizaje de entramado de datos.

Arquitectura de servicios y plataforma

Puede añadir características y herramientas a la plataforma Cloud Pak for Data como Servicio suministrando servicios. Un conjunto de servicios básicos se integra en la plataforma común. Otros servicios asociados trabajan con la plataforma pero se ejecutan fuera de ella. En función de cómo se registre en Cloud Pak for Data como servicio, puede empezar con un subconjunto de los servicios principales que representan un único caso de uso de solución de tejido de datos.

Arquitectura de servicios

Puede suministrar estos tipos de servicios desde el catálogo de servicios de Cloud Pak for Data como servicio:

  • Servicios principales
    Los servicios principales se integran perfectamente y añaden herramientas, espacios de trabajo o potencia de cálculo a la interfaz de usuario de la plataforma:

    • watsonx.ai Estudio de análisis de datos
    • watsonx.ai Runtime para crear y desplegar modelos
    • Watson OpenScale para evaluar modelos
    • IBM Knowledge Catalog para controlar y catalogar datos y otros activos
    • DataStage para integrar datos
    • Data Virtualization datos para virtualizar y consultar datos
    • Match 360 para crear datos maestros
    • Data Replication para replicar datos
    • Cognos Dashboard Embedded para visualizar datos
  • Servicios asociados
    IBM Cloud que puede utilizar para acceder a los datos desde la plataforma pero almacenar y gestionar los datos fuera de la plataforma.

    Servicios de Watson que tienen sus propias interfaces de usuario o que proporcionan API para analizar datos.

Espacios de trabajo y activos

Cloud Pak for Data as a Service se organiza como un conjunto de espacios de trabajo colaborativos donde puede trabajar con su equipo u organización. Cada espacio de trabajo tiene un conjunto de miembros con roles que proporcionan permisos para realizar acciones. La mayoría de los usuarios trabajan con activos, que son los elementos que los usuarios añaden a la plataforma. Los activos de datos contienen metadatos que representan datos, mientras que los activos que crea en herramientas, como interconexiones de datos y modelos, ejecutan código para trabajar con datos. El diagrama siguiente muestra los espacios de trabajo principales, sus propósitos y cómo se mueven los activos y otros elementos alrededor de la plataforma.

Los espacios de trabajo principales son proyectos, catálogos, espacios de despliegue y categorías. Los activos se mueven entre proyectos y espacios de despliegue y catálogos. Los artefactos de gobernabilidad se crean en categorías y se añaden como metadatos a los activos de los catálogos.

Proyectos

Los proyectos son donde los equipos de ciencia de datos, ingeniería de datos u ordenación de datos trabajan con datos para crear activos, tales como cuadernos, paneles de control, modelos, interconexiones de datos o activos de datos enriquecidos. La mayoría de los servicios principales proporcionan herramientas de proyecto:

  • watsonx.ai Studio proporciona las herramientas Data Refinery, Jupyter notebooks editor, SPSS Modeler, Decision Optimization, Pipelines y RStudio
  • watsonx.ai Runtime proporciona herramientas de AutoAI y Federated Learning
  • IBM Knowledge Catalog proporciona las herramientas de Data Refinery, Metadata import, enriquecimiento de metadatos y enmascaramiento de flujos
  • DataStage proporciona el editor de interconexiones de datos de DataStage
  • Cognos Dashboard Embedded proporciona el editor del panel de control
  • Data Replication proporciona la herramienta Data Replication
  • Match 360 proporciona la herramienta de configuración de datos maestros

La imagen siguiente muestra el aspecto que podría tener la página Visión general de un proyecto.

Un proyecto contiene activos y colaboradores.

Catálogos

Los catálogos son donde su organización encuentra y almacena datos de alta calidad y de confianza y otros activos, como las hojas de datos de modelos. Puede encontrar activos de datos en un catálogo y moverlos a un proyecto para trabajar con los datos. O bien puede conservar los datos en proyectos y publicar los activos de datos de alta calidad en un catálogo para que los utilicen otros. Los catálogos requieren el servicio IBM Knowledge Catalog .

La imagen siguiente muestra el aspecto que podría tener la página Activos de un catálogo.

Un catálogo contiene una vista de activos.

Espacios de despliegue

Los espacios de despliegue son donde el equipo de ModelOps despliega modelos y otros activos desplegables en producción y, a continuación, prueba y gestiona los despliegues en producción. Después de crear modelos y activos desplegables en proyectos, puede promocionarlos a espacios de despliegue.

La imagen siguiente muestra el aspecto que podría tener la página Visión general de un espacio de despliegue.

Un espacio de despliegue contiene activos y colaboradores.

Categorías

Las categorías son donde el equipo de gobierno crea y gestiona artefactos de gobierno que enriquecen los activos de datos en catálogos. Las categorías requieren el servicio IBM Knowledge Catalog .

La imagen siguiente muestra el aspecto que podría tener una categoría.

Una categoría contiene artefactos de gobernabilidad.

Otros espacios de trabajo

Puede crear activos de datos especializados en otros espacios de trabajo y moverlos a proyectos y catálogos:

  • El servicio de Data Virtualization proporciona un espacio de trabajo para virtualizar los activos de datos de muchas fuentes de datos.
  • El servicio Match360 proporciona un espacio de trabajo para configurar y explorar una vista de 360 grados de los datos del cliente.

El concentrador de recursos

La plataforma incluye un concentrador de recursos integrado que proporciona activos de datos de ejemplo, cuadernos y proyectos. Los cuadernos de ejemplo proporcionan ejemplos de ciencia de datos y código de aprendizaje automático. Los proyectos de ejemplo, incluidos los aceleradores del sector, contienen conjuntos de datos, modelos, otros activos e instrucciones detalladas sobre cómo resolver un problema empresarial determinado. El concentrador de recursos también proporciona Knowledge Accelerators, que contienen conjuntos de artefactos de gobernabilidad que puede importar para proporcionar vocabularios de negocio para sectores específicos.

La imagen siguiente muestra el aspecto del concentrador de recursos.

El concentrador de recursos contiene ejemplos.

Vea este vídeo para ver una visita guiada por el concentrador de recursos.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Más información

Tema principal: Cloud Pak for Data como servicio

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información