Diferencias de características entre despliegues de Cloud Pak for Data

Cloud Pak for Data como servicio y software Cloud Pak for Data 4.0 y 3.5 tienen algunas diferencias en las características y la implementación. Cloud Pak for Data as a Service es un conjunto de servicios de IBM Cloud. Cloud Pak for Data 4.0 y 3.5 se ofrecen como software que debe instalar y mantener. Los servicios que están disponibles en ambos despliegues también tienen diferencias en las características de Cloud Pak for Data como servicio en comparación con Cloud Pak for Data 4.0 y 3.5.

Diferencias de plataforma

Cloud Pak for Data como servicio y Cloud Pak for Data 4.0 comparten una base de código común, sin embargo, difieren en las siguientes formas clave:

Funciones Cloud Pak for Data as a Service Cloud Pak for Data
Software, hardware e instalación Cloud Pak for Data as a Service está totalmente gestionado por IBM en IBM Cloud. Las actualizaciones de software son automáticas. El escalado de recursos de cálculo y almacenamiento es automático. Se registra en https://dataplatform.cloud.ibm.com. Proporciona y mantiene el hardware. Instala, mantiene y actualiza el software de Cloud Pak for Data. Consulte Requisitos de software.
Almacenamiento Puede suministrar una instancia de servicio de IBM Cloud Object Storage para proporcionar almacenamiento. Consulte IBM Cloud Object Storage. Proporciona un sistema de almacenamiento de archivos en un clúster de Red Hat OpenShift. Consulte Requisitos de almacenamiento.
Calcular recursos para ejecutar cargas de trabajo Los usuarios eligen el tiempo de ejecución adecuado para sus trabajos. El uso de cálculo se factura en función de la tarifa para el entorno de ejecución y la duración del trabajo. Consulte Supervisar el uso de los recursos de la cuenta. Ha configurado el número de clústeres y nodos de Red Hat OpenShift con el número adecuado de vCPU. Consulte Requisitos de hardware y Supervisión de la plataforma.
Coste Compre cada servicio que necesite en el nivel de plan adecuado. Muchos servicios facturan por el consumo de recursos de cálculo. Consulte cada página de servicio en el catálogo de IBM Cloud o en el catálogo de servicios de Cloud Pak for Data como servicio, seleccionando Servicios > Catálogo de servicios en el menú de navegación. Usted compra una licencia para Cloud Pak for Data más cada servicio que necesite. Consulte Cloud Pak for Data.
Seguridad, cumplimiento y aislamiento IBM Cloud gestiona la seguridad de los datos, la seguridad de la red, el cumplimiento de los estándares de seguridad y el aislamiento de Cloud Pak for Data como servicio. Puede configurar opciones de seguridad y cifrado adicionales. Consulte Seguridad de Cloud Pak for Data como servicio. Red Hat OpenShift Container Platform proporciona características de seguridad básicas. Cloud Pak for Data se evalúa para diversas normativas de privacidad y conformidad y proporciona características que puede utilizar como preparación para diversas evaluaciones de privacidad y conformidad. Usted es responsable de las características de seguridad adicionales, el cifrado y el aislamiento de la red. Consulte Consideraciones de seguridad.
Servicios disponibles La mayoría de los servicios de tejido de datos están disponibles en ambos entornos de despliegue.
Consulte Servicios para Cloud Pak for Data como servicio.
Incluye muchos otros servicios. Véase Servicios para Cloud Pak for Data 4.0.
Gestión de usuarios Puede añadir usuarios y grupos de usuarios y gestionar sus roles y permisos de cuenta con IBM Cloud Identity and Access Management. Consulte Añadir usuarios a la cuenta.
También puede configurar la federación SAML en IBM Cloud. Véase Docs de IBM Cloud: ¿Qué es IBM Cloud Identity and Access Management?
Puede añadir usuarios y crear grupos de usuarios desde el menú Administración. Puede utilizar Identity and Access Management Service o utilizar el SSO de SAML o el proveedor de LDAP existente para la gestión de identidades y contraseñas. Consulte Gestión de usuarios.

Características comunes a través de servicios

Las siguientes características en los servicios son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:

  • Búsqueda global de activos y artefactos en toda la plataforma
  • El catálogo de activos de la plataforma para compartir conexiones en toda la plataforma
  • Gestión de usuarios basada en roles dentro de los espacios de trabajo colaborativo en toda la plataforma
  • Infraestructura común para activos y espacios de trabajo
  • Un catálogo de servicios para añadir servicios
  • Ver el uso de cálculo desde el menú Administración

La tabla siguiente describe las diferencias en las características entre servicios entre Cloud Pak for Data como servicio y Cloud Pak for Data 3.5 y 4.0.

Característica Cloud Pak for Data as a Service Cloud Pak for Data
Experiencia de proyectos actualizados Consulte Nueva experiencia en proyectos. No disponible
Conexiones con orígenes de datos remotos La mayoría de los orígenes de datos soportados son comunes a ambos entornos de despliegue.
Consulte Conexiones soportadas.
Consulte Orígenes de datos soportados.
Credenciales de conexión personales o compartidas Las conexiones en proyectos y catálogos pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de cuenta. Las conexiones de plataforma pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de plataforma.
Credenciales de conexión de secretos en una caja fuerte No disponible
Ejemplos de activos y proyectos de la Galería No disponible
Solicitudes de acceso a datos No disponible

Watson Studio

Las siguientes características de Watson Studio son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:

  • Colaboración en proyectos
  • Importar y exportar proyectos utilizando un archivo ZIP de proyecto
  • Cuadernos Jupyter
  • Planificación de trabajos
  • Data Refinery

Esta tabla describe las diferencias de características entre el servicio Watson Studio en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios de adición. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Studio.

Característica Cloud Pak for Data as a Service Cloud Pak for Data
Crear proyecto Crear:
- Un proyecto vacío
- Un proyecto a partir de un ejemplo de la Galería
- Un proyecto del archivo
Crear:
- Un proyecto vacío
- Un proyecto del archivo
- Un proyecto con integración de Git
Integración de Git - Publicar cuadernos en GitHub
- Publicar cuadernos como gist
- Integrar un proyecto con Git
- sincronizar activos en el repositorio en un proyecto y utilizar dichos activos en otro proyecto
Terminal de proyecto para operaciones avanzadas de Git No disponible Disponible en proyectos con la integración de Git predeterminada
JupyterLab No disponible Disponible en proyectos con integración de Git
RStudio No se puede integrar con Git Puede integrarse con Git. Requiere el servidor de RStudio con servicio R.
Scripts Python No disponible Trabajar con scripts de Python en JupyterLab. Requiere cuadernos Jupiter con Python o cuadernos Jupyter con el servicio R.
Acceder a los activos del proyecto mediante programación Utilice project-lib para Python y R Utilice ibm-watson-studio-lib para Python y R (sucesor de project-lib)
Insertar en código en cuadernos utilizando el servicio Flight No disponible
Gestionar el ciclo de vida del cuaderno No disponible Utilizar CPDCTL para la gestión del ciclo de vida del cuaderno
Activos de paquete de código (conjunto de archivos dependientes en una estructura de carpetas) No disponible Utilice CPDCTL para crear activos de paquete de código en un espacio de despliegue
Promover cuadernos a espacios No disponible Disponible manualmente desde la página Activos del proyecto o mediante programación utilizando CPDCTL
Python con GPU Soporte disponible sólo para un solo tipo de GPU (Nvidia K80) Soporte disponible para varios tipos de GPU Nvidia. Requiere cuadernos Jupiter con Python con servicio de GPU.
Crear y utilizar imágenes personalizadas No disponible Crear imágenes personalizadas para entornos Python (con y sin GPU), R, JupyterLab (con y sin GPU), RStudio y SPSS
Repositorio Anaconda No disponible Se utiliza para crear entornos personalizados e imágenes personalizadas
Integración de Hadoop No disponible Crear y entrenar modelos y ejecutar flujos de Data Refinery en un clúster de Hadoop. Requiere el servicio de ejecución del motor para Apache Hadoop.
Decision Optimization Requiere el servicio Decision Optimization.
SPSS Modeler Requiere el servicio SPSS Modeler.
Paneles de control Requiere el servicio Cognos Dashboard Embedded. Requiere el servicio Cognos Dashboards.

Para ver las diferencias entre Watson Studio Desktop y Watson Studio en Cloud Pak for Data como servicio y Cloud Pak for Data, consulte Diferencias de características entre despliegues de Watson Studio.

Watson Machine Learning

Las siguientes características de Watson Machine Learning son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:

  • Crear y desplegar experimentos de IA automática
  • Colaborar en espacios de despliegue
  • Desplegar modelos
  • Desplegar funciones
  • API REST de Watson Machine Learning
  • Cliente Python de Watson Machine Learning
  • Crear trabajos de despliegue por lotes
  • Crear despliegues en línea
  • Escalar y actualizar despliegues
  • Definir y utilizar componentes personalizados
  • Utilizar el aprendizaje federado para entrenar un modelo común con orígenes de datos independientes y seguros
  • Supervisar despliegues en distintos espacios

Esta tabla describe las diferencias de características entre el servicio Watson Studio en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios adicionales. Para obtener detalles sobre las diferencias de funcionalidad entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Machine Learning.

Característica Cloud Pak for Data as a Service Cloud Pak for Data
Despliegue utilizando infraestructuras
y especificaciones de software populares
Comprobar las últimas versiones soportadas Las versiones soportadas difieren por release
Conectar a bases de datos para despliegues por lotes Comprobación de soporte por tipo de despliegue Comprobar el soporte por tipo de despliegue
y por versión
Desplegar scripts de Python Disponible a través del cliente Python Crear scripts en JupyterLab y, a continuación, desplegar
Desplegar aplicaciones Shiny No disponible Crear y desplegar aplicaciones Shiny
Despliegues virtuales (CoreML) Crear aplicaciones para iOS
en desuso se eliminarán
Evaluar los trabajos para la equidad, el sesgo o la desviación Requiere Watson OpenScale Requiere Watson OpenScale
Creación del espacio de control Sin restricciones por rol Utilizar permisos para controlar quién puede ver y crear espacios
Seguimiento de los detalles del modelo en un inventario de modelos Registrar modelos para ver las hojas de datos con detalles del ciclo de vida No disponible
Crear y utilizar imágenes personalizadas No disponible Crear imágenes personalizadas para Python o SPSS
Automatizar sucesos del ciclo de vida de IA Orquestar un flujo de extremo a extremo
utilizando Watson Studio Pipelines (beta)
Utilizar CPDCTL para automatizar sucesos de ciclo de vida
Importar un archivo de proyecto o espacio a un espacio no vacío No disponible Disponible, a partir de 4.0.6
Experimento de aprendizaje profundo Está en desuso y se eliminará Requiere el servicio de Watson Machine Learning Accelerator
Suministrar y gestionar instancias de servicio de IBM Cloud Añadir instancias para Watson Machine Learning
o Watson OpenScale
El administrador suministra los servicios en el clúster

{: caption="Diferencias de características entre despliegues de Watson Machine Learning" caption-side="top"}

Watson Knowledge Catalog

Las siguientes características de Watson Knowledge Catalog son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:

  • Búsqueda basada en IA y recomendaciones en catálogos
  • Calificación y revisión de activos en catálogos
  • Colaboración en proyectos y catálogos
  • Herramienta de Data Refinery en proyectos
  • Categorías con roles de colaborador
  • Clasificaciones predefinidas
  • Clases de datos predefinidas
  • Reglas de gobernabilidad
  • Perfilado manual de activos de datos relacionales individuales en un proyecto o un catálogo
  • Perfilado automático de activos de datos relacionales añadidos a un catálogo gobernado

Esta tabla describe las diferencias en las características entre el servicio Watson Knowledge Catalog en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios de adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Knowledge Catalog.

Característica Cloud Pak for Data as a Service Cloud Pak for Data
Creación de perfiles de datos no estructurados Perfilado automático de activos individuales que se añaden a un proyecto o a un catálogo. No disponible.
Herramienta de importación de metadatos en proyectos Soporte para un subconjunto de conexiones de proyecto y catálogo. Consulte Conexiones de importación de metadatos. La mayoría de las conexiones soportadas son las mismas en ambos entornos de despliegue. Consulte Conexiones de importación de metadatos para 3.5 y Conexiones de importación de metadatos para 4.0.
Importación de metadatos con la interfaz de usuario existente No disponible. Utilice la importación de metadatos en proyectos en su lugar. Requiere IBM InfoSphere DataStage, QualityStage Designer y un servidor de intercambio de metadatos. Da soporte a un conjunto distinto de conexiones como importación de metadatos en proyectos. Consulte Conectores de importación de metadatos y Puentes de importación de metadatos.
Herramienta de enriquecimiento de metadatos Requiere el plan Professional o Enterprise.
Disponible en proyectos.
No disponible. Utilice la creación de perfiles, el descubrimiento con las opciones correspondientes o ejecute el análisis en proyectos de calidad en su lugar.
Herramienta de ordenación de datos avanzada No disponible. Utilice las herramientas de importación de metadatos y de enriquecimiento de metadatos en su lugar. Trabajar con descubrimiento de datos y proyectos de calidad.
Asignación automática de términos Disponible en la herramienta de enriquecimiento de metadatos. Parte de los trabajos de descubrimiento:
- Siempre se incluye en los trabajos de exploración rápida
- Opcional en el descubrimiento automatizado
Puntuaciones de calidad de datos Las puntuaciones de calidad de datos se muestran en:
- Perfiles de activos en proyectos y catálogos
- Resultados del enriquecimiento de metadatos
Las puntuaciones de calidad de datos se muestran en:
- Perfiles de activos en proyectos de análisis y catálogos
- Resultados de exploración rápida
- Proyectos de calidad de datos
Análisis de calidad de datos Ejecutar en la herramienta de enriquecimiento de metadatos. Ejecutar en trabajos de descubrimiento automatizados o en proyectos de calidad con reglas de datos.
Tipos de activos personalizados y atributos de activo Requiere el plan Professional o Enterprise.
Crear con las API de datos de Watson.
Crear con las API de datos de Watson.
Actividades de activos Requiere un plan de pago.
Disponible en proyectos y catálogos.
Disponible en los catálogos y proyectos de análisis.
Vista de activos de información No disponible Una vista independiente del catálogo predeterminado para visualizar más propiedades e información.
Linaje de datos operativos No disponible Disponible en la vista Activos de información. No visible en los catálogos.
Gráficos de relaciones No disponible Disponible en la vista Activos de información. No visible en los catálogos.
Clasificaciones personalizadas Requiere el plan Professional o Enterprise.
Clases de datos personalizadas Requiere el plan Professional o Enterprise.
Términos empresariales Límites para algunos planes.
Políticas Límites para algunos planes.
Reglas de protección de datos Límites para algunos planes.
Entregar conjuntos de datos enmascarados en proyectos con privacidad de datos Requiere un plan Enterprise. No disponible en 3.5.
Conjuntos de datos de referencia Límites para algunos planes.
Atributos y relaciones personalizados para artefactos, categorías Requiere un plan de Professional o Enterprise.
Crear con las API de datos de Watson.
Creae desde el menú Administración o con las API de datos de Watson.
Knowledge Accelerators Requiere un plan Enterprise.
Descargar desde la Galería.
Descargar desde la comunidad.
Flujo de trabajo para artefactos de gobierno Los planes Lite y Standard permiten al autor publicar un artefacto sin revisión ni aprobación.
Los planes Enterprise y Professional proporcionan varias plantillas con varios pasos.
Varias plantillas con varios pasos.
Configuraciones de flujo de trabajo personalizadas para artefactos de gobierno y solicitudes No disponible
Migrar activos desde InfoSphere Information Server No disponible

DataStage

La tabla siguiente describe las diferencias en las características entre DataStage en Cloud Pak for Data como servicio y DataStage en Cloud Pak for Data 4.0.2 y posteriores.

Característica Cloud Pak for Data as a Service Cloud Pak for Data 4.0.2 y posteriores
Gestión de instancias de PX Puede suministrar instancias de un conjunto de tamaños predefinidos. Puede suministrar instancias de forma más flexible mediante la administración de instancias de Cloud Pak for Data.
Compilación de trabajos
  • OSH se genera durante la compilación.
  • El transformador se compila durante el tiempo de ejecución.
  • OSH se genera durante la compilación.
  • El transformador se compila durante el tiempo de compilación y se pone a disposición del montaje de /ds-storage.
  • La compilación se realiza de forma síncrona.
Tiempo de ejecución del trabajo Cada instancia sólo puede ejecutar un trabajo a la vez para garantizar un aislamiento correcto.
  • Se da soporte a ejecuciones de trabajos simultáneas.
  • La simultaneidad se determina por la capacidad de instancia y los valores del archivo /px-storage/config/wlm.config.properties.
Gestión de activos Para los archivos de tipo .xls, .xlsx, .xml y .json, sólo se da soporte a estructuras simples. Está disponible el soporte completo de archivos de tipo .csv, .txt, .xls, .xlsx, .xml y .json.
Almacenamiento
  • El almacenamiento real basado en archivos POSIX no está disponible.
  • El almacenamiento se emula mediante el uso de un grupo de proyectos de Cloud Object Storage.
Etapa Integración de Java No disponible
JDBC No disponible
Excel No disponible
AVI No disponible
Etapa External Source No disponible
Etapa External Target No disponible
Etapa jerárquica
  • La opción de archivo individual o de conjunto de archivos para el analizador XML y el analizador JSON Parser no está disponible.
  • El archivo único, el conjunto de archivos y la opción Objeto grande para XML Composer y JSON Composer no están disponibles.
MPP y SMP S, M, L son un solo nodo, la configuración SMP. MPP-S, MPP-M, MPP-L son varios nodos, configuración MPP. De forma predeterminada, sólo está disponible la configuración de MPP. Las cargas de trabajo paralelas se gestionan mediante la partición lógica, que se configura con la opción APT_CONFIG_FILE.
  • Evaluar los despliegues para la equidad
  • Evaluar la calidad de los despliegues
  • Supervisar despliegues para la desviación
  • Ver y comparar resultados de modelo en un panel de control de Insights
  • Añadir despliegues del proveedor de aprendizaje automático de su elección
  • Establecer alertas para desencadenar cuando las evaluaciones caigan por debajo de un umbral especificado
  • Evaluar despliegues en una interfaz de usuario o un cuaderno{: .blue}

Watson Query y Data Virtualization

En Cloud Pak for Data como servicio, el servicio de consulta de Watson proporciona la funcionalidad de virtualización de datos. En Cloud Pak for Data, el servicio Data Virtualization proporciona la misma funcionalidad. La siguiente funcionalidad de virtualización de datos es la misma en Cloud Pak for Data como un servicio y Cloud Pak for Data 4.0:

  • Conexión a orígenes de datos soportados
  • Virtualización de datos
  • Gobierno de datos virtuales utilizando políticas y reglas de protección de datos
  • Supervisión y exploración del servicio
  • Utilización de la interfaz SQL
  • Almacenamiento en memoria caché

La siguiente funcionalidad de virtualización de datos parece ser diferente en la interfaz de usuario, pero proporciona la misma funcionalidad básica:

Esta tabla describe las diferencias en las características entre Watson Query en Cloud Pak for Data como servicio y Data Virtualization en Cloud Pak for Data.

Característica Cloud Pak for Data as a Service Cloud Pak for Data
Integración con Watson Knowledge Catalog Obligatorio Opcional
Autorización basada en grupo y acceso a nivel de objeto para grupos No disponible
Soporte para conectores remotos No disponible
Soporte para orígenes de datos basados en el sistema de archivos, excepto en Cloud Object Storage No disponible
Conexión a orígenes de datos con conexiones JDBC, por ejemplo, SAP HANA No disponible ✓ con controladores JDBC cargados por el usuario
Recopilación de estadísticas en la interfaz de usuario No disponible
Enmascaramiento de columna No disponible

Más información

Tema principal: Cloud Pak for Data como servicio