Diferencias de características entre despliegues de Cloud Pak for Data
Cloud Pak for Data como servicio y software Cloud Pak for Data 4.0 y 3.5 tienen algunas diferencias en las características y la implementación. Cloud Pak for Data as a Service es un conjunto de servicios de IBM Cloud. Cloud Pak for Data 4.0 y 3.5 se ofrecen como software que debe instalar y mantener. Los servicios que están disponibles en ambos despliegues también tienen diferencias en las características de Cloud Pak for Data como servicio en comparación con Cloud Pak for Data 4.0 y 3.5.
- Diferencias de plataforma
- Características comunes a través de servicios
- Watson Studio
- Watson Machine Learning
- Watson Knowledge Catalog
- DataStage
- Watson Query y Data Virtualization
Diferencias de plataforma
Cloud Pak for Data como servicio y Cloud Pak for Data 4.0 comparten una base de código común, sin embargo, difieren en las siguientes formas clave:
Funciones | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Software, hardware e instalación | Cloud Pak for Data as a Service está totalmente gestionado por IBM en IBM Cloud. Las actualizaciones de software son automáticas. El escalado de recursos de cálculo y almacenamiento es automático. Se registra en https://dataplatform.cloud.ibm.com. | Proporciona y mantiene el hardware. Instala, mantiene y actualiza el software de Cloud Pak for Data. Consulte Requisitos de software. |
Almacenamiento | Puede suministrar una instancia de servicio de IBM Cloud Object Storage para proporcionar almacenamiento. Consulte IBM Cloud Object Storage. | Proporciona un sistema de almacenamiento de archivos en un clúster de Red Hat OpenShift. Consulte Requisitos de almacenamiento. |
Calcular recursos para ejecutar cargas de trabajo | Los usuarios eligen el tiempo de ejecución adecuado para sus trabajos. El uso de cálculo se factura en función de la tarifa para el entorno de ejecución y la duración del trabajo. Consulte Supervisar el uso de los recursos de la cuenta. | Ha configurado el número de clústeres y nodos de Red Hat OpenShift con el número adecuado de vCPU. Consulte Requisitos de hardware y Supervisión de la plataforma. |
Coste | Compre cada servicio que necesite en el nivel de plan adecuado. Muchos servicios facturan por el consumo de recursos de cálculo. Consulte cada página de servicio en el catálogo de IBM Cloud o en el catálogo de servicios de Cloud Pak for Data como servicio, seleccionando Servicios > Catálogo de servicios en el menú de navegación. | Usted compra una licencia para Cloud Pak for Data más cada servicio que necesite. Consulte Cloud Pak for Data. |
Seguridad, cumplimiento y aislamiento | IBM Cloud gestiona la seguridad de los datos, la seguridad de la red, el cumplimiento de los estándares de seguridad y el aislamiento de Cloud Pak for Data como servicio. Puede configurar opciones de seguridad y cifrado adicionales. Consulte Seguridad de Cloud Pak for Data como servicio. | Red Hat OpenShift Container Platform proporciona características de seguridad básicas. Cloud Pak for Data se evalúa para diversas normativas de privacidad y conformidad y proporciona características que puede utilizar como preparación para diversas evaluaciones de privacidad y conformidad. Usted es responsable de las características de seguridad adicionales, el cifrado y el aislamiento de la red. Consulte Consideraciones de seguridad. |
Servicios disponibles | La mayoría de los servicios de tejido de datos están disponibles en ambos entornos de despliegue. Consulte Servicios para Cloud Pak for Data como servicio. |
Incluye muchos otros servicios. Véase Servicios para Cloud Pak for Data 4.0. |
Gestión de usuarios | Puede añadir usuarios y grupos de usuarios y gestionar sus roles y permisos de cuenta con IBM Cloud Identity and Access Management. Consulte Añadir usuarios a la cuenta. También puede configurar la federación SAML en IBM Cloud. Véase Docs de IBM Cloud: ¿Qué es IBM Cloud Identity and Access Management? |
Puede añadir usuarios y crear grupos de usuarios desde el menú Administración. Puede utilizar Identity and Access Management Service o utilizar el SSO de SAML o el proveedor de LDAP existente para la gestión de identidades y contraseñas. Consulte Gestión de usuarios. |
Características comunes a través de servicios
Las siguientes características en los servicios son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:
- Búsqueda global de activos y artefactos en toda la plataforma
- El catálogo de activos de la plataforma para compartir conexiones en toda la plataforma
- Gestión de usuarios basada en roles dentro de los espacios de trabajo colaborativo en toda la plataforma
- Infraestructura común para activos y espacios de trabajo
- Un catálogo de servicios para añadir servicios
- Ver el uso de cálculo desde el menú Administración
La tabla siguiente describe las diferencias en las características entre servicios entre Cloud Pak for Data como servicio y Cloud Pak for Data 3.5 y 4.0.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Experiencia de proyectos actualizados | Consulte Nueva experiencia en proyectos. | No disponible |
Conexiones con orígenes de datos remotos | La mayoría de los orígenes de datos soportados son comunes a ambos entornos de despliegue. Consulte Conexiones soportadas. |
Consulte Orígenes de datos soportados. |
Credenciales de conexión personales o compartidas | Las conexiones en proyectos y catálogos pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de cuenta. | Las conexiones de plataforma pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de plataforma. |
Credenciales de conexión de secretos en una caja fuerte | No disponible | ✓ |
Ejemplos de activos y proyectos de la Galería | ✓ | No disponible |
Solicitudes de acceso a datos | No disponible | ✓ |
Watson Studio
Las siguientes características de Watson Studio son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:
- Colaboración en proyectos
- Importar y exportar proyectos utilizando un archivo ZIP de proyecto
- Cuadernos Jupyter
- Planificación de trabajos
- Data Refinery
Esta tabla describe las diferencias de características entre el servicio Watson Studio en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios de adición. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Studio.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Crear proyecto | Crear: - Un proyecto vacío - Un proyecto a partir de un ejemplo de la Galería - Un proyecto del archivo |
Crear: - Un proyecto vacío - Un proyecto del archivo - Un proyecto con integración de Git |
Integración de Git | - Publicar cuadernos en GitHub - Publicar cuadernos como gist |
- Integrar un proyecto con Git - sincronizar activos en el repositorio en un proyecto y utilizar dichos activos en otro proyecto |
Terminal de proyecto para operaciones avanzadas de Git | No disponible | Disponible en proyectos con la integración de Git predeterminada |
JupyterLab | No disponible | Disponible en proyectos con integración de Git |
RStudio | No se puede integrar con Git | Puede integrarse con Git. Requiere el servidor de RStudio con servicio R. |
Scripts Python | No disponible | Trabajar con scripts de Python en JupyterLab. Requiere cuadernos Jupiter con Python o cuadernos Jupyter con el servicio R. |
Acceder a los activos del proyecto mediante programación | Utilice project-lib para Python y R |
Utilice ibm-watson-studio-lib para Python y R (sucesor de project-lib ) |
Insertar en código en cuadernos utilizando el servicio Flight | No disponible | ✓ |
Gestionar el ciclo de vida del cuaderno | No disponible | Utilizar CPDCTL para la gestión del ciclo de vida del cuaderno |
Activos de paquete de código (conjunto de archivos dependientes en una estructura de carpetas) | No disponible | Utilice CPDCTL para crear activos de paquete de código en un espacio de despliegue |
Promover cuadernos a espacios | No disponible | Disponible manualmente desde la página Activos del proyecto o mediante programación utilizando CPDCTL |
Python con GPU | Soporte disponible sólo para un solo tipo de GPU (Nvidia K80) | Soporte disponible para varios tipos de GPU Nvidia. Requiere cuadernos Jupiter con Python con servicio de GPU. |
Crear y utilizar imágenes personalizadas | No disponible | Crear imágenes personalizadas para entornos Python (con y sin GPU), R, JupyterLab (con y sin GPU), RStudio y SPSS |
Repositorio Anaconda | No disponible | Se utiliza para crear entornos personalizados e imágenes personalizadas |
Integración de Hadoop | No disponible | Crear y entrenar modelos y ejecutar flujos de Data Refinery en un clúster de Hadoop. Requiere el servicio de ejecución del motor para Apache Hadoop. |
Decision Optimization | ✓ | Requiere el servicio Decision Optimization. |
SPSS Modeler | ✓ | Requiere el servicio SPSS Modeler. |
Paneles de control | Requiere el servicio Cognos Dashboard Embedded. | Requiere el servicio Cognos Dashboards. |
Para ver las diferencias entre Watson Studio Desktop y Watson Studio en Cloud Pak for Data como servicio y Cloud Pak for Data, consulte Diferencias de características entre despliegues de Watson Studio.
Watson Machine Learning
Las siguientes características de Watson Machine Learning son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:
- Crear y desplegar experimentos de IA automática
- Colaborar en espacios de despliegue
- Desplegar modelos
- Desplegar funciones
- API REST de Watson Machine Learning
- Cliente Python de Watson Machine Learning
- Crear trabajos de despliegue por lotes
- Crear despliegues en línea
- Escalar y actualizar despliegues
- Definir y utilizar componentes personalizados
- Utilizar el aprendizaje federado para entrenar un modelo común con orígenes de datos independientes y seguros
- Supervisar despliegues en distintos espacios
Esta tabla describe las diferencias de características entre el servicio Watson Studio en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios adicionales. Para obtener detalles sobre las diferencias de funcionalidad entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Machine Learning.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Despliegue utilizando infraestructuras y especificaciones de software populares |
Comprobar las últimas versiones soportadas | Las versiones soportadas difieren por release |
Conectar a bases de datos para despliegues por lotes | Comprobación de soporte por tipo de despliegue | Comprobar el soporte por tipo de despliegue y por versión |
Desplegar scripts de Python | Disponible a través del cliente Python | Crear scripts en JupyterLab y, a continuación, desplegar |
Desplegar aplicaciones Shiny | No disponible | Crear y desplegar aplicaciones Shiny |
Despliegues virtuales (CoreML) | Crear aplicaciones para iOS | en desuso se eliminarán |
Evaluar los trabajos para la equidad, el sesgo o la desviación | Requiere Watson OpenScale | Requiere Watson OpenScale |
Creación del espacio de control | Sin restricciones por rol | Utilizar permisos para controlar quién puede ver y crear espacios |
Seguimiento de los detalles del modelo en un inventario de modelos | Registrar modelos para ver las hojas de datos con detalles del ciclo de vida | No disponible |
Crear y utilizar imágenes personalizadas | No disponible | Crear imágenes personalizadas para Python o SPSS |
Automatizar sucesos del ciclo de vida de IA | Orquestar un flujo de extremo a extremo utilizando Watson Studio Pipelines (beta) |
Utilizar CPDCTL para automatizar sucesos de ciclo de vida |
Importar un archivo de proyecto o espacio a un espacio no vacío | No disponible | Disponible, a partir de 4.0.6 |
Experimento de aprendizaje profundo | Está en desuso y se eliminará | Requiere el servicio de Watson Machine Learning Accelerator |
Suministrar y gestionar instancias de servicio de IBM Cloud | Añadir instancias para Watson Machine Learning o Watson OpenScale |
El administrador suministra los servicios en el clúster |
{: caption="Diferencias de características entre despliegues de Watson Machine Learning" caption-side="top"}
Watson Knowledge Catalog
Las siguientes características de Watson Knowledge Catalog son efectivamente las mismas en Cloud Pak for Data como un servicio, Cloud Pak for Data 3.5 y Cloud Pak for Data 4.0:
- Búsqueda basada en IA y recomendaciones en catálogos
- Calificación y revisión de activos en catálogos
- Colaboración en proyectos y catálogos
- Herramienta de Data Refinery en proyectos
- Categorías con roles de colaborador
- Clasificaciones predefinidas
- Clases de datos predefinidas
- Reglas de gobernabilidad
- Perfilado manual de activos de datos relacionales individuales en un proyecto o un catálogo
- Perfilado automático de activos de datos relacionales añadidos a un catálogo gobernado
Esta tabla describe las diferencias en las características entre el servicio Watson Knowledge Catalog en varios entornos de despliegue, las diferencias entre los planes de oferta y si son necesarios servicios de adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Knowledge Catalog.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Creación de perfiles de datos no estructurados | Perfilado automático de activos individuales que se añaden a un proyecto o a un catálogo. | No disponible. |
Herramienta de importación de metadatos en proyectos | Soporte para un subconjunto de conexiones de proyecto y catálogo. Consulte Conexiones de importación de metadatos. | La mayoría de las conexiones soportadas son las mismas en ambos entornos de despliegue. Consulte Conexiones de importación de metadatos para 3.5 y Conexiones de importación de metadatos para 4.0. |
Importación de metadatos con la interfaz de usuario existente | No disponible. Utilice la importación de metadatos en proyectos en su lugar. | Requiere IBM InfoSphere DataStage, QualityStage Designer y un servidor de intercambio de metadatos. Da soporte a un conjunto distinto de conexiones como importación de metadatos en proyectos. Consulte Conectores de importación de metadatos y Puentes de importación de metadatos. |
Herramienta de enriquecimiento de metadatos | Requiere el plan Professional o Enterprise. Disponible en proyectos. |
No disponible. Utilice la creación de perfiles, el descubrimiento con las opciones correspondientes o ejecute el análisis en proyectos de calidad en su lugar. |
Herramienta de ordenación de datos avanzada | No disponible. Utilice las herramientas de importación de metadatos y de enriquecimiento de metadatos en su lugar. | Trabajar con descubrimiento de datos y proyectos de calidad. |
Asignación automática de términos | Disponible en la herramienta de enriquecimiento de metadatos. | Parte de los trabajos de descubrimiento: - Siempre se incluye en los trabajos de exploración rápida - Opcional en el descubrimiento automatizado |
Puntuaciones de calidad de datos | Las puntuaciones de calidad de datos se muestran en: - Perfiles de activos en proyectos y catálogos - Resultados del enriquecimiento de metadatos |
Las puntuaciones de calidad de datos se muestran en: - Perfiles de activos en proyectos de análisis y catálogos - Resultados de exploración rápida - Proyectos de calidad de datos |
Análisis de calidad de datos | Ejecutar en la herramienta de enriquecimiento de metadatos. | Ejecutar en trabajos de descubrimiento automatizados o en proyectos de calidad con reglas de datos. |
Tipos de activos personalizados y atributos de activo | Requiere el plan Professional o Enterprise. Crear con las API de datos de Watson. |
Crear con las API de datos de Watson. |
Actividades de activos | Requiere un plan de pago. Disponible en proyectos y catálogos. |
Disponible en los catálogos y proyectos de análisis. |
Vista de activos de información | No disponible | Una vista independiente del catálogo predeterminado para visualizar más propiedades e información. |
Linaje de datos operativos | No disponible | Disponible en la vista Activos de información. No visible en los catálogos. |
Gráficos de relaciones | No disponible | Disponible en la vista Activos de información. No visible en los catálogos. |
Clasificaciones personalizadas | Requiere el plan Professional o Enterprise. | ✓ |
Clases de datos personalizadas | Requiere el plan Professional o Enterprise. | ✓ |
Términos empresariales | Límites para algunos planes. | ✓ |
Políticas | Límites para algunos planes. | ✓ |
Reglas de protección de datos | Límites para algunos planes. | ✓ |
Entregar conjuntos de datos enmascarados en proyectos con privacidad de datos | Requiere un plan Enterprise. | No disponible en 3.5. |
Conjuntos de datos de referencia | Límites para algunos planes. | ✓ |
Atributos y relaciones personalizados para artefactos, categorías | Requiere un plan de Professional o Enterprise. Crear con las API de datos de Watson. |
Creae desde el menú Administración o con las API de datos de Watson. |
Knowledge Accelerators | Requiere un plan Enterprise. Descargar desde la Galería. |
Descargar desde la comunidad. |
Flujo de trabajo para artefactos de gobierno | Los planes Lite y Standard permiten al autor publicar un artefacto sin revisión ni aprobación. Los planes Enterprise y Professional proporcionan varias plantillas con varios pasos. |
Varias plantillas con varios pasos. |
Configuraciones de flujo de trabajo personalizadas para artefactos de gobierno y solicitudes | No disponible | ✓ |
Migrar activos desde InfoSphere Information Server | No disponible | ✓ |
DataStage
La tabla siguiente describe las diferencias en las características entre DataStage en Cloud Pak for Data como servicio y DataStage en Cloud Pak for Data 4.0.2 y posteriores.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data 4.0.2 y posteriores |
---|---|---|
Gestión de instancias de PX | Puede suministrar instancias de un conjunto de tamaños predefinidos. | Puede suministrar instancias de forma más flexible mediante la administración de instancias de Cloud Pak for Data. |
Compilación de trabajos |
|
|
Tiempo de ejecución del trabajo | Cada instancia sólo puede ejecutar un trabajo a la vez para garantizar un aislamiento correcto. |
|
Gestión de activos | Para los archivos de tipo .xls, .xlsx, .xml y .json, sólo se da soporte a estructuras simples. | Está disponible el soporte completo de archivos de tipo .csv, .txt, .xls, .xlsx, .xml y .json. |
Almacenamiento |
|
|
Etapa Integración de Java | No disponible | ✓ |
JDBC | No disponible | ✓ |
Excel | No disponible | ✓ |
AVI | No disponible | ✓ |
Etapa External Source | No disponible | ✓ |
Etapa External Target | No disponible | ✓ |
Etapa jerárquica |
|
✓ |
MPP y SMP | S, M, L son un solo nodo, la configuración SMP. MPP-S, MPP-M, MPP-L son varios nodos, configuración MPP. | De forma predeterminada, sólo está disponible la configuración de MPP. Las cargas de trabajo paralelas se gestionan mediante la partición lógica, que se configura con la opción APT_CONFIG_FILE. |
- Evaluar los despliegues para la equidad
- Evaluar la calidad de los despliegues
- Supervisar despliegues para la desviación
- Ver y comparar resultados de modelo en un panel de control de Insights
- Añadir despliegues del proveedor de aprendizaje automático de su elección
- Establecer alertas para desencadenar cuando las evaluaciones caigan por debajo de un umbral especificado
- Evaluar despliegues en una interfaz de usuario o un cuaderno{: .blue}
Watson Query y Data Virtualization
En Cloud Pak for Data como servicio, el servicio de consulta de Watson proporciona la funcionalidad de virtualización de datos. En Cloud Pak for Data, el servicio Data Virtualization proporciona la misma funcionalidad. La siguiente funcionalidad de virtualización de datos es la misma en Cloud Pak for Data como un servicio y Cloud Pak for Data 4.0:
- Conexión a orígenes de datos soportados
- Virtualización de datos
- Gobierno de datos virtuales utilizando políticas y reglas de protección de datos
- Supervisión y exploración del servicio
- Utilización de la interfaz SQL
- Almacenamiento en memoria caché
La siguiente funcionalidad de virtualización de datos parece ser diferente en la interfaz de usuario, pero proporciona la misma funcionalidad básica:
- Publicación de datos virtuales en catálogos
- Gestionar el acceso a los objetos virtuales
- Administración de usuarios y roles
- Escalado del servicio
Esta tabla describe las diferencias en las características entre Watson Query en Cloud Pak for Data como servicio y Data Virtualization en Cloud Pak for Data.
Característica | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Integración con Watson Knowledge Catalog | Obligatorio | Opcional |
Autorización basada en grupo y acceso a nivel de objeto para grupos | No disponible | ✓ |
Soporte para conectores remotos | No disponible | ✓ |
Soporte para orígenes de datos basados en el sistema de archivos, excepto en Cloud Object Storage | No disponible | ✓ |
Conexión a orígenes de datos con conexiones JDBC, por ejemplo, SAP HANA | No disponible | ✓ con controladores JDBC cargados por el usuario |
Recopilación de estadísticas en la interfaz de usuario | No disponible | ✓ |
Enmascaramiento de columna | No disponible | ✓ |
Más información
- Planes de ofertas
- Servicios para Cloud Pak for Data como servicio
- Servicios de para Cloud Pak for Data 4.0
- Opciones de entorno de despliegue de nube para Cloud Pak for Data 4.0
Tema principal: Cloud Pak for Data como servicio