El software Cloud Pak for Data as a Service y Cloud Pak for Data tienen algunas diferencias en características e implementación. Cloud Pak for Data as a Service es un conjunto de servicios de IBM Cloud. Cloud Pak for Data 5.1 se ofrece como software que debe instalar y mantener en IBM Software Hub. Los servicios que están disponibles en ambas implementaciones también presentan diferencias en cuanto a características en Cloud Pak for Data as a Service en comparación con Cloud Pak for Data 5.1, 5.0 y 4.8.
- Diferencias de plataforma
- Características comunes a través de servicios
- watsonx.ai Studio comparado con Watson Studio
- tiempo de ejecución dewatsonx.ai comparado con Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Data Virtualization
Diferencias de plataforma
El software Cloud Pak for Data as a Service y Cloud Pak for Data comparten una base de código común, sin embargo, difieren de las siguientes formas clave:
Funciones | Como servicio | Software |
---|---|---|
Software, hardware e instalación | Cloud Pak for Data as a Service está totalmente gestionado por IBM en IBM Cloud. Las actualizaciones de software son automáticas. El escalado de recursos de cálculo y almacenamiento es automático. Regístrese en Try Cloud Pak for Data as a Service. | Proporciona y mantiene el hardware. Instale, mantenga y actualice el software. Véase Requisitos del software. |
Almacenamiento | Puede suministrar una instancia de servicio de IBM Cloud Object Storage para proporcionar almacenamiento. Véase IBM Cloud Object Storage. | El almacenamiento persistente se proporciona en un clúster de Red Hat OpenShift . Véase Requisitos de almacenamiento. |
Calcular recursos para ejecutar cargas de trabajo | Los usuarios eligen el tiempo de ejecución adecuado para sus trabajos. El uso de cálculo se factura en función de la tarifa para el entorno de ejecución y la duración del trabajo. Consulte Supervisar el uso de los recursos de la cuenta. | Puede configurar el número de nodos Red Hat OpenShift con el número adecuado de vCPUs. Consulte Requisitos de hardware y Supervisión de la plataforma. |
Coste | Compre cada servicio que necesite en el nivel de plan adecuado. Muchos servicios facturan por el consumo de recursos de cálculo. Consulte cada página de servicio en el catálogo deIBM Cloud o en el catálogo de servicios en Cloud Pak for Data as a Service, seleccionando Servicios > Catálogo de servicios en el menú de navegación. | Adquiere una licencia de software basada en los servicios que necesita. Por ejemplo, la licencia Cloud Pak for Data Enterprise Edition incluye el derecho a servicios como watsonx.ai Studio e IBM Knowledge Catalog. Véase Licencias y derechos. |
Seguridad, cumplimiento y aislamiento | IBM Cloud gestiona la seguridad de los datos, la seguridad de la red, el cumplimiento de los estándares de seguridad y el aislamiento de Cloud Pak for Data como servicio. Puede configurar opciones de seguridad y cifrado adicionales. Consulte Seguridad de Cloud Pak for Data como servicio. | Red Hat OpenShift Container Platform proporciona características de seguridad básicas. Cloud Pak for Data se evalúa para diversas normativas de privacidad y conformidad y proporciona características que puede utilizar como preparación para diversas evaluaciones de privacidad y conformidad. Usted es responsable de las características de seguridad adicionales, el cifrado y el aislamiento de la red. Véase Consideraciones de seguridad. |
Servicios disponibles | La mayoría de los servicios de tejido de datos están disponibles en ambos entornos de despliegue. Consulte Servicios para Cloud Pak for Data como servicio. |
Incluye muchos otros servicios. Ver Servicios. |
Gestión de usuarios | Puede añadir usuarios y grupos de usuarios y gestionar sus roles y permisos de cuenta con IBM Cloud Identity and Access Management. Consulte Añadir usuarios a la cuenta. También puede configurar la federación SAML en IBM Cloud. Consulte los documentos IBM Cloud: Cómo funciona IBM Cloud IAM. |
Puede añadir usuarios y crear grupos de usuarios desde el menú Administración. Puede utilizar Identity and Access Management Service o utilizar el SSO de SAML o el proveedor de LDAP existente para la gestión de identidades y contraseñas. Puede crear grupos de usuarios dinámicos basados en atributos. Véase Gestión de usuarios. |
Funcionalidad básica común entre servicios
La siguiente funcionalidad básica que se proporciona con la plataforma es efectivamente la misma para los servicios en Cloud Pak for Data as a Service, software Cloud Pak for Data, versiones 5.1, 5.0 y 4.8:
- Búsqueda global de activos y artefactos en toda la plataforma
- El catálogo de activos de la plataforma para compartir conexiones en toda la plataforma
- Gestión de usuarios basada en roles dentro de los espacios de trabajo colaborativo en toda la plataforma
- Infraestructura común para activos y espacios de trabajo
- Un catálogo de servicios para añadir servicios
- Ver el uso de cálculo desde el menú Administración
En la siguiente tabla se describen las diferencias en la funcionalidad básica de los servicios entre las versiones de software Cloud Pak for Data as a Service y Cloud Pak for Data 5.1 , 5.0 y 4.8.
Característica | Como servicio | Software |
---|---|---|
Gestionar todos los proyectos | Los usuarios con el permiso Gestionar proyectos del rol Administrador de acceso al servicio IAM para el servicio IBM Cloud Pak for Data pueden unirse a cualquier proyecto con el rol Administrador y, a continuación, gestionar o eliminar el proyecto. | Los usuarios con el permiso Gestionar proyectos pueden unirse a cualquier proyecto con el rol Admin y, a continuación, gestionar o suprimir el proyecto. |
Conexiones con orígenes de datos remotos | La mayoría de las fuentes de datos admitidas son comunes a ambos entornos de implantación. Véase Conectores. |
Véase Fuentes de datos compatibles. |
Credenciales de conexión personales o compartidas | Las conexiones en proyectos y catálogos pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de cuenta. | Las conexiones de plataforma pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de plataforma. |
Credenciales de conexión de secretos en una caja fuerte | No disponible | Disponible |
Autenticación Kerberos | No disponible | Disponible para algunos servicios y conexiones |
Activos y proyectos de ejemplo de la app Resource Hub | Disponible | No disponible |
Conector JDBC personalizado | No disponible | Disponible a partir de 4.8.0 |
Definiciones de origen de datos | No disponible | Disponible a partir de 5.0. Consulte Protección de datos con definiciones de origen de datos. |
watsonx.ai Studio comparado con Watson Studio
Las siguientes funciones de watsonx.ai Studio en Cloud Pak for Data as a Service son efectivamente las mismas que las funciones de Watson Studio en el software Cloud Pak for Data, versiones 5.1, 5.0, y 4.8:
- Colaboración en proyectos y espacios de despliegue
- Acceso a activos de proyecto mediante programación
- Importar y exportar proyectos utilizando un archivo ZIP de proyecto
- Cuadernos Jupyter
- Planificación de trabajos
- Data Refinery
- Watson Natural Language Processing para Python
- Chatear con modelos de la fundación sobre documentos e imágenes
Esta tabla describe las diferencias de características entre el servicio watsonx.ai Studio en el entorno de implantación as-a-service y el servicio Watson Studio Studio en el entorno de implantación de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales. Para obtener más información sobre las diferencias entre los planes de oferta Cloud Pak for Data as a Service, consulte los planes de oferta dewatsonx.ai Studio.
Característica | Como servicio | Software |
---|---|---|
Crear proyecto | Crear: • Un proyecto vacío • Un proyecto de un ejemplo en el concentrador de recursos • Un proyecto de archivo |
Crear: • Un proyecto vacío • Un proyecto del archivo • Un proyecto con integración de Git |
Integración de Git | • Publicar cuadernos en GitHub • Publicar cuadernos como gist |
• Integrar un proyecto con Git • sincronizar activos con el repositorio en un proyecto y utilizar esos activos en otro proyecto |
Terminal de proyecto para operaciones avanzadas de Git | No disponible | Disponible en proyectos con la integración de Git predeterminada |
Organizar activos en proyectos con carpetas | No disponible | Disponible a partir de 4.8.0 |
JupyterLab | No disponible | Disponible en proyectos con integración de Git |
Integración de Visual Studio Code | No disponible | Disponible en proyectos con integración de Git |
RStudio | No se puede integrar con Git | Puede integrarse con Git. Requiere un servicio RStudio Server Runtimes . |
Scripts Python | No disponible | Trabajar con scripts de Python en JupyterLab. Requiere un servicio Watson Studio Runtimes. |
Generar código para cargar datos en un cuaderno utilizando el Flight service | No disponible | Disponible |
Gestionar el ciclo de vida del cuaderno | No disponible | Utilizar CPDCTL para la gestión del ciclo de vida del cuaderno |
Activos de paquete de código (conjunto de archivos dependientes en una estructura de carpetas) | No disponible | Utilice CPDCTL para crear activos de paquete de código en un espacio de despliegue |
Promover cuadernos a espacios | No disponible | Disponible manualmente desde la página Activos del proyecto o mediante programación utilizando CPDCTL |
Python con GPU | Soporte disponible sólo para un único tipo de GPU | Soporte disponible para varios tipos de GPU Nvidia. Requiere un servicio Watson Studio Runtimes. |
Crear y utilizar imágenes personalizadas | No disponible | Cree imágenes personalizadas para entornos Python (con y sin GPU), R, JupyterLab (con y sin GPU), RStudio y SPSS. Requiere Watson Studio Runtimes y otros servicios aplicables. |
Repositorio Anaconda | No disponible | Se utiliza para crear entornos personalizados e imágenes personalizadas |
Integración de Hadoop | No disponible | Crear y entrenar modelos y ejecutar flujos de Data Refinery en un clúster de Hadoop. Requiere el servicio de ejecución del motor para Apache Hadoop. |
Decision Optimization | Disponible | Requiere el servicio Decision Optimization. |
SPSS Modeler | Disponible | Requiere el servicio SPSS Modeler. |
Interconexiones de orquestación | Disponible | Requiere el servicio de conductos de orquestación. |
tiempo de ejecución de watsonx.ai comparado con Watson Machine Learning
Las siguientes características de watsonx.ai Runtime en Cloud Pak for Data as a Service son efectivamente las mismas que las características de Watson Machine Learning en el software Cloud Pak for Data, versiones 5.1, 5.0, y 4.8:
- Colaboración en proyectos y espacios de despliegue
- Desplegar modelos
- Desplegar funciones
- aPI REST de tiempo de ejecución de watsonx.ai y API REST de Watson Machine Learning
- watsonx.ai Cliente Python
- Crear despliegues en línea
- Escalar y actualizar despliegues
- Definir y utilizar componentes personalizados
- Utilizar el aprendizaje federado para entrenar un modelo común con orígenes de datos independientes y seguros
- Supervisar despliegues en distintos espacios
- Formularios actualizados para probar el despliegue en línea
- Utilizar interconexiones anidadas
- Imputación de datos de AutoAI
- Evaluación de equidad de AutoAI
- Características de soporte de la serie temporal AutoAI
Esta tabla describe las diferencias de características entre el servicio watsonx.ai Runtime en el entorno de implementación as-a-service y el servicio Watson Machine Learning en el entorno de implementación de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales. Para obtener más información sobre las diferencias de funcionalidad entre los planes de oferta Cloud Pak for Data as a Service, consulte los planes de oferta dewatsonx.ai Runtime.
Característica | Como servicio | Software |
---|---|---|
Entrada de entrenamiento de AutoAI | orígenes de datos soportados actuales | Orígenes de datos soportados : cambio por release |
Configuración de cálculo del experimento AutoAI | Diferentes tamaños disponibles | Diferentes tamaños disponibles |
AutoAI limita el tamaño de los datos y el número de destinos de predicción |
Establecer límites | Los límites difieren según la configuración de cálculo |
Aprendizaje incremental de AutoAI | No disponible | Disponible |
Despliegue utilizando infraestructuras populares y especificaciones de software |
Comprobar las últimas versiones soportadas | Las versiones soportadas difieren por release |
Conectar a bases de datos para despliegues por lotes | Comprobación de soporte por tipo de despliegue | Comprobar el soporte por tipo de despliegue y por versión |
Desplegar y puntuar scripts Python | Disponible a través del cliente Python | Cree scripts en el cliente JupyterLab o Python y, a continuación, despliegue |
Desplegar y puntuar por lotes scripts R | No disponible | Disponible |
Desplegar aplicaciones Shiny | No disponible | Crear y desplegar apps Shiny Deploy desde el paquete de código |
Evaluar la equidad o la desviación de los trabajos | Requiere el servicio watsonx.governance | Requiere el servicio Watson OpenScale o watsonx.governance |
Evaluar la equidad, la desviación o la explicabilidad de los despliegues en línea en un espacio |
No disponible | Disponible Requiere el servicio Watson OpenScale o watsonx.governance |
Evaluar plantillas de solicitud desplegadas en un espacio | Disponible | |
Evaluar plantillas de solicitud desconectadas en un espacio | No disponible | Disponible a partir de 5.0 |
Creación del espacio de control | Sin restricciones por rol | Utilizar permisos para controlar quién puede ver y crear espacios |
Importar del proyecto GIT al espacio | No disponible | Disponible |
Paquete de código creado automáticamente al importar desde el proyecto Git al espacio |
No disponible | Disponible |
Actualizar aplicación RShiny desde el paquete de código | No disponible | Disponible |
Crear y utilizar imágenes personalizadas | No disponible | Crear imágenes personalizadas para Python o SPSS |
Notificar a los colaboradores sobre sucesos de interconexión | No disponible | Utilizar Enviar correo para notificar a los colaboradores |
Experimento de aprendizaje profundo | No disponible | Requiere el servicio IBM Scheduler |
Suministrar y gestionar instancias de servicio de IBM Cloud | Añadir instancias para watsonx.ai Runtime o Watson OpenScale |
El administrador suministra los servicios en el clúster |
watsonx.governance
Las siguientes funciones de gobernanza son efectivamente las mismas en el software Cloud Pak for Data as a Service y Cloud Pak for Data, versiones 5.1, 5.0 y 4.8:
- Evaluar los despliegues para la equidad
- Evaluar la calidad de los despliegues
- Supervisar despliegues para la desviación
- Ver y comparar resultados de modelo en un panel de control de Insights
- Añadir despliegues desde el proveedor de aprendizaje automático de su elección
- Establecer alertas para desencadenar cuando las evaluaciones caigan por debajo de un umbral especificado
- Evaluar despliegues en una interfaz de usuario o cuaderno
- Evaluaciones y métricas personalizadas
- Ver detalles sobre evaluaciones en hojas de datos de modelo
Esta tabla describe las diferencias de características entre el servicio watsonx.governance en los entornos as-a-service y de despliegue de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales.
Característica | Como servicio | Software |
---|---|---|
Evaluar modelos de aprendizaje automático | Sí | Sí |
Cargar datos de prueba puntuados previamente | No disponible | Disponible |
IBM SPSS Collaboration and Deployment Services | No disponible | Disponible |
Proceso por lotes | No disponible | Disponible |
Dar soporte al control de accesos por grupos de usuarios | No disponible | Disponible |
Base de datos gratuita y planes Postgres | Disponible | Postgres disponible a partir de 4.8 |
IBM Knowledge Catalog
Las siguientes funciones son efectivamente las mismas para IBM Knowledge Catalog on Cloud Pak for Data as a Service y en Cloud Pak for Data software, versiones 5.1, 5.0 y 4.8:
- Colaboración en proyectos y catálogos
- Búsqueda basada en IA y recomendaciones en catálogos
- Calificación y revisión de activos en catálogos
- Herramienta de Data Refinery en proyectos
- Categorías con roles de colaborador
- Clasificaciones predefinidas y personalizadas
- Clases de datos predefinidas y personalizadas
- Reglas de gobernabilidad
- Políticas
- Reglas de protección de datos
- Reglas de SLA de calidad de datos
- Perfilado manual de activos de datos relacionales individuales en un proyecto o un catálogo
- Perfilado automático de activos de datos relacionales añadidos a un catálogo gobernado
- Herramienta de enriquecimiento de metadatos en proyectos de elaboración de perfiles, asignación de términos, análisis de calidad y análisis de claves o relaciones en grandes conjuntos de activos de datos
- Tipos de activos personalizados, propiedades personalizadas para activos y relaciones personalizadas entre activos en catálogos
- Supervisar tareas de flujo de trabajo
- Entregar conjuntos de datos enmascarados en proyectos con flujos de enmascaramiento
- Información detallada sobre la calidad de los activos de datos en proyectos y catálogos, y como parte de los resultados del enriquecimiento de metadatos
- Flujos de trabajo de remediación para problemas de calidad de datos
- Crear activos de datos conectados y activos de datos segmentados con consultas SQL
- Panel de métricas y ventanas de ejecución de las tareas de enriquecimiento de metadatos
Esta tabla describe las diferencias en las características entre el servicio IBM Knowledge Catalog en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si son necesarios servicios adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data as a Service, consulte Planes de oferta deIBM Knowledge Catalog.
A partir de la versión Cloud Pak for Data 5.0, puede instalar el cartucho IBM Knowledge Catalog Premium o el cartucho IBM Knowledge Catalog Standard en lugar del servicio IBM Knowledge Catalog. IBM Knowledge Catalog Premium proporciona las mismas funciones que el servicio IBM Knowledge Catalog más funciones de IA generativa. IBM Knowledge Catalog Standard proporciona un subconjunto de funciones IBM Knowledge Catalog más funciones de IA generativa.
Característica | Como servicio | Software |
---|---|---|
Herramienta Metadata import en proyectos-descubrimiento | Importar activos de datos a proyectos o catálogos. Soporte para un subconjunto de conexiones de proyecto y catálogo. Consulte Orígenes de datos soportados para la ordenación y la calidad de los datos. | Importar diferentes tipos de activos: • Importar activos de datos en proyectos o catálogos. La mayoría de las conexiones soportadas son las mismas en ambos entornos de despliegue. • Importar informes de inteligencia empresarial, activos con sus scripts de transformación asociados, trabajos ETL o modelos de datos en catálogos. Requiere la instalación de MANTA Automated Data Lineage sin una clave de licencia. Soporte para un subconjunto de conexiones de catálogo. ' ' Ver ' Fuentes de datos compatibles para la curación y la calidad de los datos. |
Herramienta Metadata import en proyectos-linaje | Disponible. El linaje de datos debe estar activado. Límites por plan. |
- Importe el linaje de los activos de datos a los catálogos. Requiere la instalación de IBM Manta Data Lineage o MANTA Automated Data Lineage con una clave de licencia. - Capture y acceda al linaje de trabajos ETL en MANTA Automated Data Lineage. Requiere la instalación de MANTA Automated Data Lineage con una clave de licencia. Compatibilidad con un subconjunto de conexiones de catálogo. Consulte Fuentes de datos compatibles para la curación y la calidad de los datos. |
Enriquecimiento mejorado mediante IA generativa | Disponible. | No disponible. A partir de 5.0, instale IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard en su lugar. |
Reglas de calidad de datos en proyectos | Disponible Requiere el servicio DataStage . |
Disponible. Requiere el servicio DataStage . |
Añadir varios activos a un catálogo con un archivo | No disponibles. | Disponible. |
Actividades de activos | Requiere un plan de pago. Disponible en proyectos y catálogos. |
Disponible en proyectos y catálogos. |
Linaje empresarial | No disponible | Disponible. |
Linaje de datos técnicos | No disponibles. | Disponible. Requiere que esté instalada una versión con licencia de MANTA Automated Data Lineage for IBM Cloud Pak for Data. Se genera ejecutando la herramienta de importación de metadatos. Se puede acceder desde catálogos. |
Linaje de datos | Requiere habilitación. | No disponibles. |
Términos empresariales | Límites para algunos planes. | Disponible. |
Términos comerciales predefinidos | Los términos empresariales predefinidos y la categoría Datos personales de muestra de Knowledge Accelerator que los incluye solo están disponibles si crea una instancia de servicio IBM Knowledge Catalog con un plan Lite o Standard después del 7 de octubre de 2022. | No disponibles. |
Conjuntos de datos de referencia | Límites por plan. | Disponible. |
Relaciones personalizadas para artefactos | Requiere un plan de pago. | Disponible. |
Knowledge Accelerators | Requiere un plan Enterprise desde Resource hub. |
Se suministra con la plataforma. |
Configuraciones de flujo de trabajo personalizadas para artefactos de gobierno y solicitudes | Disponible para artefactos de gobernanza. | Disponible. |
Roles de categoría personalizados | Límites por plan. | Disponible. |
Normas de protección de datos de exportación e importación | Para exportar reglas de protección de datos desde cualquier sistema e importarlas al mismo sistema o a otro diferente, puede utilizar las API. Para obtener más información, consulte Migración de reglas de protección de datos. | Para exportar reglas de protección de datos desde cualquier sistema e importarlas al mismo sistema o a otro diferente, puede utilizar las API o los comandos cpd-cli. Para obtener más información, consulte Migración de reglas de protección de datos. |
Informes administrativos | Requiere un plan de pago. | Disponible. |
Migrar datos desde InfoSphere Information Server | No disponibles. | Disponible. |
Explorador de relaciones | No disponibles. | Disponible a partir de 5.0. Requiere instalar el componente opcional knowledge graph con IBM Knowledge Catalog. |
DataStage
En la tabla siguiente se describen las diferencias de características entre DataStage on Cloud Pak for Data as a Service y DataStage en el software Cloud Pak for Data, las versiones 5.1, 5.0 y 4.8.
Característica | Como servicio | Software |
---|---|---|
Gestión de instancias de PX | Puede suministrar instancias de un conjunto de tamaños predefinidos. | Puede suministrar instancias de forma más flexible mediante la administración de instancias de Cloud Pak for Data. |
Compilación de trabajos |
|
|
Tiempo de ejecución del trabajo | Puede enviar tantos trabajos como desee, sujetos a la colocación en cola. |
|
Gestión de activos | Para los archivos de tipo .xls, .xlsx, .xml y .json, sólo se da soporte a estructuras simples. Los esquemas de varios niveles/anidados no se pueden analizar. | Está disponible el soporte completo de archivos de tipo .csv, .txt, .xls, .xlsx, .xml y .json. |
Almacenamiento |
|
|
Etapa Integración de Java | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Componente de biblioteca Java | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión JDBC genérica | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Excel | Disponible conDataStage-aaS En cualquier lugar | Disponible |
AVI | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Etapa External Source | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Etapa External Target | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Etapa jerárquica |
|
Disponible |
SMP | S, M, L son un solo nodo, la configuración SMP. Utilice un motor de tiempo de ejecución remoto para configurar una configuración alternativa. | Las cargas de trabajo paralelas se gestionan a través de particiones lógicas, que se configuran con la opción APT_CONFIG_FILE. |
Conexión de SAP Bulk Extract | No disponible | Disponible |
Conexión de SAP Delta Extract | No disponible | Disponible |
Etapa de envoltura | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión de SAP HANA | No disponible | Disponible |
Origen de datos de texto en la conexión ODBC | No disponible | Disponible |
Crear etapa | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Enviar informes utilizando subrutinas antes/después de trabajo | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Etapa personalizada | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión Apache HBase | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Autenticación Kerberos para conexiones Apache Hive | No disponible | Disponible |
Funciones definidas por el usuario (UDF) | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Archivos APT_CONFIG_FILE creados por el usuario | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Propiedades antes/después del trabajo | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conector de servicio de datos | No disponible | Disponible |
Secuencia de base de datos Db2 en la etapa Lentamente Changing Dimension, la etapa Suplgate Key Generator y la etapa Transformer | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Utilice la conexión Apache Hive como destino. (Disponible cuando se selecciona Utilizar propiedades de DataStage en el conector.) | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Parametrizar propiedades con conexiones locales | No disponible | Disponible |
Etapa Operational Decision Manager | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Espacios de despliegue | No disponible | Disponible |
Data Virtualization
En Cloud Pak for Data as a Service, la funcionalidad de virtualización de datos la proporciona el servicio Data Virtualization. La siguiente funcionalidad de virtualización de datos es efectivamente la misma en el software Cloud Pak for Data as a Service y Cloud Pak for Data, versiones 5.1, 5.0 y 4.8.
- Conexión a orígenes de datos soportados
- Virtualización de datos
- Gobierno de datos virtuales utilizando políticas y reglas de protección de datos
- Supervisión y exploración del servicio
- Utilización de la interfaz SQL
- Almacenamiento en memoria caché
- Enmascaramiento de columna
- Explorar vista y recarga de tablas
- Muestreo de datos en recopilación de estadísticas
- Enriquecimiento de metadatos
La siguiente funcionalidad de virtualización de datos parece ser diferente en la interfaz de usuario, pero proporciona la misma funcionalidad básica:
- Publicación de datos virtuales en catálogos
- Gestionar el acceso a los objetos virtuales
- Administración de usuarios y roles
- Escalado del servicio
- Recopilación de estadísticas en el cliente web en Data Virtualization
Esta tabla describe las diferencias de características entre el software " Data Virtualization " (antes " Watson Query) en " Cloud Pak for Data as a Service " y " Data Virtualization (antes " Watson Query) en " Cloud Pak for Data ".
Característica | Como servicio | Software |
---|---|---|
Utilice las definiciones de origen de datos (DSD) de Cloud Pak for Data para aplicar las reglas de protección de datos de IBM Knowledge Catalog | No aplicable para SaaS | Disponible a partir de 5.0 |
Consultar datos en orígenes de datos de la API REST | No aplicable para SaaS | Disponible a partir de 5.0 |
Tablas de consulta de catálogos anteriores de Presto y Databricks con soporte de varios catálogos | No aplicable para SaaS | Disponible a partir de 5.0 |
Escalar automáticamente las instancias de servicio | No aplicable para SaaS | Disponible a partir de 5.0 |
Enmascarar caracteres de varios bytes para mejorar la privacidad de los datos confidenciales | No aplicable para SaaS | Disponible a partir de 5.0 |
Ver las reglas de protección de datos que se aplican a un usuario | No aplicable para SaaS | Disponible a partir de 5.0 |
Seguridad mejorada para los resultados de creación de perfiles en vistas de Data Virtualization | No aplicable para SaaS | Disponible a partir de 5.0 |
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma | No aplicable para SaaS | Disponible a partir de 5.0 |
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma | No aplicable para SaaS | Disponible a partir de 5.0 |
Seguridad mejorada para el rol Admin: el rol Admin no tiene acceso predeterminado a todos los datos. | No aplicable para SaaS | Disponible a partir de 4.8 |
Las reglas de protección de datos de IBM Knowledge Catalog siempre están habilitadas para los datos de Watson Query | No aplicable para SaaS | Disponible a partir de 4.8 |
Proteja los objetos no gobernados: con las reglas de protección de datos de IBM Knowledge Catalog en Watson Query, los objetos virtualizados que no se publican en un catálogo gobernado siguen el valor de convención de acceso a datos predeterminado de los valores de regla. | No aplicable para SaaS | Disponible a partir de 4.8 |
Consultar datos de Presto : puede crear una conexión con Presto para acceder y consultar datos en Presto. | No aplicable para SaaS | Disponible a partir de 4.8 |
Registro de auditoría para supervisar la actividad del usuario y el acceso a datos | Disponible | Disponible |
Integración con IBM Knowledge Catalog | Necesario | Opcional |
Autorización basada en grupo y acceso a nivel de objeto para grupos | No disponible | Disponible |
Soporte para conectores remotos | No aplicable para SaaS | Disponible |
Soporte para orígenes de datos basados en el sistema de archivos, excepto en Cloud Object Storage | No aplicable para SaaS | Disponible |
Conexión a orígenes de datos que requieren un controlador JDBC cargado, por ejemplo, SAP HANA, Genérico JDBC | No aplicable para SaaS | Disponible |
Recopilación de estadísticas en la interfaz de usuario | No disponible | Disponible |
Recopilación automática de estadísticas durante la virtualización de objetos | No disponible | Disponible |
Gestión de accesos para varios grupos | No disponible | Disponible |
Soporte para archivos CSV o TSV en Cloud Object Storage | No aplicable para SaaS | Disponible |
Credenciales en cajas fuertes para conexiones en Cloud Object Storage | No aplicable para SaaS | Disponible |
Almacenamiento automático de consultas | No disponible | Disponible a partir de 5.0.3 |
Más información
- Servicios para Cloud Pak for Data como servicio
- Servicios para IBM Software Hub 5.1
- Opciones de entorno de implantación en la nube para https://www.ibm.com/docs/SSNFH6_5.1.x 5.1
Tema principal: Cloud Pak for Data como servicio