0 / 0
Volver a la versión inglesa de la documentación
Diferencias de características entre despliegues de Cloud Pak for Data
Última actualización: 19 dic 2024
Diferencias de características entre despliegues de Cloud Pak for Data

El software Cloud Pak for Data as a Service y Cloud Pak for Data tienen algunas diferencias en características e implementación. Cloud Pak for Data as a Service es un conjunto de servicios de IBM Cloud. Cloud Pak for Data 5.1 se ofrece como software que debe instalar y mantener en IBM Software Hub. Los servicios que están disponibles en ambas implementaciones también presentan diferencias en cuanto a características en Cloud Pak for Data as a Service en comparación con Cloud Pak for Data 5.1, 5.0 y 4.8.

Diferencias de plataforma

El software Cloud Pak for Data as a Service y Cloud Pak for Data comparten una base de código común, sin embargo, difieren de las siguientes formas clave:

Diferencias de plataforma
Funciones Como servicio Software
Software, hardware e instalación Cloud Pak for Data as a Service está totalmente gestionado por IBM en IBM Cloud. Las actualizaciones de software son automáticas. El escalado de recursos de cálculo y almacenamiento es automático. Regístrese en Try Cloud Pak for Data as a Service. Proporciona y mantiene el hardware. Instale, mantenga y actualice el software. Véase Requisitos del software.
Almacenamiento Puede suministrar una instancia de servicio de IBM Cloud Object Storage para proporcionar almacenamiento. Véase IBM Cloud Object Storage. El almacenamiento persistente se proporciona en un clúster de Red Hat OpenShift . Véase Requisitos de almacenamiento.
Calcular recursos para ejecutar cargas de trabajo Los usuarios eligen el tiempo de ejecución adecuado para sus trabajos. El uso de cálculo se factura en función de la tarifa para el entorno de ejecución y la duración del trabajo. Consulte Supervisar el uso de los recursos de la cuenta. Puede configurar el número de nodos Red Hat OpenShift con el número adecuado de vCPUs. Consulte Requisitos de hardware y Supervisión de la plataforma.
Coste Compre cada servicio que necesite en el nivel de plan adecuado. Muchos servicios facturan por el consumo de recursos de cálculo. Consulte cada página de servicio en el catálogo deIBM Cloud o en el catálogo de servicios en Cloud Pak for Data as a Service, seleccionando Servicios > Catálogo de servicios en el menú de navegación. Adquiere una licencia de software basada en los servicios que necesita. Por ejemplo, la licencia Cloud Pak for Data Enterprise Edition incluye el derecho a servicios como watsonx.ai Studio e IBM Knowledge Catalog. Véase Licencias y derechos.
Seguridad, cumplimiento y aislamiento IBM Cloud gestiona la seguridad de los datos, la seguridad de la red, el cumplimiento de los estándares de seguridad y el aislamiento de Cloud Pak for Data como servicio. Puede configurar opciones de seguridad y cifrado adicionales. Consulte Seguridad de Cloud Pak for Data como servicio. Red Hat OpenShift Container Platform proporciona características de seguridad básicas. Cloud Pak for Data se evalúa para diversas normativas de privacidad y conformidad y proporciona características que puede utilizar como preparación para diversas evaluaciones de privacidad y conformidad. Usted es responsable de las características de seguridad adicionales, el cifrado y el aislamiento de la red. Véase Consideraciones de seguridad.
Servicios disponibles La mayoría de los servicios de tejido de datos están disponibles en ambos entornos de despliegue.
Consulte Servicios para Cloud Pak for Data como servicio.
Incluye muchos otros servicios. Ver Servicios.
Gestión de usuarios Puede añadir usuarios y grupos de usuarios y gestionar sus roles y permisos de cuenta con IBM Cloud Identity and Access Management. Consulte Añadir usuarios a la cuenta.
También puede configurar la federación SAML en IBM Cloud. Consulte los documentos IBM Cloud: Cómo funciona IBM Cloud IAM.
Puede añadir usuarios y crear grupos de usuarios desde el menú Administración. Puede utilizar Identity and Access Management Service o utilizar el SSO de SAML o el proveedor de LDAP existente para la gestión de identidades y contraseñas. Puede crear grupos de usuarios dinámicos basados en atributos. Véase Gestión de usuarios.

Funcionalidad básica común entre servicios

La siguiente funcionalidad básica que se proporciona con la plataforma es efectivamente la misma para los servicios en Cloud Pak for Data as a Service, software Cloud Pak for Data, versiones 5.1, 5.0 y 4.8:

  • Búsqueda global de activos y artefactos en toda la plataforma
  • El catálogo de activos de la plataforma para compartir conexiones en toda la plataforma
  • Gestión de usuarios basada en roles dentro de los espacios de trabajo colaborativo en toda la plataforma
  • Infraestructura común para activos y espacios de trabajo
  • Un catálogo de servicios para añadir servicios
  • Ver el uso de cálculo desde el menú Administración

En la siguiente tabla se describen las diferencias en la funcionalidad básica de los servicios entre las versiones de software Cloud Pak for Data as a Service y Cloud Pak for Data 5.1 , 5.0 y 4.8.

Diferencias en características comunes entre servicios
Característica Como servicio Software
Gestionar todos los proyectos Los usuarios con el permiso Gestionar proyectos del rol Administrador de acceso al servicio IAM para el servicio IBM Cloud Pak for Data pueden unirse a cualquier proyecto con el rol Administrador y, a continuación, gestionar o eliminar el proyecto. Los usuarios con el permiso Gestionar proyectos pueden unirse a cualquier proyecto con el rol Admin y, a continuación, gestionar o suprimir el proyecto.
Conexiones con orígenes de datos remotos La mayoría de las fuentes de datos admitidas son comunes a ambos entornos de implantación.
Véase Conectores.
Véase Fuentes de datos compatibles.
Credenciales de conexión personales o compartidas Las conexiones en proyectos y catálogos pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de cuenta. Las conexiones de plataforma pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de plataforma.
Credenciales de conexión de secretos en una caja fuerte No disponible Disponible
Autenticación Kerberos No disponible Disponible para algunos servicios y conexiones
Activos y proyectos de ejemplo de la app Resource Hub Disponible No disponible
Conector JDBC personalizado No disponible Disponible a partir de 4.8.0
Definiciones de origen de datos No disponible Disponible a partir de 5.0.
Consulte Protección de datos con definiciones de origen de datos.

watsonx.ai Studio comparado con Watson Studio

Las siguientes funciones de watsonx.ai Studio en Cloud Pak for Data as a Service son efectivamente las mismas que las funciones de Watson Studio en el software Cloud Pak for Data, versiones 5.1, 5.0, y 4.8:

  • Colaboración en proyectos y espacios de despliegue
  • Acceso a activos de proyecto mediante programación
  • Importar y exportar proyectos utilizando un archivo ZIP de proyecto
  • Cuadernos Jupyter
  • Planificación de trabajos
  • Data Refinery
  • Watson Natural Language Processing para Python
  • Chatear con modelos de la fundación sobre documentos e imágenes

Esta tabla describe las diferencias de características entre el servicio watsonx.ai Studio en el entorno de implantación as-a-service y el servicio Watson Studio Studio en el entorno de implantación de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales. Para obtener más información sobre las diferencias entre los planes de oferta Cloud Pak for Data as a Service, consulte los planes de oferta dewatsonx.ai Studio.

Diferencias en watsonx.ai Studio
Característica Como servicio Software
Crear proyecto Crear:
• Un proyecto vacío
• Un proyecto de un ejemplo en el concentrador de recursos
• Un proyecto de archivo
Crear:
• Un proyecto vacío
• Un proyecto del archivo
• Un proyecto con integración de Git
Integración de Git • Publicar cuadernos en GitHub
• Publicar cuadernos como gist
• Integrar un proyecto con Git
• sincronizar activos con el repositorio en un proyecto y utilizar esos activos en otro proyecto
Terminal de proyecto para operaciones avanzadas de Git No disponible Disponible en proyectos con la integración de Git predeterminada
Organizar activos en proyectos con carpetas No disponible Disponible a partir de 4.8.0
JupyterLab No disponible Disponible en proyectos con integración de Git
Integración de Visual Studio Code No disponible Disponible en proyectos con integración de Git
RStudio No se puede integrar con Git Puede integrarse con Git. Requiere un servicio RStudio Server Runtimes .
Scripts Python No disponible Trabajar con scripts de Python en JupyterLab. Requiere un servicio Watson Studio Runtimes.
Generar código para cargar datos en un cuaderno utilizando el Flight service No disponible Disponible
Gestionar el ciclo de vida del cuaderno No disponible Utilizar CPDCTL para la gestión del ciclo de vida del cuaderno
Activos de paquete de código (conjunto de archivos dependientes en una estructura de carpetas) No disponible Utilice CPDCTL para crear activos de paquete de código en un espacio de despliegue
Promover cuadernos a espacios No disponible Disponible manualmente desde la página Activos del proyecto o mediante programación utilizando CPDCTL
Python con GPU Soporte disponible sólo para un único tipo de GPU Soporte disponible para varios tipos de GPU Nvidia. Requiere un servicio Watson Studio Runtimes.
Crear y utilizar imágenes personalizadas No disponible Cree imágenes personalizadas para entornos Python (con y sin GPU), R, JupyterLab (con y sin GPU), RStudio y SPSS. Requiere Watson Studio Runtimes y otros servicios aplicables.
Repositorio Anaconda No disponible Se utiliza para crear entornos personalizados e imágenes personalizadas
Integración de Hadoop No disponible Crear y entrenar modelos y ejecutar flujos de Data Refinery en un clúster de Hadoop. Requiere el servicio de ejecución del motor para Apache Hadoop.
Decision Optimization Disponible Requiere el servicio Decision Optimization.
SPSS Modeler Disponible Requiere el servicio SPSS Modeler.
Interconexiones de orquestación Disponible Requiere el servicio de conductos de orquestación.

tiempo de ejecución de watsonx.ai comparado con Watson Machine Learning

Las siguientes características de watsonx.ai Runtime en Cloud Pak for Data as a Service son efectivamente las mismas que las características de Watson Machine Learning en el software Cloud Pak for Data, versiones 5.1, 5.0, y 4.8:

  • Colaboración en proyectos y espacios de despliegue
  • Desplegar modelos
  • Desplegar funciones
  • aPI REST de tiempo de ejecución de watsonx.ai y API REST de Watson Machine Learning
  • watsonx.ai Cliente Python
  • Crear despliegues en línea
  • Escalar y actualizar despliegues
  • Definir y utilizar componentes personalizados
  • Utilizar el aprendizaje federado para entrenar un modelo común con orígenes de datos independientes y seguros
  • Supervisar despliegues en distintos espacios
  • Formularios actualizados para probar el despliegue en línea
  • Utilizar interconexiones anidadas
  • Imputación de datos de AutoAI
  • Evaluación de equidad de AutoAI
  • Características de soporte de la serie temporal AutoAI

Esta tabla describe las diferencias de características entre el servicio watsonx.ai Runtime en el entorno de implementación as-a-service y el servicio Watson Machine Learning en el entorno de implementación de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales. Para obtener más información sobre las diferencias de funcionalidad entre los planes de oferta Cloud Pak for Data as a Service, consulte los planes de oferta dewatsonx.ai Runtime.

Diferencias de características entre las implantaciones de watsonx.ai Runtime
Característica Como servicio Software
Entrada de entrenamiento de AutoAI orígenes de datos soportados actuales Orígenes de datos soportados : cambio por release
Configuración de cálculo del experimento AutoAI Diferentes tamaños disponibles Diferentes tamaños disponibles
AutoAI limita el tamaño de los datos
y el número de destinos de predicción
Establecer límites Los límites difieren según la configuración de cálculo
Aprendizaje incremental de AutoAI No disponible Disponible
Despliegue utilizando infraestructuras populares
y especificaciones de software
Comprobar las últimas versiones soportadas Las versiones soportadas difieren por release
Conectar a bases de datos para despliegues por lotes Comprobación de soporte por tipo de despliegue Comprobar el soporte por tipo de despliegue
y por versión
Desplegar y puntuar scripts Python Disponible a través del cliente Python Cree scripts en el cliente JupyterLab o Python y, a continuación, despliegue
Desplegar y puntuar por lotes scripts R No disponible Disponible
Desplegar aplicaciones Shiny No disponible Crear y desplegar apps Shiny
Deploy desde el paquete de código
Evaluar la equidad o la desviación de los trabajos Requiere el servicio watsonx.governance Requiere el servicio Watson OpenScale o watsonx.governance
Evaluar la equidad, la desviación o la explicabilidad de los despliegues en línea en un espacio
No disponible Disponible
Requiere el servicio Watson OpenScale o watsonx.governance
Evaluar plantillas de solicitud desplegadas en un espacio Disponible
Evaluar plantillas de solicitud desconectadas en un espacio No disponible Disponible a partir de 5.0
Creación del espacio de control Sin restricciones por rol Utilizar permisos para controlar quién puede ver y crear espacios
Importar del proyecto GIT al espacio No disponible Disponible
Paquete de código creado automáticamente al importar
desde el proyecto Git al espacio
No disponible Disponible
Actualizar aplicación RShiny desde el paquete de código No disponible Disponible
Crear y utilizar imágenes personalizadas No disponible Crear imágenes personalizadas para Python o SPSS
Notificar a los colaboradores sobre sucesos de interconexión No disponible Utilizar Enviar correo para notificar a los colaboradores
Experimento de aprendizaje profundo No disponible Requiere el servicio IBM Scheduler
Suministrar y gestionar instancias de servicio de IBM Cloud Añadir instancias para watsonx.ai Runtime
o Watson OpenScale
El administrador suministra los servicios en el clúster

watsonx.governance

Las siguientes funciones de gobernanza son efectivamente las mismas en el software Cloud Pak for Data as a Service y Cloud Pak for Data, versiones 5.1, 5.0 y 4.8:

  • Evaluar los despliegues para la equidad
  • Evaluar la calidad de los despliegues
  • Supervisar despliegues para la desviación
  • Ver y comparar resultados de modelo en un panel de control de Insights
  • Añadir despliegues desde el proveedor de aprendizaje automático de su elección
  • Establecer alertas para desencadenar cuando las evaluaciones caigan por debajo de un umbral especificado
  • Evaluar despliegues en una interfaz de usuario o cuaderno
  • Evaluaciones y métricas personalizadas
  • Ver detalles sobre evaluaciones en hojas de datos de modelo

Esta tabla describe las diferencias de características entre el servicio watsonx.governance en los entornos as-a-service y de despliegue de software, las diferencias entre los planes de oferta y si se requieren servicios adicionales.

Diferencias de características entrewatsonx.governance implementaciones
Característica Como servicio Software
Evaluar modelos de aprendizaje automático
Cargar datos de prueba puntuados previamente No disponible Disponible
IBM SPSS Collaboration and Deployment Services No disponible Disponible
Proceso por lotes No disponible Disponible
Dar soporte al control de accesos por grupos de usuarios No disponible Disponible
Base de datos gratuita y planes Postgres Disponible Postgres disponible a partir de 4.8

IBM Knowledge Catalog

Las siguientes funciones son efectivamente las mismas para IBM Knowledge Catalog on Cloud Pak for Data as a Service y en Cloud Pak for Data software, versiones 5.1, 5.0 y 4.8:

  • Colaboración en proyectos y catálogos
  • Búsqueda basada en IA y recomendaciones en catálogos
  • Calificación y revisión de activos en catálogos
  • Herramienta de Data Refinery en proyectos
  • Categorías con roles de colaborador
  • Clasificaciones predefinidas y personalizadas
  • Clases de datos predefinidas y personalizadas
  • Reglas de gobernabilidad
  • Políticas
  • Reglas de protección de datos
  • Reglas de SLA de calidad de datos
  • Perfilado manual de activos de datos relacionales individuales en un proyecto o un catálogo
  • Perfilado automático de activos de datos relacionales añadidos a un catálogo gobernado
  • Herramienta de enriquecimiento de metadatos en proyectos de elaboración de perfiles, asignación de términos, análisis de calidad y análisis de claves o relaciones en grandes conjuntos de activos de datos
  • Tipos de activos personalizados, propiedades personalizadas para activos y relaciones personalizadas entre activos en catálogos
  • Supervisar tareas de flujo de trabajo
  • Entregar conjuntos de datos enmascarados en proyectos con flujos de enmascaramiento
  • Información detallada sobre la calidad de los activos de datos en proyectos y catálogos, y como parte de los resultados del enriquecimiento de metadatos
  • Flujos de trabajo de remediación para problemas de calidad de datos
  • Crear activos de datos conectados y activos de datos segmentados con consultas SQL
  • Panel de métricas y ventanas de ejecución de las tareas de enriquecimiento de metadatos

Esta tabla describe las diferencias en las características entre el servicio IBM Knowledge Catalog en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si son necesarios servicios adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data as a Service, consulte Planes de oferta deIBM Knowledge Catalog.

A partir de la versión Cloud Pak for Data 5.0, puede instalar el cartucho IBM Knowledge Catalog Premium o el cartucho IBM Knowledge Catalog Standard en lugar del servicio IBM Knowledge Catalog. IBM Knowledge Catalog Premium proporciona las mismas funciones que el servicio IBM Knowledge Catalog más funciones de IA generativa. IBM Knowledge Catalog Standard proporciona un subconjunto de funciones IBM Knowledge Catalog más funciones de IA generativa.

Diferencias en IBM Knowledge Catalog
Característica Como servicio Software
Herramienta Metadata import en proyectos-descubrimiento Importar activos de datos a proyectos o catálogos. Soporte para un subconjunto de conexiones de proyecto y catálogo. Consulte Orígenes de datos soportados para la ordenación y la calidad de los datos. Importar diferentes tipos de activos:
• Importar activos de datos en proyectos o catálogos. La mayoría de las conexiones soportadas son las mismas en ambos entornos de despliegue.
• Importar informes de inteligencia empresarial, activos con sus scripts de transformación asociados, trabajos ETL o modelos de datos en catálogos. Requiere la instalación de MANTA Automated Data Lineage sin una clave de licencia. Soporte para un subconjunto de conexiones de catálogo. '
'
Ver ' Fuentes de datos compatibles para la curación y la calidad de los datos.
Herramienta Metadata import en proyectos-linaje Disponible.
El linaje de datos debe estar activado.
Límites por plan.
- Importe el linaje de los activos de datos a los catálogos. Requiere la instalación de IBM Manta Data Lineage o MANTA Automated Data Lineage con una clave de licencia.
- Capture y acceda al linaje de trabajos ETL en MANTA Automated Data Lineage. Requiere la instalación de MANTA Automated Data Lineage con una clave de licencia.

Compatibilidad con un subconjunto de conexiones de catálogo. Consulte Fuentes de datos compatibles para la curación y la calidad de los datos.
Enriquecimiento mejorado mediante IA generativa Disponible. No disponible.
A partir de 5.0, instale IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard en su lugar.
Reglas de calidad de datos en proyectos Disponible
Requiere el servicio DataStage .
Disponible.
Requiere el servicio DataStage .
Añadir varios activos a un catálogo con un archivo No disponibles. Disponible.
Actividades de activos Requiere un plan de pago.
Disponible en proyectos y catálogos.
Disponible en proyectos y catálogos.
Linaje empresarial No disponible Disponible.
Linaje de datos técnicos No disponibles. Disponible.
Requiere que esté instalada una versión con licencia de MANTA Automated Data Lineage for IBM Cloud Pak for Data. Se genera ejecutando la herramienta de importación de metadatos. Se puede acceder desde catálogos.
Linaje de datos Requiere habilitación. No disponibles.
Términos empresariales Límites para algunos planes. Disponible.
Términos comerciales predefinidos Los términos empresariales predefinidos y la categoría Datos personales de muestra de Knowledge Accelerator que los incluye solo están disponibles si crea una instancia de servicio IBM Knowledge Catalog con un plan Lite o Standard después del 7 de octubre de 2022. No disponibles.
Conjuntos de datos de referencia Límites por plan. Disponible.
Relaciones personalizadas para artefactos Requiere un plan de pago. Disponible.
Knowledge Accelerators Requiere un plan Enterprise
desde Resource hub.
Se suministra con la plataforma.
Configuraciones de flujo de trabajo personalizadas para artefactos de gobierno y solicitudes Disponible para artefactos de gobernanza. Disponible.
Roles de categoría personalizados Límites por plan. Disponible.
Normas de protección de datos de exportación e importación Para exportar reglas de protección de datos desde cualquier sistema e importarlas al mismo sistema o a otro diferente, puede utilizar las API. Para obtener más información, consulte Migración de reglas de protección de datos. Para exportar reglas de protección de datos desde cualquier sistema e importarlas al mismo sistema o a otro diferente, puede utilizar las API o los comandos cpd-cli. Para obtener más información, consulte Migración de reglas de protección de datos.
Informes administrativos Requiere un plan de pago. Disponible.
Migrar datos desde InfoSphere Information Server No disponibles. Disponible.
Explorador de relaciones No disponibles. Disponible a partir de 5.0.
Requiere instalar el componente opcional knowledge graph con IBM Knowledge Catalog.

DataStage

En la tabla siguiente se describen las diferencias de características entre DataStage on Cloud Pak for Data as a Service y DataStage en el software Cloud Pak for Data, las versiones 5.1, 5.0 y 4.8.

Diferencias en DataStage
Característica Como servicio Software
Gestión de instancias de PX Puede suministrar instancias de un conjunto de tamaños predefinidos. Puede suministrar instancias de forma más flexible mediante la administración de instancias de Cloud Pak for Data.
Compilación de trabajos
  • OSH se genera durante la compilación.
  • El transformador se compila durante el tiempo de ejecución.
  • OSH se genera durante la compilación.
  • El transformador se compila durante el tiempo de compilación y se pone a disposición del montaje de /ds-storage.
  • La compilación se realiza de forma síncrona.
Tiempo de ejecución del trabajo Puede enviar tantos trabajos como desee, sujetos a la colocación en cola.
  • Se da soporte a ejecuciones de trabajos simultáneas.
  • La simultaneidad se determina por la capacidad de instancia y los valores del archivo /px-storage/config/wlm.config.xml.
Gestión de activos Para los archivos de tipo .xls, .xlsx, .xml y .json, sólo se da soporte a estructuras simples. Los esquemas de varios niveles/anidados no se pueden analizar. Está disponible el soporte completo de archivos de tipo .csv, .txt, .xls, .xlsx, .xml y .json.
Almacenamiento
  • El almacenamiento real basado en archivos POSIX no está disponible.
  • El almacenamiento se emula mediante el uso de un grupo de proyectos de Cloud Object Storage.
Etapa Integración de Java Disponible conDataStage-aaS En cualquier lugar Disponible
Componente de biblioteca Java Disponible conDataStage-aaS En cualquier lugar Disponible
Conexión JDBC genérica Disponible conDataStage-aaS En cualquier lugar Disponible
Excel Disponible conDataStage-aaS En cualquier lugar Disponible
AVI Disponible conDataStage-aaS En cualquier lugar Disponible
Etapa External Source Disponible conDataStage-aaS En cualquier lugar Disponible
Etapa External Target Disponible conDataStage-aaS En cualquier lugar Disponible
Etapa jerárquica
  • La opción de archivo individual o de conjunto de archivos para el analizador XML y el analizador JSON Parser no está disponible.
  • El archivo único, el conjunto de archivos y la opción Objeto grande para XML Composer y JSON Composer no están disponibles.
Disponible
SMP S, M, L son un solo nodo, la configuración SMP. Utilice un motor de tiempo de ejecución remoto para configurar una configuración alternativa. Las cargas de trabajo paralelas se gestionan a través de particiones lógicas, que se configuran con la opción APT_CONFIG_FILE.
Conexión de SAP Bulk Extract No disponible Disponible
Conexión de SAP Delta Extract No disponible Disponible
Etapa de envoltura Disponible conDataStage-aaS En cualquier lugar Disponible
Conexión de SAP HANA No disponible Disponible
Origen de datos de texto en la conexión ODBC No disponible Disponible
Crear etapa Disponible conDataStage-aaS En cualquier lugar Disponible
Enviar informes utilizando subrutinas antes/después de trabajo Disponible conDataStage-aaS En cualquier lugar Disponible
Etapa personalizada Disponible conDataStage-aaS En cualquier lugar Disponible
Conexión Apache HBase Disponible conDataStage-aaS En cualquier lugar Disponible
Autenticación Kerberos para conexiones Apache Hive No disponible Disponible
Funciones definidas por el usuario (UDF) Disponible conDataStage-aaS En cualquier lugar Disponible
Archivos APT_CONFIG_FILE creados por el usuario Disponible conDataStage-aaS En cualquier lugar Disponible
Propiedades antes/después del trabajo Disponible conDataStage-aaS En cualquier lugar Disponible
Conector de servicio de datos No disponible Disponible
Secuencia de base de datos Db2 en la etapa Lentamente Changing Dimension, la etapa Suplgate Key Generator y la etapa Transformer Disponible conDataStage-aaS En cualquier lugar Disponible
Utilice la conexión Apache Hive como destino. (Disponible cuando se selecciona Utilizar propiedades de DataStage en el conector.) Disponible conDataStage-aaS En cualquier lugar Disponible
Parametrizar propiedades con conexiones locales No disponible Disponible
Etapa Operational Decision Manager Disponible conDataStage-aaS En cualquier lugar Disponible
Espacios de despliegue No disponible Disponible

Data Virtualization

En Cloud Pak for Data as a Service, la funcionalidad de virtualización de datos la proporciona el servicio Data Virtualization. La siguiente funcionalidad de virtualización de datos es efectivamente la misma en el software Cloud Pak for Data as a Service y Cloud Pak for Data, versiones 5.1, 5.0 y 4.8.

  • Conexión a orígenes de datos soportados
  • Virtualización de datos
  • Gobierno de datos virtuales utilizando políticas y reglas de protección de datos
  • Supervisión y exploración del servicio
  • Utilización de la interfaz SQL
  • Almacenamiento en memoria caché
  • Enmascaramiento de columna
  • Explorar vista y recarga de tablas
  • Muestreo de datos en recopilación de estadísticas
  • Enriquecimiento de metadatos

La siguiente funcionalidad de virtualización de datos parece ser diferente en la interfaz de usuario, pero proporciona la misma funcionalidad básica:

Esta tabla describe las diferencias de características entre el software " Data Virtualization " (antes " Watson Query) en " Cloud Pak for Data as a Service " y " Data Virtualization (antes " Watson Query) en " Cloud Pak for Data ".

Diferencias en la Data Virtualization
Característica Como servicio Software
Utilice las definiciones de origen de datos (DSD) de Cloud Pak for Data para aplicar las reglas de protección de datos de IBM Knowledge Catalog No aplicable para SaaS Disponible a partir de 5.0
Consultar datos en orígenes de datos de la API REST No aplicable para SaaS Disponible a partir de 5.0
Tablas de consulta de catálogos anteriores de Presto y Databricks con soporte de varios catálogos No aplicable para SaaS Disponible a partir de 5.0
Escalar automáticamente las instancias de servicio No aplicable para SaaS Disponible a partir de 5.0
Enmascarar caracteres de varios bytes para mejorar la privacidad de los datos confidenciales No aplicable para SaaS Disponible a partir de 5.0
Ver las reglas de protección de datos que se aplican a un usuario No aplicable para SaaS Disponible a partir de 5.0
Seguridad mejorada para los resultados de creación de perfiles en vistas de Data Virtualization No aplicable para SaaS Disponible a partir de 5.0
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma No aplicable para SaaS Disponible a partir de 5.0
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma No aplicable para SaaS Disponible a partir de 5.0
Seguridad mejorada para el rol Admin: el rol Admin no tiene acceso predeterminado a todos los datos. No aplicable para SaaS Disponible a partir de 4.8
Las reglas de protección de datos de IBM Knowledge Catalog siempre están habilitadas para los datos de Watson Query No aplicable para SaaS Disponible a partir de 4.8
Proteja los objetos no gobernados: con las reglas de protección de datos de IBM Knowledge Catalog en Watson Query, los objetos virtualizados que no se publican en un catálogo gobernado siguen el valor de convención de acceso a datos predeterminado de los valores de regla. No aplicable para SaaS Disponible a partir de 4.8
Consultar datos de Presto : puede crear una conexión con Presto para acceder y consultar datos en Presto. No aplicable para SaaS Disponible a partir de 4.8
Registro de auditoría para supervisar la actividad del usuario y el acceso a datos Disponible Disponible
Integración con IBM Knowledge Catalog Necesario Opcional
Autorización basada en grupo y acceso a nivel de objeto para grupos No disponible Disponible
Soporte para conectores remotos No aplicable para SaaS Disponible
Soporte para orígenes de datos basados en el sistema de archivos, excepto en Cloud Object Storage No aplicable para SaaS Disponible
Conexión a orígenes de datos que requieren un controlador JDBC cargado, por ejemplo, SAP HANA, Genérico JDBC No aplicable para SaaS Disponible
Recopilación de estadísticas en la interfaz de usuario No disponible Disponible
Recopilación automática de estadísticas durante la virtualización de objetos No disponible Disponible
Gestión de accesos para varios grupos No disponible Disponible
Soporte para archivos CSV o TSV en Cloud Object Storage No aplicable para SaaS Disponible
Credenciales en cajas fuertes para conexiones en Cloud Object Storage No aplicable para SaaS Disponible
Almacenamiento automático de consultas No disponible Disponible a partir de 5.0.3

Más información

Tema principal: Cloud Pak for Data como servicio

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información