Traducción no actualizada
Diferencias de características entre despliegues de Cloud Pak for Data
El software Cloud Pak for Data as a Service y Cloud Pak for Data tienen algunas diferencias en características e implementación. Cloud Pak for Data as a Service es un conjunto de servicios de IBM Cloud. Cloud Pak for Data 5.0 se ofrece como software que debe instalar y mantener. Los servicios disponibles en ambos despliegues también tienen diferencias en las características de Cloud Pak for Data as a Service en comparación con Cloud Pak for Data 5.0, 4.8y 4.7.
- Diferencias de plataforma
- Características comunes a través de servicios
- Watson Studio
- Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Watson OpenScale
- Watson Query
Diferencias de plataforma
El software Cloud Pak for Data as a Service y Cloud Pak for Data comparten una base de código común, sin embargo, difieren de las siguientes formas clave:
Funciones | Como servicio | Software |
---|---|---|
Software, hardware e instalación | Cloud Pak for Data as a Service está totalmente gestionado por IBM en IBM Cloud. Las actualizaciones de software son automáticas. El escalado de recursos de cálculo y almacenamiento es automático. Te registras enhttps://dataplatform.cloud.ibm.com . | Proporciona y mantiene el hardware. Instale, mantenga y actualice el software. Ver Requisitos de Software . |
Almacenamiento | Puede suministrar una instancia de servicio de IBM Cloud Object Storage para proporcionar almacenamiento. Consulte IBM Cloud Object Storage. | El almacenamiento persistente se proporciona en un clúster de Red Hat OpenShift . Ver Requisitos de almacenamiento . |
Calcular recursos para ejecutar cargas de trabajo | Los usuarios eligen el tiempo de ejecución adecuado para sus trabajos. El uso de cálculo se factura en función de la tarifa para el entorno de ejecución y la duración del trabajo. Consulte Supervisar el uso de los recursos de la cuenta. | Puede configurar el número de nodos Red Hat OpenShift con el número adecuado de vCPUs. Ver Requisitos de hardware y Monitoreo de la plataforma . |
Coste | Compre cada servicio que necesite en el nivel de plan adecuado. Muchos servicios facturan por el consumo de recursos de cálculo. Vea cada página de servicio en elIBM Cloud catalogar o en el catálogo de servicios enCloud Pak for Data as a Service , seleccionando Servicios > Catálogo de servicios desde el menú de navegación. | Adquiere una licencia de software basada en los servicios que necesita. Por ejemplo, la licencia de Cloud Pak for Data Enterprise Edition incluye titularidad para servicios como Watson Studio o IBM Knowledge Catalog. VerCloud Pak for Data . |
Seguridad, cumplimiento y aislamiento | IBM Cloud gestiona la seguridad de los datos, la seguridad de la red, el cumplimiento de los estándares de seguridad y el aislamiento de Cloud Pak for Data como servicio. Puede configurar opciones de seguridad y cifrado adicionales. Consulte Seguridad de Cloud Pak for Data como servicio. | Red Hat OpenShift Container Platform proporciona características de seguridad básicas. Cloud Pak for Data se evalúa para diversas normativas de privacidad y conformidad y proporciona características que puede utilizar como preparación para diversas evaluaciones de privacidad y conformidad. Usted es responsable de las características de seguridad adicionales, el cifrado y el aislamiento de la red. Ver Consideraciones de Seguridad . |
Servicios disponibles | La mayoría de los servicios de tejido de datos están disponibles en ambos entornos de despliegue. Consulte Servicios para Cloud Pak for Data como servicio. |
Incluye muchos otros servicios. Consulte Servicios para Cloud Pak for Data 5.0. |
Gestión de usuarios | Puede añadir usuarios y grupos de usuarios y gestionar sus roles y permisos de cuenta con IBM Cloud Identity and Access Management. Consulte Añadir usuarios a la cuenta. También puede configurar la federación SAML en IBM Cloud. Consulte la documentación de IBM Cloud : Cómo funciona IBM Cloud IAM. |
Puede añadir usuarios y crear grupos de usuarios desde el menú Administración. Puede utilizar Identity and Access Management Service o utilizar el SSO de SAML o el proveedor de LDAP existente para la gestión de identidades y contraseñas. Puede crear grupos de usuarios dinámicos basados en atributos. Ver Gestión de usuarios . |
Funcionalidad básica común entre servicios
La siguiente funcionalidad básica que se proporciona con la plataforma es realmente la misma para los servicios en Cloud Pak for Data as a Service, el software Cloud Pak for Data , las versiones 5.0, 4.8y 4.7:
- Búsqueda global de activos y artefactos en toda la plataforma
- El catálogo de activos de la plataforma para compartir conexiones en toda la plataforma
- Gestión de usuarios basada en roles dentro de los espacios de trabajo colaborativo en toda la plataforma
- Infraestructura común para activos y espacios de trabajo
- Un catálogo de servicios para añadir servicios
- Ver el uso de cálculo desde el menú Administración
En la tabla siguiente se describen las diferencias en la funcionalidad principal entre los servicios entre Cloud Pak for Data as a Service y las versiones de software de Cloud Pak for Data 5.0, 4.8y 4.7.
Característica | Como servicio | Software |
---|---|---|
Gestionar todos los proyectos | Los usuarios con el permiso Gestionar proyectos del rol Gestor de acceso de servicio de IAM para el servicio IBM Cloud Pak for Data pueden unirse a cualquier proyecto con el rol Admin y, a continuación, gestionar o suprimir el proyecto. | Los usuarios con el permiso Gestionar proyectos pueden unirse a cualquier proyecto con el rol Admin y, a continuación, gestionar o suprimir el proyecto. |
Conexiones con orígenes de datos remotos | La mayoría de los orígenes de datos soportados son comunes a ambos entornos de despliegue. Consulte Conexiones soportadas. |
Ver Fuentes de datos admitidas . |
Credenciales de conexión personales o compartidas | Las conexiones en proyectos y catálogos pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de cuenta. | Las conexiones de plataforma pueden requerir credenciales personales o permitir credenciales compartidas. Las credenciales compartidas se pueden inhabilitar en el nivel de plataforma. |
Credenciales de conexión de secretos en una caja fuerte | No disponible | Disponible |
Autenticación Kerberos | No disponible | Disponible para algunos servicios y conexiones |
Activos y proyectos de ejemplo de la app Resource Hub | Disponible | No disponible |
Conector JDBC personalizado | No disponible | Disponible a partir de 4.8.0 |
Definiciones de origen de datos | No disponible | Disponible a partir de 5.0. Consulte Protección de datos con definiciones de origen de datos. |
Watson Studio
Las siguientes características de Watson Studio son realmente las mismas en el software Cloud Pak for Data as a Service y Cloud Pak for Data , versiones 5.0, 4.8y 4.7:
- Colaboración en proyectos y espacios de despliegue
- Acceso a activos de proyecto mediante programación
- Importar y exportar proyectos utilizando un archivo ZIP de proyecto
- Cuadernos Jupyter
- Planificación de trabajos
- Data Refinery
- Watson Natural Language Processing para Python
En esta tabla se describen las diferencias de características entre el servicio Watson Studio en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si se necesitan servicios adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Studio.
Característica | Como servicio | Software |
---|---|---|
Crear proyecto | Crear: • Un proyecto vacío • Un proyecto de un ejemplo en el concentrador de recursos • Un proyecto de archivo |
Crear: • Un proyecto vacío • Un proyecto del archivo • Un proyecto con integración de Git |
Integración de Git | • Publicar cuadernos en GitHub • Publicar cuadernos como gist |
• Integrar un proyecto con Git • sincronizar activos con el repositorio en un proyecto y utilizar esos activos en otro proyecto |
Terminal de proyecto para operaciones avanzadas de Git | No disponible | Disponible en proyectos con la integración de Git predeterminada |
Organizar activos en proyectos con carpetas | No disponible | Disponible a partir de 4.8.0 |
JupyterLab | No disponible | Disponible en proyectos con integración de Git |
Integración de Visual Studio Code | No disponible | Disponible en proyectos con integración de Git |
RStudio | No se puede integrar con Git | Puede integrarse con Git. Requiere un servicio RStudio Server Runtimes . |
Scripts Python | No disponible | Trabajar con scripts de Python en JupyterLab. Requiere un servicio Watson Studio Runtimes. |
Generar código para cargar datos en un cuaderno utilizando el Flight service | No disponible | Disponible |
Gestionar el ciclo de vida del cuaderno | No disponible | Utilizar CPDCTL para la gestión del ciclo de vida del cuaderno |
Activos de paquete de código (conjunto de archivos dependientes en una estructura de carpetas) | No disponible | Utilice CPDCTL para crear activos de paquete de código en un espacio de despliegue |
Promover cuadernos a espacios | No disponible | Disponible manualmente desde la página Activos del proyecto o mediante programación utilizando CPDCTL |
Python con GPU | Soporte disponible sólo para un único tipo de GPU | Soporte disponible para varios tipos de GPU Nvidia. Requiere un servicio Watson Studio Runtimes. |
Crear y utilizar imágenes personalizadas | No disponible | Cree imágenes personalizadas para entornos Python (con y sin GPU), R, JupyterLab (con y sin GPU), RStudio y SPSS . Requiere un Watson Studio Runtimes y otros servicios aplicables. |
Repositorio Anaconda | No disponible | Se utiliza para crear entornos personalizados e imágenes personalizadas |
Integración de Hadoop | No disponible | Crear y entrenar modelos y ejecutar flujos de Data Refinery en un clúster de Hadoop. Requiere el servicio de ejecución del motor para Apache Hadoop. |
Decision Optimization | Disponible | Requiere el servicio Decision Optimization. |
SPSS Modeler | Disponible | Requiere el servicio SPSS Modeler. |
Interconexiones de orquestación | Disponible | Requiere el servicio de conductos de orquestación. |
Watson Machine Learning
Las siguientes características de Watson Machine Learning son realmente las mismas en el software Cloud Pak for Data as a Service y Cloud Pak for Data , versiones 5.0, 4.8y 4.7:
- Colaboración en proyectos y espacios de despliegue
- Desplegar modelos
- Desplegar funciones
- API REST de Watson Machine Learning
- Cliente Python de Watson Machine Learning
- Crear despliegues en línea
- Escalar y actualizar despliegues
- Definir y utilizar componentes personalizados
- Utilizar el aprendizaje federado para entrenar un modelo común con orígenes de datos independientes y seguros
- Supervisar despliegues en distintos espacios
- Formularios actualizados para probar el despliegue en línea
- Utilizar interconexiones anidadas
- Imputación de datos de AutoAI
- Evaluación de equidad de AutoAI
- Características de soporte de la serie temporal AutoAI
Esta tabla describe las diferencias en las características entre el servicio Watson Machine Learning en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si se necesitan servicios adicionales. Para obtener detalles sobre las diferencias de funcionalidad entre los planes de oferta en Cloud Pak for Data como servicio, consulte los planes de oferta de Watson Machine Learning.
Característica | Como servicio | Software |
---|---|---|
Entrada de entrenamiento de AutoAI | orígenes de datos soportados actuales | Orígenes de datos soportados : cambio por release |
Configuración de cálculo del experimento AutoAI | Diferentes tamaños disponibles | Diferentes tamaños disponibles |
AutoAI limita el tamaño de los datos y el número de destinos de predicción |
Establecer límites | Los límites difieren según la configuración de cálculo |
Aprendizaje incremental de AutoAI | No disponible | Disponible |
Despliegue utilizando infraestructuras populares y especificaciones de software |
Comprobar las últimas versiones soportadas | Las versiones soportadas difieren por release |
Conectar a bases de datos para despliegues por lotes | Comprobación de soporte por tipo de despliegue | Comprobar el soporte por tipo de despliegue y por versión |
Desplegar y puntuar scripts Python | Disponible a través del cliente Python | Cree scripts en el cliente JupyterLab o Python y, a continuación, despliegue |
Desplegar y puntuar por lotes scripts R | No disponible | Disponible |
Desplegar aplicaciones Shiny | No disponible | Crear y desplegar apps Shiny Deploy desde el paquete de código |
Evaluar la equidad o la desviación de los trabajos | Requiere el servicio watsonx.governance | Requiere el servicio Watson OpenScale o watsonx.governance |
Evaluar la equidad, la desviación o la explicabilidad de los despliegues en línea en un espacio |
No disponible | Disponible a partir de 4.7 Requiere el servicio Watson OpenScale o watsonx.governance |
Evaluar plantillas de solicitud desplegadas en un espacio | Disponible | |
Evaluar plantillas de solicitud desconectadas en un espacio | No disponible | Disponible a partir de 5.0 |
Creación del espacio de control | Sin restricciones por rol | Utilizar permisos para controlar quién puede ver y crear espacios |
Importar del proyecto GIT al espacio | No disponible | Disponible |
Paquete de código creado automáticamente al importar desde el proyecto Git al espacio |
No disponible | Disponible |
Actualizar aplicación RShiny desde el paquete de código | No disponible | Disponible |
Seguimiento de los detalles del modelo en un inventario de modelos | Registrar modelos para ver hojas de datos con detalles de ciclo de vida. Requiere el servicio IBM Knowledge Catalog . | Disponible Requiere el servicio AI Factsheets o watsonx.governance . |
Crear y utilizar imágenes personalizadas | No disponible | Crear imágenes personalizadas para Python o SPSS |
Notificar a los colaboradores sobre sucesos de interconexión | No disponible | Utilizar Enviar correo para notificar a los colaboradores |
Experimento de aprendizaje profundo | No disponible | Requiere el servicio Watson Machine Learning Accelerator |
Suministrar y gestionar instancias de servicio de IBM Cloud | Añadir instancias para Watson Machine Learning o Watson OpenScale |
El administrador suministra los servicios en el clúster |
watsonx.governance
Característica | Como servicio | Software |
---|---|---|
Evaluar modelos de aprendizaje automático | Sí | Sí |
Evaluar plantillas de mensajes | Requierewatsonx solo dallas |
Sí |
Integrar con la consola de gobierno | Integración manual RequiereIBMOpenPages |
Sí |
Integrar conAWS (Hacedor de sabios) | Integración manual RequiereIBMOpenPagesYes |
|
Almacene casos de uso de IA enIBM Knowledge Catalog | Cloud Pak for Data as a Service solo | No disponible |
Almacene casos de uso de IA en el catálogo de acceso a la plataforma | watsonx | Sí |
IBM Knowledge Catalog
Las características siguientes son realmente las mismas para IBM Knowledge Catalog en Cloud Pak for Data as a Service y en el software Cloud Pak for Data , versiones 5.0, 4.8y 4.7:
- Colaboración en proyectos y catálogos
- Búsqueda basada en IA y recomendaciones en catálogos
- Calificación y revisión de activos en catálogos
- Herramienta de Data Refinery en proyectos
- Categorías con roles de colaborador
- Clasificaciones predefinidas y personalizadas
- Clases de datos predefinidas y personalizadas
- Reglas de gobernabilidad
- Políticas
- Reglas de protección de datos
- Perfilado manual de activos de datos relacionales individuales en un proyecto o un catálogo
- Perfilado automático de activos de datos relacionales añadidos a un catálogo gobernado
- Tipos de activos personalizados, propiedades personalizadas para activos y relaciones personalizadas entre activos en catálogos
- Supervisar tareas de flujo de trabajo
- Entregar conjuntos de datos enmascarados en proyectos con flujos de enmascaramiento
Esta tabla describe las diferencias en las características entre el servicio IBM Knowledge Catalog en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si son necesarios servicios adicionales. Para obtener más información sobre las diferencias de características entre los planes de oferta en Cloud Pak for Data as a Service, consulte Planes de oferta deIBM Knowledge Catalog.
A partir de Cloud Pak for Data versión 5.0, puede instalar el cartucho IBM Knowledge Catalog Premium o el cartucho IBM Knowledge Catalog Standard en lugar del servicio IBM Knowledge Catalog . IBM Knowledge Catalog Premium proporciona las mismas características que el servicio IBM Knowledge Catalog además de características de IA semánticas y generativas. IBM Knowledge Catalog Standard proporciona un subconjunto de características de IBM Knowledge Catalog más características de IA semánticas y generativas.
Característica | Como servicio | Software |
---|---|---|
Herramienta Metadata import en proyectos-descubrimiento | Importar activos de datos a proyectos o catálogos. Soporte para un subconjunto de conexiones de proyecto y catálogo. Consulte Orígenes de datos soportados para la ordenación y la calidad de los datos. | Importar diferentes tipos de activos: • Importar activos de datos en proyectos o catálogos. La mayoría de las conexiones soportadas son las mismas en ambos entornos de despliegue. • Importar informes de inteligencia empresarial, activos con sus scripts de transformación asociados, trabajos ETL o modelos de datos en catálogos. Requiere la instalación de MANTA Automated Data Lineage sin una clave de licencia. Soporte para un subconjunto de conexiones de catálogo. Ver Fuentes de datos compatibles para la curación y la calidad de los datos . |
Herramienta Metadata import en proyectos-linaje | No disponibles. | • Importar linaje de activos de datos en catálogos. • Capturar y acceder al linaje de trabajos ETL en MANTA Automated Data Lineage (a partir de 4.7) Requiere la instalación de MANTA Automated Data Lineage con una clave de licencia. Soporte para un subconjunto de conexiones de catálogo. Ver Fuentes de datos compatibles para la curación y la calidad de los datos . |
Herramientas de interfaz de usuario heredadas | No disponibles. En su lugar, utilice herramientas en proyectos. | No disponible a partir de 4.7. En su lugar, utilice herramientas en proyectos. |
Herramienta de enriquecimiento de metadatos en proyectos | Ejecute la creación de perfiles, la asignación de términos, el análisis de calidad y el análisis de claves o relaciones en grandes conjuntos de activos de datos. | Disponibles. |
Mejora del enriquecimiento mediante funcionalidades semánticas e IA generativa | Disponibles. | No disponible. A partir de 5.0, instale IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard en su lugar. |
Puntuaciones de calidad de datos | Las puntuaciones de calidad de datos se muestran en: • Información de calidad de datos para activos en proyectos y catálogos • Resultados de enriquecimiento de metadatos |
Las puntuaciones de calidad de datos se muestran en: • Información de calidad de datos para activos en proyectos y catálogos • Resultados de enriquecimiento de metadatos • Perfiles de activos en proyectos y catálogos. No disponible en 4.7 y posteriores. • Resultados de exploración rápida con la interfaz de usuario heredada. No disponible en 4.7 y posteriores. • Proyectos de calidad de datos con la interfaz de usuario heredada. No está disponible en 4.7 y posteriores. |
Información detallada sobre la calidad de los datos | Página Calidad de datos en proyectos y catálogos, y como parte de los resultados de enriquecimiento de metadatos | Disponible a partir de 4.7. |
Reglas de calidad de datos en proyectos | Disponible Requiere el servicio DataStage . |
Disponible. Requiere el servicio DataStage . |
Reglas de SLA de calidad de datos | No disponibles. | Supervise la calidad de los datos y notifique las infracciones. Los informes de conformidad SLA se muestran en la página Calidad de datos de un activo de datos en proyectos. Disponible a partir de 4.7.3. |
Flujos de trabajo de remediación para problemas de calidad de datos | No disponibles. | Disponible a partir de 4.7.3. |
Añadir varios activos a un catálogo con un archivo | No disponibles. | Disponible a partir de 4.7.3. |
Actividades de activos | Requiere un plan de pago. Disponible en proyectos y catálogos. |
Disponible en proyectos y catálogos. |
Linaje de datos | No disponible | Disponibles. |
Linaje de datos técnicos | No disponible | Disponible Requiere que se instale una versión con licencia de MANTA Automated Data Lineage for IBM Cloud Pak for Data . Se genera ejecutando la herramienta de importación de metadatos. Se puede acceder desde catálogos. |
Términos empresariales | Límites para algunos planes. | Disponibles. |
Términos empresariales predefinidos | Los términos de negocio predefinidos y la categoría Datos personales de ejemplo de Knowledge Accelerator que los incluye solo están disponibles si crea una instancia de servicio de IBM Knowledge Catalog con un plan Lite o Standard después del 7 de octubre de 2022. | No disponibles. |
Conjuntos de datos de referencia | Límites por plan. | Disponibles. |
Relaciones personalizadas para artefactos | Requiere un plan de pago. | Disponible |
Knowledge Accelerators | Requiere un plan de empresa. Descargar desde el concentrador de recursos. |
Se proporciona con la plataforma. |
Configuraciones de flujo de trabajo personalizadas para artefactos de gobierno y solicitudes | Disponible para artefactos de gobernabilidad. | Disponibles. |
Roles de categoría personalizados | Límites por plan. | Disponibles. |
Exportar e importar reglas de protección de datos | Para exportar reglas de protección de datos desde cualquier sistema e importar las reglas en el mismo sistema o en un sistema diferente, puede utilizar las API. Para obtener detalles, consulte Migración de reglas de protección de datos. | Para exportar reglas de protección de datos desde cualquier sistema e importar las reglas en el mismo sistema o en un sistema diferente, puede utilizar API o mandatos cpd-cli. Para obtener detalles, consulte Migración de reglas de protección de datos. |
Informes administrativos | Requiere un plan de pago. | Disponibles. |
Migrar datos desde InfoSphere Information Server | No disponibles. | Disponible a partir de 4.8. |
Explorador de relaciones | No disponibles. | Disponible a partir de 5.0. Requiere la instalación del componente de gráfico de conocimientos opcional con el cartucho Cloud Pak for Data o IBM Knowledge Catalog Premium . |
DataStage
En la tabla siguiente se describen las diferencias en las características entre el software DataStage en Cloud Pak for Data as a Service y DataStage en Cloud Pak for Data , las versiones 5.0, 4.8y 4.7.
Característica | Como servicio | Software |
---|---|---|
Gestión de instancias de PX | Puede suministrar instancias de un conjunto de tamaños predefinidos. | Puede suministrar instancias de forma más flexible mediante la administración de instancias de Cloud Pak for Data. |
Compilación de trabajos |
|
|
Tiempo de ejecución del trabajo | Puede enviar tantos trabajos como desee, sujetos a la colocación en cola. |
|
Gestión de activos | Para los archivos de tipo .xls, .xlsx, .xml y .json, sólo se da soporte a estructuras simples. Los esquemas de varios niveles/anidados no se pueden analizar. | Está disponible el soporte completo de archivos de tipo .csv, .txt, .xls, .xlsx, .xml y .json. |
Almacenamiento |
|
|
Etapa Integración de Java | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Componente de biblioteca Java | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión JDBC genérica | No disponible | Disponible |
Excel | No disponible | Disponible |
AVI | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Etapa External Source | No disponible | Disponible |
Etapa External Target | No disponible | Disponible |
Etapa jerárquica |
|
Disponible |
SMP | S, M, L son un solo nodo, la configuración SMP. Utilice un motor de tiempo de ejecución remoto para configurar una configuración alternativa. | Las cargas de trabajo paralelas se gestionan a través de particiones lógicas, que se configuran con la opción APT_CONFIG_FILE. |
Conexión de SAP Bulk Extract | No disponible | Disponible |
Conexión de SAP Delta Extract | No disponible | Disponible |
Etapa de envoltura | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión de SAP HANA | No disponible | Disponible |
Origen de datos de texto en la conexión ODBC | No disponible | Disponible |
Crear etapa | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Enviar informes utilizando subrutinas antes/después de trabajo | No disponible | Disponible |
Etapa personalizada | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conexión Apache HBase | No disponible | Disponible |
Autenticación Kerberos para conexiones Apache Hive | No disponible | Disponible |
Funciones definidas por el usuario (UDF) | No disponible | Disponible |
Propiedades antes/después del trabajo | Disponible conDataStage-aaS En cualquier lugar | Disponible |
Conector de servicio de datos | No disponible | Disponible |
Secuencia de base de datos Db2 en la etapa Lentamente Changing Dimension, la etapa Suplgate Key Generator y la etapa Transformer | No disponible | Disponible |
Utilice la conexión Apache Hive como destino. (Disponible cuando se selecciona Utilizar propiedades de DataStage en el conector.) | No disponible | Disponible |
Parametrizar propiedades con conexiones locales | No disponible | Disponible |
Etapa Operational Decision Manager | No disponible | Disponible |
Espacios de despliegue | No disponible | Disponible a partir de 4.7.0 |
watsonx.governance
Las siguientes características de watsonx.governance son realmente las mismas en el software Cloud Pak for Data as a Service y Cloud Pak for Data , versiones 5.0, 4.8y 4.7:
- Evaluar los despliegues para la equidad
- Evaluar la calidad de los despliegues
- Supervisar despliegues para la desviación
- Ver y comparar resultados de modelo en un panel de control de Insights
- Añadir despliegues desde el proveedor de aprendizaje automático de su elección
- Establecer alertas para desencadenar cuando las evaluaciones caigan por debajo de un umbral especificado
- Evaluar despliegues en una interfaz de usuario o cuaderno
- Evaluaciones y métricas personalizadas
- Ver detalles sobre evaluaciones en hojas de datos de modelo
Esta tabla describe las diferencias en las características entre el servicio Watson OpenScale en los entornos de despliegue de software y como servicio, las diferencias entre los planes de oferta y si se necesitan servicios adicionales.
Característica | Como servicio | Software |
---|---|---|
Cargar datos de prueba puntuados previamente | No disponible | Disponible |
IBM SPSS Collaboration and Deployment Services | No disponible | Disponible |
Proceso por lotes | No disponible | Disponible |
Dar soporte al control de accesos por grupos de usuarios | No disponible | Disponible |
Base de datos gratuita y planes Postgres | Disponible | Postgres disponible a partir de 4.8 |
Configurar varias instancias | No disponible | Disponible |
Integración con OpenPages | Disponible con integración manual | Disponible |
Evaluación de activos del modelo de base | No disponible | Disponible |
Watson Query
En Cloud Pak for Data como servicio, el servicio de consulta de Watson proporciona la funcionalidad de virtualización de datos. La siguiente funcionalidad de virtualización de datos es realmente la misma en Cloud Pak for Data as a Service y Cloud Pak for Data 5.0, 4.8y 4.7.
- Conexión a orígenes de datos soportados
- Virtualización de datos
- Gobierno de datos virtuales utilizando políticas y reglas de protección de datos
- Supervisión y exploración del servicio
- Utilización de la interfaz SQL
- Almacenamiento en memoria caché
- Enmascaramiento de columna
- Explorar vista y recarga de tablas
- Muestreo de datos en recopilación de estadísticas
- Enriquecimiento de metadatos
La siguiente funcionalidad de virtualización de datos parece ser diferente en la interfaz de usuario, pero proporciona la misma funcionalidad básica:
- Publicación de datos virtuales en catálogos
- Gestionar el acceso a los objetos virtuales
- Administración de usuarios y roles
- Escalado del servicio
- Recopilación de estadísticas en el cliente web en Watson Query
Esta tabla describe las diferencias en las características entre Watson Query en Cloud Pak for Data as a Service y Data Virtualization (anteriormente Watson Query) en el software Cloud Pak for Data .
Característica | Como servicio | Software |
---|---|---|
Nombre del servicio | Watson Query | En Cloud Pak for Data 5.0, el serivce se denomina ahora Data Virtualization. |
Utilice las definiciones de origen de datos (DSD) de Cloud Pak for Data para aplicar las reglas de protección de datos de IBM Knowledge Catalog | No aplicable para SaaS | Disponible a partir de 5.0 |
Consultar datos en orígenes de datos de la API REST | No aplicable para SaaS | Disponible a partir de 5.0 |
Tablas de consulta de catálogos anteriores de Presto y Databricks con soporte de varios catálogos | No aplicable para SaaS | Disponible a partir de 5.0 |
Escalar automáticamente las instancias de servicio | No aplicable para SaaS | Disponible a partir de 5.0 |
Enmascarar caracteres de varios bytes para mejorar la privacidad de los datos confidenciales | No aplicable para SaaS | Disponible a partir de 5.0 |
Ver las reglas de protección de datos que se aplican a un usuario | No aplicable para SaaS | Disponible a partir de 5.0 |
Seguridad mejorada para los resultados de creación de perfiles en vistas de Data Virtualization | No aplicable para SaaS | Disponible a partir de 5.0 |
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma | No aplicable para SaaS | Disponible a partir de 5.0 |
Las conexiones de Data Virtualization en catálogos ahora hacen referencia a la conexión de plataforma | No aplicable para SaaS | Disponible a partir de 5.0 |
Seguridad mejorada para el rol Admin: el rol Admin no tiene acceso predeterminado a todos los datos. | No aplicable para SaaS | Disponible a partir de 4.8 |
Las reglas de protección de datos de IBM Knowledge Catalog siempre están habilitadas para los datos de Watson Query | No aplicable para SaaS | Disponible a partir de 4.8 |
Proteja los objetos no gobernados: con las reglas de protección de datos de IBM Knowledge Catalog en Watson Query, los objetos virtualizados que no se publican en un catálogo gobernado siguen el valor de convención de acceso a datos predeterminado de los valores de regla. | No aplicable para SaaS | Disponible a partir de 4.8 |
Consultar datos de Presto : puede crear una conexión con Presto para acceder y consultar datos en Presto. | No aplicable para SaaS | Disponible a partir de 4.8 |
Registro de auditoría para supervisar la actividad del usuario y el acceso a datos | Disponible | Disponible a partir de 4.7 |
Integración con IBM Knowledge Catalog | Necesario | Opcional |
Autorización basada en grupo y acceso a nivel de objeto para grupos | No disponible | Disponible |
Soporte para conectores remotos | No aplicable para SaaS | Disponible |
Soporte para orígenes de datos basados en el sistema de archivos, excepto en Cloud Object Storage | No aplicable para SaaS | Disponible |
Conexión a orígenes de datos que requieren un controlador JDBC cargado, por ejemplo, SAP HANA, Genérico JDBC | No aplicable para SaaS | Disponible |
Recopilación de estadísticas en la interfaz de usuario | No disponible | Disponible |
Recopilación automática de estadísticas durante la virtualización de objetos | No disponible | Disponible |
Gestión de accesos para varios grupos | No disponible | Disponible |
Soporte para archivos CSV o TSV en Cloud Object Storage | No aplicable para SaaS | Disponible |
Credenciales en cajas fuertes para conexiones en Cloud Object Storage | No aplicable para SaaS | Disponible |
Más información
- Servicios para Cloud Pak for Data como servicio
- Servicios paraCloud Pak for Data5.0
- Opciones de entorno de implementación en la nube paraCloud Pak for Data5.0
Tema principal: Cloud Pak for Data como servicio