Différences entre les déploiements Cloud Pak for Data | IBM Cloud Pak for Data as a Service

Traduction non à jour

La traduction de cette page ne représente pas la dernière version. Pour les dernières mises à jour, consultez la version anglaise de la documentation.

Retourner à la version anglaise de la documentation

Différences entre les déploiements Cloud Pak for Data

Les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data présentent des différences au niveau des fonctions et de l'implémentation. Cloud Pak for Data as a Service est un ensemble de services IBM Cloud. Cloud Pak for Data 5.0 est proposé en tant que logiciel que vous devez installer et gérer. Les services disponibles sur les deux déploiements présentent également des différences dans les fonctions de Cloud Pak for Data as a Service par rapport à Cloud Pak for Data 5.0, 4.8et 4.7.

Différences de plateforme
Fonctions communes à l'ensemble des services
Watson Studio
Watson Machine Learning
watsonx.governance
IBM Knowledge Catalog
DataStage
Watson OpenScale
Watson Query

Différences de plateforme

Les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data partagent une base de code commune, mais ils diffèrent dans les principales manières suivantes:

Différences de plateforme
Fonctions	En tant que service	Logiciel
Logiciel, matériel et installation	Cloud Pak for Data as a Service est intégralement géré par IBM sur IBM Cloud. Les mises à jour logicielles sont automatiques. La mise à l'échelle des ressources de traitement et du stockage est automatique. Vous vous inscrivez surhttps://dataplatform.cloud.ibm.com .	Vous fournissez et maintenez le matériel. Vous installez, gérez et mettez à niveau le logiciel. Voir Logiciels requis .
Stockage	Vous fournissez une instance de service IBM Cloud Object Storage pour fournir un espace de stockage. Voir IBM Cloud Object Storage.	Vous fournissez un stockage persistant sur un cluster Red Hat OpenShift . Voir Exigences de stockage .
Calculer les ressources pour l'exécution des charges de travail	Les utilisateurs choisissent l'environnement d'exécution approprié pour leurs travaux. L'utilisation du calcul est facturée en fonction du taux de l'environnement d'exécution et de la durée du travail. Voir Surveillance de l'utilisation des ressources de compte.	Vous configurez le nombre de noeuds Red Hat OpenShift avec le nombre approprié d' vCPUs. Voir Exigences matérielles et Surveillance de la plateforme .
Coût	Vous achetez chaque service dont vous avez besoin au niveau du plan approprié. De nombreux services facturent la consommation de ressources informatiques. Voir chaque page de service dans leIBM Cloud catalogue ou dans le catalogue de services surCloud Pak for Data as a Service , en sélectionnant Services > Catalogue de services à partir du menu de navigation.	Vous achetez une licence logicielle basée sur les services dont vous avez besoin. Par exemple, la licence Cloud Pak for Data Enterprise Edition inclut l'autorisation d'utilisation de services tels que Watson Studio ou IBM Knowledge Catalog. VoirCloud Pak for Data .
Sécurité, conformité et isolement	La sécurité des données, la sécurité du réseau, la conformité aux normes de sécurité et l'isolement de Cloud Pak for Data en tant que service sont gérés par IBM Cloud. Vous pouvez configurer des options de sécurité et de chiffrement supplémentaires. Voir Sécurité de Cloud Pak for Data en tant que service.	Red Hat OpenShift Container Platform fournit des fonctions de sécurité de base. Cloud Pak for Data est évalué pour différents règlements de confidentialité et de conformité et fournit des fonctions que vous pouvez utiliser pour la préparation de diverses évaluations de la confidentialité et de la conformité. Vous êtes responsable des fonctions de sécurité supplémentaires, du chiffrement et de l'isolement du réseau. Voir Considérations de sécurité .
Services disponibles	La plupart des services de matrice de données sont disponibles dans les deux environnements de déploiement. Voir Services pour Cloud Pak for Data en tant que service.	Comprend de nombreux autres services. Voir Services for Cloud Pak for Data 5.0.
Gestion des utilisateurs	Vous pouvez ajouter des utilisateurs et des groupes d'utilisateurs et gérer leurs rôles et leurs droits d'accès avec IBM Cloud Identity and Access Management. Voir Ajouter des utilisateurs au compte. Vous pouvez aussi mettre en place la fédération SAML sur IBM Cloud. Voir la documentation IBM Cloud : How IBM Cloud IAM works.	Vous pouvez ajouter des utilisateurs et créer des groupes d'utilisateurs à partir du menu Administration. Vous pouvez utiliser le service de gestion des identités et des accès ou utiliser votre fournisseur de connexion unique ou LDAP SAML pour la gestion des identités et des mots de passe. Vous pouvez créer des groupes d'utilisateurs dynamiques basés sur des attributs. Voir Gestion des utilisateurs .

Fonctionnalités de base communes à tous les services

La fonctionnalité de base suivante qui est fournie avec la plateforme est effectivement la même pour les services sur Cloud Pak for Data as a Service, les logiciels Cloud Pak for Data , les versions 5.0, 4.8et 4.7:

Recherche d'actifs et d'artefacts dans l'ensemble de la plateforme
Catalogue d'actifs pour le partage de connexions dans l'ensemble de la plateforme
Gestion des utilisateurs à base de rôles dans les espaces de travail collaboratifs de la plateforme
Infrastructure commune pour les actifs et les espaces de travail
Un catalogue de services pour l'ajout de services
Affichage de l'utilisation du calcul à partir du menu Administration

Le tableau suivant décrit les différences de fonctionnalités de base entre les services Cloud Pak for Data as a Service et les logiciels Cloud Pak for Data versions 5.0, 4.8et 4.7.

Différences dans les fonctions communes entre les services
Fonction	En tant que service	Logiciel
Gérer tous les projets	Les utilisateurs disposant du droit Gérer les projets à partir du rôle Manager d'accès au service IAM pour le service IBM Cloud Pak for Data peuvent rejoindre n'importe quel projet avec le rôle Admin , puis gérer ou supprimer le projet.	Les utilisateurs disposant du droit Gérer les projets peuvent rejoindre n'importe quel projet avec le rôle Admin , puis gérer ou supprimer le projet.
Connexions aux sources de données éloignées	La plupart des sources de données prises en charge sont communes aux deux environnements de déploiement. Voir Connexions prises en charge.	Voir Sources de données prises en charge .
Données d'identification de connexion personnelles ou partagées	Les connexions dans les projets et les catalogues peuvent nécessiter des données d'identification personnelles ou des données d'identification partagées. Les données d'identification partagées peuvent être désactivées au niveau du compte.	Les connexions de plateforme peuvent nécessiter des données d'identification personnelles ou des données d'identification partagées. Les données d'identification partagées peuvent être désactivées au niveau de la plateforme.
Données d'identification de connexion à partir de secrets dans un coffre	Non disponible	Disponible
Authentification Kerberos	Non disponible	Disponible pour certains services et connexions
Exemples d'actifs et de projets à partir de l'application de concentrateur de ressources	Disponible	Non disponible
Connecteur JDBC personnalisé	Non disponible	Disponible à partir de 4.8.0
Définitions de source de données	Non disponible	Disponible à partir de la version 5.0. Voir Protection des données avec des définitions de source de données.

Watson Studio

Les fonctions Watson Studio suivantes sont identiques sur les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data , versions 5.0, 4.8et 4.7:

Collaboration dans les projets et les espaces de déploiement
Accès aux actifs de projet à l'aide d'un programme
Importation et exportation de projet à l'aide d'un fichier ZIP de projet
Blocs-notes Jupyter
Planification de travaux
Data Refinery
Watson Natural Language Processing for Python

Ce tableau décrit les différences de fonction entre le service Watson Studio dans les environnements de déploiement de logiciels et de services en tant que service, les différences entre les plans d'offre et la nécessité ou non de services supplémentaires. Pour plus d'informations sur les différences de fonction entre les plans d'offre sur Cloud Pak for Data en tant que service, voir Watson Studio propose des plans.

Différences dans Watson Studio
Fonction	En tant que service	Logiciel
Créer un projet	Créer: Un projet vide Un projet à partir d'un exemple dans le concentrateur de ressources Un projet à partir d'un fichier	Créer: Un projet vide Un projet à partir d'un fichier Un projet avec l'intégration Git
Intégration Git	Publier des blocs-notes sur GitHub Publier des blocs-notes en tant que gist	Intégrer un projet à des actifs de synchronisation Git dans un référentiel d'un projet et utiliser ces actifs dans un autre projet
Terminal de projet pour les opérations Git avancées	Non disponible	Disponible dans les projets avec l'intégration Git par défaut
Organiser les actifs dans des projets avec des dossiers	Non disponible	Disponible à partir de 4.8.0
JupyterLab	Non disponible	Disponible dans les projets avec l'intégration Git
Intégration de Visual Studio Code	Non disponible	Disponible dans les projets avec l'intégration Git
RStudio	Impossible d'intégrer à Git	Peut s'intégrer à Git. Requiert un service RStudio Server Runtimes .
Scripts Python	Non disponible	Gestion des scripts Python dans JupyterLab. Requiert un service d'exécution Watson Studio .
Génération de code pour charger des données dans un bloc-notes à l'aide du Flight service	Non disponible	Disponible
Gérer le cycle de vie des ordinateurs portables	Non disponible	Utiliser CPDCTL pour la gestion du cycle de vie du bloc-notes
Actifs de module de code (ensemble de fichiers dépendants dans une structure de dossiers)	Non disponible	Utiliser CPDCTL pour créer des actifs de module de code dans un espace de déploiement
Promouvoir les ordinateurs portables dans les espaces	Non disponible	Disponible manuellement à partir de la page Actifs du projet ou à l'aide d'un programme à l'aide de CPDCTL
Python avec GPU	Prise en charge disponible pour un seul type de processeur graphique	Support disponible pour plusieurs types de GPU Nvidia. Requiert un service d'exécution Watson Studio .
Création et utilisation d'images personnalisées	Non disponible	Créez des images personnalisées pour les environnements Python (avec et sans GPU), R, JupyterLab (avec et sans GPU), RStudio et SPSS . Requiert un environnement d'exécution Watson Studio et d'autres services applicables.
Référentiel Anaconda	Non disponible	Permet de créer des environnements personnalisés et des images personnalisées
Intégration Hadoop	Non disponible	Construire et former des modèles, et exécuter des flux de Data Refinery sur un cluster Hadoop. Requiert le service d'exécution pour le service Apache Hadoop.
Decision Optimization	Disponible	Requiert le service Decision Optimization.
SPSS Modeler	Disponible	Le service SPSS Modeler est requis.
Pipelines d'orchestration	Disponible	Requiert le service de pipelines d'orchestration.

Watson Machine Learning

Les fonctions Watson Machine Learning suivantes sont identiques sur les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data , versions 5.0, 4.8et 4.7:

Collaboration dans les projets et les espaces de déploiement
Déployer des modèles
Déploiement de fonctions
API REST de Watson Machine Learning
Client Watson Machine Learning Python
Créer des déploiements en ligne
Échelle et mise à jour des déploiements
Définir et utiliser des composants personnalisés
Utiliser l'apprentissage fédéré pour former un modèle commun avec des sources de données séparées et sécurisées
Surveillance des déploiements entre les espaces
Formulaires mis à jour pour tester le déploiement en ligne
Utiliser des pipelines imbriqués
Imputation de données AutoAI
Evaluation de l'équité AutoAI
Fonctions de prise en charge des séries temporelles dans AutoAI

Ce tableau décrit les différences entre les fonctions du service Watson Machine Learning dans les environnements de déploiement de logiciels et sous forme de service, les différences entre les plans d'offre et la nécessité ou non de services supplémentaires. Pour plus de détails sur les différences de fonctionnalité entre les plans d'offre sur Cloud Pak for Data en tant que service, voir Watson Machine Learning propose des plans.

Différences de fonctionnalité entre les déploiements de Watson Machine Learning
Fonction	En tant que service	Logiciel
Entrée d'entraînement AutoAI	sources de données actuellement prises en charge	Sources de données prises en charge par édition
Configuration de calcul d'expérimentation AutoAI	Différentes tailles disponibles	Différentes tailles disponibles
AutoAI limite la taille des données et le nombre de cibles de prévision	Définir des limites	Les limites diffèrent selon la configuration de calcul
Apprentissage incrémentiel AutoAI	Non disponible	Disponible
Déploiement à l'aide des infrastructures populaires et des spécifications logicielles	Recherchez la dernière version de Versions prises en charge	Versions prises en charge différent par édition
Se connecter aux bases de données pour les déploiements par lots	Recherchez Support par type de déploiement	Recherche de la prise en charge par Type de déploiement et par version
Déployer et évaluer les scripts Python	Disponible via le client Python	Créez des scripts dans le client JupyterLab ou Python , puis déployez
Déployer et évaluer par lots les scripts R	Non disponible	Disponible
Déploiement d'applications Shiny	Non disponible	Créer et déployer des applications Shiny Déployer à partir d'un package de code
Evaluer les travaux pour l'équité ou la dérive	Requiert le service watsonx.governance	Requiert le service Watson OpenScale ou watsonx.governance
Evaluer les déploiements en ligne dans un espace pour l'équité, la dérive ou l'explicabilité	Non disponible	Disponible à partir de 4.7 Requiert le service Watson OpenScale ou watsonx.governance
Evaluation des modèles d'invite déployés dans un espace		Disponible
Evaluation des modèles d'invite détachés dans un espace	Non disponible	Disponible à partir de 5.0
Création d'espace de contrôle	Aucune restriction par rôle	Utiliser les droits d'accès pour contrôler qui peut afficher et créer des espaces
Importer du projet GIT dans l'espace	Non disponible	Disponible
Package de code créé automatiquement lors de l'importation de à partir du projet Git dans l'espace	Non disponible	Disponible
Mettre à jour l'application RShiny à partir du package de code	Non disponible	Disponible
Suivi des détails du modèle dans un inventaire de modèles	Enregistrez des modèles pour afficher des feuilles de calcul avec des détails de cycle de vie. Requiert le service IBM Knowledge Catalog .	Disponible Requiert le service AI Factsheets ou watsonx.governance .
Création et utilisation d'images personnalisées	Non disponible	Création d'images personnalisées pour Python ou SPSS
Notifier les collaborateurs des événements de pipeline	Non disponible	Utiliser Envoyer un courrier pour avertir les collaborateurs
Expérimentations d'apprentissage en profondeur	Non disponible	Requiert le service Watson Machine Learning Accelerator
Fourniture et gestion d'instances de service IBM Cloud	Ajoutez des instances pour Watson Machine Learning ou Watson OpenScale	Les services sont mis à disposition sur le cluster par l'administrateur

watsonx.governance

Différences de fonctionnalités entrewatsonx.governance déploiements
Fonction	En tant que service	Logiciel
Évaluer les modèles d'apprentissage automatique	Oui	Oui
Évaluer les modèles d'invite	A besoinwatsonx Dallas seulement	Oui
Intégration à la console de gouvernance	Intégration manuelle A besoinIBMOpenPages	Oui
Intégrer avecAWS (Faiseur de sage)	Intégration manuelle A besoinIBMOpenPagesYes
Stocker les cas d'utilisation de l'IA dansIBM Knowledge Catalog	Cloud Pak for Data as a Service seulement	Non disponible
Stocker les cas d'utilisation de l'IA dans le catalogue d'accès à la plateforme	watsonx	Oui

IBM Knowledge Catalog

Les fonctions suivantes sont identiques pour IBM Knowledge Catalog sur Cloud Pak for Data as a Service et sur les logiciels Cloud Pak for Data , versions 5.0, 4.8et 4.7:

Collaboration dans des projets et des catalogues
Recherche et recommandations à l'aide d'IA dans les catalogues
Évaluation et révision des actifs dans les catalogues
Outil de raffinement des données dans les projets
Catégories avec rôles de collaborateur
Classifications prédéfinies et personnalisées
Classes de données prédéfinies et personnalisées
Règles de gouvernance
Stratégies
Règles de protection des données
Profilage manuel des actifs de données relationnelles individuels dans un projet ou un catalogue
Profilage automatique des actifs de données relationnelles ajoutés à un catalogue gouverné
Types d'actifs personnalisés, propriétés personnalisées pour les actifs et relations personnalisées entre les actifs dans les catalogues
Surveillance des tâches de flux de travaux
Distribution de fichiers masqués dans des projets avec des flux de masquage

Ce tableau décrit les différences entre les fonctions du service IBM Knowledge Catalog dans les environnements de déploiement sous forme de service et de logiciel, les différences entre les plans d'offre et la nécessité ou non de services supplémentaires. Pour plus d'informations sur les différences de fonction entre les plans d'offre sur Cloud Pak for Data as a Service, voir Plans d'offreIBM Knowledge Catalog.

A partir de Cloud Pak for Data version 5.0, vous pouvez installer la cartouche IBM Knowledge Catalog Premium ou la cartouche IBM Knowledge Catalog Standard à la place du service IBM Knowledge Catalog . IBM Knowledge Catalog Premium fournit les mêmes fonctions que le service IBM Knowledge Catalog , ainsi que des fonctions d'IA sémantique et générative. IBM Knowledge Catalog Standard fournit un sous-ensemble de fonctions IBM Knowledge Catalog ainsi que des fonctions d'IA sémantique et générative.

Différences dans IBM Knowledge Catalog
Fonction	En tant que service	Logiciel
Outil d' Metadata import dans les projets-reconnaissance	Importez des actifs de données dans des projets ou des catalogues. Prise en charge d'un sous-ensemble de connexions de projet et de catalogue. Voir Sources de données prises en charge pour la conservation et la qualité des données.	Importez différents types d'actifs: importez des actifs de données dans des projets ou des catalogues. La plupart des connexions prises en charge sont identiques dans les deux environnements de déploiement. Importez des rapports d'aide à la décision, des actifs avec leurs scripts de transformation associés, des travaux ETL ou des modèles de données dans des catalogues. Nécessite l'installation de MANTA Automated Data Lineage sans clé de licence. Prise en charge d'un sous-ensemble de connexions de catalogue. Voir Sources de données prises en charge pour la conservation et la qualité des données .
Outil d' Metadata import dans les projets-lignage	indisponible.	Importez le lignage des actifs de données dans les catalogues. Capture et accès au lignage des travaux ETL dans MANTA Automated Data Lineage (à partir de 4.7) Requiert l'installation de MANTA Automated Data Lineage avec une clé de licence. Prise en charge d'un sous-ensemble de connexions de catalogue. Voir Sources de données prises en charge pour la conservation et la qualité des données .
Outils d'interface utilisateur existants	indisponible. Utilisez les outils dans les projets à la place.	Non disponible à partir de la version 4.7. Utilisez les outils dans les projets à la place.
Outil d'enrichissement de métadonnées dans les projets	Exécutez le profilage, l'affectation de termes, l'analyse de la qualité et l'analyse des clés ou des relations sur de grands ensembles d'actifs de données.	Disponible.
Enrichissement amélioré à l'aide de capacités sémantiques et d'IA générative	Disponible.	Non disponible. A partir de 5.0, installez IBM Knowledge Catalog Premium ou IBM Knowledge Catalog Standard à la place.
Scores de qualité des données	Les scores de qualité des données sont affichés dans: Informations sur la qualité des données pour les actifs dans les projets et les catalogues Résultats de l'enrichissement des métadonnées	Les scores de qualité des données sont affichés dans: Informations sur la qualité des données pour les actifs dans les projets et les catalogues Résultats de l'enrichissement des métadonnées Profils d'actifs dans les projets et les catalogues. Non disponible dans 4.7 et versions ultérieures. Résultats d'analyse rapide avec l'interface utilisateur existante. Non disponible dans 4.7 et versions ultérieures. Projets de qualité de données avec l'interface utilisateur existante. Non disponible dans 4.7 et versions ultérieures.
Informations détaillées sur la qualité des données	Page Qualité des données dans les projets et les catalogues, et dans le cadre des résultats d'enrichissement des métadonnées	Disponible à partir de la version 4.7.
Règles de qualité des données dans les projets	Disponible Requiert le service DataStage .	Disponible. Requiert le service DataStage .
Règles SLA de qualité des données	indisponible.	Surveillez la qualité des données et signalez les violations. Les rapports de conformité SLA sont affichés sur la page Qualité de données d'un actif de données dans les projets. Disponible à partir de 4.7.3.
Flux de travaux de résolution pour les problèmes de qualité des données	indisponible.	Disponible à partir de 4.7.3.
Ajouter plusieurs actifs à un catalogue avec un fichier	indisponible.	Disponible à partir de 4.7.3.
Activités d'actif	Nécessite un plan payé. Disponible dans les projets et les catalogues.	Disponible dans les projets et les catalogues.
Lignage de données	Non disponible	Disponible.
Lignée de données techniques	Non disponible	Disponible Requiert l'installation d'une version sous licence de MANTA Automated Data Lineage for IBM Cloud Pak for Data . Généré en exécutant l'outil d'importation de métadonnées. Vous pouvez y accéder à partir de catalogues.
Termes métier	Limites pour certains régimes.	Disponible.
Termes métier prédéfinis	Les termes métier prédéfinis et la catégorie Knowledge Accelerator Sample Personal Data qui les inclut ne sont disponibles que si vous créez une instance de service IBM Knowledge Catalog avec un plan Lite ou Standard après le 7 octobre 2022.	indisponible.
Jeux de données de référence	Limites par plan.	Disponible.
Relations personnalisées pour les artefacts	Nécessite un plan payant.	Disponible
Knowledge Accelerators	Requiert un plan Enterprise. Téléchargement à partir du concentrateur de ressources.	Fourni avec la plateforme.
Configurations de flux de travaux personnalisées pour les artefacts de gouvernance et les demandes	Disponible pour les artefacts de gouvernance.	Disponible.
Rôles de catégorie personnalisée	Limites par plan.	Disponible.
Règles de protection des données à l'exportation et à l'importation	Pour exporter des règles de protection des données à partir de n'importe quel système et les importer dans le même système ou dans un système différent, vous pouvez utiliser des API. Pour plus de détails, voir Migration des règles de protection des données.	Pour exporter des règles de protection des données à partir de n'importe quel système et importer les règles dans le même système ou un système différent, vous pouvez utiliser des API ou des commandes cpd-cli. Pour plus de détails, voir Migration des règles de protection des données.
Rapports administratifs	Nécessite un plan payant.	Disponible.
Migration de données depuis InfoSphere Information Server	indisponible.	Disponible à partir de la version 4.8.
Explorateur de relations	indisponible.	Disponible à partir de la version 5.0. Nécessite l'installation du composant de graphique des connaissances facultatif avec Cloud Pak for Data ou IBM Knowledge Catalog Premium Cartridge.

DataStage

Le tableau suivant décrit les différences dans les fonctions entre les logiciels DataStage on Cloud Pak for Data as a Service et DataStage on Cloud Pak for Data , versions 5.0, 4.8et 4.7.

Différences dans DataStage
Fonction	En tant que service	Logiciel
Gestion des instances PX	Vous pouvez fournir des instances à partir d'un ensemble de tailles prédéfinies.	Vous pouvez fournir des instances de manière plus flexible à l'aide de l'administration d'instance Cloud Pak for Data.
Compilation des travaux	La SST est générée lors de la compilation. Transformer est compilé lors de l'exécution.	La SST est générée lors de la compilation. Transformer est compilé lors de la compilation et est mis à la disposition du montage `/ds-storage`. La compilation est effectuée de manière synchrone.
Environnement d'exécution	Vous pouvez soumettre autant de travaux que vous le souhaitez, en fonction de la mise en file d'attente.	Les exécutions de travail simultanées sont prises en charge. La devise est déterminée par la capacité de l'instance et les paramètres du fichier `/px-storage/config/wlm.config.xml`.
Gestion des actifs	Pour les fichiers de type .xls, .xlsx, .xml et .json, seules les structures simples sont prises en charge. Les schémas multi-niveaux/imbriqués ne peuvent pas être analysés.	La prise en charge complète des fichiers de type .csv, .txt, .xls, .xlsx, .xml et .json est disponible.
Stockage	Le stockage réel basé sur des fichiers de type POSIX n'est pas disponible. Le stockage est émulé par l'utilisation d'un compartiment de projet Cloud Object Storage.	Le stockage réel est disponible dans `/px-storage` et `/ds-storage`. Vous pouvez installer plus de mémoire dans la nacelle PX-runtime. Voir Mise en place d'unNFS monter dansDataStage .
Étape d'intégration Java	Disponible avecDataStage-aaS N'importe où	Disponible
Composant de bibliothèque Java	Disponible avecDataStage-aaS N'importe où	Disponible
Connexion JDBC générique	Non disponible	Disponible
Excel	Non disponible	Disponible
AVI	Disponible avecDataStage-aaS N'importe où	Disponible
Etape External Source	Non disponible	Disponible
Etape External Target	Non disponible	Disponible
Etape hiérarchique	L'option Fichier unique ou ensemble de fichiers pour l'analyseur syntaxique XML et l'analyseur syntaxique JSON n'est pas disponible. Le fichier unique, l'ensemble de fichiers et l'option Large Object pour XML Composer et JSON Composer ne sont pas disponibles.	Disponible
SMP	S, M, L sont un noeud unique, configuration SMP. Utilisez un moteur d'exécution distant pour définir une autre configuration.	Les charges de travail parallèles sont gérées via des partitions logiques, qui sont configurées avec l'option APT_CONFIG_FILE.
Connexion SAP Bulk Extract	Non disponible	Disponible
Connexion SAP Delta Extract	Non disponible	Disponible
Étape encapsulée	Disponible avecDataStage-aaS N'importe où	Disponible
Connexion SAP HANA	Non disponible	Disponible
Source de données texte dans la connexion ODBC	Non disponible	Disponible
Étape de génération	Disponible avecDataStage-aaS N'importe où	Disponible
Envoyer des rapports à l'aide de sous-routines avant / après travail	Non disponible	Disponible
Étape personnalisée	Disponible avecDataStage-aaS N'importe où	Disponible
Connexion Apache HBase	Non disponible	Disponible
Authentification Kerberos pour les connexions Apache Hive	Non disponible	Disponible
Fonctions définies par l'utilisateur (UDF)	Non disponible	Disponible
Propriétés avant / après le travail	Disponible avecDataStage-aaS N'importe où	Disponible
Connecteur de service de données	Non disponible	Disponible
Séquence de base de données Db2 dans l'étape Dimension à évolution lente, l'étape Générateur de clés de substitution et l'étape Transformer	Non disponible	Disponible
Utilisez la connexion Apache Hive comme cible. (Disponible lorsque Utiliser les propriétés DataStage est sélectionné dans le connecteur.)	Non disponible	Disponible
Paramétrer les propriétés avec des connexions locales	Non disponible	Disponible
Etape Operational Decision Manager	Non disponible	Disponible
Espaces de déploiement	Non disponible	Disponible à partir de 4.7.0

watsonx.governance

Les fonctions watsonx.governance suivantes sont identiques sur les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data , versions 5.0, 4.8et 4.7:

Évaluer les déploiements pour l'équité
Évaluer la qualité des déploiements
Contrôler les déploiements pour la dérive
Afficher et comparer les résultats du modèle dans un tableau de bord Insights
Ajouter des déploiements à partir du fournisseur d'apprentissage automatique de votre choix
Définir les alertes à déclencher lorsque les évaluations sont inférieures à un seuil spécifié
Evaluation des déploiements dans une interface utilisateur ou un bloc-notes
Évaluations et indicateurs personnalisés
Afficher les détails des évaluations dans les feuilles d'informations de modèle

Ce tableau décrit les différences entre les fonctions du service Watson OpenScale dans les environnements de déploiement de logiciels et de services en tant que service, les différences entre les plans d'offre et la nécessité ou non de services supplémentaires.

Différences IBM Watson OpenScale
Fonction	En tant que service	Logiciel
Télécharger les données de test pré-évaluées	Non disponible	Disponible
IBM SPSS Collaboration and Deployment Services	Non disponible	Disponible
Traitement par lots	Non disponible	Disponible
Prise en charge du contrôle d'accès par les groupes d'utilisateurs	Non disponible	Disponible
Base de données gratuite et plans Postgres	Disponible	Postgres disponible à partir de 4.8
Configuration de plusieurs instances	Non disponible	Disponible
Intégration à OpenPages	Disponible avec l'intégration manuelle	Disponible
Evaluation des actifs de modèle de base	Non disponible	Disponible

Watson Query

Sous Cloud Pak for Data en tant que service, la fonctionnalité de virtualisation des données est fournie par le service de requête Watson . La fonctionnalité de virtualisation des données suivante est identique sur Cloud Pak for Data as a Service et Cloud Pak for Data 5.0, 4.8et 4.7.

Connexion aux sources de données prises en charge
Virtualisation des données
Gouverner les données virtuelles à l'aide de règles et de règles de protection des données
Surveillance et exploration du service
Utilisation de l'interface SQL
Mise en cache
Masquage de colonne
Exploration de la vue et rechargement des tables
Echantillonnage de données dans la collecte de statistiques
Enrichissement des métadonnées

La fonctionnalité de virtualisation des données suivante apparaît différente dans l'interface utilisateur, mais fournit la même fonctionnalité de base :

Ce tableau décrit les différences dans les fonctions entre Watson Query sur Cloud Pak for Data as a Service et Data Virtualization (anciennement Watson Query) sur le logiciel Cloud Pak for Data .

Différences dans Watson Query
Fonction	En tant que service	Logiciel
Nom du service	Watson Query	Dans Cloud Pak for Data 5.0, le service est désormais appelé Data Virtualization.
Utilisez Cloud Pak for Data Data Source Definitions (DSD) pour appliquer les règles de protection des données IBM Knowledge Catalog	Non applicable pour SaaS	Disponible à partir de 5.0
Données de requête dans les sources de données de l'API REST	Non applicable pour SaaS	Disponible à partir de 5.0
Tables de requête des précédents catalogues Presto et Databricks avec la prise en charge de plusieurs catalogues	Non applicable pour SaaS	Disponible à partir de 5.0
Mise à l'échelle automatique des instances de service	Non applicable pour SaaS	Disponible à partir de 5.0
Masquage des caractères multi-octets pour une meilleure confidentialité des données sensibles	Non applicable pour SaaS	Disponible à partir de 5.0
Afficher les règles de protection des données appliquées à un utilisateur	Non applicable pour SaaS	Disponible à partir de 5.0
Amélioration de la sécurité pour les résultats de profilage dans les vues Data Virtualization	Non applicable pour SaaS	Disponible à partir de 5.0
Les connexions Data Virtualization dans les catalogues font désormais référence à la connexion de plateforme	Non applicable pour SaaS	Disponible à partir de 5.0
Les connexions Data Virtualization dans les catalogues font désormais référence à la connexion de plateforme	Non applicable pour SaaS	Disponible à partir de 5.0
Sécurité améliorée pour le rôle Admin: le rôle Admin ne dispose pas de l'accès par défaut à toutes les données.	Non applicable pour SaaS	Disponible à partir de la version 4.8
Les règles de protection des données IBM Knowledge Catalog sont toujours activées pour les données Watson Query	Non applicable pour SaaS	Disponible à partir de la version 4.8
Sécurisez vos objets non gouvernés: avec les règles de protection des données d' IBM Knowledge Catalog dans Watson Query, les objets virtualisés qui ne sont pas publiés dans un catalogue gouverné suivent le paramètre de convention d'accès aux données par défaut de vos paramètres de règle.	Non applicable pour SaaS	Disponible à partir de la version 4.8
Interrogation des données Presto : vous pouvez créer une connexion à Presto pour accéder aux données et les interroger dans Presto.	Non applicable pour SaaS	Disponible à partir de la version 4.8
Journalisation d'audit pour surveiller l'activité des utilisateurs et l'accès aux données	Disponible	Disponible à partir de 4.7
Intégration à IBM Knowledge Catalog	Requis	Facultatif
Autorisation basée sur un groupe et accès au niveau objet pour les groupes	Non disponible	Disponible
Prise en charge des connecteurs distants	Non applicable pour SaaS	Disponible
Prise en charge des sources de données basées sur le système de fichiers, sauf dans Cloud Object Storage	Non applicable pour SaaS	Disponible
Connexion à des sources de données nécessitant un pilote JDBC téléchargé, par exemple, SAP HANA, Generic JDBC	Non applicable pour SaaS	Disponible
Collecte de statistiques dans l'interface utilisateur	Non disponible	Disponible
Collecte automatique de statistiques lors de la virtualisation d'objet	Non disponible	Disponible
Gestion des accès pour plusieurs groupes	Non disponible	Disponible
Prise en charge des fichiers CSV ou TSV dans Cloud Object Storage	Non applicable pour SaaS	Disponible
Données d'identification dans les coffres pour les connexions dans Cloud Object Storage	Non applicable pour SaaS	Disponible

En savoir plus

Rubrique parent : Cloud Pak for Data en tant que service