Les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data présentent des différences au niveau des fonctions et de l'implémentation. Cloud Pak for Data as a Service est un ensemble de services IBM Cloud. Cloud Pak for Data 5.1 est proposé sous forme de logiciel que vous devez installer et maintenir sur IBM Software Hub. Les services disponibles sur les deux déploiements présentent également des différences de fonctionnalités sur Cloud Pak for Data as a Service par rapport à Cloud Pak for Data 5.1, 5.0 et 4.8
- Différences de plateforme
- Fonctions communes à l'ensemble des services
- watsonx.ai Studio comparé à Watson Studio
- le temps d'exécution dewatsonx.ai comparé à celui de Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Data Virtualization
Différences de plateforme
Les logiciels Cloud Pak for Data as a Service et Cloud Pak for Data partagent une base de code commune, mais ils diffèrent dans les principales manières suivantes:
Fonctions | En tant que service | Logiciel |
---|---|---|
Logiciel, matériel et installation | Cloud Pak for Data as a Service est intégralement géré par IBM sur IBM Cloud. Les mises à jour logicielles sont automatiques. La mise à l'échelle des ressources de traitement et du stockage est automatique. Vous vous inscrivez à Try Cloud Pak for Data as a Service. | Vous fournissez et maintenez le matériel. Vous installez, gérez et mettez à niveau le logiciel. Voir Exigences logicielles. |
Stockage | Vous fournissez une instance de service IBM Cloud Object Storage pour fournir un espace de stockage. Voir IBM Cloud Object Storage. | Vous fournissez un stockage persistant sur un cluster Red Hat OpenShift . Voir Exigences en matière de stockage. |
Calculer les ressources pour l'exécution des charges de travail | Les utilisateurs choisissent l'environnement d'exécution approprié pour leurs travaux. L'utilisation du calcul est facturée en fonction du taux de l'environnement d'exécution et de la durée du travail. Voir Surveillance de l'utilisation des ressources de compte. | Vous configurez le nombre de noeuds Red Hat OpenShift avec le nombre approprié d' vCPUs. Voir Configuration matérielle requise et Surveillance de la plate-forme. |
Coût | Vous achetez chaque service dont vous avez besoin au niveau du plan approprié. De nombreux services facturent la consommation de ressources informatiques. Consultez chaque page de service dans le catalogueIBM Cloud ou dans le catalogue de services sur Cloud Pak for Data as a Service, en sélectionnant Services > Catalogue de services dans le menu de navigation. | Vous achetez une licence logicielle basée sur les services dont vous avez besoin. Par exemple, la licence Cloud Pak for Data Enterprise Edition inclut le droit à des services tels que watsonx.ai Studio et IBM Knowledge Catalog Voir Licences et droits. |
Sécurité, conformité et isolement | La sécurité des données, la sécurité du réseau, la conformité aux normes de sécurité et l'isolement de Cloud Pak for Data en tant que service sont gérés par IBM Cloud. Vous pouvez configurer des options de sécurité et de chiffrement supplémentaires. Voir Sécurité de Cloud Pak for Data en tant que service. | Red Hat OpenShift Container Platform fournit des fonctions de sécurité de base. Cloud Pak for Data est évalué pour différents règlements de confidentialité et de conformité et fournit des fonctions que vous pouvez utiliser pour la préparation de diverses évaluations de la confidentialité et de la conformité. Vous êtes responsable des fonctions de sécurité supplémentaires, du chiffrement et de l'isolement du réseau. Voir Considérations de sécurité. |
Services disponibles | La plupart des services de matrice de données sont disponibles dans les deux environnements de déploiement. Voir Services pour Cloud Pak for Data en tant que service. |
Comprend de nombreux autres services. Voir les services. |
Gestion des utilisateurs | Vous pouvez ajouter des utilisateurs et des groupes d'utilisateurs et gérer leurs rôles et leurs droits d'accès avec IBM Cloud Identity and Access Management. Voir Ajouter des utilisateurs au compte. Vous pouvez aussi mettre en place la fédération SAML sur IBM Cloud. Voir IBM Cloud docs : Comment fonctionne IBM Cloud IAM. |
Vous pouvez ajouter des utilisateurs et créer des groupes d'utilisateurs à partir du menu Administration. Vous pouvez utiliser le service de gestion des identités et des accès ou utiliser votre fournisseur de connexion unique ou LDAP SAML pour la gestion des identités et des mots de passe. Vous pouvez créer des groupes d'utilisateurs dynamiques basés sur des attributs. Voir Gestion des utilisateurs. |
Fonctionnalités de base communes à tous les services
La fonctionnalité de base suivante, fournie avec la plateforme, est effectivement la même pour les services sur Cloud Pak for Data as a Service, le logiciel Cloud Pak for Data, versions 5.1, 5.0 et 4.8:
- Recherche d'actifs et d'artefacts dans l'ensemble de la plateforme
- Catalogue d'actifs pour le partage de connexions dans l'ensemble de la plateforme
- Gestion des utilisateurs à base de rôles dans les espaces de travail collaboratifs de la plateforme
- Infrastructure commune pour les actifs et les espaces de travail
- Un catalogue de services pour l'ajout de services
- Affichage de l'utilisation du calcul à partir du menu Administration
Le tableau suivant décrit les différences entre les fonctionnalités de base des services entre Cloud Pak for Data as a Service et les versions 5.1, 5.0 et 4.8 du logiciel Cloud Pak for Data.
Fonction | En tant que service | Logiciel |
---|---|---|
Gérer tous les projets | Les utilisateurs disposant de l'autorisation Gérer les projets de l'accès au service IAM Manager pour le service IBM Cloud Pak for Data peuvent rejoindre n'importe quel projet avec le rôle Admin, puis gérer ou supprimer le projet. | Les utilisateurs disposant du droit Gérer les projets peuvent rejoindre n'importe quel projet avec le rôle Admin , puis gérer ou supprimer le projet. |
Connexions aux sources de données éloignées | La plupart des sources de données prises en charge sont communes aux deux environnements de déploiement. Voir Connecteurs. |
Voir Sources de données prises en charge. |
Données d'identification de connexion personnelles ou partagées | Les connexions dans les projets et les catalogues peuvent nécessiter des données d'identification personnelles ou des données d'identification partagées. Les données d'identification partagées peuvent être désactivées au niveau du compte. | Les connexions de plateforme peuvent nécessiter des données d'identification personnelles ou des données d'identification partagées. Les données d'identification partagées peuvent être désactivées au niveau de la plateforme. |
Données d'identification de connexion à partir de secrets dans un coffre | Non disponible | Disponible |
Authentification Kerberos | Non disponible | Disponible pour certains services et connexions |
Exemples d'actifs et de projets à partir de l'application de concentrateur de ressources | Disponible | Non disponible |
Connecteur JDBC personnalisé | Non disponible | Disponible à partir de 4.8.0 |
Définitions de source de données | Non disponible | Disponible à partir de la version 5.0. Voir Protection des données avec des définitions de source de données. |
watsonx.ai Studio comparé à Watson Studio
Les fonctionnalités suivantes de watsonx.ai Studio sur Cloud Pak for Data as a Service sont en fait les mêmes que les fonctionnalités de Watson Studio sur Cloud Pak for Data software, versions 5.1, 5.0 et 4.8:
- Collaboration dans les projets et les espaces de déploiement
- Accès aux actifs de projet à l'aide d'un programme
- Importation et exportation de projet à l'aide d'un fichier ZIP de projet
- Blocs-notes Jupyter
- Planification de travaux
- Data Refinery
- Watson Natural Language Processing for Python
- Dialoguer avec les modèles de fondation au sujet de documents et d'images
Ce tableau décrit les différences de fonctionnalités entre le service watsonx.ai Studio dans l'environnement de déploiement as-a-service et le service Watson Studio dans l'environnement de déploiement logiciel, les différences entre les plans d'offre et la nécessité éventuelle de services supplémentaires. Pour plus d'informations sur les différences de fonctionnalités entre les plans d'offre sur Cloud Pak for Data as a Service, voir les plans d'offre dewatsonx.ai Studio.
Fonction | En tant que service | Logiciel |
---|---|---|
Créer un projet | Créer: Un projet vide Un projet à partir d'un exemple dans le concentrateur de ressources Un projet à partir d'un fichier |
Créer: Un projet vide Un projet à partir d'un fichier Un projet avec l'intégration Git |
Intégration Git | Publier des blocs-notes sur GitHub Publier des blocs-notes en tant que gist |
Intégrer un projet à des actifs de synchronisation Git dans un référentiel d'un projet et utiliser ces actifs dans un autre projet |
Terminal de projet pour les opérations Git avancées | Non disponible | Disponible dans les projets avec l'intégration Git par défaut |
Organiser les actifs dans des projets avec des dossiers | Non disponible | Disponible à partir de 4.8.0 |
JupyterLab | Non disponible | Disponible dans les projets avec l'intégration Git |
Intégration de Visual Studio Code | Non disponible | Disponible dans les projets avec l'intégration Git |
RStudio | Impossible d'intégrer à Git | Peut s'intégrer à Git. Requiert un service RStudio Server Runtimes . |
Scripts Python | Non disponible | Gestion des scripts Python dans JupyterLab. Requiert un service d'exécution Watson Studio . |
Génération de code pour charger des données dans un bloc-notes à l'aide du Flight service | Non disponible | Disponible |
Gérer le cycle de vie des ordinateurs portables | Non disponible | Utiliser CPDCTL pour la gestion du cycle de vie du bloc-notes |
Actifs de module de code (ensemble de fichiers dépendants dans une structure de dossiers) | Non disponible | Utiliser CPDCTL pour créer des actifs de module de code dans un espace de déploiement |
Promouvoir les ordinateurs portables dans les espaces | Non disponible | Disponible manuellement à partir de la page Actifs du projet ou à l'aide d'un programme à l'aide de CPDCTL |
Python avec GPU | Prise en charge disponible pour un seul type de processeur graphique | Support disponible pour plusieurs types de GPU Nvidia. Requiert un service d'exécution Watson Studio . |
Création et utilisation d'images personnalisées | Non disponible | Créer des images personnalisées pour les environnements Python (avec et sans GPU), R, JupyterLab (avec et sans GPU), RStudio et SPSS. Nécessite un moteur d'exécution Watson Studio et d'autres services applicables. |
Référentiel Anaconda | Non disponible | Permet de créer des environnements personnalisés et des images personnalisées |
Intégration Hadoop | Non disponible | Construire et former des modèles, et exécuter des flux de Data Refinery sur un cluster Hadoop. Requiert le service d'exécution pour le service Apache Hadoop. |
Decision Optimization | Disponible | Requiert le service Decision Optimization. |
SPSS Modeler | Disponible | Le service SPSS Modeler est requis. |
Pipelines d'orchestration | Disponible | Requiert le service de pipelines d'orchestration. |
le temps d'exécution de watsonx.ai comparé à celui de Watson Machine Learning
Les fonctionnalités suivantes de watsonx.ai Runtime sur Cloud Pak for Data as a Service sont en fait les mêmes que les fonctionnalités de Watson Machine Learning sur Cloud Pak for Data software, versions 5.1, 5.0, et 4.8:
- Collaboration dans les projets et les espaces de déploiement
- Déployer des modèles
- Déploiement de fonctions
- watsonx.ai Runtime REST API et Watson Machine Learning REST API
- client Python watsonx.ai
- Créer des déploiements en ligne
- Échelle et mise à jour des déploiements
- Définir et utiliser des composants personnalisés
- Utiliser l'apprentissage fédéré pour former un modèle commun avec des sources de données séparées et sécurisées
- Surveillance des déploiements entre les espaces
- Formulaires mis à jour pour tester le déploiement en ligne
- Utiliser des pipelines imbriqués
- Imputation de données AutoAI
- Evaluation de l'équité AutoAI
- Fonctions de prise en charge des séries temporelles dans AutoAI
Ce tableau décrit les différences de fonctionnalités entre le service watsonx.ai Runtime dans l'environnement de déploiement as-a-service et le service Watson Machine Learning dans l'environnement de déploiement logiciel, les différences entre les plans d'offre et si des services supplémentaires sont requis. Pour plus de détails sur les différences de fonctionnalités entre les plans d'offre sur Cloud Pak for Data as a Service, voir les plans d'offre dewatsonx.ai Runtime.
Fonction | En tant que service | Logiciel |
---|---|---|
Entrée d'entraînement AutoAI | sources de données actuellement prises en charge | Sources de données prises en charge par édition |
Configuration de calcul d'expérimentation AutoAI | Différentes tailles disponibles | Différentes tailles disponibles |
AutoAI limite la taille des données et le nombre de cibles de prévision |
Définir des limites | Les limites diffèrent selon la configuration de calcul |
Apprentissage incrémentiel AutoAI | Non disponible | Disponible |
Déploiement à l'aide des infrastructures populaires et des spécifications logicielles |
Recherchez la dernière version de Versions prises en charge | Versions prises en charge différent par édition |
Se connecter aux bases de données pour les déploiements par lots | Recherchez Support par type de déploiement | Recherche de la prise en charge par Type de déploiement et par version |
Déployer et évaluer les scripts Python | Disponible via le client Python | Créez des scripts dans le client JupyterLab ou Python , puis déployez |
Déployer et évaluer par lots les scripts R | Non disponible | Disponible |
Déploiement d'applications Shiny | Non disponible | Créer et déployer des applications Shiny Déployer à partir d'un package de code |
Evaluer les travaux pour l'équité ou la dérive | Requiert le service watsonx.governance | Requiert le service Watson OpenScale ou watsonx.governance |
Evaluer les déploiements en ligne dans un espace pour l'équité, la dérive ou l'explicabilité |
Non disponible | Disponible Nécessite le service Watson OpenScale ou watsonx.governance |
Evaluation des modèles d'invite déployés dans un espace | Disponible | |
Evaluation des modèles d'invite détachés dans un espace | Non disponible | Disponible à partir de 5.0 |
Création d'espace de contrôle | Aucune restriction par rôle | Utiliser les droits d'accès pour contrôler qui peut afficher et créer des espaces |
Importer du projet GIT dans l'espace | Non disponible | Disponible |
Package de code créé automatiquement lors de l'importation de à partir du projet Git dans l'espace |
Non disponible | Disponible |
Mettre à jour l'application RShiny à partir du package de code | Non disponible | Disponible |
Création et utilisation d'images personnalisées | Non disponible | Création d'images personnalisées pour Python ou SPSS |
Notifier les collaborateurs des événements de pipeline | Non disponible | Utiliser Envoyer un courrier pour avertir les collaborateurs |
Expérimentations d'apprentissage en profondeur | Non disponible | Requiert le service IBM Scheduler |
Fourniture et gestion d'instances de service IBM Cloud | Ajouter des instances pour watsonx.ai Runtime ou Watson OpenScale |
Les services sont mis à disposition sur le cluster par l'administrateur |
watsonx.governance
Les fonctions de gouvernance suivantes sont effectivement les mêmes sur le logiciel Cloud Pak for Data as a Service et Cloud Pak for Data, versions 5.1, 5.0 et 4.8:
- Évaluer les déploiements pour l'équité
- Évaluer la qualité des déploiements
- Contrôler les déploiements pour la dérive
- Afficher et comparer les résultats du modèle dans un tableau de bord Insights
- Ajouter des déploiements à partir du fournisseur d'apprentissage automatique de votre choix
- Définir les alertes à déclencher lorsque les évaluations sont inférieures à un seuil spécifié
- Evaluation des déploiements dans une interface utilisateur ou un bloc-notes
- Évaluations et indicateurs personnalisés
- Afficher les détails des évaluations dans les feuilles d'informations de modèle
Ce tableau décrit les différences de fonctionnalités entre le service watsonx.governance dans l'environnement as-a-service et l'environnement de déploiement logiciel, les différences entre les plans d'offre, et si des services supplémentaires sont nécessaires.
Fonction | En tant que service | Logiciel |
---|---|---|
Évaluer les modèles d'apprentissage automatique | Oui | Oui |
Télécharger les données de test pré-évaluées | Non disponible | Disponible |
IBM SPSS Collaboration and Deployment Services | Non disponible | Disponible |
Traitement par lots | Non disponible | Disponible |
Prise en charge du contrôle d'accès par les groupes d'utilisateurs | Non disponible | Disponible |
Base de données gratuite et plans Postgres | Disponible | Postgres disponible à partir de 4.8 |
IBM Knowledge Catalog
Les fonctionnalités suivantes sont effectivement les mêmes pour IBM Knowledge Catalog on Cloud Pak for Data as a Service et sur Cloud Pak for Data software, versions 5.1, 5.0 et 4.8:
- Collaboration dans des projets et des catalogues
- Recherche et recommandations à l'aide d'IA dans les catalogues
- Évaluation et révision des actifs dans les catalogues
- Outil de raffinement des données dans les projets
- Catégories avec rôles de collaborateur
- Classifications prédéfinies et personnalisées
- Classes de données prédéfinies et personnalisées
- Règles de gouvernance
- Stratégies
- Règles de protection des données
- Règles SLA de qualité des données
- Profilage manuel des actifs de données relationnelles individuels dans un projet ou un catalogue
- Profilage automatique des actifs de données relationnelles ajoutés à un catalogue gouverné
- Outil d'enrichissement des métadonnées dans les projets de profilage, d'attribution de termes, d'analyse de la qualité et d'analyse des clés ou des relations sur de vastes ensembles de données
- Types d'actifs personnalisés, propriétés personnalisées pour les actifs et relations personnalisées entre les actifs dans les catalogues
- Surveillance des tâches de flux de travaux
- Distribution de fichiers masqués dans des projets avec des flux de masquage
- Informations détaillées sur la qualité des données pour les actifs de données dans les projets et les catalogues, et dans le cadre des résultats de l'enrichissement des métadonnées
- Flux de travaux de résolution pour les problèmes de qualité des données
- Créer des ressources de données connectées et des ressources de données segmentées à l'aide de requêtes SQL
- Exécuter le tableau de bord des mesures et les fenêtres d'exécution pour les travaux d'enrichissement des métadonnées
Ce tableau décrit les différences entre les fonctions du service IBM Knowledge Catalog dans les environnements de déploiement sous forme de service et de logiciel, les différences entre les plans d'offre et la nécessité ou non de services supplémentaires. Pour plus d'informations sur les différences de fonction entre les plans d'offre sur Cloud Pak for Data as a Service, voir Plans d'offreIBM Knowledge Catalog.
À partir de la version Cloud Pak for Data 5.0, vous pouvez installer la cartouche IBM Knowledge Catalog Premium ou la cartouche IBM Knowledge Catalog Standard à la place du service IBM Knowledge Catalog. IBM Knowledge Catalog Premium offre les mêmes fonctionnalités que le service IBM Knowledge Catalog, auxquelles s'ajoutent des fonctionnalités d'IA générative. IBM Knowledge Catalog Standard fournit un sous-ensemble des fonctionnalités d'IBM Knowledge Catalog ainsi que des fonctionnalités d'IA générative.
Fonction | En tant que service | Logiciel |
---|---|---|
Outil d' Metadata import dans les projets-reconnaissance | Importez des actifs de données dans des projets ou des catalogues. Prise en charge d'un sous-ensemble de connexions de projet et de catalogue. Voir Sources de données prises en charge pour la conservation et la qualité des données. | Importez différents types d'actifs: importez des actifs de données dans des projets ou des catalogues. La plupart des connexions prises en charge sont identiques dans les deux environnements de déploiement. Importez des rapports d'aide à la décision, des actifs avec leurs scripts de transformation associés, des travaux ETL ou des modèles de données dans des catalogues. Nécessite l'installation de MANTA Automated Data Lineage sans clé de licence. Prise en charge d'un sous-ensemble de connexions de catalogue. ' Voir Sources de données prises en charge pour la curation et la qualité des données. |
Outil d' Metadata import dans les projets-lignage | Disponible. Le lignage des données doit être activé. Limites par plan. |
- Importation de l'historique des données dans les catalogues. Nécessite l'installation de IBM Manta Data Lineage ou MANTA Automated Data Lineage avec une clé de licence. - Capturez et accédez au lignage des travaux ETL dans MANTA Automated Data Lineage. Nécessite l'installation de MANTA Automated Data Lineage avec une clé de licence. Prise en charge d'un sous-ensemble de connexions au catalogue. Voir Sources de données prises en charge pour la curation et la qualité des données. |
Enrichissement amélioré grâce à l'IA générative | Disponible. | Non disponible. A partir de 5.0, installez IBM Knowledge Catalog Premium ou IBM Knowledge Catalog Standard à la place. |
Règles de qualité des données dans les projets | Disponible Requiert le service DataStage . |
Disponible. Requiert le service DataStage . |
Ajouter plusieurs actifs à un catalogue avec un fichier | Non disponible. | Disponible. |
Activités d'actif | Nécessite un plan payé. Disponible dans les projets et les catalogues. |
Disponible dans les projets et les catalogues. |
Lignage métier | Non disponible | Disponible. |
Lignée de données techniques | Non disponible. | Disponible. Nécessite l'installation d'une version sous licence de MANTA Automated Data Lineage for IBM Cloud Pak for Data Généré en exécutant l'outil d'importation de métadonnées. Vous pouvez y accéder à partir de catalogues. |
Lignage de données | Nécessite une habilitation. | Non disponible. |
Termes métier | Limites pour certains régimes. | Disponible. |
Termes commerciaux prédéfinis | Les termes commerciaux prédéfinis et la catégorie Knowledge Accelerator Sample Personal Data qui les inclut ne sont disponibles que si vous créez une instance de service IBM Knowledge Catalog avec un plan Lite ou Standard après le 7 octobre 2022. | Non disponible. |
Jeux de données de référence | Limites par plan. | Disponible. |
Relations personnalisées pour les artefacts | Nécessite un plan payant. | Disponible. |
Knowledge Accelerators | Nécessite un plan d'entreprise à partir du centre de ressources. |
Fourni avec la plateforme. |
Configurations de flux de travaux personnalisées pour les artefacts de gouvernance et les demandes | Disponible pour les artefacts de gouvernance. | Disponible. |
Rôles de catégorie personnalisée | Limites par plan. | Disponible. |
Règles de protection des données à l'exportation et à l'importation | Pour exporter des règles de protection des données à partir de n'importe quel système et les importer dans le même système ou dans un système différent, vous pouvez utiliser des API. Pour plus d'informations, voir Migration des règles de protection des données. | Pour exporter des règles de protection des données à partir d'un système et les importer dans le même système ou dans un système différent, vous pouvez utiliser les API ou les commandes cpd-cli. Pour plus d'informations, voir Migration des règles de protection des données. |
Rapports administratifs | Nécessite un plan payant. | Disponible. |
Migrer des données à partir d'InfoSphere Information Server | Non disponible. | Disponible. |
Explorateur de relations | Non disponible. | Disponible à partir de la version 5.0. Nécessite l'installation du composant optionnel de graphe de connaissances avec IBM Knowledge Catalog. |
DataStage
Le tableau suivant décrit les différences de fonctionnalités entre DataStage on Cloud Pak for Data as a Service et DataStage on Cloud Pak for Data, versions 5.1, 5.0 et 4.8
Fonction | En tant que service | Logiciel |
---|---|---|
Gestion des instances PX | Vous pouvez fournir des instances à partir d'un ensemble de tailles prédéfinies. | Vous pouvez fournir des instances de manière plus flexible à l'aide de l'administration d'instance Cloud Pak for Data. |
Compilation des travaux |
|
|
Environnement d'exécution | Vous pouvez soumettre autant de travaux que vous le souhaitez, en fonction de la mise en file d'attente. |
|
Gestion des actifs | Pour les fichiers de type .xls, .xlsx, .xml et .json, seules les structures simples sont prises en charge. Les schémas multi-niveaux/imbriqués ne peuvent pas être analysés. | La prise en charge complète des fichiers de type .csv, .txt, .xls, .xlsx, .xml et .json est disponible. |
Stockage |
|
|
Étape d'intégration Java | Disponible avecDataStage-aaS N'importe où | Disponible |
Composant de bibliothèque Java | Disponible avecDataStage-aaS N'importe où | Disponible |
Connexion JDBC générique | Disponible avecDataStage-aaS N'importe où | Disponible |
Excel | Disponible avecDataStage-aaS N'importe où | Disponible |
AVI | Disponible avecDataStage-aaS N'importe où | Disponible |
Etape External Source | Disponible avecDataStage-aaS N'importe où | Disponible |
Etape External Target | Disponible avecDataStage-aaS N'importe où | Disponible |
Etape hiérarchique |
|
Disponible |
SMP | S, M, L sont un noeud unique, configuration SMP. Utilisez un moteur d'exécution distant pour définir une autre configuration. | Les charges de travail parallèles sont gérées via des partitions logiques, qui sont configurées avec l'option APT_CONFIG_FILE. |
Connexion SAP Bulk Extract | Non disponible | Disponible |
Connexion SAP Delta Extract | Non disponible | Disponible |
Étape encapsulée | Disponible avecDataStage-aaS N'importe où | Disponible |
Connexion SAP HANA | Non disponible | Disponible |
Source de données texte dans la connexion ODBC | Non disponible | Disponible |
Étape de génération | Disponible avecDataStage-aaS N'importe où | Disponible |
Envoyer des rapports à l'aide de sous-routines avant / après travail | Disponible avecDataStage-aaS N'importe où | Disponible |
Étape personnalisée | Disponible avecDataStage-aaS N'importe où | Disponible |
Connexion Apache HBase | Disponible avecDataStage-aaS N'importe où | Disponible |
Authentification Kerberos pour les connexions Apache Hive | Non disponible | Disponible |
Fonctions définies par l'utilisateur (UDF) | Disponible avecDataStage-aaS N'importe où | Disponible |
Fichiers APT_CONFIG créés par l'utilisateur | Disponible avecDataStage-aaS N'importe où | Disponible |
Propriétés avant / après le travail | Disponible avecDataStage-aaS N'importe où | Disponible |
Connecteur de service de données | Non disponible | Disponible |
Séquence de base de données Db2 dans l'étape Dimension à évolution lente, l'étape Générateur de clés de substitution et l'étape Transformer | Disponible avecDataStage-aaS N'importe où | Disponible |
Utilisez la connexion Apache Hive comme cible. (Disponible lorsque Utiliser les propriétés DataStage est sélectionné dans le connecteur.) | Disponible avecDataStage-aaS N'importe où | Disponible |
Paramétrer les propriétés avec des connexions locales | Non disponible | Disponible |
Etape Operational Decision Manager | Disponible avecDataStage-aaS N'importe où | Disponible |
Espaces de déploiement | Non disponible | Disponible |
Data Virtualization
Sur Cloud Pak for Data as a Service, la fonctionnalité de virtualisation des données est fournie par le service Data Virtualization. La fonctionnalité de virtualisation des données suivante est effectivement la même sur Cloud Pak for Data as a Service et Cloud Pak for Data software, versions 5.1, 5.0 et 4.8
- Connexion aux sources de données prises en charge
- Virtualisation des données
- Gouverner les données virtuelles à l'aide de règles et de règles de protection des données
- Surveillance et exploration du service
- Utilisation de l'interface SQL
- Mise en cache
- Masquage de colonne
- Exploration de la vue et rechargement des tables
- Echantillonnage de données dans la collecte de statistiques
- Enrichissement des métadonnées
La fonctionnalité de virtualisation des données suivante apparaît différente dans l'interface utilisateur, mais fournit la même fonctionnalité de base :
- Publication de données virtuelles dans des catalogues
- Gestion de l'accès aux objets virtuels
- Administration des utilisateurs et des rôles
- Mise à l'échelle du service
- Collecte de statistiques dans le client web dans Data Virtualization
Ce tableau décrit les différences de fonctionnalités entre Data Virtualization (anciennement Watson Query) on Cloud Pak for Data as a Service et Data Virtualization (anciennement Watson Query) on Cloud Pak for Data software.
Fonction | En tant que service | Logiciel |
---|---|---|
Utilisez Cloud Pak for Data Data Source Definitions (DSD) pour appliquer les règles de protection des données IBM Knowledge Catalog | Non applicable pour SaaS | Disponible à partir de 5.0 |
Données de requête dans les sources de données de l'API REST | Non applicable pour SaaS | Disponible à partir de 5.0 |
Tables de requête des précédents catalogues Presto et Databricks avec la prise en charge de plusieurs catalogues | Non applicable pour SaaS | Disponible à partir de 5.0 |
Mise à l'échelle automatique des instances de service | Non applicable pour SaaS | Disponible à partir de 5.0 |
Masquage des caractères multi-octets pour une meilleure confidentialité des données sensibles | Non applicable pour SaaS | Disponible à partir de 5.0 |
Afficher les règles de protection des données appliquées à un utilisateur | Non applicable pour SaaS | Disponible à partir de 5.0 |
Amélioration de la sécurité pour les résultats de profilage dans les vues Data Virtualization | Non applicable pour SaaS | Disponible à partir de 5.0 |
Les connexions Data Virtualization dans les catalogues font désormais référence à la connexion de plateforme | Non applicable pour SaaS | Disponible à partir de 5.0 |
Les connexions Data Virtualization dans les catalogues font désormais référence à la connexion de plateforme | Non applicable pour SaaS | Disponible à partir de 5.0 |
Sécurité améliorée pour le rôle Admin: le rôle Admin ne dispose pas de l'accès par défaut à toutes les données. | Non applicable pour SaaS | Disponible à partir de la version 4.8 |
Les règles de protection des données IBM Knowledge Catalog sont toujours activées pour les données Watson Query | Non applicable pour SaaS | Disponible à partir de la version 4.8 |
Sécurisez vos objets non gouvernés: avec les règles de protection des données d' IBM Knowledge Catalog dans Watson Query, les objets virtualisés qui ne sont pas publiés dans un catalogue gouverné suivent le paramètre de convention d'accès aux données par défaut de vos paramètres de règle. | Non applicable pour SaaS | Disponible à partir de la version 4.8 |
Interrogation des données Presto : vous pouvez créer une connexion à Presto pour accéder aux données et les interroger dans Presto. | Non applicable pour SaaS | Disponible à partir de la version 4.8 |
Journalisation d'audit pour surveiller l'activité des utilisateurs et l'accès aux données | Disponible | Disponible |
Intégration à IBM Knowledge Catalog | Obligatoire | Facultatif |
Autorisation basée sur un groupe et accès au niveau objet pour les groupes | Non disponible | Disponible |
Prise en charge des connecteurs distants | Non applicable pour SaaS | Disponible |
Prise en charge des sources de données basées sur le système de fichiers, sauf dans Cloud Object Storage | Non applicable pour SaaS | Disponible |
Connexion à des sources de données nécessitant un pilote JDBC téléchargé, par exemple, SAP HANA, Generic JDBC | Non applicable pour SaaS | Disponible |
Collecte de statistiques dans l'interface utilisateur | Non disponible | Disponible |
Collecte automatique de statistiques lors de la virtualisation d'objet | Non disponible | Disponible |
Gestion des accès pour plusieurs groupes | Non disponible | Disponible |
Prise en charge des fichiers CSV ou TSV dans Cloud Object Storage | Non applicable pour SaaS | Disponible |
Données d'identification dans les coffres pour les connexions dans Cloud Object Storage | Non applicable pour SaaS | Disponible |
Mise en cache automatique des requêtes | Non disponible | Disponible à partir de la version 5.0.3 |
En savoir plus
- Services pour Cloud Pak for Data en tant que service
- Services pour IBM Software Hub 5.1
- Options d'environnement de déploiement en nuage pour https://www.ibm.com/docs/SSNFH6_5.1.x 5.1
Rubrique parent : Cloud Pak for Data en tant que service