Cloud Pak for Data as a Service und Cloud Pak for Data weisen einige Unterschiede bei den Features und der Implementierung auf. Cloud Pak for Data as a Service ist ein Set von IBM Cloud-Services. Cloud Pak for Data 5.1 wird als Software angeboten, die Sie auf IBM Software Hub installieren und warten müssen. Dienste, die in beiden Bereitstellungen verfügbar sind, haben auch Unterschiede in den Funktionen von Cloud Pak for Data as a Service im Vergleich zu Cloud Pak for Data 5.1, 5.0 und 4.8.
- Plattformunterschiede
- Allgemeine serviceübergreifende Funktionen
- watsonx.ai Studio im Vergleich zu Watson Studio
- watsonx.ai Runtime im Vergleich zu Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Data Virtualization
Plattformunterschiede
Cloud Pak for Data as a Service und die Software Cloud Pak for Data nutzen eine gemeinsame Codebasis, unterscheiden sich jedoch in den folgenden Schlüsselmöglichkeiten:
Features | Als Service | Software |
---|---|---|
Software, Hardware und Installation | Cloud Pak for Data as a Service wird vollständig von IBM in IBM Cloud verwaltet. Softwareaktualisierungen werden automatisch durchgeführt. Die Skalierung von Rechenressourcen und Speicher erfolgt automatisch. Sie melden sich bei Try Cloud Pak for Data as a Service an. | Die Hardware wird von Ihnen bereitgestellt und gewartet. Sie installieren, verwalten und aktualisieren die Software. Siehe Softwareanforderungen. |
Speicher | Sie stellen eine IBM Cloud Object Storage-Serviceinstanz zur Verfügung, um Speicher bereitzustellen. Siehe IBM Cloud Object Storage. | Sie stellen persistenten Speicher in einem Red Hat OpenShift -Cluster bereit. Siehe Speicheranforderungen. |
Rechenressourcen zum Ausführen von Workloads | Benutzer wählen die geeignete Laufzeit für ihre Jobs aus. Die Nutzung von Rechenressourcen wird nach dem geltenden Tarif für die Laufzeitumgebung und nach der Dauer des Jobs abgerechnet. Siehe Kontoressourcennutzung überwachen. | Sie definieren die Anzahl der Red Hat OpenShift -Knoten mit der entsprechenden Anzahl von vCPUs. Siehe Hardwareanforderungen und Überwachung der Plattform. |
Kosten | Sie erwerben jeden Service, den Sie benötigen, unter dem entsprechenden Preisstrukturplan. Bei vielen Services werden die genutzten Rechenressourcen in Rechnung gestellt. Sehen Sie sich jede Serviceseite im IBM Cloud oder im Servicekatalog auf Cloud Pak for Data as a Service an, indem Sie im Navigationsmenü Services > Servicekatalog wählen. | Sie kaufen eine Softwarelizenz basierend auf den Services, die Sie benötigen. Die Lizenz für Cloud Pak for Data Enterprise Edition beinhaltet zum Beispiel die Berechtigung für Services wie watsonx.ai Studio und IBM Knowledge Catalog. Siehe Lizenzen und Berechtigungen. |
Sicherheit, Compliance und Isolation | Datensicherheit, Netzsicherheit, Einhaltung von Sicherheitsstandards und Isolation für Cloud Pak for Data as a Service werden von IBM Cloud verwaltet. Sie können zusätzliche Sicherheits- und Verschlüsselungsoptionen einrichten. Weitere Informationen finden Sie in Sicherheit für Cloud Pak for Data as a Service. | Red Hat OpenShift Container Platform bietet grundlegende Sicherheitsfunktionen. Cloud Pak for Data wird auf die Einhaltung verschiedener Datenschutz- und Konformitätsbestimmungen überprüft und bietet Funktionen, die Sie als Vorbereitung für verschiedene Datenschutz- und Konformitätsbewertungen verwenden können. Sie sind für zusätzliche Sicherheitsfunktionen, Verschlüsselung und Netzisolation verantwortlich. Siehe Sicherheitserwägungen. |
Verfügbare Services | Die meisten Data Fabric-Services sind in beiden Bereitstellungsumgebungen verfügbar. Weitere Informationen finden Sie in Services für Cloud Pak for Data as a Service. |
Enthält viele weitere Services. Siehe Dienstleistungen. |
Benutzermanagement | Sie fügen Benutzer und Benutzergruppen hinzu und verwalten die zugehörigen Kontorollen und -berechtigungen mit IBM Cloud Identity and Access Management. Weitere Informationen finden Sie unter Benutzer zum Konto hinzufügen. Sie können außerdem SAML-Föderation in IBM Cloud konfigurieren. Siehe IBM Cloud docs: Wie IBM Cloud IAM funktioniert. |
Über das Menü Verwaltung können Sie Benutzer hinzufügen und Benutzergruppen erstellen. Sie können den Service 'Identity and Access Management' oder Ihren vorhandenen SAML-SSO- oder LDAP-Provider verwenden, um Identitäten und Kennwörter zu verwalten. Sie können dynamische, attributbasierte Benutzergruppen erstellen. Siehe Benutzerverwaltung. |
Allgemeine Serviceübergreifende Kernfunktionalität
Die folgenden Kernfunktionen, die mit der Plattform zur Verfügung gestellt werden, sind für Dienste auf den Softwareversionen Cloud Pak for Data as a Service, Cloud Pak for Data, 5.1, 5.0, und 4.8:
- Plattformweite globale Suche nach Assets und Artefakten
- Der Katalog der Plattformassets für die plattformweite gemeinsame Nutzung von Verbindungen
- Plattformweite rollenbasierte Benutzerverwaltung in Arbeitsbereichen mit Collaboration.
- Gemeinsame Infrastruktur für Assets und Arbeitsbereiche
- Servicekatalog zum Hinzufügen von Services
- Rechenressourcennutzung über das Menü Verwaltung anzeigen
Die folgende Tabelle beschreibt die Unterschiede in der Kernfunktionalität der Dienste zwischen Cloud Pak for Data as a Service und Cloud Pak for Data Software Version 5.1, 5.0 und 4.8.
Funktion | Als Service | Software |
---|---|---|
Alle Projekte verwalten | Benutzer mit der Berechtigung Projekte verwalten aus dem IAM Service Access Manager für den IBM Cloud Pak for Data Service können jedem Projekt mit der Rolle Admin beitreten und das Projekt dann verwalten oder löschen. | Benutzer mit der Berechtigung Projekte verwalten können an jedem Projekt mit der Rolle Administrator teilnehmen und dann das Projekt verwalten bzw. löschen. |
Verbindungen zu fernen Datenquellen | Die meisten unterstützten Datenquellen sind für beide Bereitstellungsumgebungen gleich. Siehe Konnektoren. |
Siehe Unterstützte Datenquellen. |
Persönliche oder gemeinsam genutzte Berechtigungsnachweise für Verbindunngen | Für Verbindungen in Projekten und Katalogen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Kontoebene inaktiviert werden. | Plattformverbindungen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Plattformebene inaktiviert werden. |
Verbindungsberechtigungsnachweise aus geheimen Schlüsseln in einer Vault | Nicht verfügbar | Verfügbar |
Kerberos-Authentifizierung | Nicht verfügbar | Verfügbar für einige Dienste und Verbindungen |
Beispielassets und Projekte aus der App "Ressourcenhub" | Verfügbar | Nicht verfügbar |
Angepasster JDBC-Connector | Nicht verfügbar | Verfügbar ab 4.8.0 |
Datenquellendefinitionen | Nicht verfügbar | Ab 5.0verfügbar. Siehe Datenschutz mit Datenquellendefinitionen. |
watsonx.ai Studio im Vergleich zu Watson Studio
Die folgenden watsonx.ai Studio-Funktionen auf Cloud Pak for Data as a Service sind effektiv die gleichen wie die Watson Studio auf Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Programmgesteuert auf Projektassets zugreifen
- Projektimport und -export mithilfe einer ZIP-Projektdatei
- Jupyter-Notebooks
- Jobplanung
- Data Refinery
- Watson Natural Language Processing für Python
- Chatten mit Stiftungsmodellen über Dokumente und Bilder
Diese Tabelle beschreibt die Funktionsunterschiede zwischen dem watsonx.ai Studio-Dienst in der As-a-Service-Bereitstellungsumgebung und dem Watson Studio in der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und ob zusätzliche Dienste erforderlich sind. Weitere Informationen zu den Funktionsunterschieden zwischen den Angebotsplänen auf Cloud Pak for Data as a Service finden Sie unter watsonx.ai Studio Angebotspläne.
Funktion | Als Service | Software |
---|---|---|
Projekt erstellen | Erstellen: Ein leeres Projekt Ein Projekt aus einem Beispiel im Ressourcenhub Ein Projekt aus einer Datei |
Erstellen: Ein leeres Projekt Ein Projekt aus Datei Ein Projekt mit Git -Integration |
Git-Integration | Notebooks auf GitHub veröffentlichen Notebooks als Gist veröffentlichen |
Ein Projekt mit Git integrieren, Assets mit Repository in einem Projekt synchronisieren und diese Assets in einem anderen Projekt verwenden |
Projektterminal für erweiterte Git-Operationen | Nicht verfügbar | Verfügbar in Projekten mit standardmäßiger Git-Integration |
Assets in Projekten mit Ordnern organisieren | Nicht verfügbar | Verfügbar ab 4.8.0 |
JupyterLab | Nicht verfügbar | Verfügbar in Projekten mit Git-Integration |
Visual Studio Code -Integration | Nicht verfügbar | Verfügbar in Projekten mit Git-Integration |
RStudio | Kann nicht in Git integriert werden | Kann in Git integriert werden Erfordert einen RStudio Server Runtimes -Service. |
Python-Scripts | Nicht verfügbar | Mit Python-Scripts in JupyterLab arbeiten Erfordert einen Watson Studio -Laufzeitservice. |
Code zum Laden von Daten in ein Notebook mithilfe des Flight service generieren | Nicht verfügbar | Verfügbar |
Notebook-Lebenszyklus verwalten | Nicht verfügbar | CPDCTL für das Lebenszyklusmanagement von Notebooks verwenden |
Codepaketassets (Gruppe abhängiger Dateien in einer Ordnerstruktur) | Nicht verfügbar | CPDCTL zum Erstellen von Codepaketassets in einem Bereitstellungsbereich verwenden |
Notebooks in Bereiche hochstufen | Nicht verfügbar | Manuell auf der Seite 'Assets' des Projekts oder programmgesteuert über CPDCTL verfügbar |
Python mit GPU | Unterstützung nur für einen einzelnen GPU-Typ verfügbar | Unterstützung für mehrere Nvidia-GPU-Typen verfügbar Erfordert einen Watson Studio -Laufzeitservice. |
Angepasste Images erstellen und verwenden | Nicht verfügbar | Erstellen Sie benutzerdefinierte Images für Python (mit und ohne GPU), R, JupyterLab (mit und ohne GPU), RStudio und SPSS. Erfordert eine Watson Studio und andere geeignete Dienste. |
Anaconda Repository | Nicht verfügbar | Zum Erstellen angepasster Umgebungen und angepasste Images verwenden |
Hadoop-Integration | Nicht verfügbar | Modelle erstellen und trainieren und Data Refinery-Abläufe in einem Hadoop-Cluster ausführen. Erfordert den Service 'Execution Engine for Apache Hadoop'. |
Decision Optimization | Verfügbar | Erfordert den Service Decision Optimization. |
SPSS Modeler | Verfügbar | Setzt den SPSS Modeler-Service voraus. |
Orchestrierungspipelines | Verfügbar | Erfordert den Orchestrierungsservice für Pipelines. |
watsonx.ai Runtime im Vergleich zu Watson Machine Learning
Die folgenden watsonx.ai Runtime-Funktionen auf Cloud Pak for Data as a Service sind effektiv die gleichen wie die Watson Machine Learning auf Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Modelle bereitstellen
- Funktionsbereitstellung
- watsonx.ai Runtime REST API und Watson Machine Learning REST API
- watsonx.ai Python
- Onlinebereitstellungen erstellen
- Bereitstellungen skalieren und aktualisieren
- Angepasste Komponenten definieren und verwenden
- Federated Learning zum Trainieren eines allgemeinen Modells mit separaten und sicheren Datenquellen verwenden
- Bereitstellungen bereichsübergreifend überwachen
- Aktualisierte Formulare zum Testen der Online-Implementierung
- Verschachtelte Pipelines verwenden
- AutoAI -Datenimputation
- AutoAI -Fairnessbewertung
- AutoAI -Zeitreihenunterstützungsfunktionen
Diese Tabelle beschreibt die Funktionsunterschiede zwischen dem watsonx.ai Runtime Service in der As-a-Service-Bereitstellungsumgebung und dem Watson Machine Learning Service in der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und ob zusätzliche Services erforderlich sind. Details zu den Funktionsunterschieden zwischen den Angebotsplänen auf Cloud Pak for Data as a Service finden Sie unter watsonx.ai Runtime Angebotspläne.
Funktion | Als Service | Software |
---|---|---|
AutoAI -Trainingseingabe | Aktuelle unterstützte Datenquellen | Unterstützte Datenquellen ändern sich nach Release |
Rechenkonfiguration für AutoAI -Experimente | Verschiedene Größen verfügbar | Verschiedene Größen verfügbar |
AutoAI begrenzt die Datenmenge und die Anzahl der Vorhersageziele |
Grenzwerte festlegen | Grenzwerte unterscheiden sich je nach Berechnungskonfiguration |
AutoAI Inkrementelles Lernen | Nicht verfügbar | Verfügbar |
Bereitstellung unter Verwendung gängiger Frameworks und Softwarespezifikationen |
Auf neueste unterstützte Versionen prüfen | Unterstützte Versionen variieren je nach Release |
Verbindung zu Datenbanken für Batchbereitstellungen herstellen | Auf Unterstützung nach Bereitstellungstyp prüfen | Auf Unterstützung nach Bereitstellungstyp und nach Version prüfen |
Python -Scripts bereitstellen und bewerten | Verfügbar über Python-Client | Scripts im JupyterLab -oder Python -Client erstellen und anschließend bereitstellen |
R-Scripts für Bereitstellung und Stapelscoring | Nicht verfügbar | Verfügbar |
Shiny-Apps bereitstellen | Nicht verfügbar | Shiny-Apps erstellen und bereitstellen Bereitstellung aus Codepaket |
Jobs auf Fairness oder Drift bewerten | Erfordert den Service watsonx.governance | Erfordert den Service Watson OpenScale oder watsonx.governance |
Bewerten Sie Onlinebereitstellungen in einem Bereich auf Fairness, Drift oder Erklärbarkeit. |
Nicht verfügbar | Verfügbar Erfordert den Watson OpenScale oder watsonx.governance |
Implementierte Eingabeaufforderungsvorlagen in einem Space auswerten | Verfügbar | |
Vorlagen für freigegebene Eingabeaufforderungen in einem Space auswerten | Nicht verfügbar | Verfügbar ab 5.0 |
Erstellung des Steuerbereichs | Keine Einschränkungen nach Rolle | Durch Berechtigungen steuern, wer Bereiche anzeigen und erstellen kann |
Aus GIT-Projekt in Bereich importieren | Nicht verfügbar | Verfügbar |
Codepaket, das automatisch erstellt wird, wenn aus einem Git -Projekt in den Speicherbereich importiert wird. |
Nicht verfügbar | Verfügbar |
RShiny-App aus Codepaket aktualisieren | Nicht verfügbar | Verfügbar |
Angepasste Images erstellen und verwenden | Nicht verfügbar | Angepasste Images für Python oder SPSS erstellen |
Mitbearbeiter über Pipeline-Ereignisse benachrichtigen | Nicht verfügbar | Verwenden Sie "E-Mail senden", um Mitarbeiter zu benachrichtigen. |
Deep-Learning-Experimente | Nicht verfügbar | Erfordert den IBM Scheduler-Dienst |
IBM Cloud-Serviceinstanzen bereitstellen und verwalten | Instanzen für watsonx.ai Runtime oder Watson OpenScale hinzufügen |
Services werden im Cluster vom Administrator bereitgestellt |
watsonx.governance
Die folgenden Governance-Funktionen sind bei den Softwareversionen Cloud Pak for Data as a Service und Cloud Pak for Data, 5.1, 5.0, und 4.8:
- Fairness von Bereitstellungen bewerten
- Qualität von Bereitstellungen bewerten
- Drift von Bereitstellungen überwachen
- Modellergebnisse in einem Insights-Dashboard anzeigen und vergleichen
- Fügen Sie Bereitstellungen vom Machine Learning-Provider Ihrer Wahl hinzu.
- Alerts festlegen, die ausgelöst werden, wenn Auswertungen einen angegebenen Schwellenwert unterschreiten
- Implementierungen in einer Benutzerschnittstelle oder einem Notebook auswerten
- Angepasste Bewertungen und Metriken
- Details zu Bewertungen in Modelldatenblättern anzeigen
Diese Tabelle beschreibt die Unterschiede zwischen den Funktionen des watsonx.governance in der As-a-Service- und der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und die Frage, ob zusätzliche Dienste erforderlich sind.
Funktion | Als Service | Software |
---|---|---|
Bewertung von Modellen des maschinellen Lernens | Ja | Ja |
Vorab bewertete Testdaten hochladen | Nicht verfügbar | Verfügbar |
IBM SPSS Collaboration and Deployment Services | Nicht verfügbar | Verfügbar |
Batchverarbeitung | Nicht verfügbar | Verfügbar |
Zugriffssteuerung nach Benutzergruppen unterstützen | Nicht verfügbar | Verfügbar |
Kostenlose Datenbank und Postgres -Pläne | Verfügbar | Postgres verfügbar ab 4.8 |
IBM Knowledge Catalog
Die folgenden Funktionen sind für die Software IBM Knowledge Catalog on Cloud Pak for Data as a Service und Cloud Pak for Data sowie für die Versionen 5.1, 5.0, und 4.8:
- Zusammenarbeit in Projekten und Katalogen
- KI-gestützte Suche und Empfehlungen in Katalogen
- Assets in Katalogen bewerten und prüfen
- Data Refinery-Tool in Projekten
- Kategorien mit Mitbearbeiterrollen
- Vordefinierte und angepasste Klassifikationen
- Vordefinierte und angepasste Datenklassen
- Governance-Regeln
- Richtlinien
- Datenschutzregeln
- SLA-Regeln für Datenqualität
- Manuelle Profilerstellung für einzelne relationale Datenassets in einem Projekt oder Katalog
- Automatische Profilerstellung für relationale Datenassets, die zu einem regulierten Katalog hinzugefügt wurden
- Werkzeug zur Anreicherung von Metadaten in Projekten zur Durchführung von Profilerstellung, Begriffszuweisung, Qualitätsanalyse und Schlüssel- oder Beziehungsanalyse bei großen Datenbeständen
- Angepasste Assettypen, angepasste Eigenschaften für Assets und angepasste Beziehungen zwischen Assets in Katalogen
- Workflow-Tasks überwachen
- Maskierte Datasets in Projekten mit Maskierungsabläufen bereitstellen
- Detaillierte Datenqualitätsinformationen für Datenbestände in Projekten und Katalogen und als Teil der Ergebnisse der Metadatenanreicherung
- Korrekturworkflows für Datenqualitätsprobleme
- Erstellen von verbundenen Datenbeständen und segmentierten Datenbeständen mit SQL-Abfragen
- Metrik-Dashboard und Ausführungsfenster für Metadaten-Anreicherungsaufträge ausführen
In dieser Tabelle werden die Unterschiede zwischen den Features des Service IBM Knowledge Catalog in den As-a-Service-und Softwareimplementierungsumgebungen, die Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Servicefinden Sie unter Angebotspläne fürIBM Knowledge Catalog.
Ab Cloud Pak for Data Version 5.0 können Sie die IBM Knowledge Catalog Premium Cartridge oder die IBM Knowledge Catalog Standard Cartridge anstelle des IBM Knowledge Catalog Service installieren. IBM Knowledge Catalog Premium bietet die gleichen Funktionen wie der IBM Knowledge Catalog Service plus generative KI-Funktionen. IBM Knowledge Catalog Standard bietet eine Teilmenge der Funktionen von IBM Knowledge Catalog sowie generative KI-Funktionen.
Funktion | Als Service | Software |
---|---|---|
Tool Metadata import in Projekten-Erkennung | Importieren Sie Datenassets in Projekte oder Kataloge. Unterstützung für eine Untergruppe mit Projekt- und Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. | Verschiedene Assettypen importieren: Importieren Sie Datenassets in Projekte oder Kataloge. Die meisten unterstützten Verbindungen sind in beiden Implementierungsumgebungen identisch. Business-Intelligence-Berichte, Assets mit den zugehörigen Transformationsscripts, ETL-Jobs oder Datenmodellen in Kataloge importieren. Erfordert die Installation von MANTA Automated Data Lineage ohne Lizenzschlüssel. Unterstützung für eine Teilmenge von Katalogverbindungen. ' Siehe Unterstützte Datenquellen für Kuration und Datenqualität. |
Tool Metadata import in 'projects-lineage' | Verfügbar. Data Lineage muss aktiviert sein. Limits pro Plan. |
- Importieren Sie die Abstammung von Datenbeständen in Kataloge. Erfordert die Installation von IBM Manta Data Lineage oder MANTA Automated Data Lineage mit einem Lizenzschlüssel. - Erfassen Sie den Verlauf von ETL-Jobs in MANTA Automated Data Lineage und greifen Sie darauf zu. Erfordert die Installation von MANTA Automated Data Lineage mit einem Lizenzschlüssel. Unterstützung für eine Teilmenge von Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. |
Verbesserte Anreicherung durch generative KI | Verfügbar. | Nicht verfügbar. Beginnen Sie in 5.0, installieren Sie stattdessen IBM Knowledge Catalog Premium oder IBM Knowledge Catalog Standard. |
Datenqualitätsregeln in Projekten | Verfügbar Erfordert den Service DataStage . |
Verfügbar. Erfordert den DataStage -Service. |
Mehrere Assets zu einem Katalog mit einer Datei hinzufügen | Nicht verfügbar. | Verfügbar. |
Assetaktivitäten | Erfordert einen kostenpflichtigen Plan. Verfügbar in Projekten und Katalogen. |
Verfügbar in Projekten und Katalogen. |
Geschäftsabstammung | Nicht verfügbar | Verfügbar. |
Abstammung technischer Daten | Nicht verfügbar. | Verfügbar. Erfordert, dass eine lizenzierte Version von MANTA Automated Data Lineage for IBM Cloud Pak for Data installiert ist. Generiert durch Ausführen des Metadatenimporttools. Zugriff über Kataloge möglich. |
Datenabstammung | Erfordert die Freigabe. | Nicht verfügbar. |
Geschäftsbedingungen | Grenzwerte für manche Pläne. | Verfügbar. |
Vordefinierte Geschäftsbegriffe | Vordefinierte Geschäftsbegriffe und die Kategorie "Knowledge Accelerator Sample Personal Data", die sie enthält, sind nur verfügbar, wenn Sie eine IBM Knowledge Catalog Service-Instanz mit einem Lite- oder Standard-Plan nach dem 7. Oktober 2022 erstellen. | Nicht verfügbar. |
Referenzdatasets | Obergrenzen pro Plan. | Verfügbar. |
Angepasste Beziehungen für Artefakte | Erfordert einen kostenpflichtigen Plan. | Verfügbar. |
Knowledge Accelerators | Erfordert einen Enterprise-Plan von Resource Hub. |
Wird mit der Plattform geliefert. |
Angepasste Workflow-Konfigurationen für Governance-Artefakte und -Anforderungen | Verfügbar für Governance-Artefakte. | Verfügbar. |
Rollen für angepasste Kategorien | Obergrenzen pro Plan. | Verfügbar. |
Datenschutzbestimmungen für die Ausfuhr und Einfuhr | Um Datenschutzregeln aus einem beliebigen System zu exportieren und die Regeln in dasselbe oder ein anderes System zu importieren, können Sie APIs verwenden. Einzelheiten finden Sie unter Migration von Datenschutzregeln. | Um Datenschutzregeln aus einem beliebigen System zu exportieren und die Regeln in dasselbe oder ein anderes System zu importieren, können Sie entweder APIs oder cpd-cli-Befehle verwenden. Einzelheiten finden Sie unter Migration von Datenschutzregeln. |
Verwaltungsberichte | Erfordert einen kostenpflichtigen Plan. | Verfügbar. |
Daten von InfoSphere Information Server migrieren | Nicht verfügbar. | Verfügbar. |
Beziehungsexplorer | Nicht verfügbar. | Ab 5.0verfügbar. Erfordert die Installation der optionalen Knowledge-Graph-Komponente mit IBM Knowledge Catalog. |
DataStage
Die folgende Tabelle beschreibt die Funktionsunterschiede zwischen DataStage on Cloud Pak for Data as a Service und DataStage on Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8.
Funktion | Als Service | Software |
---|---|---|
PX-Instanzverwaltung | Sie können Instanzen aus einer Gruppe mit vordefinierten Größen bereitstellen. | Die Cloud Pak for Data-Instanzverwaltung ermöglicht eine flexiblere Bereitstellung von Instanzen. |
Jobkompilierung |
|
|
Joblaufzeit | Sie können so viele Jobs übergeben, wie Sie möchten, abhängig von der Warteschlangensteuerung. |
|
Assetverwaltung | Für die Dateitypen .xls, .xlsx, .xml und .json werden nur einfache Strukturen unterstützt. Mehrere Ebenen/verschachtelte Schemata können nicht syntaktisch analysiert werden. | Für die Dateitypen .csv, .txt, .xls, .xlsx, .xml und .json ist vollständige Unterstützung verfügbar. |
Speicher |
|
|
Stage 'Java Integration' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Java-Bibliothekskomponente | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Generische JDBC-Verbindung | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Excel | Verfügbar mit DataStage-aaS Überall | Verfügbar |
AVI | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Stage 'External Source' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Stage 'External Target' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Hierarchische Stage |
|
Verfügbar |
SMP | S, M, L sind Einzelknoten (SMP-Konfiguration). Verwenden Sie eine ferne Laufzeitengine, um eine alternative Konfiguration einzurichten. | Parallele Arbeitslasten werden über logische Partitionen verwaltet, die mit der Option APT_CONFIG_FILE konfiguriert sind. |
Verbindung SAP Bulk Extract | Nicht verfügbar | Verfügbar |
Verbindung SAP Delta Extract | Nicht verfügbar | Verfügbar |
Wrap-Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
SAP HANA-Verbindung | Nicht verfügbar | Verfügbar |
Textdatenquelle in ODBC -Verbindung | Nicht verfügbar | Verfügbar |
Build-Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Berichte mithilfe von Subroutinen vor/nach dem Job senden | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Angepasste Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Apache HBase -Verbindung | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Kerberos -Authentifizierung für Apache Hive -Verbindungen | Nicht verfügbar | Verfügbar |
Benutzerdefinierte Funktionen | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Vom Benutzer erstellte APT_CONFIG_FILEs | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Vor-/Nachher-Job-Eigenschaften | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Datenservice-Connector | Nicht verfügbar | Verfügbar |
Db2 -Datenbanksequenz in Stage 'Slowly Changing Dimension', Stage 'Surrogate Key Generator' und Stage 'Transformer' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Verwenden Sie die Apache Hive -Verbindung als Ziel. (Verfügbar, wenn DataStage -Eigenschaften verwenden im Connector aktiviert ist.) | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Eigenschaften mit lokalen Verbindungen parametrisieren | Nicht verfügbar | Verfügbar |
Stufe Operational Decision Manager | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Einsatzbereiche | Nicht verfügbar | Verfügbar |
Data Virtualization
Auf Cloud Pak for Data as a Service wird die Datenvirtualisierungsfunktionalität durch den Data Virtualization bereitgestellt. Die folgenden Funktionen zur Datenvirtualisierung sind bei Cloud Pak for Data as a Service und Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8, praktisch identisch.
- Verbindung zu unterstützten Datenquellen herstellen
- Daten virtualisieren
- Virtuelle Daten durch Richtlinien und Datenschutzregeln regulieren
- Überwachung und Erkundung des Service
- SQL-Schnittstelle verwenden
- Zwischenspeichern
- Spaltenmaskierung
- Ansicht und erneutes Laden von Tabellen untersuchen
- Datenstichproben bei der Statistikerfassung
- Metadatenanreicherung
Die folgenden Funktionen für Datenvirtualisierung sind in der Benutzerschnittstelle anscheinend nicht identisch, bieten jedoch dieselbe Basisfunktionalität:
- Virtuelle Daten in Katalogen veröffentlichen
- Zugriff auf virtuelle Objekte verwalten
- Benutzer und Rollen verwalten
- Service skalieren
- Sammeln von Statistiken im Web-Client in der Data Virtualization
Diese Tabelle beschreibt die Funktionsunterschiede zwischen Data Virtualization (ehemals Watson Query) auf Cloud Pak for Data as a Service und Data Virtualization (ehemals Watson Query) auf Cloud Pak for Data Software.
Funktion | Als Service | Software |
---|---|---|
Verwenden Sie die Cloud Pak for Data -Datenquellendefinitionen (DSD), um Datenschutzregeln für IBM Knowledge Catalog durchzusetzen. | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Daten in REST-API-Datenquellen abfragen | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Abfragetabellen aus früheren Presto -und Databricks-Katalogen mit Unterstützung mehrerer Kataloge | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Serviceinstanzen automatisch skalieren | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Mehrbytezeichen für erweiterten Datenschutz sensibler Daten maskieren | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Datenschutzregeln anzeigen, die auf einen Benutzer angewendet werden | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Erweiterte Sicherheit für Profilermittlungsergebnisse in Data Virtualization -Ansichten | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Erweiterte Sicherheit für die Verwaltungsrolle: Die Verwaltungsrolle hat keinen Standardzugriff auf alle Daten. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
IBM Knowledge Catalog -Datenschutzregeln sind immer für Watson Query -Daten aktiviert | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Schützen Sie Ihre nicht regulierten Objekte: Mit den IBM Knowledge Catalog -Datenschutzregeln in Watson Queryentsprechen virtualisierte Objekte, die nicht in einem regulierten Katalog veröffentlicht sind, der Standarddatenzugriffskonventionen aus Ihren Regeleinstellungen. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Presto -Daten abfragen: Sie können eine Verbindung zu Presto herstellen, um auf Daten in Prestozuzugreifen und diese abzufragen. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Prüfprotokollierung zur Überwachung der Benutzeraktivität und des Datenzugriffs | Verfügbar | Verfügbar |
Integration mit IBM Knowledge Catalog | Erforderlich | Optionale |
Gruppenbasierte Berechtigung und Zugriff auf Objektebene für Gruppen | Nicht verfügbar | Verfügbar |
Unterstützung für ferne Connectors | Nicht zutreffend für SaaS | Verfügbar |
Unterstützung für dateisystembasierte Datenquellen, außer in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Verbindung zu Datenquellen herstellen, für die ein hochgeladener JDBC -Treiber erforderlich ist, z. B. SAP HANA, generisches JDBC | Nicht zutreffend für SaaS | Verfügbar |
Statistikdaten in der Benutzerschnittstelle erfassen | Nicht verfügbar | Verfügbar |
Automatische Statistikerfassung während Objektvirtualisierung | Nicht verfügbar | Verfügbar |
Zugriffsmanagement für mehrere Gruppen | Nicht verfügbar | Verfügbar |
Unterstützung für CSV-oder TSV-Dateien in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Berechtigungsnachweise in Vaults für Verbindungen in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Autocaching von Abfragen | Nicht verfügbar | Verfügbar ab 5.0.3 |
Weitere Informationen
- Services für Cloud Pak for Data as a Service
- Dienstleistungen für IBM Software Hub 5.1
- Optionen für die Cloud-Bereitstellungsumgebung für https://www.ibm.com/docs/SSNFH6_5.1.x 5.1
Übergeordnetes Thema: Cloud Pak for Data as a Service