Funktionsunterschiede zwischenCloud Pak for Data Implementierungen
Cloud Pak for Data as a Service und Cloud Pak for Data weisen einige Unterschiede bei den Features und der Implementierung auf. Cloud Pak for Data as a Service ist ein Set von IBM Cloud-Services. Cloud Pak for Data 5.0 wird als Software angeboten, die Sie installieren und pflegen müssen. Services, die in beiden Bereitstellungen verfügbar sind, haben auch Unterschiede in den Features von Cloud Pak for Data as a Service im Vergleich zu Cloud Pak for Data 5.0, 4.8und 4.7.
- Plattformunterschiede
- Allgemeine serviceübergreifende Funktionen
- Watson Studio
- Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Watson OpenScale
- Watson Query
Plattformunterschiede
Cloud Pak for Data as a Service und die Software Cloud Pak for Data nutzen eine gemeinsame Codebasis, unterscheiden sich jedoch in den folgenden Schlüsselmöglichkeiten:
Features | Als Service | Software |
---|---|---|
Software, Hardware und Installation | Cloud Pak for Data as a Service wird vollständig von IBM in IBM Cloud verwaltet. Softwareaktualisierungen werden automatisch durchgeführt. Die Skalierung von Rechenressourcen und Speicher erfolgt automatisch. Sie melden sich an unter https://dataplatform.cloud.ibm.com. | Die Hardware wird von Ihnen bereitgestellt und gewartet. Sie installieren, verwalten und aktualisieren die Software. Siehe Softwareanforderungen. |
Speicher | Sie stellen eine IBM Cloud Object Storage-Serviceinstanz zur Verfügung, um Speicher bereitzustellen. Siehe IBM Cloud Object Storage. | Sie stellen persistenten Speicher in einem Red Hat OpenShift -Cluster bereit. Siehe Speicheranforderungen. |
Rechenressourcen zum Ausführen von Workloads | Benutzer wählen die geeignete Laufzeit für ihre Jobs aus. Die Nutzung von Rechenressourcen wird nach dem geltenden Tarif für die Laufzeitumgebung und nach der Dauer des Jobs abgerechnet. Siehe Kontoressourcennutzung überwachen. | Sie definieren die Anzahl der Red Hat OpenShift -Knoten mit der entsprechenden Anzahl von vCPUs. Siehe Hardwareanforderungen und Überwachung der Plattform. |
Kosten | Sie erwerben jeden Service, den Sie benötigen, unter dem entsprechenden Preisstrukturplan. Bei vielen Services werden die genutzten Rechenressourcen in Rechnung gestellt. Sehen Sie sich die einzelnen Service-Seiten im IBM Cloud-Katalog oder im Service-Katalog auf Cloud Pak for Data as a Service an, indem Sie Services > Service-Katalog aus dem Navigationsmenü auswählen. | Sie kaufen eine Softwarelizenz basierend auf den Services, die Sie benötigen. Die Lizenz für Cloud Pak for Data Enterprise Edition enthält beispielsweise eine Berechtigung für Services wie Watson Studio oder IBM Knowledge Catalog. Siehe Cloud Pak for Data. |
Sicherheit, Compliance und Isolation | Datensicherheit, Netzsicherheit, Einhaltung von Sicherheitsstandards und Isolation für Cloud Pak for Data as a Service werden von IBM Cloud verwaltet. Sie können zusätzliche Sicherheits- und Verschlüsselungsoptionen einrichten. Weitere Informationen finden Sie in Sicherheit für Cloud Pak for Data as a Service. | Red Hat OpenShift Container Platform bietet grundlegende Sicherheitsfunktionen. Cloud Pak for Data wird auf die Einhaltung verschiedener Datenschutz- und Konformitätsbestimmungen überprüft und bietet Funktionen, die Sie als Vorbereitung für verschiedene Datenschutz- und Konformitätsbewertungen verwenden können. Sie sind für zusätzliche Sicherheitsfunktionen, Verschlüsselung und Netzisolation verantwortlich. Siehe Sicherheitsüberlegungen. |
Verfügbare Services | Die meisten Data Fabric-Services sind in beiden Bereitstellungsumgebungen verfügbar. Weitere Informationen finden Sie in Services für Cloud Pak for Data as a Service. |
Enthält viele weitere Services. Siehe Services for Cloud Pak for Data 5.0. |
Benutzermanagement | Sie fügen Benutzer und Benutzergruppen hinzu und verwalten die zugehörigen Kontorollen und -berechtigungen mit IBM Cloud Identity and Access Management. Weitere Informationen finden Sie unter Benutzer zum Konto hinzufügen. Sie können außerdem SAML-Föderation in IBM Cloud konfigurieren. Siehe IBM Cloud docs: Wie IBM Cloud IAM funktioniert. |
Über das Menü Verwaltung können Sie Benutzer hinzufügen und Benutzergruppen erstellen. Sie können den Service 'Identity and Access Management' oder Ihren vorhandenen SAML-SSO- oder LDAP-Provider verwenden, um Identitäten und Kennwörter zu verwalten. Sie können dynamische, attributbasierte Benutzergruppen erstellen. Siehe Benutzerverwaltung. |
Allgemeine Serviceübergreifende Kernfunktionalität
Die folgende Kernfunktionalität, die mit der Plattform bereitgestellt wird, ist für Services in Cloud Pak for Data as a Service, Software Cloud Pak for Data , Version 5.0, 4.8und 4.7:
- Plattformweite globale Suche nach Assets und Artefakten
- Der Katalog der Plattformassets für die plattformweite gemeinsame Nutzung von Verbindungen
- Plattformweite rollenbasierte Benutzerverwaltung in Arbeitsbereichen mit Collaboration.
- Gemeinsame Infrastruktur für Assets und Arbeitsbereiche
- Servicekatalog zum Hinzufügen von Services
- Rechenressourcennutzung über das Menü Verwaltung anzeigen
In der folgenden Tabelle werden Unterschiede in der Kernfunktionalität zwischen Services zwischen Cloud Pak for Data as a Service und den Cloud Pak for Data -Softwareversionen 5.0, 4.8und 4.7beschrieben.
Funktion | Als Service | Software |
---|---|---|
Alle Projekte verwalten | Benutzer mit der Berechtigung Projekte verwalten aus dem IAM Service Access Manager für den IBM Cloud Pak for Data Service können jedem Projekt mit der Rolle Admin beitreten und das Projekt dann verwalten oder löschen. | Benutzer mit der Berechtigung Projekte verwalten können an jedem Projekt mit der Rolle Administrator teilnehmen und dann das Projekt verwalten bzw. löschen. |
Verbindungen zu fernen Datenquellen | Die meisten unterstützten Datenquellen werden für beide Bereitstellungsumgebungen verwendet (siehe Unterstützte Verbindungen). |
Siehe Unterstützte Datenquellen. |
Persönliche oder gemeinsam genutzte Berechtigungsnachweise für Verbindunngen | Für Verbindungen in Projekten und Katalogen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Kontoebene inaktiviert werden. | Plattformverbindungen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Plattformebene inaktiviert werden. |
Verbindungsberechtigungsnachweise aus geheimen Schlüsseln in einer Vault | Nicht verfügbar | Verfügbar |
Kerberos-Authentifizierung | Nicht verfügbar | Verfügbar für einige Dienste und Verbindungen |
Beispielassets und Projekte aus der App "Ressourcenhub" | Verfügbar | Nicht verfügbar |
Angepasster JDBC-Connector | Nicht verfügbar | Verfügbar ab 4.8.0 |
Datenquellendefinitionen | Nicht verfügbar | Ab 5.0verfügbar. Siehe Datenschutz mit Datenquellendefinitionen. |
Watson Studio
Die folgenden Watson Studio -Features sind in Cloud Pak for Data as a Service und Cloud Pak for Data -Software mit den Versionen 5.0, 4.8und 4.7:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Programmgesteuert auf Projektassets zugreifen
- Projektimport und -export mithilfe einer ZIP-Projektdatei
- Jupyter-Notebooks
- Jobplanung
- Data Refinery
- Watson Natural Language Processing für Python
In dieser Tabelle werden die Funktionsunterschiede zwischen dem Watson Studio -Service in den As-a-Service-und Softwareimplementierungsumgebungen, Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen in Cloud Pak for Data as a Service finden Sie unter Watson Studio-Angebotspläne.
Funktion | Als Service | Software |
---|---|---|
Projekt erstellen | Erstellen: Ein leeres Projekt Ein Projekt aus einem Beispiel im Ressourcenhub Ein Projekt aus einer Datei |
Erstellen: Ein leeres Projekt Ein Projekt aus Datei Ein Projekt mit Git -Integration |
Git-Integration | Notebooks auf GitHub veröffentlichen Notebooks als Gist veröffentlichen |
Ein Projekt mit Git integrieren, Assets mit Repository in einem Projekt synchronisieren und diese Assets in einem anderen Projekt verwenden |
Projektterminal für erweiterte Git-Operationen | Nicht verfügbar | Verfügbar in Projekten mit standardmäßiger Git-Integration |
Assets in Projekten mit Ordnern organisieren | Nicht verfügbar | Verfügbar ab 4.8.0 |
JupyterLab | Nicht verfügbar | Verfügbar in Projekten mit Git-Integration |
Visual Studio Code -Integration | Nicht verfügbar | Verfügbar in Projekten mit Git-Integration |
RStudio | Kann nicht in Git integriert werden | Kann in Git integriert werden Erfordert einen RStudio Server Runtimes -Service. |
Python-Scripts | Nicht verfügbar | Mit Python-Scripts in JupyterLab arbeiten Erfordert einen Watson Studio -Laufzeitservice. |
Code zum Laden von Daten in ein Notebook mithilfe des Flight service generieren | Nicht verfügbar | Verfügbar |
Notebook-Lebenszyklus verwalten | Nicht verfügbar | CPDCTL für das Lebenszyklusmanagement von Notebooks verwenden |
Codepaketassets (Gruppe abhängiger Dateien in einer Ordnerstruktur) | Nicht verfügbar | CPDCTL zum Erstellen von Codepaketassets in einem Bereitstellungsbereich verwenden |
Notebooks in Bereiche hochstufen | Nicht verfügbar | Manuell auf der Seite 'Assets' des Projekts oder programmgesteuert über CPDCTL verfügbar |
Python mit GPU | Unterstützung nur für einen einzelnen GPU-Typ verfügbar | Unterstützung für mehrere Nvidia-GPU-Typen verfügbar Erfordert einen Watson Studio -Laufzeitservice. |
Angepasste Images erstellen und verwenden | Nicht verfügbar | Erstellen Sie angepasste Images für Python (mit und ohne GPU), R, JupyterLab (mit und ohne GPU), RStudio und SPSS -Umgebungen. Erfordert Watson Studio Runtimes und andere anwendbare Services. |
Anaconda Repository | Nicht verfügbar | Zum Erstellen angepasster Umgebungen und angepasste Images verwenden |
Hadoop-Integration | Nicht verfügbar | Modelle erstellen und trainieren und Data Refinery-Abläufe in einem Hadoop-Cluster ausführen. Erfordert den Service 'Execution Engine for Apache Hadoop'. |
Decision Optimization | Verfügbar | Erfordert den Service Decision Optimization. |
SPSS Modeler | Verfügbar | Setzt den SPSS Modeler-Service voraus. |
Orchestrierungspipelines | Verfügbar | Erfordert den Orchestrierungsservice für Pipelines. |
Watson Machine Learning
Die folgenden Watson Machine Learning -Features sind in Cloud Pak for Data as a Service und der Cloud Pak for Data -Software mit den Versionen 5.0, 4.8und 4.7:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Modelle bereitstellen
- Funktionsbereitstellung
- REST-APIs von Watson Machine Learning
- Python-Client von Watson Machine Learning
- Onlinebereitstellungen erstellen
- Bereitstellungen skalieren und aktualisieren
- Angepasste Komponenten definieren und verwenden
- Federated Learning zum Trainieren eines allgemeinen Modells mit separaten und sicheren Datenquellen verwenden
- Bereitstellungen bereichsübergreifend überwachen
- Aktualisierte Formulare zum Testen der Online-Implementierung
- Verschachtelte Pipelines verwenden
- AutoAI -Datenimputation
- AutoAI -Fairnessbewertung
- AutoAI -Zeitreihenunterstützungsfunktionen
In dieser Tabelle werden die Unterschiede in den Features des Service Watson Machine Learning in den As-a-Service-und Softwareimplementierungsumgebungen, die Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Details zu den Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Service finden Sie unter Watson Machine Learning-Angebotspläne.
Funktion | Als Service | Software |
---|---|---|
AutoAI -Trainingseingabe | Aktuelle unterstützte Datenquellen | Unterstützte Datenquellen ändern sich nach Release |
Rechenkonfiguration für AutoAI -Experimente | Verschiedene Größen verfügbar | Verschiedene Größen verfügbar |
AutoAI begrenzt die Datenmenge und die Anzahl der Vorhersageziele |
Grenzwerte festlegen | Grenzwerte unterscheiden sich je nach Berechnungskonfiguration |
AutoAI Inkrementelles Lernen | Nicht verfügbar | Verfügbar |
Bereitstellung unter Verwendung gängiger Frameworks und Softwarespezifikationen |
Auf neueste unterstützte Versionen prüfen | Unterstützte Versionen variieren je nach Release |
Verbindung zu Datenbanken für Batchbereitstellungen herstellen | Auf Unterstützung nach Bereitstellungstyp prüfen | Auf Unterstützung nach Bereitstellungstyp und nach Version prüfen |
Python -Scripts bereitstellen und bewerten | Verfügbar über Python-Client | Scripts im JupyterLab -oder Python -Client erstellen und anschließend bereitstellen |
R-Scripts für Bereitstellung und Stapelscoring | Nicht verfügbar | Verfügbar |
Shiny-Apps bereitstellen | Nicht verfügbar | Shiny-Apps erstellen und bereitstellen Bereitstellung aus Codepaket |
Jobs auf Fairness oder Drift bewerten | Erfordert den Service watsonx.governance | Erfordert den Service Watson OpenScale oder watsonx.governance |
Bewerten Sie Onlinebereitstellungen in einem Bereich auf Fairness, Drift oder Erklärbarkeit. |
Nicht verfügbar | Verfügbar ab 4.7 Erfordert den Service Watson OpenScale oder watsonx.governance |
Implementierte Eingabeaufforderungsvorlagen in einem Space auswerten | Verfügbar | |
Vorlagen für freigegebene Eingabeaufforderungen in einem Space auswerten | Nicht verfügbar | Verfügbar ab 5.0 |
Erstellung des Steuerbereichs | Keine Einschränkungen nach Rolle | Durch Berechtigungen steuern, wer Bereiche anzeigen und erstellen kann |
Aus GIT-Projekt in Bereich importieren | Nicht verfügbar | Verfügbar |
Codepaket, das automatisch erstellt wird, wenn aus einem Git -Projekt in den Speicherbereich importiert wird. |
Nicht verfügbar | Verfügbar |
RShiny-App aus Codepaket aktualisieren | Nicht verfügbar | Verfügbar |
Modelldetails in einem Modellbestand überwachen | Registrieren Sie Modelle, um Factsheets mit Lebenszyklusdetails anzuzeigen. Erfordert den Service IBM Knowledge Catalog . | Verfügbar Erfordert die AI Factsheets oder den Service watsonx.governance . |
Angepasste Images erstellen und verwenden | Nicht verfügbar | Angepasste Images für Python oder SPSS erstellen |
Mitbearbeiter über Pipeline-Ereignisse benachrichtigen | Nicht verfügbar | Verwenden Sie "E-Mail senden", um Mitarbeiter zu benachrichtigen. |
Deep-Learning-Experimente | Nicht verfügbar | Erfordert den Service Watson Machine Learning Accelerator |
IBM Cloud-Serviceinstanzen bereitstellen und verwalten | Instanzen für Watson Machine Learning oder Watson OpenScale hinzufügen |
Services werden im Cluster vom Administrator bereitgestellt |
watsonx.governance
Funktion | Als Service | Software |
---|---|---|
Bewertung von Modellen des maschinellen Lernens | Ja | Ja |
Prompt-Vorlagen auswerten | Erfordert nur watsonx Dallas |
Ja |
Integration mit der Governance-Konsole | Manuelle Integration Erfordert IBM OpenPages |
Ja |
Integration mit AWS (Amazon SageMaker) | Manuelle Integration Erfordert IBM OpenPages |
Ja |
Speichern von AI-Anwendungsfällen im IBM Knowledge Catalog | Cloud Pak for Data as a Service nur | Nicht verfügbar |
Speichern von AI-Anwendungsfällen im Plattformzugangskatalog | watsonx | Ja |
IBM Knowledge Catalog
Die folgenden Funktionen sind für IBM Knowledge Catalog on Cloud Pak for Data as a Service und auf Cloud Pak for Data Software, Versionen 5.0, 4.8 und 4.7: gleich
- Zusammenarbeit in Projekten und Katalogen
- KI-gestützte Suche und Empfehlungen in Katalogen
- Assets in Katalogen bewerten und prüfen
- Data Refinery-Tool in Projekten
- Kategorien mit Mitbearbeiterrollen
- Vordefinierte und angepasste Klassifikationen
- Vordefinierte und angepasste Datenklassen
- Governance-Regeln
- Richtlinien
- Datenschutzregeln
- Manuelle Profilerstellung für einzelne relationale Datenassets in einem Projekt oder Katalog
- Automatische Profilerstellung für relationale Datenassets, die zu einem regulierten Katalog hinzugefügt wurden
- Angepasste Assettypen, angepasste Eigenschaften für Assets und angepasste Beziehungen zwischen Assets in Katalogen
- Workflow-Tasks überwachen
- Maskierte Datasets in Projekten mit Maskierungsabläufen bereitstellen
In dieser Tabelle werden die Unterschiede zwischen den Features des Service IBM Knowledge Catalog in den As-a-Service-und Softwareimplementierungsumgebungen, die Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Servicefinden Sie unter Angebotspläne fürIBM Knowledge Catalog.
Ab Cloud Pak for Data Version 5.0 können Sie die IBM Knowledge Catalog Premium Cartridge oder die IBM Knowledge Catalog Standard Cartridge anstelle des IBM Knowledge Catalog Service installieren. IBM Knowledge Catalog Premium bietet die gleichen Funktionen wie der IBM Knowledge Catalog Service plus semantische und generative KI-Funktionen. IBM Knowledge Catalog Standard bietet eine Teilmenge der IBM Knowledge Catalog-Funktionen sowie semantische und generative AI-Funktionen.
Funktion | Als Service | Software |
---|---|---|
Tool Metadata import in Projekten-Erkennung | Importieren Sie Datenassets in Projekte oder Kataloge. Unterstützung für eine Untergruppe mit Projekt- und Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. | Verschiedene Assettypen importieren: Importieren Sie Datenassets in Projekte oder Kataloge. Die meisten unterstützten Verbindungen sind in beiden Implementierungsumgebungen identisch. Business-Intelligence-Berichte, Assets mit den zugehörigen Transformationsscripts, ETL-Jobs oder Datenmodellen in Kataloge importieren. Erfordert die Installation von MANTA Automated Data Lineage ohne Lizenzschlüssel. Unterstützung für eine Teilmenge von Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. |
Tool Metadata import in 'projects-lineage' | Nicht verfügbar. | Importieren Sie die Herkunft von Datenassets in Kataloge. Erfassung und Zugriffsabstammung von ETL-Jobs in MANTA Automated Data Lineage (ab 4.7) Erfordert die Installation von MANTA Automated Data Lineage mit einem Lizenzschlüssel. Unterstützung für eine Untergruppe von Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. |
Traditionelle Benutzerschnittstellentools | Nicht verfügbar. Verwenden Sie stattdessen Tools in Projekten. | Ab 4.7nicht mehr verfügbar. Verwenden Sie stattdessen Tools in Projekten. |
Metadatenanreicherungstool in Projekten | Führen Sie Profilermittlung, Begriffszuordnung, Qualitätsanalyse und Schlüssel-oder Beziehungsanalyse für große Gruppen von Datenassets durch. | Verfügbar. |
Erweiterte Aufbereitung mithilfe semantischer Funktionen und generativer KI | Verfügbar. | Nicht verfügbar. Beginnen Sie in 5.0, installieren Sie stattdessen IBM Knowledge Catalog Premium oder IBM Knowledge Catalog Standard. |
Datenqualitätsscores | Datenqualitätsscores werden angezeigt in: Datenqualitätsinformationen für Assets in Projekten und Katalogen Ergebnisse der Metadatenaufbereitung |
Datenqualitätsscores werden angezeigt in: Datenqualitätsinformationen für Assets in Projekten und Katalogen Ergebnisse der Metadatenaufbereitung Assetprofile in Projekten und Katalogen. In 4.7 und höher nicht verfügbar. Ergebnisse der Schnellsuche mit der traditionellen Benutzerschnittstelle. In 4.7 und höher nicht verfügbar. Datenqualitätsprojekte mit der traditionellen Benutzerschnittstelle. Nicht verfügbar ab 4.7 . |
Detaillierte Informationen zur Datenqualität | Seite Datenqualität in Projekten und Katalogen sowie als Teil der Ergebnisse der Metadatenaufbereitung | Verfügbar ab 4.7. |
Datenqualitätsregeln in Projekten | Verfügbar Erfordert den Service DataStage . |
Verfügbar. Erfordert den DataStage -Service. |
SLA-Regeln für Datenqualität | Nicht verfügbar. | Überwachen Sie die Datenqualität und melden Sie Verstöße. SLA-Konformitätsberichte werden auf der Seite Datenqualität eines Datenassets in Projekten angezeigt. Ab 4.7.3. |
Korrekturworkflows für Datenqualitätsprobleme | Nicht verfügbar. | Verfügbar ab 4.7.3. |
Mehrere Assets zu einem Katalog mit einer Datei hinzufügen | Nicht verfügbar. | Verfügbar ab 4.7.3. |
Assetaktivitäten | Erfordert einen kostenpflichtigen Plan. Verfügbar in Projekten und Katalogen. |
Verfügbar in Projekten und Katalogen. |
Datenabstammung | Nicht verfügbar | Verfügbar. |
Abstammung technischer Daten | Nicht verfügbar | Verfügbar Erfordert die Installation einer lizenzierten Version von MANTA Automated Data Lineage for IBM Cloud Pak for Data . Generiert durch Ausführen des Metadatenimporttools. Zugriff über Kataloge möglich. |
Geschäftsbedingungen | Grenzwerte für manche Pläne. | Verfügbar. |
Vordefinierte Geschäftsbegriffe | Vordefinierte Geschäftsbegriffe und die Kategorie 'Persönliche Beispieldaten' von Knowledge Accelerator sind nur verfügbar, wenn Sie nach dem 7. Oktober 2022 eine IBM Knowledge Catalog -Serviceinstanz mit einem Lite-oder Standard-Plan erstellen. | Nicht verfügbar. |
Referenzdatasets | Grenzwerte pro Plan. | Verfügbar. |
Angepasste Beziehungen für Artefakte | Erfordert einen kostenpflichtigen Plan. | Verfügbar |
Knowledge Accelerators | Erfordert einen Enterprise-Plan. Von Ressourcenhub herunterladen. |
Wird mit der Plattform bereitgestellt. |
Angepasste Workflow-Konfigurationen für Governance-Artefakte und -Anforderungen | Verfügbar für Governance-Artefakte. | Verfügbar. |
Rollen für angepasste Kategorien | Grenzwerte pro Plan. | Verfügbar. |
Datenschutzregeln exportieren und importieren | Sie können APIs verwenden, um Datenschutzregeln aus einem beliebigen System zu exportieren und die Regeln in dasselbe oder ein anderes System zu importieren. Details finden Sie unter Datenschutzregeln migrieren. | Zum Exportieren von Datenschutzregeln aus einem beliebigen System und zum Importieren der Regeln in dasselbe System oder ein anderes System können Sie entweder APIs oder cpd-cli-Befehle verwenden. Details finden Sie unter Datenschutzregeln migrieren. |
Verwaltungsberichte | Erfordert einen kostenpflichtigen Plan. | Verfügbar. |
Daten von InfoSphere Information Server migrieren | Nicht verfügbar. | Verfügbar ab 4.8. |
Beziehungsexplorer | Nicht verfügbar. | Ab 5.0verfügbar. Erfordert die Installation der optionalen Knowledge-Graph-Komponente mit Cloud Pak for Data oder IBM Knowledge Catalog Premium Cartridge. |
DataStage
In der folgenden Tabelle werden die Unterschiede in den Features der Software DataStage on Cloud Pak for Data as a Service und DataStage on Cloud Pak for Data Version 5.0, 4.8und 4.7beschrieben.
Funktion | Als Service | Software |
---|---|---|
PX-Instanzverwaltung | Sie können Instanzen aus einer Gruppe mit vordefinierten Größen bereitstellen. | Die Cloud Pak for Data-Instanzverwaltung ermöglicht eine flexiblere Bereitstellung von Instanzen. |
Jobkompilierung |
|
|
Joblaufzeit | Sie können so viele Jobs übergeben, wie Sie möchten, abhängig von der Warteschlangensteuerung. |
|
Assetverwaltung | Für die Dateitypen .xls, .xlsx, .xml und .json werden nur einfache Strukturen unterstützt. Mehrere Ebenen/verschachtelte Schemata können nicht syntaktisch analysiert werden. | Für die Dateitypen .csv, .txt, .xls, .xlsx, .xml und .json ist vollständige Unterstützung verfügbar. |
Speicher |
|
|
Stage 'Java Integration' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Java-Bibliothekskomponente | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Generische JDBC-Verbindung | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Excel | Verfügbar mit DataStage-aaS Überall | Verfügbar |
AVI | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Stage 'External Source' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Stage 'External Target' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Hierarchische Stage |
|
Verfügbar |
SMP | S, M, L sind Einzelknoten (SMP-Konfiguration). Verwenden Sie eine ferne Laufzeitengine, um eine alternative Konfiguration einzurichten. | Parallele Arbeitslasten werden über logische Partitionen verwaltet, die mit der Option APT_CONFIG_FILE konfiguriert sind. |
Verbindung SAP Bulk Extract | Nicht verfügbar | Verfügbar |
Verbindung SAP Delta Extract | Nicht verfügbar | Verfügbar |
Wrap-Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
SAP HANA-Verbindung | Nicht verfügbar | Verfügbar |
Textdatenquelle in ODBC -Verbindung | Nicht verfügbar | Verfügbar |
Build-Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Berichte mithilfe von Subroutinen vor/nach dem Job senden | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Angepasste Stage | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Apache HBase -Verbindung | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Kerberos -Authentifizierung für Apache Hive -Verbindungen | Nicht verfügbar | Verfügbar |
Benutzerdefinierte Funktionen | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Vom Benutzer erstellte APT_CONFIG_FILEs | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Vor-/Nachher-Job-Eigenschaften | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Datenservice-Connector | Nicht verfügbar | Verfügbar |
Db2 -Datenbanksequenz in Stage 'Slowly Changing Dimension', Stage 'Surrogate Key Generator' und Stage 'Transformer' | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Verwenden Sie die Apache Hive -Verbindung als Ziel. (Verfügbar, wenn DataStage -Eigenschaften verwenden im Connector aktiviert ist.) | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Eigenschaften mit lokalen Verbindungen parametrisieren | Nicht verfügbar | Verfügbar |
Stufe Operational Decision Manager | Verfügbar mit DataStage-aaS Überall | Verfügbar |
Einsatzbereiche | Nicht verfügbar | Verfügbar ab 4.7.0 |
watsonx.governance
Die folgenden watsonx.governance -Features sind in Cloud Pak for Data as a Service und Cloud Pak for Data -Software, Versionen 5.0, 4.8und 4.7:
- Fairness von Bereitstellungen bewerten
- Qualität von Bereitstellungen bewerten
- Drift von Bereitstellungen überwachen
- Modellergebnisse in einem Insights-Dashboard anzeigen und vergleichen
- Fügen Sie Bereitstellungen vom Machine Learning-Provider Ihrer Wahl hinzu.
- Alerts festlegen, die ausgelöst werden, wenn Auswertungen einen angegebenen Schwellenwert unterschreiten
- Implementierungen in einer Benutzerschnittstelle oder einem Notebook auswerten
- Angepasste Bewertungen und Metriken
- Details zu Bewertungen in Modelldatenblättern anzeigen
In dieser Tabelle werden die Unterschiede bei den Features des Watson OpenScale -Service in den As-a-Service-und Softwareimplementierungsumgebungen, die Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben.
Funktion | Als Service | Software |
---|---|---|
Vorab bewertete Testdaten hochladen | Nicht verfügbar | Verfügbar |
IBM SPSS Collaboration and Deployment Services | Nicht verfügbar | Verfügbar |
Batchverarbeitung | Nicht verfügbar | Verfügbar |
Zugriffssteuerung nach Benutzergruppen unterstützen | Nicht verfügbar | Verfügbar |
Kostenlose Datenbank und Postgres -Pläne | Verfügbar | Postgres verfügbar ab 4.8 |
Mehrere Instanzen einrichten | Nicht verfügbar | Verfügbar |
Integration mit OpenPages | Mit manueller Integration verfügbar | Verfügbar |
Bewertung von Basismodellassets | Nicht verfügbar | Verfügbar |
Watson Query
In Cloud Pak for Data as a Service wird die Funktion für Datenvirtualisierung vom Watson Query-Service bereitgestellt. Die folgende Datenvirtualisierungsfunktionalität ist in Cloud Pak for Data as a Service und Cloud Pak for Data 5.0, 4.8und 4.7effektiv identisch.
- Verbindung zu unterstützten Datenquellen herstellen
- Daten virtualisieren
- Virtuelle Daten durch Richtlinien und Datenschutzregeln regulieren
- Überwachung und Erkundung des Service
- SQL-Schnittstelle verwenden
- Zwischenspeichern
- Spaltenmaskierung
- Ansicht und erneutes Laden von Tabellen untersuchen
- Datenstichproben bei der Statistikerfassung
- Metadatenanreicherung
Die folgenden Funktionen für Datenvirtualisierung sind in der Benutzerschnittstelle anscheinend nicht identisch, bieten jedoch dieselbe Basisfunktionalität:
- Virtuelle Daten in Katalogen veröffentlichen
- Zugriff auf virtuelle Objekte verwalten
- Benutzer und Rollen verwalten
- Service skalieren
- Statistiken im Web-Client in Watson Queryerfassen
In dieser Tabelle werden die Unterschiede bei den Features zwischen Watson Query für Cloud Pak for Data as a Service und Data Virtualization (früher Watson Query) für Cloud Pak for Data beschrieben.
Funktion | Als Service | Software |
---|---|---|
Servicename | Watson Query | In Cloud Pak for Data 5.0heißt der Service jetzt Data Virtualization. |
Verwenden Sie die Cloud Pak for Data -Datenquellendefinitionen (DSD), um Datenschutzregeln für IBM Knowledge Catalog durchzusetzen. | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Daten in REST-API-Datenquellen abfragen | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Abfragetabellen aus früheren Presto -und Databricks-Katalogen mit Unterstützung mehrerer Kataloge | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Serviceinstanzen automatisch skalieren | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Mehrbytezeichen für erweiterten Datenschutz sensibler Daten maskieren | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Datenschutzregeln anzeigen, die auf einen Benutzer angewendet werden | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Erweiterte Sicherheit für Profilermittlungsergebnisse in Data Virtualization -Ansichten | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung | Nicht zutreffend für SaaS | Verfügbar ab 5.0 |
Erweiterte Sicherheit für die Verwaltungsrolle: Die Verwaltungsrolle hat keinen Standardzugriff auf alle Daten. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
IBM Knowledge Catalog -Datenschutzregeln sind immer für Watson Query -Daten aktiviert | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Schützen Sie Ihre nicht regulierten Objekte: Mit den IBM Knowledge Catalog -Datenschutzregeln in Watson Queryentsprechen virtualisierte Objekte, die nicht in einem regulierten Katalog veröffentlicht sind, der Standarddatenzugriffskonventionen aus Ihren Regeleinstellungen. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Presto -Daten abfragen: Sie können eine Verbindung zu Presto herstellen, um auf Daten in Prestozuzugreifen und diese abzufragen. | Nicht zutreffend für SaaS | Verfügbar ab 4.8 |
Prüfprotokollierung zur Überwachung der Benutzeraktivität und des Datenzugriffs | Verfügbar | Verfügbar ab 4.7 |
Integration mit IBM Knowledge Catalog | Erforderlich | Optionale |
Gruppenbasierte Berechtigung und Zugriff auf Objektebene für Gruppen | Nicht verfügbar | Verfügbar |
Unterstützung für ferne Connectors | Nicht zutreffend für SaaS | Verfügbar |
Unterstützung für dateisystembasierte Datenquellen, außer in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Verbindung zu Datenquellen herstellen, für die ein hochgeladener JDBC -Treiber erforderlich ist, z. B. SAP HANA, generisches JDBC | Nicht zutreffend für SaaS | Verfügbar |
Statistikdaten in der Benutzerschnittstelle erfassen | Nicht verfügbar | Verfügbar |
Automatische Statistikerfassung während Objektvirtualisierung | Nicht verfügbar | Verfügbar |
Zugriffsmanagement für mehrere Gruppen | Nicht verfügbar | Verfügbar |
Unterstützung für CSV-oder TSV-Dateien in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Berechtigungsnachweise in Vaults für Verbindungen in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar |
Weitere Informationen
- Services für Cloud Pak for Data as a Service
- Dienste für Cloud Pak for Data 5.0
- Optionen für die Cloud-Bereitstellungsumgebung für Cloud Pak for Data 5.0
Übergeordnetes Thema: Cloud Pak for Data as a Service