0 / 0
Zurück zur englischen Version der Dokumentation
Funktionsunterschiede zwischenCloud Pak for Data Implementierungen
Letzte Aktualisierung: 19. Dez. 2024
Funktionsunterschiede zwischenCloud Pak for Data Implementierungen

Cloud Pak for Data as a Service und Cloud Pak for Data weisen einige Unterschiede bei den Features und der Implementierung auf. Cloud Pak for Data as a Service ist ein Set von IBM Cloud-Services. Cloud Pak for Data 5.1 wird als Software angeboten, die Sie auf IBM Software Hub installieren und warten müssen. Dienste, die in beiden Bereitstellungen verfügbar sind, haben auch Unterschiede in den Funktionen von Cloud Pak for Data as a Service im Vergleich zu Cloud Pak for Data 5.1, 5.0 und 4.8.

Plattformunterschiede

Cloud Pak for Data as a Service und die Software Cloud Pak for Data nutzen eine gemeinsame Codebasis, unterscheiden sich jedoch in den folgenden Schlüsselmöglichkeiten:

Plattformunterschiede
Features Als Service Software
Software, Hardware und Installation Cloud Pak for Data as a Service wird vollständig von IBM in IBM Cloud verwaltet. Softwareaktualisierungen werden automatisch durchgeführt. Die Skalierung von Rechenressourcen und Speicher erfolgt automatisch. Sie melden sich bei Try Cloud Pak for Data as a Service an. Die Hardware wird von Ihnen bereitgestellt und gewartet. Sie installieren, verwalten und aktualisieren die Software. Siehe Softwareanforderungen.
Speicher Sie stellen eine IBM Cloud Object Storage-Serviceinstanz zur Verfügung, um Speicher bereitzustellen. Siehe IBM Cloud Object Storage. Sie stellen persistenten Speicher in einem Red Hat OpenShift -Cluster bereit. Siehe Speicheranforderungen.
Rechenressourcen zum Ausführen von Workloads Benutzer wählen die geeignete Laufzeit für ihre Jobs aus. Die Nutzung von Rechenressourcen wird nach dem geltenden Tarif für die Laufzeitumgebung und nach der Dauer des Jobs abgerechnet. Siehe Kontoressourcennutzung überwachen. Sie definieren die Anzahl der Red Hat OpenShift -Knoten mit der entsprechenden Anzahl von vCPUs. Siehe Hardwareanforderungen und Überwachung der Plattform.
Kosten Sie erwerben jeden Service, den Sie benötigen, unter dem entsprechenden Preisstrukturplan. Bei vielen Services werden die genutzten Rechenressourcen in Rechnung gestellt. Sehen Sie sich jede Serviceseite im IBM Cloud oder im Servicekatalog auf Cloud Pak for Data as a Service an, indem Sie im Navigationsmenü Services > Servicekatalog wählen. Sie kaufen eine Softwarelizenz basierend auf den Services, die Sie benötigen. Die Lizenz für Cloud Pak for Data Enterprise Edition beinhaltet zum Beispiel die Berechtigung für Services wie watsonx.ai Studio und IBM Knowledge Catalog. Siehe Lizenzen und Berechtigungen.
Sicherheit, Compliance und Isolation Datensicherheit, Netzsicherheit, Einhaltung von Sicherheitsstandards und Isolation für Cloud Pak for Data as a Service werden von IBM Cloud verwaltet. Sie können zusätzliche Sicherheits- und Verschlüsselungsoptionen einrichten. Weitere Informationen finden Sie in Sicherheit für Cloud Pak for Data as a Service. Red Hat OpenShift Container Platform bietet grundlegende Sicherheitsfunktionen. Cloud Pak for Data wird auf die Einhaltung verschiedener Datenschutz- und Konformitätsbestimmungen überprüft und bietet Funktionen, die Sie als Vorbereitung für verschiedene Datenschutz- und Konformitätsbewertungen verwenden können. Sie sind für zusätzliche Sicherheitsfunktionen, Verschlüsselung und Netzisolation verantwortlich. Siehe Sicherheitserwägungen.
Verfügbare Services Die meisten Data Fabric-Services sind in beiden Bereitstellungsumgebungen verfügbar.
Weitere Informationen finden Sie in Services für Cloud Pak for Data as a Service.
Enthält viele weitere Services. Siehe Dienstleistungen.
Benutzermanagement Sie fügen Benutzer und Benutzergruppen hinzu und verwalten die zugehörigen Kontorollen und -berechtigungen mit IBM Cloud Identity and Access Management. Weitere Informationen finden Sie unter Benutzer zum Konto hinzufügen.
Sie können außerdem SAML-Föderation in IBM Cloud konfigurieren. Siehe IBM Cloud docs: Wie IBM Cloud IAM funktioniert.
Über das Menü Verwaltung können Sie Benutzer hinzufügen und Benutzergruppen erstellen. Sie können den Service 'Identity and Access Management' oder Ihren vorhandenen SAML-SSO- oder LDAP-Provider verwenden, um Identitäten und Kennwörter zu verwalten. Sie können dynamische, attributbasierte Benutzergruppen erstellen. Siehe Benutzerverwaltung.

Allgemeine Serviceübergreifende Kernfunktionalität

Die folgenden Kernfunktionen, die mit der Plattform zur Verfügung gestellt werden, sind für Dienste auf den Softwareversionen Cloud Pak for Data as a Service, Cloud Pak for Data, 5.1, 5.0, und 4.8:

  • Plattformweite globale Suche nach Assets und Artefakten
  • Der Katalog der Plattformassets für die plattformweite gemeinsame Nutzung von Verbindungen
  • Plattformweite rollenbasierte Benutzerverwaltung in Arbeitsbereichen mit Collaboration.
  • Gemeinsame Infrastruktur für Assets und Arbeitsbereiche
  • Servicekatalog zum Hinzufügen von Services
  • Rechenressourcennutzung über das Menü Verwaltung anzeigen

Die folgende Tabelle beschreibt die Unterschiede in der Kernfunktionalität der Dienste zwischen Cloud Pak for Data as a Service und Cloud Pak for Data Software Version 5.1, 5.0 und 4.8.

Unterschiede bei allgemeinen Funktionen zwischen Services
Funktion Als Service Software
Alle Projekte verwalten Benutzer mit der Berechtigung Projekte verwalten aus dem IAM Service Access Manager für den IBM Cloud Pak for Data Service können jedem Projekt mit der Rolle Admin beitreten und das Projekt dann verwalten oder löschen. Benutzer mit der Berechtigung Projekte verwalten können an jedem Projekt mit der Rolle Administrator teilnehmen und dann das Projekt verwalten bzw. löschen.
Verbindungen zu fernen Datenquellen Die meisten unterstützten Datenquellen sind für beide Bereitstellungsumgebungen gleich.
Siehe Konnektoren.
Siehe Unterstützte Datenquellen.
Persönliche oder gemeinsam genutzte Berechtigungsnachweise für Verbindunngen Für Verbindungen in Projekten und Katalogen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Kontoebene inaktiviert werden. Plattformverbindungen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Plattformebene inaktiviert werden.
Verbindungsberechtigungsnachweise aus geheimen Schlüsseln in einer Vault Nicht verfügbar Verfügbar
Kerberos-Authentifizierung Nicht verfügbar Verfügbar für einige Dienste und Verbindungen
Beispielassets und Projekte aus der App "Ressourcenhub" Verfügbar Nicht verfügbar
Angepasster JDBC-Connector Nicht verfügbar Verfügbar ab 4.8.0
Datenquellendefinitionen Nicht verfügbar Ab 5.0verfügbar.
Siehe Datenschutz mit Datenquellendefinitionen.

watsonx.ai Studio im Vergleich zu Watson Studio

Die folgenden watsonx.ai Studio-Funktionen auf Cloud Pak for Data as a Service sind effektiv die gleichen wie die Watson Studio auf Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8:

  • Zusammenarbeit in Projekten und Bereitstellungsbereichen
  • Programmgesteuert auf Projektassets zugreifen
  • Projektimport und -export mithilfe einer ZIP-Projektdatei
  • Jupyter-Notebooks
  • Jobplanung
  • Data Refinery
  • Watson Natural Language Processing für Python
  • Chatten mit Stiftungsmodellen über Dokumente und Bilder

Diese Tabelle beschreibt die Funktionsunterschiede zwischen dem watsonx.ai Studio-Dienst in der As-a-Service-Bereitstellungsumgebung und dem Watson Studio in der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und ob zusätzliche Dienste erforderlich sind. Weitere Informationen zu den Funktionsunterschieden zwischen den Angebotsplänen auf Cloud Pak for Data as a Service finden Sie unter watsonx.ai Studio Angebotspläne.

Unterschiede im watsonx.ai Studio
Funktion Als Service Software
Projekt erstellen Erstellen:
Ein leeres Projekt
Ein Projekt aus einem Beispiel im Ressourcenhub
Ein Projekt aus einer Datei
Erstellen:
Ein leeres Projekt
Ein Projekt aus Datei
Ein Projekt mit Git -Integration
Git-Integration Notebooks auf GitHub veröffentlichen
Notebooks als Gist veröffentlichen
Ein Projekt mit Git
integrieren, Assets mit Repository in einem Projekt synchronisieren und diese Assets in einem anderen Projekt verwenden
Projektterminal für erweiterte Git-Operationen Nicht verfügbar Verfügbar in Projekten mit standardmäßiger Git-Integration
Assets in Projekten mit Ordnern organisieren Nicht verfügbar Verfügbar ab 4.8.0
JupyterLab Nicht verfügbar Verfügbar in Projekten mit Git-Integration
Visual Studio Code -Integration Nicht verfügbar Verfügbar in Projekten mit Git-Integration
RStudio Kann nicht in Git integriert werden Kann in Git integriert werden Erfordert einen RStudio Server Runtimes -Service.
Python-Scripts Nicht verfügbar Mit Python-Scripts in JupyterLab arbeiten Erfordert einen Watson Studio -Laufzeitservice.
Code zum Laden von Daten in ein Notebook mithilfe des Flight service generieren Nicht verfügbar Verfügbar
Notebook-Lebenszyklus verwalten Nicht verfügbar CPDCTL für das Lebenszyklusmanagement von Notebooks verwenden
Codepaketassets (Gruppe abhängiger Dateien in einer Ordnerstruktur) Nicht verfügbar CPDCTL zum Erstellen von Codepaketassets in einem Bereitstellungsbereich verwenden
Notebooks in Bereiche hochstufen Nicht verfügbar Manuell auf der Seite 'Assets' des Projekts oder programmgesteuert über CPDCTL verfügbar
Python mit GPU Unterstützung nur für einen einzelnen GPU-Typ verfügbar Unterstützung für mehrere Nvidia-GPU-Typen verfügbar Erfordert einen Watson Studio -Laufzeitservice.
Angepasste Images erstellen und verwenden Nicht verfügbar Erstellen Sie benutzerdefinierte Images für Python (mit und ohne GPU), R, JupyterLab (mit und ohne GPU), RStudio und SPSS. Erfordert eine Watson Studio und andere geeignete Dienste.
Anaconda Repository Nicht verfügbar Zum Erstellen angepasster Umgebungen und angepasste Images verwenden
Hadoop-Integration Nicht verfügbar Modelle erstellen und trainieren und Data Refinery-Abläufe in einem Hadoop-Cluster ausführen. Erfordert den Service 'Execution Engine for Apache Hadoop'.
Decision Optimization Verfügbar Erfordert den Service Decision Optimization.
SPSS Modeler Verfügbar Setzt den SPSS Modeler-Service voraus.
Orchestrierungspipelines Verfügbar Erfordert den Orchestrierungsservice für Pipelines.

watsonx.ai Runtime im Vergleich zu Watson Machine Learning

Die folgenden watsonx.ai Runtime-Funktionen auf Cloud Pak for Data as a Service sind effektiv die gleichen wie die Watson Machine Learning auf Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8:

  • Zusammenarbeit in Projekten und Bereitstellungsbereichen
  • Modelle bereitstellen
  • Funktionsbereitstellung
  • watsonx.ai Runtime REST API und Watson Machine Learning REST API
  • watsonx.ai Python
  • Onlinebereitstellungen erstellen
  • Bereitstellungen skalieren und aktualisieren
  • Angepasste Komponenten definieren und verwenden
  • Federated Learning zum Trainieren eines allgemeinen Modells mit separaten und sicheren Datenquellen verwenden
  • Bereitstellungen bereichsübergreifend überwachen
  • Aktualisierte Formulare zum Testen der Online-Implementierung
  • Verschachtelte Pipelines verwenden
  • AutoAI -Datenimputation
  • AutoAI -Fairnessbewertung
  • AutoAI -Zeitreihenunterstützungsfunktionen

Diese Tabelle beschreibt die Funktionsunterschiede zwischen dem watsonx.ai Runtime Service in der As-a-Service-Bereitstellungsumgebung und dem Watson Machine Learning Service in der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und ob zusätzliche Services erforderlich sind. Details zu den Funktionsunterschieden zwischen den Angebotsplänen auf Cloud Pak for Data as a Service finden Sie unter watsonx.ai Runtime Angebotspläne.

Funktionsunterschiede zwischen watsonx.ai Runtime Implementierungen
Funktion Als Service Software
AutoAI -Trainingseingabe Aktuelle unterstützte Datenquellen Unterstützte Datenquellen ändern sich nach Release
Rechenkonfiguration für AutoAI -Experimente Verschiedene Größen verfügbar Verschiedene Größen verfügbar
AutoAI begrenzt die Datenmenge
und die Anzahl der Vorhersageziele
Grenzwerte festlegen Grenzwerte unterscheiden sich je nach Berechnungskonfiguration
AutoAI Inkrementelles Lernen Nicht verfügbar Verfügbar
Bereitstellung unter Verwendung gängiger Frameworks
und Softwarespezifikationen
Auf neueste unterstützte Versionen prüfen Unterstützte Versionen variieren je nach Release
Verbindung zu Datenbanken für Batchbereitstellungen herstellen Auf Unterstützung nach Bereitstellungstyp prüfen Auf Unterstützung nach Bereitstellungstyp
und nach Version prüfen
Python -Scripts bereitstellen und bewerten Verfügbar über Python-Client Scripts im JupyterLab -oder Python -Client erstellen und anschließend bereitstellen
R-Scripts für Bereitstellung und Stapelscoring Nicht verfügbar Verfügbar
Shiny-Apps bereitstellen Nicht verfügbar Shiny-Apps erstellen und bereitstellen
Bereitstellung aus Codepaket
Jobs auf Fairness oder Drift bewerten Erfordert den Service watsonx.governance Erfordert den Service Watson OpenScale oder watsonx.governance
Bewerten Sie Onlinebereitstellungen in einem Bereich
auf Fairness, Drift oder Erklärbarkeit.
Nicht verfügbar Verfügbar
Erfordert den Watson OpenScale oder watsonx.governance
Implementierte Eingabeaufforderungsvorlagen in einem Space auswerten Verfügbar
Vorlagen für freigegebene Eingabeaufforderungen in einem Space auswerten Nicht verfügbar Verfügbar ab 5.0
Erstellung des Steuerbereichs Keine Einschränkungen nach Rolle Durch Berechtigungen steuern, wer Bereiche anzeigen und erstellen kann
Aus GIT-Projekt in Bereich importieren Nicht verfügbar Verfügbar
Codepaket, das automatisch erstellt wird, wenn
aus einem Git -Projekt in den Speicherbereich importiert wird.
Nicht verfügbar Verfügbar
RShiny-App aus Codepaket aktualisieren Nicht verfügbar Verfügbar
Angepasste Images erstellen und verwenden Nicht verfügbar Angepasste Images für Python oder SPSS erstellen
Mitbearbeiter über Pipeline-Ereignisse benachrichtigen Nicht verfügbar Verwenden Sie "E-Mail senden", um Mitarbeiter zu benachrichtigen.
Deep-Learning-Experimente Nicht verfügbar Erfordert den IBM Scheduler-Dienst
IBM Cloud-Serviceinstanzen bereitstellen und verwalten Instanzen für watsonx.ai Runtime
oder Watson OpenScale hinzufügen
Services werden im Cluster
vom Administrator bereitgestellt

watsonx.governance

Die folgenden Governance-Funktionen sind bei den Softwareversionen Cloud Pak for Data as a Service und Cloud Pak for Data, 5.1, 5.0, und 4.8:

  • Fairness von Bereitstellungen bewerten
  • Qualität von Bereitstellungen bewerten
  • Drift von Bereitstellungen überwachen
  • Modellergebnisse in einem Insights-Dashboard anzeigen und vergleichen
  • Fügen Sie Bereitstellungen vom Machine Learning-Provider Ihrer Wahl hinzu.
  • Alerts festlegen, die ausgelöst werden, wenn Auswertungen einen angegebenen Schwellenwert unterschreiten
  • Implementierungen in einer Benutzerschnittstelle oder einem Notebook auswerten
  • Angepasste Bewertungen und Metriken
  • Details zu Bewertungen in Modelldatenblättern anzeigen

Diese Tabelle beschreibt die Unterschiede zwischen den Funktionen des watsonx.governance in der As-a-Service- und der Software-Bereitstellungsumgebung, die Unterschiede zwischen den Angebotsplänen und die Frage, ob zusätzliche Dienste erforderlich sind.

Funktionsunterschiede zwischen watsonx.governance Einsätzen
Funktion Als Service Software
Bewertung von Modellen des maschinellen Lernens Ja Ja
Vorab bewertete Testdaten hochladen Nicht verfügbar Verfügbar
IBM SPSS Collaboration and Deployment Services Nicht verfügbar Verfügbar
Batchverarbeitung Nicht verfügbar Verfügbar
Zugriffssteuerung nach Benutzergruppen unterstützen Nicht verfügbar Verfügbar
Kostenlose Datenbank und Postgres -Pläne Verfügbar Postgres verfügbar ab 4.8

IBM Knowledge Catalog

Die folgenden Funktionen sind für die Software IBM Knowledge Catalog on Cloud Pak for Data as a Service und Cloud Pak for Data sowie für die Versionen 5.1, 5.0, und 4.8:

  • Zusammenarbeit in Projekten und Katalogen
  • KI-gestützte Suche und Empfehlungen in Katalogen
  • Assets in Katalogen bewerten und prüfen
  • Data Refinery-Tool in Projekten
  • Kategorien mit Mitbearbeiterrollen
  • Vordefinierte und angepasste Klassifikationen
  • Vordefinierte und angepasste Datenklassen
  • Governance-Regeln
  • Richtlinien
  • Datenschutzregeln
  • SLA-Regeln für Datenqualität
  • Manuelle Profilerstellung für einzelne relationale Datenassets in einem Projekt oder Katalog
  • Automatische Profilerstellung für relationale Datenassets, die zu einem regulierten Katalog hinzugefügt wurden
  • Werkzeug zur Anreicherung von Metadaten in Projekten zur Durchführung von Profilerstellung, Begriffszuweisung, Qualitätsanalyse und Schlüssel- oder Beziehungsanalyse bei großen Datenbeständen
  • Angepasste Assettypen, angepasste Eigenschaften für Assets und angepasste Beziehungen zwischen Assets in Katalogen
  • Workflow-Tasks überwachen
  • Maskierte Datasets in Projekten mit Maskierungsabläufen bereitstellen
  • Detaillierte Datenqualitätsinformationen für Datenbestände in Projekten und Katalogen und als Teil der Ergebnisse der Metadatenanreicherung
  • Korrekturworkflows für Datenqualitätsprobleme
  • Erstellen von verbundenen Datenbeständen und segmentierten Datenbeständen mit SQL-Abfragen
  • Metrik-Dashboard und Ausführungsfenster für Metadaten-Anreicherungsaufträge ausführen

In dieser Tabelle werden die Unterschiede zwischen den Features des Service IBM Knowledge Catalog in den As-a-Service-und Softwareimplementierungsumgebungen, die Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Servicefinden Sie unter Angebotspläne fürIBM Knowledge Catalog.

Ab Cloud Pak for Data Version 5.0 können Sie die IBM Knowledge Catalog Premium Cartridge oder die IBM Knowledge Catalog Standard Cartridge anstelle des IBM Knowledge Catalog Service installieren. IBM Knowledge Catalog Premium bietet die gleichen Funktionen wie der IBM Knowledge Catalog Service plus generative KI-Funktionen. IBM Knowledge Catalog Standard bietet eine Teilmenge der Funktionen von IBM Knowledge Catalog sowie generative KI-Funktionen.

Unterschiede im IBM Knowledge Catalog
Funktion Als Service Software
Tool Metadata import in Projekten-Erkennung Importieren Sie Datenassets in Projekte oder Kataloge. Unterstützung für eine Untergruppe mit Projekt- und Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität. Verschiedene Assettypen importieren:
Importieren Sie Datenassets in Projekte oder Kataloge. Die meisten unterstützten Verbindungen sind in beiden Implementierungsumgebungen identisch.
Business-Intelligence-Berichte, Assets mit den zugehörigen Transformationsscripts, ETL-Jobs oder Datenmodellen in Kataloge importieren. Erfordert die Installation von MANTA Automated Data Lineage ohne Lizenzschlüssel. Unterstützung für eine Teilmenge von Katalogverbindungen.
'
Siehe Unterstützte Datenquellen für Kuration und Datenqualität.
Tool Metadata import in 'projects-lineage' Verfügbar.
Data Lineage muss aktiviert sein.
Limits pro Plan.
- Importieren Sie die Abstammung von Datenbeständen in Kataloge. Erfordert die Installation von IBM Manta Data Lineage oder MANTA Automated Data Lineage mit einem Lizenzschlüssel.
- Erfassen Sie den Verlauf von ETL-Jobs in MANTA Automated Data Lineage und greifen Sie darauf zu. Erfordert die Installation von MANTA Automated Data Lineage mit einem Lizenzschlüssel.

Unterstützung für eine Teilmenge von Katalogverbindungen. Siehe Unterstützte Datenquellen für Kuration und Datenqualität.
Verbesserte Anreicherung durch generative KI Verfügbar. Nicht verfügbar.
Beginnen Sie in 5.0, installieren Sie stattdessen IBM Knowledge Catalog Premium oder IBM Knowledge Catalog Standard.
Datenqualitätsregeln in Projekten Verfügbar
Erfordert den Service DataStage .
Verfügbar.
Erfordert den DataStage -Service.
Mehrere Assets zu einem Katalog mit einer Datei hinzufügen Nicht verfügbar. Verfügbar.
Assetaktivitäten Erfordert einen kostenpflichtigen Plan.
Verfügbar in Projekten und Katalogen.
Verfügbar in Projekten und Katalogen.
Geschäftsabstammung Nicht verfügbar Verfügbar.
Abstammung technischer Daten Nicht verfügbar. Verfügbar.
Erfordert, dass eine lizenzierte Version von MANTA Automated Data Lineage for IBM Cloud Pak for Data installiert ist. Generiert durch Ausführen des Metadatenimporttools. Zugriff über Kataloge möglich.
Datenabstammung Erfordert die Freigabe. Nicht verfügbar.
Geschäftsbedingungen Grenzwerte für manche Pläne. Verfügbar.
Vordefinierte Geschäftsbegriffe Vordefinierte Geschäftsbegriffe und die Kategorie "Knowledge Accelerator Sample Personal Data", die sie enthält, sind nur verfügbar, wenn Sie eine IBM Knowledge Catalog Service-Instanz mit einem Lite- oder Standard-Plan nach dem 7. Oktober 2022 erstellen. Nicht verfügbar.
Referenzdatasets Obergrenzen pro Plan. Verfügbar.
Angepasste Beziehungen für Artefakte Erfordert einen kostenpflichtigen Plan. Verfügbar.
Knowledge Accelerators Erfordert einen Enterprise-Plan
von Resource Hub.
Wird mit der Plattform geliefert.
Angepasste Workflow-Konfigurationen für Governance-Artefakte und -Anforderungen Verfügbar für Governance-Artefakte. Verfügbar.
Rollen für angepasste Kategorien Obergrenzen pro Plan. Verfügbar.
Datenschutzbestimmungen für die Ausfuhr und Einfuhr Um Datenschutzregeln aus einem beliebigen System zu exportieren und die Regeln in dasselbe oder ein anderes System zu importieren, können Sie APIs verwenden. Einzelheiten finden Sie unter Migration von Datenschutzregeln. Um Datenschutzregeln aus einem beliebigen System zu exportieren und die Regeln in dasselbe oder ein anderes System zu importieren, können Sie entweder APIs oder cpd-cli-Befehle verwenden. Einzelheiten finden Sie unter Migration von Datenschutzregeln.
Verwaltungsberichte Erfordert einen kostenpflichtigen Plan. Verfügbar.
Daten von InfoSphere Information Server migrieren Nicht verfügbar. Verfügbar.
Beziehungsexplorer Nicht verfügbar. Ab 5.0verfügbar.
Erfordert die Installation der optionalen Knowledge-Graph-Komponente mit IBM Knowledge Catalog.

DataStage

Die folgende Tabelle beschreibt die Funktionsunterschiede zwischen DataStage on Cloud Pak for Data as a Service und DataStage on Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8.

Unterschiede in DataStage
Funktion Als Service Software
PX-Instanzverwaltung Sie können Instanzen aus einer Gruppe mit vordefinierten Größen bereitstellen. Die Cloud Pak for Data-Instanzverwaltung ermöglicht eine flexiblere Bereitstellung von Instanzen.
Jobkompilierung
  • OSH wird während der Kompilierung generiert.
  • Transformer wird während der Laufzeit kompiliert.
  • OSH wird während der Kompilierung generiert.
  • Transformer wird während der Kompilierungszeit kompiliert und für den /ds-storage-Mount verfügbar gemacht.
  • Die Kompilierung erfolgt synchron.
Joblaufzeit Sie können so viele Jobs übergeben, wie Sie möchten, abhängig von der Warteschlangensteuerung.
  • Gleichzeitige Jobausführungen werden unterstützt.
  • Der gemeinsame Zugriff wird durch die Kapazität der Instanz und die Einstellungen in der Datei /px-storage/config/wlm.config.xml bestimmt.
Assetverwaltung Für die Dateitypen .xls, .xlsx, .xml und .json werden nur einfache Strukturen unterstützt. Mehrere Ebenen/verschachtelte Schemata können nicht syntaktisch analysiert werden. Für die Dateitypen .csv, .txt, .xls, .xlsx, .xml und .json ist vollständige Unterstützung verfügbar.
Speicher
  • Dateibasierter POSIX-Realspeicher ist nicht verfügbar.
  • Speicher wird durch die Verwendung eines Cloud Object Storage-Projektbuckets emuliert.
Stage 'Java Integration' Verfügbar mit DataStage-aaS Überall Verfügbar
Java-Bibliothekskomponente Verfügbar mit DataStage-aaS Überall Verfügbar
Generische JDBC-Verbindung Verfügbar mit DataStage-aaS Überall Verfügbar
Excel Verfügbar mit DataStage-aaS Überall Verfügbar
AVI Verfügbar mit DataStage-aaS Überall Verfügbar
Stage 'External Source' Verfügbar mit DataStage-aaS Überall Verfügbar
Stage 'External Target' Verfügbar mit DataStage-aaS Überall Verfügbar
Hierarchische Stage
  • Die Option für Einzeldatei oder Dateigruppe für den XML-Parser und den JSON-Parser ist nicht verfügbar.
  • Die Option für Einzeldatei, Dateigruppe und große Objekte für XML Composer und JSON Composer ist nicht verfügbar.
Verfügbar
SMP S, M, L sind Einzelknoten (SMP-Konfiguration). Verwenden Sie eine ferne Laufzeitengine, um eine alternative Konfiguration einzurichten. Parallele Arbeitslasten werden über logische Partitionen verwaltet, die mit der Option APT_CONFIG_FILE konfiguriert sind.
Verbindung SAP Bulk Extract Nicht verfügbar Verfügbar
Verbindung SAP Delta Extract Nicht verfügbar Verfügbar
Wrap-Stage Verfügbar mit DataStage-aaS Überall Verfügbar
SAP HANA-Verbindung Nicht verfügbar Verfügbar
Textdatenquelle in ODBC -Verbindung Nicht verfügbar Verfügbar
Build-Stage Verfügbar mit DataStage-aaS Überall Verfügbar
Berichte mithilfe von Subroutinen vor/nach dem Job senden Verfügbar mit DataStage-aaS Überall Verfügbar
Angepasste Stage Verfügbar mit DataStage-aaS Überall Verfügbar
Apache HBase -Verbindung Verfügbar mit DataStage-aaS Überall Verfügbar
Kerberos -Authentifizierung für Apache Hive -Verbindungen Nicht verfügbar Verfügbar
Benutzerdefinierte Funktionen Verfügbar mit DataStage-aaS Überall Verfügbar
Vom Benutzer erstellte APT_CONFIG_FILEs Verfügbar mit DataStage-aaS Überall Verfügbar
Vor-/Nachher-Job-Eigenschaften Verfügbar mit DataStage-aaS Überall Verfügbar
Datenservice-Connector Nicht verfügbar Verfügbar
Db2 -Datenbanksequenz in Stage 'Slowly Changing Dimension', Stage 'Surrogate Key Generator' und Stage 'Transformer' Verfügbar mit DataStage-aaS Überall Verfügbar
Verwenden Sie die Apache Hive -Verbindung als Ziel. (Verfügbar, wenn DataStage -Eigenschaften verwenden im Connector aktiviert ist.) Verfügbar mit DataStage-aaS Überall Verfügbar
Eigenschaften mit lokalen Verbindungen parametrisieren Nicht verfügbar Verfügbar
Stufe Operational Decision Manager Verfügbar mit DataStage-aaS Überall Verfügbar
Einsatzbereiche Nicht verfügbar Verfügbar

Data Virtualization

Auf Cloud Pak for Data as a Service wird die Datenvirtualisierungsfunktionalität durch den Data Virtualization bereitgestellt. Die folgenden Funktionen zur Datenvirtualisierung sind bei Cloud Pak for Data as a Service und Cloud Pak for Data Software, Versionen 5.1, 5.0 und 4.8, praktisch identisch.

  • Verbindung zu unterstützten Datenquellen herstellen
  • Daten virtualisieren
  • Virtuelle Daten durch Richtlinien und Datenschutzregeln regulieren
  • Überwachung und Erkundung des Service
  • SQL-Schnittstelle verwenden
  • Zwischenspeichern
  • Spaltenmaskierung
  • Ansicht und erneutes Laden von Tabellen untersuchen
  • Datenstichproben bei der Statistikerfassung
  • Metadatenanreicherung

Die folgenden Funktionen für Datenvirtualisierung sind in der Benutzerschnittstelle anscheinend nicht identisch, bieten jedoch dieselbe Basisfunktionalität:

Diese Tabelle beschreibt die Funktionsunterschiede zwischen Data Virtualization (ehemals Watson Query) auf Cloud Pak for Data as a Service und Data Virtualization (ehemals Watson Query) auf Cloud Pak for Data Software.

Unterschiede bei der Data Virtualization
Funktion Als Service Software
Verwenden Sie die Cloud Pak for Data -Datenquellendefinitionen (DSD), um Datenschutzregeln für IBM Knowledge Catalog durchzusetzen. Nicht zutreffend für SaaS Verfügbar ab 5.0
Daten in REST-API-Datenquellen abfragen Nicht zutreffend für SaaS Verfügbar ab 5.0
Abfragetabellen aus früheren Presto -und Databricks-Katalogen mit Unterstützung mehrerer Kataloge Nicht zutreffend für SaaS Verfügbar ab 5.0
Serviceinstanzen automatisch skalieren Nicht zutreffend für SaaS Verfügbar ab 5.0
Mehrbytezeichen für erweiterten Datenschutz sensibler Daten maskieren Nicht zutreffend für SaaS Verfügbar ab 5.0
Datenschutzregeln anzeigen, die auf einen Benutzer angewendet werden Nicht zutreffend für SaaS Verfügbar ab 5.0
Erweiterte Sicherheit für Profilermittlungsergebnisse in Data Virtualization -Ansichten Nicht zutreffend für SaaS Verfügbar ab 5.0
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung Nicht zutreffend für SaaS Verfügbar ab 5.0
Data Virtualization -Verbindungen in Katalogen verweisen jetzt auf die Plattformverbindung Nicht zutreffend für SaaS Verfügbar ab 5.0
Erweiterte Sicherheit für die Verwaltungsrolle: Die Verwaltungsrolle hat keinen Standardzugriff auf alle Daten. Nicht zutreffend für SaaS Verfügbar ab 4.8
IBM Knowledge Catalog -Datenschutzregeln sind immer für Watson Query -Daten aktiviert Nicht zutreffend für SaaS Verfügbar ab 4.8
Schützen Sie Ihre nicht regulierten Objekte: Mit den IBM Knowledge Catalog -Datenschutzregeln in Watson Queryentsprechen virtualisierte Objekte, die nicht in einem regulierten Katalog veröffentlicht sind, der Standarddatenzugriffskonventionen aus Ihren Regeleinstellungen. Nicht zutreffend für SaaS Verfügbar ab 4.8
Presto -Daten abfragen: Sie können eine Verbindung zu Presto herstellen, um auf Daten in Prestozuzugreifen und diese abzufragen. Nicht zutreffend für SaaS Verfügbar ab 4.8
Prüfprotokollierung zur Überwachung der Benutzeraktivität und des Datenzugriffs Verfügbar Verfügbar
Integration mit IBM Knowledge Catalog Erforderlich Optionale
Gruppenbasierte Berechtigung und Zugriff auf Objektebene für Gruppen Nicht verfügbar Verfügbar
Unterstützung für ferne Connectors Nicht zutreffend für SaaS Verfügbar
Unterstützung für dateisystembasierte Datenquellen, außer in Cloud Object Storage Nicht zutreffend für SaaS Verfügbar
Verbindung zu Datenquellen herstellen, für die ein hochgeladener JDBC -Treiber erforderlich ist, z. B. SAP HANA, generisches JDBC Nicht zutreffend für SaaS Verfügbar
Statistikdaten in der Benutzerschnittstelle erfassen Nicht verfügbar Verfügbar
Automatische Statistikerfassung während Objektvirtualisierung Nicht verfügbar Verfügbar
Zugriffsmanagement für mehrere Gruppen Nicht verfügbar Verfügbar
Unterstützung für CSV-oder TSV-Dateien in Cloud Object Storage Nicht zutreffend für SaaS Verfügbar
Berechtigungsnachweise in Vaults für Verbindungen in Cloud Object Storage Nicht zutreffend für SaaS Verfügbar
Autocaching von Abfragen Nicht verfügbar Verfügbar ab 5.0.3

Weitere Informationen

Übergeordnetes Thema: Cloud Pak for Data as a Service

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen