Funktionsunterschiede zwischenCloud Pak for Data Implementierungen
Cloud Pak for Data as a Service und die Software Cloud Pak for Data 4.6, 4.5, 4.0und 3.5 weisen einige Unterschiede in Features und Implementierung auf. Cloud Pak for Data as a Service ist ein Set von IBM Cloud-Services. Cloud Pak for Data 4.6 und 3.5 werden als Software angeboten, die Sie installieren und verwalten müssen. Services, die in beiden Implementierungen verfügbar sind, weisen auch Unterschiede in den Features von Cloud Pak for Data as a Service im Vergleich zu Cloud Pak for Data 4.6, 4.5, 4.0und 3.5auf.
- Plattformunterschiede
- Allgemeine serviceübergreifende Funktionen
- Watson Studio
- Watson Machine Learning
- Watson Knowledge Catalog
- DataStage
- Watson OpenScale
- Watson Query
Plattformunterschiede
Cloud Pak for Data as a Service und Cloud Pak for Data 4.6 nutzen eine gemeinsame Codebasis, unterscheiden sich jedoch in den folgenden Schlüsselmöglichkeiten:
Funktionen | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Software, Hardware und Installation | Cloud Pak for Data as a Service wird vollständig von IBM in IBM Cloud verwaltet. Softwareaktualisierungen werden automatisch durchgeführt. Die Skalierung von Rechenressourcen und Speicher erfolgt automatisch. Sie melden sich unter https://dataplatform.cloud.ibm.coman. | Die Hardware wird von Ihnen bereitgestellt und gewartet. Die Cloud Pak for Data-Software wird von Ihnen installiert, gewartet und aktualisiert. Siehe Softwarevoraussetzungen. |
Speicher | Sie stellen eine IBM Cloud Object Storage-Serviceinstanz zur Verfügung, um Speicher bereitzustellen. Siehe IBM Cloud Object Storage. | Sie stellen ein Dateispeichersystem in einem Red Hat OpenShift -Cluster bereit. Siehe Speicherbedarf. |
Rechenressourcen zum Ausführen von Workloads | Benutzer wählen die geeignete Laufzeit für ihre Jobs aus. Die Nutzung von Rechenressourcen wird nach dem geltenden Tarif für die Laufzeitumgebung und nach der Dauer des Jobs abgerechnet. Siehe Kontoressourcennutzung überwachen. | Sie richten die Anzahl der Red Hat OpenShift-Cluster und -Knoten mit der entsprechenden Anzahl von vCPUs ein. Siehe Hardwarevoraussetzungen und Plattform überwachen. |
Kosten | Sie erwerben jeden Service, den Sie benötigen, unter dem entsprechenden Preisstrukturplan. Bei vielen Services werden die genutzten Rechenressourcen in Rechnung gestellt. Rufen Sie jede Serviceseite im IBM Cloud -Katalog oder im Servicekatalog in Cloud Pak for Data as a Serviceauf, indem Sie im Navigationsmenü Services > Servicekatalog auswählen. | Sie erwerben eine Lizenz für Cloud Pak for Data und für jeden Service, den Sie benötigen. Siehe Cloud Pak for Data. |
Sicherheit, Compliance und Isolation | Datensicherheit, Netzsicherheit, Einhaltung von Sicherheitsstandards und Isolation für Cloud Pak for Data as a Service werden von IBM Cloud verwaltet. Sie können zusätzliche Sicherheits- und Verschlüsselungsoptionen einrichten. Weitere Informationen finden Sie in Sicherheit für Cloud Pak for Data as a Service. | Red Hat OpenShift Container Platform bietet grundlegende Sicherheitsfunktionen. Cloud Pak for Data wird auf die Einhaltung verschiedener Datenschutz- und Konformitätsbestimmungen überprüft und bietet Funktionen, die Sie als Vorbereitung für verschiedene Datenschutz- und Konformitätsbewertungen verwenden können. Sie sind für zusätzliche Sicherheitsfunktionen, Verschlüsselung und Netzisolation verantwortlich. Siehe Sicherheitsaspekte. |
Verfügbare Services | Die meisten Data Fabric-Services sind in beiden Bereitstellungsumgebungen verfügbar. Weitere Informationen finden Sie in Services für Cloud Pak for Data as a Service. |
Enthält viele weitere Services. Siehe Services for Cloud Pak for Data 4.6. |
Benutzermanagement | Sie fügen Benutzer und Benutzergruppen hinzu und verwalten die zugehörigen Kontorollen und -berechtigungen mit IBM Cloud Identity and Access Management. Weitere Informationen finden Sie unter Benutzer zum Konto hinzufügen. Sie können außerdem SAML-Föderation in IBM Cloud konfigurieren. Siehe IBM Cloud-Dokumentation: Was ist IBM Cloud Identity and Access Management? |
Über das Menü Verwaltung können Sie Benutzer hinzufügen und Benutzergruppen erstellen. Sie können den Service 'Identity and Access Management' oder Ihren vorhandenen SAML-SSO- oder LDAP-Provider verwenden, um Identitäten und Kennwörter zu verwalten. Sie können dynamische, attributbasierte Benutzergruppen erstellen. Siehe Benutzerverwaltung. |
Allgemeine serviceübergreifende Funktionen
Die folgenden Features, die mit der Plattform bereitgestellt werden, sind für Services unter Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5und 4.6:
- Plattformweite globale Suche nach Assets und Artefakten
- Der Katalog der Plattformassets für die plattformweite gemeinsame Nutzung von Verbindungen
- Plattformweite rollenbasierte Benutzerverwaltung in Arbeitsbereichen mit Collaboration.
- Gemeinsame Infrastruktur für Assets und Arbeitsbereiche
- Servicekatalog zum Hinzufügen von Services
- Rechenressourcennutzung über das Menü Verwaltung anzeigen
In der folgenden Tabelle werden die Unterschiede zwischen den Funktionen von Cloud Pak for Data as a Service und Cloud Pak for Data 3.5, 4.5und 4.6beschrieben.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Aktualisierte Projekterfahrung | ✓ | Verfügbar ab 4.5 |
Alle Projekte verwalten | Benutzer mit der Berechtigung Projekte verwalten aus der IAM-Servicezugriffsrolle Manager für den Service IBM Cloud Pak for Data können an jedem Projekt mit der Rolle Administrator teilnehmen und das Projekt anschließend verwalten oder löschen. | Benutzer mit der Berechtigung Projekte verwalten können an jedem Projekt mit der Rolle Administrator teilnehmen und dann das Projekt verwalten bzw. löschen. |
Verbindungen zu fernen Datenquellen | Die meisten unterstützten Datenquellen werden für beide Bereitstellungsumgebungen verwendet (siehe Unterstützte Verbindungen). |
Siehe Unterstützte Datenquellen. |
Persönliche oder gemeinsam genutzte Berechtigungsnachweise für Verbindunngen | Für Verbindungen in Projekten und Katalogen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Kontoebene inaktiviert werden. | Plattformverbindungen können persönliche Berechtigungsnachweise erfordern oder gemeinsam genutzte Berechtigungsnachweise zulassen. Gemeinsam genutzte Berechtigungsnachweise können auf Plattformebene inaktiviert werden. |
Verbindungsberechtigungsnachweise aus geheimen Schlüsseln in einer Vault | Nicht verfügbar. | ✓ |
Beispielassets und Projekte aus der Galerie | ✓ | Nicht verfügbar. |
Anforderungen für den Datenzugriff | Nicht verfügbar. | ✓ |
Watson Studio
Die folgenden Watson Studio -Funktionen sind in Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5und Cloud Pak for Data 4.6:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Projektimport und -export mithilfe einer ZIP-Projektdatei
- Jupyter-Notebooks
- Jobplanung
- Data Refinery
In dieser Tabelle werden die Funktionsunterschiede zwischen dem Watson Studio -Service in mehreren Implementierungsumgebungen, Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen in Cloud Pak for Data as a Service finden Sie unter Watson Studio-Angebotspläne.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Projekt erstellen | Erstellen: Ein leeres Projekt Ein Projekt aus einem Beispiel in der Galerie Ein Projekt aus einer Datei |
Erstellen: Ein leeres Projekt Ein Projekt aus Datei Ein Projekt mit Git -Integration |
Git-Integration | Notebooks auf GitHub veröffentlichen Notebooks als Gist veröffentlichen |
Ein Projekt mit Git integrieren, Assets mit Repository in einem Projekt synchronisieren und diese Assets in einem anderen Projekt verwenden |
Projektterminal für erweiterte Git-Operationen | Nicht verfügbar. | Verfügbar in Projekten mit standardmäßiger Git-Integration |
JupyterLab | Nicht verfügbar. | Verfügbar in Projekten mit Git-Integration |
Visual Studio Code -Integration | Nicht verfügbar. | Verfügbar in Projekten mit Git -Integration ab 4.6 |
RStudio | Kann nicht in Git integriert werden | Kann in Git integriert werden Erfordert einen RStudio Server Runtimes -Service. |
Python-Scripts | Nicht verfügbar. | Mit Python-Scripts in JupyterLab arbeiten Erfordert einen Watson Studio -Laufzeitservice. |
Programmgesteuerter Zugriff auf Projektassets | Verwenden Sie project-lib für Python und R. |
Verwenden Sie ibm-watson-studio-lib für Python und R (Nachfolger von project-lib ) |
Code zum Laden von Daten in ein Notebook mithilfe des Flight service generieren | Nicht verfügbar. | ✓ |
Watson Natural Language Processing (Verarbeitung natürlicher Sprache) | Verfügbar für Python | Verfügbar für Python |
Notebook-Lebenszyklus verwalten | Nicht verfügbar. | CPDCTL für das Lebenszyklusmanagement von Notebooks verwenden |
Codepaketassets (Gruppe abhängiger Dateien in einer Ordnerstruktur) | Nicht verfügbar. | CPDCTL zum Erstellen von Codepaketassets in einem Bereitstellungsbereich verwenden |
Notebooks in Bereiche hochstufen | Nicht verfügbar. | Manuell auf der Seite 'Assets' des Projekts oder programmgesteuert über CPDCTL verfügbar |
Python mit GPU | Unterstützung nur für einen GPU-Typ verfügbar (Nvidia K80) | Unterstützung für mehrere Nvidia-GPU-Typen verfügbar Erfordert einen Watson Studio -Laufzeitservice. |
Angepasste Images erstellen und verwenden | Nicht verfügbar. | Erstellen Sie angepasste Images für Python (mit und ohne GPU), R, JupyterLab (mit und ohne GPU), RStudio und SPSS -Umgebungen. Erfordert Watson Studio -Laufzeiten und andere anwendbare Services. |
Anaconda Repository | Nicht verfügbar. | Zum Erstellen angepasster Umgebungen und angepasste Images verwenden |
Hadoop-Integration | Nicht verfügbar. | Modelle erstellen und trainieren und Data Refinery-Abläufe in einem Hadoop-Cluster ausführen. Erfordert den Service 'Execution Engine for Apache Hadoop'. |
Decision Optimization | ✓ | Erfordert den Service Decision Optimization. |
SPSS Modeler | ✓ | Setzt den SPSS Modeler-Service voraus. |
Watson Pipelines | Beta-Release | Verfügbar ab 4.6. Erfordert den Service Watson Pipelines . |
Dashboards | Erfordert den Service Cognos Dashboard Embedded. | Setzt den Service 'Cognos Dashboards' voraus. |
Watson Machine Learning
Die folgenden Watson Machine Learning -Features sind in Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5und 4.6:
- Zusammenarbeit in Projekten und Bereitstellungsbereichen
- Modellbereitstellung
- Funktionsbereitstellung
- REST-APIs von Watson Machine Learning
- Python-Client von Watson Machine Learning
- Onlinebereitstellungen erstellen
- Bereitstellungen skalieren und aktualisieren
- Angepasste Komponenten definieren und verwenden
- Federated Learning zum Trainieren eines allgemeinen Modells mit separaten und sicheren Datenquellen verwenden
- Bereitstellungen bereichsübergreifend überwachen
In dieser Tabelle werden die Funktionsunterschiede zwischen dem Watson Machine Learning-Service in Umgebungen mit mehreren Bereitstellungen sowie die Unterschiede zwischen Angebotsplänen dargestellt und es wird angegeben, ob zusätzliche Services erforderlich sind. Details zu den Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Service finden Sie unter Watson Machine Learning-Angebotspläne.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
AutoAI -Trainingseingabe | Aktuelle unterstützte Datenquellen | Unterstützte Datenquellen ändern sich nach Release |
Rechenkonfiguration für AutoAI -Experimente | 8 CPUs und 32 GB | Verschiedene Größen verfügbar |
AutoAI begrenzt die Datenmenge und die Anzahl der Vorhersageziele |
Grenzwerte festlegen | Grenzwerte unterscheiden sich je nach Berechnungskonfiguration |
AutoAI -Datenimputation | ✓ | Verfügbar ab 4.5.2 |
AutoAI -Fairnessbewertung | ✓ | Verfügbar ab 4.5.2 |
AutoAI -Zeitreihenunterstützungsfunktionen | ✓ | Verfügbar ab 4.5.3 |
AutoAI Inkrementelles Lernen | Nicht verfügbar. | Verfügbar ab 4.6.0 |
Bereitstellung unter Verwendung gängiger Frameworks und Softwarespezifikationen |
Auf neueste unterstützte Versionen prüfen | Unterstützte Versionen variieren je nach Release |
Verbindung zu Datenbanken für Batchbereitstellungen herstellen | Auf Unterstützung nach Bereitstellungstyp prüfen | Auf Unterstützung nach Bereitstellungstyp und nach Version prüfen |
Python -Scripts bereitstellen und bewerten | Verfügbar über Python-Client | Scripts im JupyterLab -oder Python -Client erstellen und anschließend bereitstellen |
R-Scripts für Bereitstellung und Stapelscoring | Nicht verfügbar. | Verfügbar |
Shiny-Apps bereitstellen | Nicht verfügbar. | Erstellen und implementieren Sie Shiny-Apps Bereitstellung über Codepaket ab 4.5 |
Fairness, Verzerrung oder Drift für Jobs bewerten | Erfordert Watson OpenScale | Erfordert Watson OpenScale |
Erstellung des Steuerbereichs | Keine Einschränkungen nach Rolle | Durch Berechtigungen steuern, wer Bereiche anzeigen und erstellen kann |
Aktualisierte Formulare zum Testen der Online-Implementierung | ✓ | Verfügbar ab 4.5.3 |
Aus GIT-Projekt in Bereich importieren | Nicht verfügbar. | Verfügbar ab 4.5 |
Codepaket, das automatisch erstellt wird, wenn aus einem Git -Projekt in den Speicherbereich importiert wird. |
Nicht verfügbar. | Verfügbar ab 4.5 |
RShiny-App aus Codepaket aktualisieren | Nicht verfügbar. | Verfügbar ab 4.6 |
Modelldetails in einem Modellbestand überwachen | Registrieren Sie Modelle, um Factsheets mit Lebenszyklusdetails anzuzeigen. Erfordert den Service Watson Knowledge Catalog . | Ab 4.5verfügbar. Erfordert den Service AI Factsheets . |
Angepasste Images erstellen und verwenden | Nicht verfügbar. | Angepasste Images für Python oder SPSS erstellen |
Mitbearbeiter über Pipeline-Ereignisse benachrichtigen | Nicht verfügbar. | Verwenden Sie "E-Mail senden", um Mitbearbeiter ab 4.5 zu benachrichtigen. |
Verschachtelte Pipelines verwenden | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Projekt- oder Bereichsdatei in nicht leeren Bereich importieren | Nicht verfügbar. | Verfügbar ab 4.0.6 |
Deep-Learning-Experimente | Nicht verfügbar. | Erfordert Watson Machine Learning Accelerator-Service |
IBM Cloud-Serviceinstanzen bereitstellen und verwalten | Instanzen für Watson Machine Learning oder Watson OpenScale hinzufügen |
Services werden im Cluster vom Administrator bereitgestellt |
Watson Knowledge Catalog
Die folgenden Features von Watson Knowledge Catalog sind in Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5und 4.6:
- Zusammenarbeit in Projekten und Katalogen
- KI-gestützte Suche und Empfehlungen in Katalogen
- Assets in Katalogen bewerten und prüfen
- Data Refinery-Tool in Projekten
- Kategorien mit Mitbearbeiterrollen
- Vordefinierte und angepasste Klassifikationen
- Vordefinierte und angepasste Datenklassen
- Governance-Regeln
- Richtlinien
- Datenschutzregeln
- Manuelle Profilerstellung für einzelne relationale Datenassets in einem Projekt oder Katalog
- Automatische Profilerstellung für relationale Datenassets, die zu einem regulierten Katalog hinzugefügt wurden
- Angepasste Assettypen, angepasste Eigenschaften für Assets und angepasste Beziehungen zwischen Assets in Katalogen
In dieser Tabelle werden die Unterschiede bei den Features des Service Watson Knowledge Catalog in mehreren Implementierungsumgebungen, Unterschiede zwischen Angebotsplänen und die Angabe, ob zusätzliche Services erforderlich sind, beschrieben. Weitere Informationen zu Funktionsunterschieden zwischen Angebotsplänen für Cloud Pak for Data as a Service finden Sie unter Watson Knowledge Catalog-Angebotspläne.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Profilerstellung für unstrukturierte Daten | Automatische Profilerstellung für einzelne Assets, die zu einem Projekt oder Katalog hinzugefügt werden. | Nicht verfügbar. |
Tool Metadata import in Projekten-Erkennung | Importieren Sie Datenassets in Projekte oder Kataloge. Unterstützung für eine Untergruppe mit Projekt- und Katalogverbindungen. Weitere Informationen finden Sie unter Unterstützte Datenquellen für Metadatenimport und Metadatenaufbereitung. | Verschiedene Assettypen importieren: Importieren Sie Datenassets in Projekte oder Kataloge. Die meisten unterstützten Verbindungen sind in beiden Implementierungsumgebungen identisch. Verfügbar ab 4.5: Importieren Sie Business Intelligence-Berichte, Assets mit den zugehörigen Transformationsscripts oder Datenmodelle (ab 4.5.2) in Kataloge. Erfordert die Installation von MANTA Automated Data Lineage ohne Lizenzschlüssel. Unterstützung für eine Untergruppe von Katalogverbindungen. Siehe Unterstützte Datenquellen für Metadatenimport und Metadatenanreicherung. |
Tool Metadata import in 'projects-lineage' | Nicht verfügbar. | Nur in Katalog importieren. Erfordert die Installation von MANTA Automated Data Lineage mit einem Lizenzschlüssel. Unterstützung für eine Untergruppe von Katalogverbindungen. Weitere Informationen finden Sie unter Unterstützte Datenquellen für Metadatenimport und Metadatenaufbereitung. |
Traditionelle Benutzerschnittstellentools | Nicht verfügbar. Verwenden Sie stattdessen Tools in Projekten. | Metadata import Automatische Erkennung QuickScan Datenqualitätsanalyse Informationsassetansicht |
Metadatenanreicherungstool in Projekten | Führen Sie Profilerstellung, Begriffszuordnung und Qualitätsanalyse für große Gruppen von Datenassets aus. | Ab 4.5verfügbar. |
Automatische Begriffszuordnung | ✓ | ✓ |
Datenqualitätsscores | Datenqualitätsscores werden angezeigt in: Assetprofile in Projekten und Katalogen Ergebnisse der Metadatenaufbereitung |
Datenqualitätsscores werden angezeigt in: Assetprofile in Projekten und Katalogen Ergebnisse der Metadatenerweiterung Ergebnisse der Schnellsuche mit der traditionellen Benutzerschnittstelle Datenqualitätsprojekte mit der traditionellen Benutzerschnittstelle |
Datenqualitätsanalyse | ✓ | ✓ |
Datenqualitätsregeln in Projekten | ✓ | Ab 4.5verfügbar. |
Assetaktivitäten | Erfordert einen kostenpflichtigen Plan. Verfügbar in Projekten und Katalogen. |
Verfügbar in Projekten und Katalogen. |
Datenabstammung | Nicht verfügbar. | Ab 4.5verfügbar. |
Abstammung technischer Daten | Nicht verfügbar. | Ab 4.5verfügbar. Erfordert, dass eine lizenzierte Version von MANTA Automated Data Lineage for IBM Cloud Pak for Data installiert ist. Generiert durch Ausführen des Metadatenimporttools. Zugriff über Kataloge möglich. |
Geschäftsbegriffe | Grenzwerte für manche Pläne. | ✓ |
Vordefinierte Geschäftsbegriffe | Vordefinierte Geschäftsbegriffe und die Kategorie 'Knowledge Accelerator Sample Personal Data', die sie enthält, sind nur verfügbar, wenn Sie nach dem 7. Oktober 2022 eine Watson Knowledge Catalog -Serviceinstanz mit einem Lite-oder Standard-Plan erstellen. | Nicht verfügbar. |
Maskierte Datasets in Projekten mit Datenschutz bereitstellen | ✓ | Nicht verfügbar in Version 3.5. |
Referenzdatasets | Grenzwerte pro Plan. | ✓ |
Angepasste Eigenschaften für Artefakte, Kategorien | ✓ | Erstellen Sie über das Menü Administration ab 4.6. |
Angepasste Beziehungen für Artefakte | Erfordert einen kostenpflichtigen Plan. | Erstellen Sie über das Menü Administration ab 4.6. |
Knowledge Accelerators | Erfordert einen Enterprise-Plan. Laden Sie aus der Galerie herunter. |
Laden Sie von der Community für 3.5. herunter, das mit der Plattform ab 4.5bereitgestellt wird. |
Angepasste Workflow-Konfigurationen für Governance-Artefakte und -Anforderungen | Verfügbar für Governance-Artefakte. | ✓ |
Workflow-Tasks überwachen | ✓ | Verfügbar ab 4.5 |
Rollen für angepasste Kategorien | Grenzwerte pro Plan. | ✓ |
Verwaltungsberichte | Erfordert einen kostenpflichtigen Plan. | Ab 4.5verfügbar. |
Assets aus InfoSphere Information Server migrieren | Nicht verfügbar. | ✓ |
DataStage
In der folgenden Tabelle werden die Funktionsunterschiede zwischen DataStage on Cloud Pak for Data as a Service und DataStage on Cloud Pak for Data 4.0.2 oder höher beschrieben.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data 4.0.2 oder höher |
---|---|---|
PX-Instanzverwaltung | Sie können Instanzen aus einer Gruppe mit vordefinierten Größen bereitstellen. | Die Cloud Pak for Data-Instanzverwaltung ermöglicht eine flexiblere Bereitstellung von Instanzen. |
Jobkompilierung |
|
|
Joblaufzeit | Jede Instanz kann jeweils nur einen Job auf einmal ausführen, um die ordnungsgemäße Isolation zu gewährleisten. |
|
Assetverwaltung | Für die Dateitypen .xls, .xlsx, .xml und .json werden nur einfache Strukturen unterstützt. | Für die Dateitypen .csv, .txt, .xls, .xlsx, .xml und .json ist vollständige Unterstützung verfügbar. |
Speicher |
|
|
Stage 'Java Integration' | Nicht verfügbar. | ✓ |
Java-Bibliothekskomponente | Nicht verfügbar. | Verfügbar ab 4.6 |
Generische JDBC-Verbindung | Nicht verfügbar. | ✓ |
Excel | Nicht verfügbar. | ✓ |
AVI | Nicht verfügbar. | ✓ |
Stage 'External Source' | Nicht verfügbar. | ✓ |
Stage 'External Target' | Nicht verfügbar. | ✓ |
Hierarchische Stage |
|
✓ |
MPP und SMP | S, M, L sind Einzelknoten (SMP-Konfiguration). MPP-S, MPP-M, MPP-L sind mehrere Knoten (MPP-Konfiguration). | Standardmäßig ist nur die MPP-Konfiguration verfügbar. Parallele Workloads werden durch eine logische Partition verwaltet, die mit der Option APT_CONFIG_FILE konfiguriert ist. |
Verbindung SAP Bulk Extract | Nicht verfügbar. | Verfügbar ab 4.5 |
Verbindung SAP Delta Extract | Nicht verfügbar. | Verfügbar ab 4.5 |
Wrap-Stage | Nicht verfügbar. | Verfügbar ab 4.5 |
SAP HANA-Verbindung | Nicht verfügbar. | ✓ |
Textdatenquelle in ODBC -Verbindung | Nicht verfügbar. | ✓ |
Build-Stage | Nicht verfügbar. | Verfügbar ab 4.0.9 |
Berichte mithilfe von Subroutinen vor/nach dem Job senden | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Migration verschachtelter Sequenzjobs auf IBM Watson Pipelines | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Angepasste Stage | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Apache HBase -Verbindung | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Kerberos -Authentifizierung für Apache Hive -Verbindungen | Nicht verfügbar. | Verfügbar ab 4.5.2 |
Benutzerdefinierte Funktionen | Nicht verfügbar. | ✓ |
Vor-/Nachher-Job-Eigenschaften | Nicht verfügbar. | ✓ |
Datenservice-Connector | Nicht verfügbar. | ✓ |
Connector für komplexe Flachdateien | Nicht verfügbar. | ✓ |
Match Designer | Nicht verfügbar. | ✓ |
Stage Survive | Nicht verfügbar. | Verfügbar ab 4.6.3 |
Db2 -Datenbanksequenz in Stage 'Slowly Changing Dimension', Stage 'Surrogate Key Generator' und Stage 'Transformer' | Nicht verfügbar. | Verfügbar ab 4.6 |
Verwenden Sie die Apache Hive -Verbindung als Ziel. (Verfügbar, wenn DataStage -Eigenschaften verwenden im Connector aktiviert ist.) | Nicht verfügbar. | Verfügbar ab 4.6.1 |
Eigenschaften mit lokalen Verbindungen parametrisieren | Nicht verfügbar. | Verfügbar ab 4.6.1 |
Stufe Operational Decision Manager | Nicht verfügbar. | Verfügbar ab 4.6.1 |
Watson OpenScale
Die folgende Watson OpenScale -Funktionalität ist in Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5und Cloud Pak for Data 4.6:
- Fairness von Bereitstellungen bewerten
- Qualität von Bereitstellungen bewerten
- Drift von Bereitstellungen überwachen
- Modellergebnisse in einem Insights-Dashboard anzeigen und vergleichen
- Bereitstellungen des gewünschten Machine Learning-Providers hinzufügen
- Alerts festlegen, die ausgelöst werden, wenn Auswertungen einen angegebenen Schwellenwert unterschreiten
- Implementierungen in einer Benutzerschnittstelle oder einem Notebook auswerten
In dieser Tabelle werden die Funktionsunterschiede zwischen dem Watson OpenScale-Service in Umgebungen mit mehreren Bereitstellungen sowie die Unterschiede zwischen Angebotsplänen dargestellt und es wird angegeben, ob zusätzliche Services erforderlich sind.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Vorab bewertete Testdaten hochladen | Nicht verfügbar. | Verfügbar ab 4.0.7 |
Details zu Bewertungen in Modelldatenblättern anzeigen | ✓ | Verfügbar ab 4.5 |
IBM SPSS Collaboration and Deployment Services | Nicht verfügbar. | ✓ |
Batchverarbeitung | Nicht verfügbar. | ✓ |
Zugriffssteuerung nach Benutzergruppen unterstützen | Nicht verfügbar. | ✓ |
Kostenlose Datenbank und Postgres -Pläne | ✓ | Nicht verfügbar. |
Mehrere Instanzen einrichten | Nicht verfügbar. | ✓ |
Angepasste Bewertungen und Metriken | ✓ | Verfügbar ab 4.5 |
Integration mit OpenPages | Nicht verfügbar. | ✓ |
Watson Query
In Cloud Pak for Data as a Service wird die Funktion für Datenvirtualisierung vom Watson Query-Service bereitgestellt. In Cloud Pak for Datawurde der Service Data Virtualization in Version 4.6in Watson Query umbenannt. Die folgende Data virtualization ist in Cloud Pak for Data as a Service und Cloud Pak for Data 4.0effektiv identisch.
- Verbindung zu unterstützten Datenquellen herstellen
- Daten virtualisieren
- Virtuelle Daten durch Richtlinien und Datenschutzregeln regulieren
- Überwachung und Erkundung des Service
- SQL-Schnittstelle verwenden
- Zwischenspeichern
Die folgenden Funktionen für Datenvirtualisierung sind in der Benutzerschnittstelle anscheinend nicht identisch, bieten jedoch dieselbe Basisfunktionalität:
- Virtuelle Daten in Katalogen veröffentlichen
- Zugriff auf virtuelle Objekte verwalten
- Benutzer und Rollen verwalten
- Service skalieren
- Statistikdaten im Web-Client in Watson Queryerfassen
In dieser Tabelle werden die Unterschiede bei den Features zwischen Watson Query in Cloud Pak for Data as a Service und Watson Query (früher Data Virtualization) in Cloud Pak for Databeschrieben.
Funktion | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Integration mit Watson Knowledge Catalog | erforderlich | Optionale |
Gruppenbasierte Berechtigung und Zugriff auf Objektebene für Gruppen | Nicht verfügbar. | ✓ |
Unterstützung für ferne Connectors | Nicht zutreffend für SaaS | ✓ |
Unterstützung für dateisystembasierte Datenquellen, außer in Cloud Object Storage | Nicht zutreffend für SaaS | ✓ |
Verbindung zu Datenquellen herstellen, für die ein hochgeladener JDBC -Treiber erforderlich ist, z. B. SAP HANA, generisches JDBC | Nicht zutreffend für SaaS | ✓ |
Statistikdaten in der Benutzerschnittstelle erfassen | Nicht verfügbar. | ✓ |
Automatische Statistikerfassung während Objektvirtualisierung | Nicht verfügbar. | ✓ |
Spaltenmaskierung | ✓ | ✓ |
Ansicht und erneutes Laden von Tabellen untersuchen | ✓ | Verfügbar ab 4.5 |
Datenstichproben bei der Statistikerfassung | ✓ | Verfügbar ab 4.5 |
Unterstützung für die Regulierung von Daten mithilfe von Richtlinien auf Zeilenebene | Nicht verfügbar. | Verfügbar ab 4.5 |
Metadatenanreicherung | ✓ | Verfügbar ab 4.5 |
Caching von Datenschutzregeln | Nicht verfügbar. | Verfügbar ab 4.5 |
Zugriffsmanagement für mehrere Gruppen | Nicht verfügbar. | Verfügbar ab 4.5 |
Unterstützung für CSV-oder TSV-Dateien in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar ab 4.6 |
Berechtigungsnachweise in Vaults für Verbindungen in Cloud Object Storage | Nicht zutreffend für SaaS | Verfügbar ab 4.6 |
Weitere Informationen
- Produktangebotspläne
- Services für Cloud Pak for Data as a Service
- Services für Cloud Pak for Data 4.6
- Cloud-Implementierungsumgebungsoptionen für Cloud Pak for Data 4.6
Übergeordnetes Thema: Cloud Pak for Data as a Service