Übersicht über Cloud Pak for Data as a Service

Cloud Pak for Data as a Service ist eine Cloud-Serviceplattform für alle Aufgaben im Zusammenhang mit Datengovernance, Data Engineering, Datenanalyse und KI-Lebenszyklus. Cloud Pak for Data as a Service implementiert eine Datenstrukturlösung, damit Sie sofort und sicher auf vertrauenswürdige Daten in Ihrem Unternehmen zugreifen, Prozesse und Compliance automatisieren und vertrauenswürdige KI in Ihren Anwendungen bereitstellen können.

Cloud Pak for Data as a Service ist eine vollständig verwaltete Cloud-Service-Plattform mit den folgenden Vorteilen:

  • Kein Installieren, Verwalten oder Aktualisieren von Software oder Hardware
  • Einfach zu skalieren nach oben oder unten
  • Sicher und kompatibel
  • Composable Services-Architektur
  • Monatliche Abrechnung auf Abonnement- oder Nutzungsbasis

Cloud Pak for Data as a Service-Datenstrukturlösung

Mit einer Datenstrukturarchitektur kann Ihr Unternehmen das Potenzial Ihrer Daten in einer hybriden Multi-Cloud-Datenlandschaft ausschöpfen. Die Umstellung auf eine Datenstrukturarchitektur verändert die Art und Weise, wie Ihr Unternehmen Daten für Analysen, Datenwissenschaft, Kundenstammdaten und Compliance integriert, regelt und verwendet. Die Datenstrukturlösung Cloud Pak for Data as a Service bietet die folgenden Hauptfunktionen für die Verwaltung und Automatisierung Ihrer Daten und KI-Lebenszyklen:

Self-Service Alle Benutzer können Daten unternehmensweit in Katalogen suchen und verwenden.

Erweitertes Wissen Ein einheitliches Geschäftsvokabular hilft Benutzern, Ihre Daten zu verstehen.

Intelligente Integration Stellen Sie Zugriff auf Daten in Ihrer vorhandenen Datenarchitektur bereit.

Datengovernance, Sicherheit und Compliance Sorgen Sie für die automatische Durchsetzung eines einheitlichen Datenschutzes auf der gesamten Plattform.

Einheitlicher Lebenszyklus Automatisieren Sie das Erstellen, Testen, Bereitstellen und Überwachen von Datenpipelines und KI-Modellen.

Weitere Informationen zu den Vorteilen der Datenstruktur finden Sie unter Was ist eine Datenstruktur?

Cloud Pak for Data as a Service stellt vier Anwendungsfälle als Teil der Datenstrukturlösung bereit:

  • Multi-Cloud-Datenintegration: Vereinfachen und automatisieren Sie den Zugriff auf alle Ihre Daten, ohne sie zu verschieben.
  • Datengovernance und Datenschutz: Implementieren Sie Governance auf der Basis von Metadaten, die Geschäftswissen bereitstellen und Datenschutz definieren. Stellen Sie hochwertige Datenassets in Self-Service-Katalogen bereit. Automatisieren Sie die Durchsetzung von Datengovernance für die Einhaltung gesetzlicher Bestimmungen.
  • Customer 360: Verschaffen Sie sich einen umfassenden Einblick in Ihre Kunden, der durch KI-gestützte Erkenntnisse ergänzt wird, um intelligentere Kundeninteraktionen zu ermöglichen.
  • MLOps und vertrauenswürdige KI: Erstellen und operationalisieren Sie KI mit einem automatisierten und regulierten Workflow, der Fairness, Qualität und Erklärbarkeit in Ihren Modellen durchsetzt.

Sie können mit einem beliebigen Anwendungsfall beginnen und die anderen nach Bedarf hinzufügen. Sie implementieren jeden Anwendungsfall, indem Sie mindestens einen Service bereitstellen, der Features und Tools bietet. Einige Services sind in mehreren Anwendungsfällen enthalten.

Anwendungsfall 'Multi-Cloud-Datenintegration'

{: #integrate} Der Anwendungsfall 'Multi-Cloud-Datenintegration' stellt Tools bereit, die Daten in einer verteilten Umgebung dynamisch und intelligent orchestrieren, um ein Netz von sofort verfügbaren Informationen für Datenkonsumenten zu erstellen.

Die Datenstrukturlösung bietet die folgenden Vorteile gegenüber einer Lösung, die sich nur auf die Datenintegration konzentriert:

Self-Service-Katalog Datenentwickler können jedes integrierte Dataset in einem einzigen Katalog veröffentlichen, in dem sich alle Benutzer, die die Daten nutzen müssen, bedienen können.

Datenschutz Sensible Daten können automatisch geschützt werden.

Datenentwickler können Ihre Daten auf folgende Weise für die Nutzung vorbereiten:

  • Sie ermöglichen den Zugriff auf Daten in Ihrer vorhandenen Multi-Cloud- und On-Premises-Datenarchitektur, und zwar in beliebigem Umfang und in beliebiger Komplexität.
  • Sie integrieren und virtualisieren Daten für schnellere, einfachere Abfragen.
  • Sie automatisieren die Massenaufnahme, Bereinigung und komplexe Transformationen von Daten, um regelmäßig aktualisierte Datenassets zu veröffentlichen.
  • Sie verlagern die Verarbeitung der Daten an die Position der Daten.
  • Sie veröffentlichen vorbereitete Datenassets zur Self-Service-Nutzung in Katalogen.

Services für diesen Anwendungsfall: Watson Query, DataStage und Watson Knowledge Catalog.

Lernprogramm für diesen Anwendungsfall:

Lernprogramm Beschreibung Fachkenntnisse für das Lernprogramm
Daten integrieren Sie extrahieren, filtern, verknüpfen und transformieren Ihre Daten. Verwendung der Drag-and-drop-Schnittstelle von DataStage zum Transformieren von Daten.


Anwendungsfall 'Datengovernance und Datenschutz'

{: #govern} Der Anwendungsfall 'Datengovernance und Datenschutz' stellt Methoden zur Automatisierung von Datengovernance und Datenschutz bereit, um Vertrauen, Schutz, Sicherheit und Compliance sicherzustellen.

Die Datenstrukturlösung bietet die folgenden Vorteile gegenüber einer Lösung, die sich nur auf die Datengovernance konzentriert:

Automatisierter, einheitlicher Datenschutz Eine einzelne Gruppe von Regeln wird automatisch plattformübergreifend durchgesetzt.

Self-Service-Kataloge Data-Scientists und andere Benutzer können sich die benötigten Daten beschaffen und dabei die Zugriffs- und Datenschutzrichtlinien des Unternehmens einhalten.

Datenverantwortliche und andere Governance-Teammitglieder können Ihre Daten auf folgende Weise für die Nutzung vorbereiten:

  • Sie erstellen ein Geschäftsvokabular, das die Daten beschreibt, damit Datenkonsumenten die Daten verstehen, finden und verwenden können.
  • Sie kuratieren hochwertige Daten, die mit Metadaten in Katalogen aufbereitet werden, indem sie automatisierte Erkennung, Qualitätsanalyse, Klassifizierung und Geschäftsbegriffszuordnungen verwenden.
  • Sie setzen den Datenschutz auf der gesamten Plattform automatisch durch, indem sie Datenschutzregeln erstellen, die sensible Daten maskieren und gleichzeitig das Datendienstprogramm beibehalten.

Data-Scientists und andere Geschäftsbenutzer können die Daten wie folgt suchen und verwenden:

  • Sie suchen die benötigten Daten in Katalogen mithilfe von KI-gestützter semantischer Suche und Empfehlungen.
  • Sie fügen Datenassets aus einem Katalog zu einem Projekt hinzu, in dem sie zusammenarbeiten, um die Daten vorzubereiten, zu analysieren und zu modellieren.

Service für diesen Anwendungsfall: Watson Knowledge Catalog.

Anwendungsfall 'Kunde 360'

{: #customer} Der Anwendungsfall 'Kunde 360' stellt Tools bereit, mit denen Sie eine umfassende Ansicht der Kunden erstellen können, indem Sie Daten domänenübergreifend verbinden und diese Daten in interaktiven Dashboards darstellen.

Die Datenstrukturlösung bietet die folgenden Vorteile gegenüber einer Lösung, die sich nur auf Stammdaten konzentriert:

Datenschutz Sensible Daten über Kunden können automatisch geschützt werden.

Datenqualität Data-Scientists und Mitarbeiter aus anderen Einsatzbereichen haben Zugriff auf hochwertige Daten, die über einen Self-Service-Katalog verfügbar und für die Analyse bereit sind.

Datenentwickler und Data-Scientists können Stammdaten auf folgende Arten vorbereiten:

  • Sie kombinieren Daten aus unterschiedlichen Quellen, generieren und optimieren das Datenmodell und ordnen die Daten dem Datenmodell zu.
  • Sie erstellen Stammdateneinträge, indem sie den KI-basierten Abgleichalgorithmus ausführen.
  • Sie konfigurieren und optimieren den Abgleichalgorithmus, um die Anforderungen Ihres Unternehmens zu erfüllen.

Geschäftsbenutzer können auf folgende Arten Erkenntnisse aus Kundendaten gewinnen:

  • Sie erkunden umfassende Informationen zu einem oder mehreren Kunden.
  • Sie erstellen und teilen interaktive Dashboards, die das Kundenverhalten beschreiben.

Services für diesen Anwendungsfall: IBM Match 360 with Watson, Cognos Dashboard Embedded und Watson Knowledge Catalog.

Lernprogramme für diesen Anwendungsfall:

Lernprogramm Beschreibung Fachkenntnisse für das Lernprogramm
360-Grad-Ansicht konfigurieren Sie richten Ihre Daten ein, ordnen sie zu und modellieren sie, um eine 360-Grad-Ansicht Ihrer Kunden zu erstellen. Verwendung der Drag-and-drop-Schnittstelle von Match 360 zum Konfigurieren Ihrer 360-Ansicht.
Lernen Sie Ihre Kunden kennen Sie erkunden die 360-Grad-Ansicht, um die geeignetsten Kunden für die Angebot der Marketingkampagne zu ermitteln. Verwendung der Drag-and-drop-Schnittstelle von Match 360, um Daten zu untersuchen.


Anwendungsfall 'MLOps und vertrauenswürdige KI'

{: #trust} Der Anwendungsfall 'MLOps und vertrauenswürdige KI' stellt Tools für den gesamten KI-Lebenszyklus bereit, die Governance, Automatisierung und Herkunft abdecken, um vertrauenswürdige Ergebnisse sicherzustellen.

Die Datenstrukturlösung bietet die folgenden Vorteile gegenüber einer Lösung, die sich nur auf die Datenwissenschaft konzentriert:

Datenqualität Data-Scientists und Mitarbeiter aus anderen Einsatzbereichen haben Zugriff auf hochwertige Daten, die reguliert werden, über einen Self-Service-Katalog verfügbar sind und mit mehreren Methoden analysiert werden können.

Schneller Einsatz in der Produktion Data-Science-Teams können mit MLOps, das von Fairness, Erklärbarkeit und Robustheit geprägt ist, die Zeit für die Einführung von Modellen in die Produktion verkürzen.

KI-Governance MLOps-Teams können Prozesse automatisieren, um Konsistenz, Effizienz und Transparenz von KI-Modellen zu fördern, sodass gesetzliche Bestimmungen mit minimalem Aufwand erfüllt oder übertroffen werden.

Data-Scientists, Geschäftsanalysten und Entwickler für maschinelles Lernen können Modelle auf folgende Arten erstellen, bereitstellen und verwalten:

  • Sie erstellen gemeinsam Modelle, indem sie die Tools auswählen, die ihren individuellen Präferenzen und Kenntnisstufen entsprechen.
  • Sie stufen trainierte Modelle in Bereitstellungsbereiche hoch, stellen die Modelle bereit und bewerten sie, überprüfen Vorhersagebewertungen und Erkenntnisse und überwachen Bereitstellungsjobs in einem Dashboard.
  • Sie automatisieren Ihre Modelllebenszyklen mit durchgängigen Abläufen, die Daten vorbereiten. Anschließend werden Modelle für maschinelles Lernen erstellt, trainiert, bereitgestellt, überwacht und aktualisiert.
  • Sie bewerten Bereitstellungen im Hinblick auf systematische Fehler oder Abweichungen und aktualisieren Daten. Danach trainieren Sie bereitgestellte Modelle erneut, um die Qualitätsziele zu erfüllen.
  • Sie erfassen Metadaten zum Modell, verfolgen die Daten-und Modellherkunft und dokumentieren den Modelllebenszyklus in Modelldatenblättern.

Services für diesen Anwendungsfall: Watson Studio, Watson Machine Learning, Watson OpenScale und Watson Knowledge Catalog.

Lernprogramme für diesen Anwendungsfall:

Lernprogramm Beschreibung Fachkenntnisse für das Lernprogramm
Modell erstellen und bereitstellen Sie trainieren ein Modell, stufen es in einen Bereitstellungsbereich hoch und stellen das Modell bereit. Ausführen eines Notebooks.
Modell testen und validieren Sie bewerten ein Modell auf Genauigkeit, Fairness und Erklärbarkeit. Ausführen eines Notebooks aus und anzeigen der Ergebnisse in der Benutzeroberfläche.

Services und Plattformarchitektur

Durch die Bereitstellung von Services fügen Sie der Cloud Pak for Data as a Service-Plattform Features und Tools hinzu. Eine Gruppe von Kernservices ist in die allgemeine Plattform integriert. Andere zugehörige Services arbeiten mit der Plattform, werden aber außerhalb der Plattform ausgeführt. Je nachdem, wie Sie sich für Cloud Pak for Data as a Service anmelden, können Sie mit einer Untergruppe der Kernservices beginnen, die einen einzelnen Anwendungsfall für eine Datenstrukturlösung darstellen.

Servicearchitektur

Sie können die folgenden Servicetypen aus dem Cloud Pak for Data as a Service-Servicekatalog bereitstellen:

Kernservices Kernservices werden nahtlos integriert und fügen Tools, Arbeitsbereiche oder Rechenleistung zur Benutzerschnittstelle der Plattform hinzu:

  • Watson Studio zum Analysieren von Daten
  • Watson Machine Learning zum Erstellen und Bereitstellen von Modellen
  • Watson OpenScale zum Auswerten von Modellen
  • Watson Knowledge Catalog für die Regulierung und Katalogisierung von Daten und anderen Assets
  • DataStage für die Integration von Daten
  • Watson Query für die Virtualisierung und Abfrage von Daten
  • Match 360 für die Erstellung von Stammdaten
  • Cognos Dashboard Embedded für die Visualisierung von Daten

Zugeordnete Services IBM Cloud-Datenbankservices, mit denen Sie auf Daten innerhalb der Plattform zugreifen, die Daten jedoch außerhalb der Plattform speichern und verwalten können.

Watson-Services, die über eigene Benutzerschnittstellen verfügen oder APIs zum Analysieren von Daten bereitstellen.

Arbeitsbereiche und Assets

{: #workspace}Cloud Pak for Data as a Service ist als Gruppe von bereichsübergreifenden Arbeitsbereichen organisiert, in denen Sie mit Ihrem Team oder Ihrer Organisation arbeiten können. Jeder Arbeitsbereich hat eine Gruppe von Mitgliedern mit Rollen, die Berechtigungen zum Ausführen von Aktionen bereitstellen. Die meisten Benutzer arbeiten mit Assets. Datenassets enthalten Metadaten, die Daten darstellen, während operative Assets, wie z. B. Datenpipelines und Modelle, Code ausführen, um mit Daten zu arbeiten. Das folgende Diagramm zeigt die wichtigsten Arbeitsbereiche, ihren Zweck und die Art und Weise, wie sich Assets und andere Elemente auf der Plattform bewegen.

Die Hauptarbeitsbereiche sind Projekte, Kataloge, Bereitstellungsbereiche und Kategorien. Assets bewegen sich zwischen Projekten und Bereitstellungsbereichen und Katalogen. Governance-Artefakte werden in Kategorien erstellt und als Metadaten zu Assets in Katalogen hinzugefügt.

Projekte

Ihre Data-Science-, Data-Engineering- oder Datenkuratierungsteams arbeiten in Projekten mit Daten, um Assets wie Notebooks, Dashboards, Modelle, Datenpipelines oder aufbereitete Datenassets zu erstellen. Die Projekttools werden von den meisten Kernservices bereitgestellt:

  • Watson Studio stellt Tools für Data Refinery, den Jupyter Notebooks-Editor, SPSS Modeler, Decision Optimization, Pipelines und RStudio bereit.
  • Watson Machine Learning stellt AutoAI- und Federated Learning-Tools bereit
  • Watson Knowledge Catalog stellt die Tools für Data Refinery, den Metadatenimport, die Metadatenaufbereitung und Maskierungsabläufe bereit.
  • DataStage stellt den Editor für DataStage-Datenpipelines bereit
  • Cognos Dashboard Embedded stellt den Dashboardeditor bereit
  • Match 360 stellt das Konfigurationstool für Stammdaten bereit

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Projekts aussehen könnte.

Ein Projekt enthält Assets und Mitarbeiter.

Kataloge

In Katalogen findet und speichert Ihr Unternehmen hochwertige, vertrauenswürdige Daten und andere Assets, z. B. Modelldatenblätter. Sie können Datenassets in einem Katalog suchen und in ein Projekt verschieben, um mit den Daten zu arbeiten. Oder Sie können Daten in Projekten kuratieren und die hochwertigen Datenassets für andere Benutzer in einem Katalog veröffentlichen. Kataloge erfordern den Service Watson Knowledge Catalog.

Die folgende Abbildung zeigt, wie die Seite Assets eines Katalogs aussehen könnte.

Ein Katalog enthält eine Ansicht von Assets.

Bereitstellungsbereich

Bereitstellungsbereiche sind Bereiche, in denen Ihr ModelOps-Team Modelle in der Produktion bereitstellt und anschließend Modelle in der Produktion testet und verwaltet. Nachdem Sie Modelle in Projekten erstellt haben, stufen Sie sie in Bereitstellungsbereiche hoch. Bereitstellungsbereiche erfordern den Watson Machine Learning-Service.

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Bereitstellungsbereichs aussehen könnte. Ein Bereitstellungsbereich enthält Assets und Mitarbeiter.

Kategorien

In Kategorien erstellt und verwaltet Ihr Governance-Team Governance-Artefakte, die Datenassets in Katalogen aufbereiten. Kategorien erfordern den Service Watson Knowledge Catalog.

Die folgende Abbildung zeigt, wie eine Kategorie aussehen könnte. Eine Kategorie enthält Governance-Artefakte.

Weitere Arbeitsbereiche

Sie können spezialisierte Datenassets in anderen Arbeitsbereichen erstellen und in Projekte und Kataloge verschieben:

  • Der Watson Query-Service stellt einen Arbeitsbereich zum Erstellen von virtualisierten Datenassets und Abfragedaten bereit.
  • Der Match360-Service stellt einen Arbeitsbereich zum Konfigurieren und Erkunden einer 360-Grad-Ansicht von Kundendaten bereit.

Beispielgalerie

Die Plattform enthält eine integrierte Beispielgalerie, die Datenassets, Notebooks und Beispielprojekte bereitstellt. Beispielnotebooks enthalten Beispiele mit Code für Data-Science und maschinelles Lernen. Beispielprojekte, einschließlich Branchenbeschleuniger, enthalten Datensätze, Modelle, andere Assets und detaillierte Anweisungen zur Lösung eines bestimmten Geschäftsproblems. Die Galerie stellt auch Knowledge Accelerators bereit. Diese enthalten Gruppen von Governance-Artefakten, die Sie importieren können, um Geschäftsvokabular für bestimmte Branchen bereitzustellen.

Die folgende Abbildung zeigt, wie die Galerie aussieht. Die Galerie enthält Beispiele.

Weitere Informationen

Übergeordneter Abschnitt: Cloud Pak for Data as a Service