0 / 0
Zurück zur englischen Version der Dokumentation
Übersicht über Cloud Pak for Data as a Service
Übersicht über Cloud Pak for Data as a Service

Übersicht über Cloud Pak for Data as a Service

Cloud Pak for Data as a Service ist eine Cloud-Serviceplattform für alle Aufgaben im Zusammenhang mit Datengovernance, Data Engineering, Datenanalyse und KI-Lebenszyklus. Cloud Pak for Data as a Service implementiert eine Datenstrukturlösung, damit Sie sofort und sicher auf vertrauenswürdige Daten in Ihrem Unternehmen zugreifen, Prozesse und Compliance automatisieren und vertrauenswürdige KI in Ihren Anwendungen bereitstellen können.

Cloud Pak for Data as a Service ist eine vollständig verwaltete Cloud-Service-Plattform mit den folgenden Vorteilen:

  • Kein Installieren, Verwalten oder Aktualisieren von Software oder Hardware
  • Einfach zu skalieren nach oben oder unten
  • Sicher und kompatibel
  • Composable Services-Architektur
  • Monatliche Abrechnung auf Abonnement- oder Nutzungsbasis

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

Cloud Pak for Data as a Service-Datenstrukturlösung

Mit einer Datenstrukturarchitektur kann Ihr Unternehmen das Potenzial Ihrer Daten in einer hybriden Multi-Cloud-Datenlandschaft ausschöpfen. Die Umstellung auf eine Datenstrukturarchitektur verändert die Art und Weise, wie Ihr Unternehmen Daten für Analysen, Datenwissenschaft, Kundenstammdaten und Compliance integriert, regelt und verwendet.

Mit einem Datenfabric können Sie auf sichere und konsistente Weise auf Daten aus unterschiedlichen Quellen zugreifen. Sie können ineffiziente, sich wiederholende und manuelle Datenzugriffs-und Integrationsprozesse vermeiden. Eine Datenstrukturarchitektur schließt die Lücke zwischen den Quellen und stellt geschäftsbereite Daten bereit, um die Anforderungen Ihres Unternehmens zu unterstützen. Sie können mit Daten aus verschiedenen Quellen in einer Hybrid-und Multi-Cloud-Umgebung arbeiten, während Sie diese Daten sicher und vertrauenswürdig mit der gesamten Bandbreite der integrierten Datenmanagementfunktionen halten.

Abbildung mit einem Datenfabric mit verschiedenen Datenquellen

Ihre Datenentwickler benötigen Tools zum Vorbereiten, Transformieren und Virtualisieren von Daten. Ihre Datenqualitätsanalysten benötigen Tools, um die Qualität der Daten zu messen. Ihr Governance-Team benötigt Tools zum Steuern, Schützen und Aufbereiten Ihrer Daten. Ihre Datenkonsumenten wie Geschäftsanalysten und Data-Scientists benötigen Tools, um gemeinsam Erkenntnisse und Modelle zu entwickeln. Mit der Cloud Pak for Data -Plattform mit integrierten Tools kann Ihr Unternehmen effizient zusammenarbeiten, um Ihre Daten zur Verbesserung Ihres Unternehmens zu nutzen.

Weitere Informationen zur Datenstrukturlösung finden Sie unter Übersicht über die Datenstrukturlösung. Wenn Sie sich mit der Implementierung der Datenstruktur vertraut machen möchten, nutzen Sie die Lernprogramme für Datenstrukturen.

Services und Plattformarchitektur

Durch die Bereitstellung von Services fügen Sie der Cloud Pak for Data as a Service-Plattform Features und Tools hinzu. Eine Gruppe von Kernservices ist in die allgemeine Plattform integriert. Andere zugehörige Services arbeiten mit der Plattform, werden aber außerhalb der Plattform ausgeführt. Je nachdem, wie Sie sich für Cloud Pak for Data as a Service anmelden, können Sie mit einer Untergruppe der Kernservices beginnen, die einen einzelnen Anwendungsfall für eine Datenstrukturlösung darstellen.

Servicearchitektur

Sie können die folgenden Servicetypen aus dem Cloud Pak for Data as a Service-Servicekatalog bereitstellen:

Kernservices Kernservices werden nahtlos integriert und fügen Tools, Arbeitsbereiche oder Rechenleistung zur Benutzerschnittstelle der Plattform hinzu:

  • Watson Studio zum Analysieren von Daten
  • Watson Machine Learning zum Erstellen und Bereitstellen von Modellen
  • Watson OpenScale zum Auswerten von Modellen
  • Watson Knowledge Catalog für die Regulierung und Katalogisierung von Daten und anderen Assets
  • DataStage für die Integration von Daten
  • Watson Query für die Virtualisierung und Abfrage von Daten
  • Match 360 für die Erstellung von Stammdaten
  • Cognos Dashboard Embedded für die Visualisierung von Daten

Zugeordnete Services IBM Cloud-Datenbankservices, mit denen Sie auf Daten innerhalb der Plattform zugreifen, die Daten jedoch außerhalb der Plattform speichern und verwalten können.

Watson-Services, die über eigene Benutzerschnittstellen verfügen oder APIs zum Analysieren von Daten bereitstellen.

Arbeitsbereiche und Assets

Cloud Pak for Data as a Service ist als Gruppe von Arbeitsbereichen mit Onlinezusammenarbeit organisiert, in denen Sie mit Ihrem Team oder Ihrer Organisation arbeiten können. Jeder Arbeitsbereich hat eine Gruppe von Mitgliedern mit Rollen, die Berechtigungen zum Ausführen von Aktionen bereitstellen. Die meisten Benutzer arbeiten mit Assets. Datenassets enthalten Metadaten, die Daten darstellen, während operative Assets, wie z. B. Datenpipelines und Modelle, Code ausführen, um mit Daten zu arbeiten. Das folgende Diagramm zeigt die wichtigsten Arbeitsbereiche, ihren Zweck und die Art und Weise, wie sich Assets und andere Elemente auf der Plattform bewegen.

Die Hauptarbeitsbereiche sind Projekte, Kataloge, Bereitstellungsbereiche und Kategorien. Assets bewegen sich zwischen Projekten und Bereitstellungsbereichen und Katalogen. Governance-Artefakte werden in Kategorien erstellt und als Metadaten zu Assets in Katalogen hinzugefügt.

Projekte

Ihre Data-Science-, Data-Engineering- oder Datenkuratierungsteams arbeiten in Projekten mit Daten, um Assets wie Notebooks, Dashboards, Modelle, Datenpipelines oder aufbereitete Datenassets zu erstellen. Die Projekttools werden von den meisten Kernservices bereitgestellt:

  • Watson Studio stellt Tools für Data Refinery, den Jupyter Notebooks-Editor, SPSS Modeler, Decision Optimization, Pipelines und RStudio bereit.
  • Watson Machine Learning stellt AutoAI- und Federated Learning-Tools bereit
  • Watson Knowledge Catalog stellt die Tools für Data Refinery, den Metadatenimport, die Metadatenaufbereitung und Maskierungsabläufe bereit.
  • DataStage stellt den Editor für DataStage-Datenpipelines bereit
  • Cognos Dashboard Embedded stellt den Dashboardeditor bereit
  • Match 360 stellt das Konfigurationstool für Stammdaten bereit

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Projekts aussehen könnte.

Ein Projekt enthält Assets und Mitarbeiter.

Kataloge

In Katalogen findet und speichert Ihr Unternehmen hochwertige, vertrauenswürdige Daten und andere Assets, z. B. Modelldatenblätter. Sie können Datenassets in einem Katalog suchen und in ein Projekt verschieben, um mit den Daten zu arbeiten. Oder Sie können Daten in Projekten kuratieren und die hochwertigen Datenassets für andere Benutzer in einem Katalog veröffentlichen. Kataloge erfordern den Service Watson Knowledge Catalog.

Die folgende Abbildung zeigt, wie die Seite Assets eines Katalogs aussehen könnte.

Ein Katalog enthält eine Ansicht von Assets.

Bereitstellungsbereich

Bereitstellungsbereiche sind Bereiche, in denen Ihr ModelOps-Team Modelle in der Produktion bereitstellt und anschließend Modelle in der Produktion testet und verwaltet. Nachdem Sie Modelle in Projekten erstellt haben, stufen Sie sie in Bereitstellungsbereiche hoch. Bereitstellungsbereiche erfordern den Watson Machine Learning-Service.

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Bereitstellungsbereichs aussehen könnte.

Ein Bereitstellungsbereich enthält Assets und Mitarbeiter.

Kategorien

In Kategorien erstellt und verwaltet Ihr Governance-Team Governance-Artefakte, die Datenassets in Katalogen aufbereiten. Kategorien erfordern den Service Watson Knowledge Catalog.

Die folgende Abbildung zeigt, wie eine Kategorie aussehen könnte.

Eine Kategorie enthält Governance-Artefakte.

Weitere Arbeitsbereiche

Sie können spezialisierte Datenassets in anderen Arbeitsbereichen erstellen und in Projekte und Kataloge verschieben:

  • Der Service Watson Query stellt einen Arbeitsbereich zum Virtualisieren von Datenassets für viele Datenquellen bereit.
  • Der Match360-Service stellt einen Arbeitsbereich zum Konfigurieren und Erkunden einer 360-Grad-Ansicht von Kundendaten bereit.

Die Plattform enthält eine integrierte Beispielgalerie, die Datenassets, Notebooks und Beispielprojekte bereitstellt. Beispielnotebooks enthalten Beispiele mit Code für Data-Science und maschinelles Lernen. Beispielprojekte, einschließlich Branchenbeschleuniger, enthalten Datensätze, Modelle, andere Assets und detaillierte Anweisungen zur Lösung eines bestimmten Geschäftsproblems. Die Galerie stellt auch Knowledge Accelerators bereit. Diese enthalten Gruppen von Governance-Artefakten, die Sie importieren können, um Geschäftsvokabular für bestimmte Branchen bereitzustellen.

Die folgende Abbildung zeigt, wie die Galerie aussieht.

Die Galerie enthält Beispiele.

Weitere Informationen

Übergeordnetes Thema: Cloud Pak for Data as a Service