0 / 0
Zurück zur englischen Version der Dokumentation
Übersicht über Cloud Pak for Data as a Service
Letzte Aktualisierung: 28. Nov. 2024
Übersicht über Cloud Pak for Data as a Service

Cloud Pak for Data as a Service ist eine Cloud-Serviceplattform für alle Aufgaben im Zusammenhang mit Datengovernance, Data Engineering, Datenanalyse und KI-Lebenszyklus. Cloud Pak for Data as a Service implementiert eine Datenstrukturlösung, damit Sie sofort und sicher auf vertrauenswürdige Daten in Ihrem Unternehmen zugreifen, Prozesse und Compliance automatisieren und vertrauenswürdige KI in Ihren Anwendungen bereitstellen können.

Cloud Pak for Data as a Service ist eine vollständig verwaltete Cloud-Service-Plattform mit den folgenden Vorteilen:

  • Kein Installieren, Verwalten oder Aktualisieren von Software oder Hardware
  • Einfach zu skalieren nach oben oder unten
  • Sicher und kompatibel
  • Composable Services-Architektur
  • Monatliche Abrechnung auf Abonnement- oder Nutzungsbasis

Sehen Sie sich dieses Video an, um eine Übersicht über Cloud Pak for Data as a Service anzuzeigen.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.


Cloud Pak for Data as a Service-Datenstrukturlösung

Mit einer Data Fabric architektur kann Ihr Unternehmen das Potenzial Ihrer Daten in einer hybriden Multi-Cloud-Datenlandschaft ausschöpfen. Die Umstellung auf eine Data Fabric architektur verändert die Art und Weise, wie Ihr Unternehmen Daten für Analysen, Datenwissenschaft, Kundenstammdaten und Compliance integriert, regelt und verwendet.

Mit einem Data Fabric können Sie auf sichere und konsistente Weise auf Daten aus unterschiedlichen Quellen zugreifen. Sie können ineffiziente, sich wiederholende und manuelle Datenzugriffs-und Integrationsprozesse vermeiden. Eine Data Fabric architektur überbrückt die Lücke zwischen den Quellen und stellt geschäftsbereite Daten bereit, die die Anforderungen Ihres Unternehmens unterstützen. Sie können mit Daten aus verschiedenen Quellen in einer Hybrid-und Multi-Cloud-Umgebung arbeiten, während Sie diese Daten sicher und vertrauenswürdig mit der gesamten Bandbreite der integrierten Datenmanagementfunktionen halten.

Abbildung mit einem Datenfabric mit verschiedenen Datenquellen

Ihre Datenentwickler benötigen Tools zum Vorbereiten, Transformieren und Virtualisieren von Daten. Ihre Datenqualitätsanalysten benötigen Tools, um die Qualität der Daten zu messen. Ihr Governance-Team benötigt Tools zum Steuern, Schützen und Aufbereiten Ihrer Daten. Ihre Datenkonsumenten wie Geschäftsanalysten und Data-Scientists benötigen Tools, um gemeinsam Erkenntnisse und Modelle zu entwickeln. Mit der Cloud Pak for Data -Plattform mit integrierten Tools kann Ihr Unternehmen effizient zusammenarbeiten, um Ihre Daten zur Verbesserung Ihres Unternehmens zu nutzen.

Eine Datenstrukturarchitektur implementiert ein aktives Metadatenmanagement, das maschinelles Lernen verwendet, um die Metadatenverarbeitung zu automatisieren. Die Ergebnisse der Metadatenanalyse ermöglichen eine automatisierte Datenerkennung, verbessern das Vertrauen in Daten und ermöglichen Datenschutz und Datengovernance im richtigen Maß.

Weitere Informationen zur Datenstrukturlösung finden Sie unter Anwendungsfälle. Wenn Sie sich mit der Implementierung der Datenstruktur vertraut machen möchten, nutzen Sie die Lernprogramme für Datenstrukturen.

Services und Plattformarchitektur

Durch die Bereitstellung von Services fügen Sie der Cloud Pak for Data as a Service-Plattform Features und Tools hinzu. Eine Gruppe von Kernservices ist in die allgemeine Plattform integriert. Andere zugehörige Services arbeiten mit der Plattform, werden aber außerhalb der Plattform ausgeführt. Je nachdem, wie Sie sich für Cloud Pak for Data as a Service anmelden, können Sie mit einer Untergruppe der Kernservices beginnen, die einen einzelnen Anwendungsfall für eine Datenstrukturlösung darstellen.

Servicearchitektur

Sie können die folgenden Servicetypen aus dem Cloud Pak for Data as a Service-Servicekatalog bereitstellen:

  • Core-Services
    Core-Services sind nahtlos integriert und fügen Tools, Arbeitsbereiche oder Rechenleistung zur Benutzerschnittstelle der Plattform hinzu:

    • watsonx.ai Studio für die Analyse von Daten
    • watsonx.ai Runtime zum Erstellen und Bereitstellen von Modellen
    • Watson OpenScale zum Auswerten von Modellen
    • IBM Knowledge Catalog für die Steuerung und Katalogisierung von Daten und anderen Assets
    • DataStage für die Integration von Daten
    • Data Virtualization zur Virtualisierung und Abfrage von Daten
    • Match 360 für die Erstellung von Stammdaten
    • Data Replication für die Replikation von Daten
    • Cognos Dashboard Embedded für die Visualisierung von Daten
  • Zugehörige Services
    IBM Cloud -Datenbankservices, die Sie verwenden können, um auf Daten innerhalb der Plattform zuzugreifen, die Daten jedoch außerhalb der Plattform zu speichern und verwalten.

    Watson -Services, die über eigene Benutzerschnittstellen verfügen oder APIs für die Datenanalyse bereitstellen.

Arbeitsbereiche und Assets

Cloud Pak for Data as a Service ist als Gruppe von Arbeitsbereichen mit Onlinezusammenarbeit organisiert, in denen Sie mit Ihrem Team oder Ihrer Organisation arbeiten können. Jeder Arbeitsbereich hat eine Gruppe von Mitgliedern mit Rollen, die Berechtigungen zum Ausführen von Aktionen bereitstellen. Die meisten Benutzer arbeiten mit Assets. Dies sind die Elemente, die Benutzer zur Plattform hinzufügen. Datenassets enthalten Metadaten, die Daten darstellen, während Assets, die Sie in Tools wie Datenpipelines und Modellen erstellen, Code ausführen, um mit Daten zu arbeiten. Das folgende Diagramm zeigt die wichtigsten Arbeitsbereiche, ihren Zweck und die Art und Weise, wie sich Assets und andere Elemente auf der Plattform bewegen.

Die Hauptarbeitsbereiche sind Projekte, Kataloge, Bereitstellungsbereiche und Kategorien. Assets bewegen sich zwischen Projekten und Bereitstellungsbereichen und Katalogen. Governance-Artefakte werden in Kategorien erstellt und als Metadaten zu Assets in Katalogen hinzugefügt.

Projekte

Ihre Data-Science-, Data-Engineering- oder Datenkuratierungsteams arbeiten in Projekten mit Daten, um Assets wie Notebooks, Dashboards, Modelle, Datenpipelines oder aufbereitete Datenassets zu erstellen. Die Projekttools werden von den meisten Kernservices bereitgestellt:

  • watsonx.ai Studio bietet die Tools Data Refinery, Jupyter notebooks editor, SPSS Modeler, Decision Optimization, Pipelines und RStudio
  • watsonx.ai Runtime bietet AutoAI und Federated Learning Werkzeuge
  • IBM Knowledge Catalog stellt die Tools Data Refinery, Metadata import, Metadatenaufbereitung und Maskierungsabläufe bereit.
  • DataStage stellt den Editor für DataStage-Datenpipelines bereit
  • Cognos Dashboard Embedded stellt den Dashboardeditor bereit
  • Data Replication stellt das Tool Data Replication bereit
  • Match 360 stellt das Konfigurationstool für Stammdaten bereit

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Projekts aussehen könnte.

Ein Projekt enthält Assets und Mitarbeiter.

Kataloge

In Katalogen findet und speichert Ihr Unternehmen hochwertige, vertrauenswürdige Daten und andere Assets, z. B. Modelldatenblätter. Sie können Datenassets in einem Katalog suchen und in ein Projekt verschieben, um mit den Daten zu arbeiten. Oder Sie können Daten in Projekten kuratieren und die hochwertigen Datenassets für andere Benutzer in einem Katalog veröffentlichen. Kataloge erfordern den Service IBM Knowledge Catalog .

Die folgende Abbildung zeigt, wie die Seite Assets eines Katalogs aussehen könnte.

Ein Katalog enthält eine Ansicht von Assets.

Einsatzbereiche

Bereitstellungsbereiche sind Bereiche, in denen Ihr ModelOps -Team Modelle und andere bereitstellbare Assets in der Produktion bereitstellt und dann Bereitstellungen in der Produktion testet und verwaltet. Nachdem Sie Modelle und implementierbare Assets in Projekten erstellt haben, stufen Sie sie in Bereitstellungsbereiche hoch.

Die folgende Abbildung zeigt, wie die Seite Übersicht eines Bereitstellungsbereichs aussehen könnte.

Ein Bereitstellungsbereich enthält Assets und Mitarbeiter.

Kategorien

In Kategorien erstellt und verwaltet Ihr Governance-Team Governance-Artefakte, die Datenassets in Katalogen aufbereiten. Kategorien erfordern den Service IBM Knowledge Catalog .

Die folgende Abbildung zeigt, wie eine Kategorie aussehen könnte.

Eine Kategorie enthält Governance-Artefakte.

Weitere Arbeitsbereiche

Sie können spezialisierte Datenassets in anderen Arbeitsbereichen erstellen und in Projekte und Kataloge verschieben:

  • Der Data Virtualization bietet einen Arbeitsbereich zur Virtualisierung von Datenbeständen über viele Datenquellen hinweg.
  • Der Match360-Service stellt einen Arbeitsbereich zum Konfigurieren und Erkunden einer 360-Grad-Ansicht von Kundendaten bereit.

Der Ressourcenhub

Die Plattform enthält einen integrierten Ressourcenhub, der Beispieldatenassets, Notebooks und Projekte bereitstellt. Beispielnotebooks enthalten Beispiele mit Code für Data-Science und maschinelles Lernen. Beispielprojekte, einschließlich Branchenbeschleuniger, enthalten Datensätze, Modelle, andere Assets und detaillierte Anweisungen zur Lösung eines bestimmten Geschäftsproblems. Der Ressourcenhub stellt auch Knowledge Acceleratorsbereit, die Gruppen von Governance-Artefakten enthalten, die Sie importieren können, um Geschäftsvokabulare für bestimmte Branchen bereitzustellen.

Die folgende Abbildung zeigt, wie der Ressourcenhub aussieht.

Der Ressourcenhub enthält Beispiele.

Sehen Sie sich dieses Video an, um eine Tour durch den Ressourcenhub zu sehen.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.

Weitere Informationen

Übergeordnetes Thema: Cloud Pak for Data as a Service

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen