Übersicht über die Data Fabric-Lösung
Wenn Sie die Datenstrukturlösung in Cloud Pak for Dataimplementieren, können Sie die Herausforderungen des Datenzugriffs, der Datenqualität, der Datengovernance und der Verwaltung Ihrer Daten-und KI-Lebenszyklen bewältigen.
Die Data-Fabric-Lösung in Cloud Pak for Data bietet die folgenden Hauptfunktionen für die Verwaltung und Automatisierung Ihrer Daten-und KI-Lebenszyklen:
- Datenzugriff
- Greifen Sie auf Ihre Daten in mehreren Clouds und lokal in Ihrer vorhandenen Datenarchitektur zu.
- Self-Service-Nutzung
- Teilen und verwenden Sie Daten und andere Assets aus dem gesamten Unternehmen in Katalogen.
- Aufgelaufenes Wissen
- Sie können Ihre Daten über ein allgemeines Geschäftsvokabular verstehen. Vertrauen Sie Ihren Daten durch Protokoll-, Abstammungs-und Qualitätsanalyse.
- Collaborative Innovation
- Arbeiten Sie mit anderen zusammen, um Erkenntnisse zu gewinnen. Bereiten Sie Daten vor, analysieren Sie Daten und erstellen Sie Modelle mit einer Reihe integrierter Tools für alle Erfahrungsstufen.
- Governance und Konformität
- Definieren Sie Regeln zur Durchsetzung des Datenschutzes. Verfolgen und dokumentieren Sie den detaillierten Verlauf von KI-Modellen, um Compliance sicherzustellen.
- Einheitlicher Lebenszyklus
- Automatisieren Sie das Erstellen, Testen, Bereitstellen und Überwachen von Datenpipelines und KI-Modellen.
Der Wert von Assets
Mit dem Datenfabric können Sie Daten in Assets umwandeln, die Bedeutung und Wert ansammeln. Assets sind mehr als nur Daten. Wenn Sie zum ersten Mal eine Verbindung zu einer Datenquelle herstellen, erhalten Sie grundlegende Informationen zum Zugriff auf die Daten, Tabellen, Schemas und Datenwerte. Sie beginnen mit der Wertschöpfung, während Sie Daten durch Virtualisierung, Transformation oder Replikation in Arbeitsbereichen, die als Projekte bezeichnet werden, aufnehmen.
Wenn Sie die Daten kuratieren, fügen Sie Ihren Datenassets Metadaten hinzu. Sie erstellen ein Profil der Daten, um sie zu klassifizieren und Statistikdaten zu den Werten zu kompilieren. Sie erweitern Assets mit einem Geschäftsvokabular, das die semantische Bedeutung der Daten für Ihr Unternehmen beschreibt. Sie analysieren die Datenqualität. Die Metadaten, die Sie während der Kuration hinzufügen, werden als aktive Metadaten betrachtet, da sie automatisch durch Prozesse für maschinelles Lernen generiert werden. Wenn Sie die Kuratierung nach Ihren Datenänderungen erneut ausführen, werden die Metadaten basierend auf der automatisierten Datenanalyse aktualisiert.
Wenn Benutzer die Assets in Projekten verwenden, erstellen sie die dritte Bedeutungsebene, die den Verlauf der Assetverwendung und die Beziehungen zwischen Assets beschreibt. Benutzer können die Daten in Notebooks oder Dashboards analysieren oder Modelle für maschinelles Lernen trainieren.
Benutzer können auch Informationen zu Assets hinzufügen, wie z. B. Bewertungen und Berichte, Visualisierungen der Daten, Tags und andere Beziehungen.
Die folgende Abbildung zeigt, wie Datenassets den Wert in einem Datenfabric kumulieren.
Modelle sind auch Assets. Sie können Bereitstellungen und Eingabedaten für das Modell, Vergleiche zwischen Modellen, Konformität mit Unternehmensprotokollen und andere Leistungsmetriken verfolgen.
Anwendungsfälle
Cloud Pak for Data as a Service stellt vier Anwendungsfälle als Teil der Datenstrukturlösung bereit. Sie implementieren das Datenfabric wie in jedem Anwendungsfall dargestellt, indem Sie eine oder mehrere Serviceinstanzen erstellen, die Features und Tools bereitstellen. Einige Services sind in mehreren Anwendungsfällen enthalten.
Anwendungsfälle stellen Möglichkeiten dar, einen Teil der Datenstrukturlösung zu implementieren, sodass Ihre Teams mit der Arbeit beginnen können, während Sie andere Teile erstellen. Sie können mit jedem Anwendungsfall beginnen und die anderen nach Bedarf hinzufügen:
- Wenn Sie ein ausgereifteres Datengovernance-Modell haben, beginnen Sie mit der Erstellung Ihres Geschäftsvokabulars, wie im Anwendungsfall 'Datengovernance' beschrieben.
- Wenn Sie eine schnellere Zeit bis zur Wertschöpfung wünschen, beginnen Sie mit Datenvirtualisierung oder Data-Science, wie in den Anwendungsfällen Data Integration und Data Science und MLOps beschrieben.
- Wenn Sie sicherstellen müssen, dass Ihre Modelle den Zielen und Bestimmungen Ihres Unternehmens entsprechen, beginnen Sie mit der Verfolgung Ihrer Modelle, wie im KI-Governance-Anwendungsfall beschrieben.
Untersuchen Sie jeden Anwendungsfall, um zu erfahren, was Sie erreichen können und welche Tools Sie verwenden können.
Datengovernance
Implementieren Sie Governance auf der Basis von Metadaten, die Geschäftswissen bereitstellen und den Datenschutz definieren. Stellen Sie hochwertige Datenassets in Self-Service-Katalogen bereit. Automatisieren Sie die Durchsetzung von Datengovernance für die Einhaltung gesetzlicher Bestimmungen.
Services für diesen Anwendungsfall: Watson Knowledge Catalog und IBM Match 360 with Watson.
Datenintegration
Vereinfachen und automatisieren Sie den Zugriff auf alle Ihre Daten, ohne sie zu verschieben. Koordiniert Daten in einer verteilten Umgebung, um ein Netz von sofort verfügbaren Informationen für Datenkonsumenten zu erstellen.
Services für diesen Anwendungsfall: Watson Query, DataStageund Watson Knowledge Catalog.
Datenwissenschaft und MLOps
Operationalisieren Sie Datenanalyse und Modellerstellung mit einem automatisierten Workflow, der Daten vorbereitet, erstellt, implementiert, überwacht und Modelle erneut trainiert.
Services für diesen Anwendungsfall: Watson Studio, Watson Machine Learning, Watson OpenScaleund Watson Knowledge Catalog
KI-Governance
Operationalisieren Sie KI-Governance mit einem automatisierten Workflow, der Fairness, Qualität und Erklärbarkeit in Ihren Modellen durchsetzt.
Services für diesen Anwendungsfall: Watson Studio, Watson Machine Learning, Watson OpenScaleund Watson Knowledge Catalog
Siehe KI-Governance-Anwendungsfall.