0 / 0
Zurück zur englischen Version der Dokumentation
Datengovernance (IBM Knowledge Catalog)
Letzte Aktualisierung: 13. Dez. 2024
Datengovernance (IBM Knowledge Catalog)

Datengovernance ist der Prozess der Verfolgung und Steuerung von Datenassets auf der Basis von Assetmetadaten. Kataloge sind Arbeitsbereiche, in denen Sie kontrollierten Zugriff auf regulierte Assets ermöglichen.

Erforderlicher Service
IBM Knowledge Catalog

Ein Katalog enthält Assets und Mitarbeiter. Mitarbeiter sind die Personen, die Assets zum Katalog hinzufügen, und die Personen, die die Assets verwenden müssen. Sie können Datengovernance anpassen, um Datenassets in Katalogen aufzubereiten und zu steuern.

Erfahren Sie mehr über Governance oder beginnen Sie mit Katalogen und Governance:

Ansätze für Datengovernance

Sie können Datengovernance auf iterative Weise konfigurieren. Sie können mit einer einfachen Implementierung von Datengovernance beginnen, die auf vordefinierten Artefakten und Standardfeatures basiert. Wenn sich Ihre Anforderungen ändern, können Sie Ihr Datengovernance-Framework anpassen, um Ihre Datenassets besser zu beschreiben und zu schützen.

Um die Tools anzuzeigen, mit denen Sie Daten regulieren können, öffnen Sie die Karte 'Tools und Services' und klicken Sie im Taskabschnitt auf Governance .

Einfachste Implementierung von Datengovernance

Sie verwenden einen Katalog, um Assets in Ihrer Organisation gemeinsam zu nutzen. Ein Katalog kann als Feature-Store fungieren, indem er Datasets mit Spalten enthält, die als Features (Eingaben) in Modellen für maschinelles Lernen verwendet werden. Ein IBM Knowledge Catalog -Administrator erstellt den Katalog für die gemeinsame Nutzung von Assets und fügt Datenentwickler, Data-Scientists und Geschäftsanalysten als Mitarbeiter hinzu. Katalogmitarbeiter können mit Katalogassets arbeiten, indem sie sie in Projekte kopieren und Assets veröffentlichen, die sie in Projekten im Katalog erstellen.

Kataloge speichern und verfolgen Assets. In Projekten bereiten Benutzer Datenassets vor und erstellen Modelle. Assets werden zwischen dem Katalog und Projekten verschoben.

Katalogmitarbeiter können Assets zum Katalog hinzufügen, um sie mit anderen zu teilen oder Assets auf folgende Arten zu suchen und zu verwenden:

  • Datenentwickler erstellen bereinigte Daten, virtualisierte Daten und integrierte Datenassets in Projekten und publizieren die Assets anschließend im Katalog.
  • Datenentwickler importieren Tabellen oder Dateien aus einer Datenquelle in den Katalog.
  • Data-Scientists und Geschäftsanalysten suchen Datenassets in Katalogen und fügen die Assets anschließend Projekten hinzu, um mit den Daten zu arbeiten.

Datenassets sammeln Metadaten im Laufe der Zeit auf folgende Arten an:

  • Für Datenassets wird ein Profil erstellt, das automatisch vordefinierte Datenklassen zuordnet, die das Format der Daten beschreiben.
  • Katalogmitarbeiter fügen Tags, vordefinierte Geschäftsbegriffe, Datenklassen und Klassifizierungen, Beziehungen und Bewertungen zu Assets hinzu.
  • Alle Aktionen für Anlagen werden automatisch in der Anlagenhistorie gespeichert.

Siehe Katalog erstellen.

Anpassungsoptionen für Datengovernance

Sie können jederzeit benutzerdefinierte Optionen zu Ihrer Datengovernance-Implementierung hinzufügen oder aktualisieren. Ihr Governance-Team kann Ihr Geschäftsvokabular erstellen, Daten mit Ihrem Vokabular importieren und aufbereiten, die Datenqualität analysieren, Regeln zum Schutz von Daten definieren und die Datenassets anschließend in einem Katalog veröffentlichen, in dem die Datenkonsumenten sie finden können. Wenn sich Ihre Daten ändern, können Sie Metadaten zu den Tabellen oder Dateien erneut importieren und Ihre Datenassets mit Ihrem Geschäftsvokabular und Ihrer Datenqualitätsanalyse aufbereiten. Sie können immer präzisere Regeln erstellen, um Daten zu schützen, wenn Sie Ihr Geschäftsvokabular erweitern. Während des Datengovernance-Zyklus können Ihre Data-Scientists und anderen Datenkonsumenten vertrauenswürdige Daten in Katalogen finden. Die folgende Abbildung zeigt, wie Datengovernance ein kontinuierlicher Zyklus der Aktualisierung der Metadaten für Datenassets ist, um Änderungen in den Daten und in Ihrem Geschäftsvokabular widerzuspiegeln.

Zyklus von Datengovernance-Tasks

Business-Vokabular erstellen

  • Ihr Governance-Team kann ein Geschäftsvokabular erstellen, das die Bedeutung von Daten mit Geschäftsbegriffen und das Format von Daten mit Datenklassen beschreibt. Ein Geschäftsvokabular hilft Ihren Geschäftsbenutzern, mithilfe nicht technischer Begriffe leichter zu finden, wonach sie suchen.
  • Ihr Team kann Ihr Geschäftsvokabular schnell erstellen, indem Sie Ihr vorhandenes Geschäftsvokabular importieren oder Knowledge Accelerators importieren, die Dutzende bis Tausende von Governance-Artefakten bereitstellen.
  • Ihr IBM Knowledge Catalog -Administrator kann den Workflow, die Organisation, die Eigenschaften und die Beziehungen von Governance-Artefakten anpassen.

Siehe Implementierung eines Governance-Frameworks planen.

Datenassets mit Ihrem Geschäftsvokabular importieren und aufbereiten

  • Data-Stewards können regelmäßig Metadatenimport-und -aufbereitungsjobs ausführen, die den Katalog mit Änderungen an Tabellen oder Dateien aus Ihren Datenquellen aktualisieren und die entsprechenden Geschäftsbegriffe und Datenklassen automatisch zuordnen.
  • Wenn Ihr Team Governance-Artefakte hinzufügt, schlagen die Metadatenaufbereitungsjobs die neuen Artefakte den neuen oder aktualisierten Datenassets vor.
  • Wenn Data-Stewards Geschäftsbegriffszuordnungen während der Metadatenaufbereitung bestätigen oder anpassen, werden die Algorithmen für maschinelles Lernen für die Begriffszuordnung für Ihre Daten präziser.
  • Data-Stewards können Metadatenimport und -aufbereitung so konfigurieren, dass sie nur ausgeführt werden, wenn Änderungen erkannt werden.
  • Sie können die KI-basierten Anreicherungsfunktionen von gen nutzen, um beschreibende Asset- und Spaltennamen zu generieren, um aussagekräftige Beschreibungen für Assets und Spalten zu erstellen und um Geschäftsbegriffe zuzuweisen.

Siehe Kuratieren von Datenassets zur gemeinsamen Nutzung in Katalogen planen.

Datenqualität analysieren

  • Data-Stewards können die Datenqualität mit Standardeinstellungen während der Metadatenaufbereitung analysieren. Die Datenqualitätsanalyse wird auf jedes Asset als Ganzes und auf Spalten in Tabellen angewendet.
  • Datenverantwortliche können angepasste Datenqualitätsdefinitionen erstellen und diese in Datenqualitätsregeln anwenden oder SQL-basierte Datenqualitätsregeln anwenden.

Siehe Kuratieren von Datenassets zur gemeinsamen Nutzung in Katalogen planen.

Schützen Sie Ihre Daten mit Regeln

  • Ihr Governance-Team kann einen Plan für Datenschutzregeln erstellen, indem Richtlinien geschrieben werden, die die Standards und Richtlinien Ihres Unternehmens zum Schutz und zur Verwaltung von Daten dokumentieren. Eine Richtlinie kann beispielsweise eine bestimmte Verordnung beschreiben und wie eine Datenschutzregel die Einhaltung dieser Verordnung sicherstellt.
  • Ihr Governance-Team kann Datenschutzregeln erstellen, die definieren, wie private Informationen privat bleiben. Datenschutzregeln werden automatisch für die Durchsetzung ausgewertet, wenn ein Benutzer versucht, auf ein Datenasset in einem regulierten Katalog auf der Plattform zuzugreifen. Datenschutzregeln können definieren, wie der Zugriff auf Daten gesteuert, sensible Werte maskiert oder Zeilen aus Datenassets gefiltert werden.
  • Ihr Team kann mit Datenschutzregeln beginnen, die auf angepassten Tags, Benutzern oder vordefinierten Datenklassen, Geschäftsbegriffen und Klassifizierungen basieren. Wenn Ihr Governance-Team Governance-Artefakte hinzufügt, kann das Team Datenschutzregeln basierend auf Ihrem Geschäftsvokabular definieren.
  • Datenentwickler können Datenschutzregeln für virtualisierte Daten durchsetzen.
  • Datenentwickler können Daten in Datenassets mit Maskierungsflüssen permanent maskieren.

Siehe Schutz von Daten mit Regeln planen.

Erste Schritte mit IBM Knowledge Catalog

Die Tasks für den Einstieg in IBM Knowledge Catalog hängen von Ihrem Ziel ab. Welche Aktionen Sie ausführen können, wird durch Ihre Cloud Pak for Data -Servicezugriffsrollen definiert. Einige Aktionen haben auch Anforderungen an die Arbeitsbereichsrolle, z. B. als Mitarbeiter in einem Katalog oder einer Kategorie.

Informationen zum Überprüfen Ihrer Servicezugriffsrollen finden Sie unter IBM Cloud. Informationen zum Verständnis Ihrer IBM Knowledge Catalog -Rollen finden Sie unter Benutzerrollen und -berechtigungen.

In der folgenden Tabelle sind allgemeine Ziele, die erforderlichen Servicezugriffsrollen für Cloud Pak for Data und Links zu Informationen für den Einstieg aufgeführt.

Ziel Erforderliche Servicezugriffsrolle für Cloud Pak for Data Weitere Informationen
IBM Knowledge Catalog einrichten oder verwalten Manager Implementierung von Datengovernance planen
IBM Knowledge Catalog
IBM Knowledge Catalog
Assets oder Features in einem Katalog suchen Beliebige Rolle Assets in einem Katalog suchen
Assets plattformübergreifend suchen
Katalogressource zu einem Projekt hinzufügen
Daten pflegen CloudPak Data Steward oder
CloudPak Data Engineer
Daten kuratieren
Daten kuratieren
Datenqualität verwalten CloudPak Data Steward oder
CloudPak Data Engineer
Datenqualität verwalten
Governance-Artefakte anzeigen CloudPak Data Steward oder
CloudPak Data Engineer
Governance-Artefakte verwalten
Knowledge Accelerators
Implementierung eines Governance-Frameworks planen
Datenschutzregeln erstellen CloudPak Data Steward oder
CloudPak Data Engineer
Datenschutzregeln
Schutz von Daten mit Regeln planen
IBM Knowledge Catalog -APIs ausführen Dieselbe Rolle zum Ausführen der Task in der Benutzerschnittstelle. - IBM Knowledge Catalog API
Berichte zum IBM Knowledge Catalog generieren Administrator für Berichterstellung Berichterstellung einrichten

Weitere Informationen

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen