Anwendungsfall Datenintelligenz
Vertrauen Sie auf die Qualität Ihrer Daten und die daraus gewonnenen Erkenntnisse - mit Data Intelligence. Viele Unternehmen haben Schwierigkeiten, die Vorteile des Datenzugriffs mit der Notwendigkeit des Schutzes sensibler Daten in Einklang zu bringen. Cloud Pak for Data as a Service bietet die Methoden, die Ihr Unternehmen benötigt, um Datenintelligenz zu automatisieren, damit Sie sicherstellen können, dass die Daten sowohl zugänglich als auch geschützt sind.
Data Governance ist ein entscheidender Bestandteil des Anwendungsfalls Data Intelligence in Cloud Pak for Data. Sehen Sie sich dieses Video an, um einen typischen Anwendungsfall für Data Governance zu sehen.
Dieses Video bietet eine visuelle Methode, um die Konzepte und Aufgaben in dieser Dokumentation zu erlernen.
Challenges (Abfragen)
Viele Unternehmen stehen vor den folgenden Herausforderungen im Bereich der Datenintelligenz:
- Datenschutz in großem Maßstab
- Organisationen müssen die Datenschutzbestimmungen für Daten in Datenquellen über mehrere Cloud-Plattformen und vor Ort einhalten.
- Zugriff auf Daten – hochwertige Daten
- Unternehmen müssen mehreren Teams Zugriff auf hochwertige Unternehmensdaten gewähren.
- Erstellen eines vollständigen Kundenprofils
- Teams müssen schnell genaue Kundenprofile in großem Umfang erstellen, um Self-Service-Prozesse und die Datenverwaltung zu optimieren.
- Verfolgen Sie die Reise Ihrer Daten
- Teams müssen Genauigkeit, Vertrauen und Compliance sicherstellen, indem sie den Weg Ihrer Daten nachverfolgen.
- Bereitstellung von Daten zur Selbstbedienung
- Datenkonsumenten, wie z. B. Datenwissenschaftler, haben Schwierigkeiten, die benötigten Daten zu finden und zu nutzen.
Sie können diese Herausforderungen lösen, indem Sie eine Datenstruktur mit Cloud Pak for Data as a Service implementieren.
Beispiel: Herausforderungen der Golden Bank
Verfolgen Sie die Geschichte der Golden Bank, wie das Governance-Team eine Data-Intelligence-Lösung implementiert. Die Golden Bank verfügt über eine große Menge an Kunden- und Hypothekendaten, die auch sensible Daten enthalten.Die Bank möchte die Qualität der Daten sicherstellen, sensible Daten maskieren und sie für die Nutzung in mehreren Abteilungen verfügbar machen.
Prozess
Wie Sie die Datenverwaltung umsetzen, hängt von den Anforderungen Ihrer Organisation ab. Sie können die Datenverwaltung linear oder iterativ umsetzen. Sie können sich auf Standardfunktionen und vordefinierte Artefakte verlassen oder Ihre Lösung anpassen.
Um die Datenverwaltung umzusetzen, kann Ihre Organisation diesen Prozess befolgen:
- Legen Sie Ihren geschäftlichen Wortschatz fest
- Legen Sie Regeln zum Schutz Ihrer Daten fest
- Daten verwalten und konsolidieren
- Teilen Sie Ihre Daten in Katalogen
Der Service IBM Knowledge Catalog unter Cloud Pak for Data bietet die Tools und Prozesse, die Ihr Unternehmen für die Implementierung einer Data Intelligence-Lösung benötigt.
1. Legen Sie Ihren geschäftlichen Wortschatz fest
Um die Herausforderungen zu meistern, muss Ihr Team ein Geschäftsvokabular erstellen, indem es Governance-Artefakte importiert oder erstellt, die als Metadaten zur Klassifizierung und Beschreibung der Daten dienen:
- Bevor Sie den Datenschutz automatisieren können, muss Ihr Team sicherstellen, dass die zu kontrollierenden Daten genau identifiziert werden.
- Bevor Sie die Datenqualität analysieren können, müssen Sie das Format der Daten ermitteln.
- Damit Daten leicht auffindbar sind, muss Ihr Team sicherstellen, dass der Inhalt der Daten genau beschrieben wird.
In diesem ersten Schritt des Prozesses kann Ihr Governance-Team auf der Grundlage der vordefinierten Governance-Artefakte aufbauen und benutzerdefinierte Governance-Artefakte erstellen, die speziell auf Ihre Organisation zugeschnitten sind. Sie können Artefakte erstellen, um das Format, die geschäftliche Bedeutung, die Sensibilität, den Wertebereich und die Governance-Richtlinien der Daten zu beschreiben.
Was Sie verwenden können | Aktion | Am besten zu verwenden, wenn |
---|---|---|
Kategorien | Verwenden Sie die vordefinierte Kategorie, um Ihre Governance-Artefakte zu speichern. Erstellen Sie Kategorien, um Governance-Artefakte in einer hierarchischen Struktur zu organisieren, die Ordnern ähnelt. Fügen Sie Mitarbeiter mit Rollen hinzu, die ihre Berechtigungen für die Artefakte in der Kategorie definieren. |
Sie benötigen mehr als die vordefinierte Kategorie. Sie möchten genau festlegen, wer Governance-Artefakte besitzen, erstellen und anzeigen darf. |
Workflows | Verwenden Sie die Standard-Workflow-Konfiguration, die nicht einschränkt, wer Governance-Artefakte erstellt oder Überprüfungen verlangt. Konfigurieren Sie Workflows für Governance-Artefakte und legen Sie fest, wer welche Arten von Governance-Artefakten in welchen Kategorien erstellen darf. |
Sie möchten kontrollieren, wer Governance-Artefakte erstellt. Sie möchten, dass Entwürfe von Governance-Artefakten vor der Veröffentlichung überprüft werden. |
Governance-Artefakte | Verwenden Sie die vordefinierten Geschäftsbedingungen, Datenklassen und Klassifizierungen. Erstellen Sie Governance-Artefakte, die als Metadaten zur Anreicherung, Definition und Kontrolle von Datenbeständen dienen. |
Sie möchten Daten mit Wissen und Bedeutung anreichern, um Menschen das Verständnis der Daten zu erleichtern. Sie möchten die Analyse der Datenqualität verbessern. |
Knowledge Accelerators | Importieren Sie eine Reihe vordefinierter Governance-Artefakte, um die Datenklassifizierung, die Einhaltung von Vorschriften, Self-Service-Analysen und andere Governance-Vorgänge zu verbessern. | Sie benötigen einen Standardwortschatz, um geschäftliche Probleme, die Unternehmensleistung, Branchenstandards und Vorschriften zu beschreiben. Sie möchten Zeit sparen, indem Sie vorab erstellte Governance-Artefakte importieren. |
Beispiel: Geschäftsvokabular der Golden Bank
Der Leiter des Governance-Teams bei der Golden Bank erstellt zunächst eine Kategorie, "Banking ", in der die Governance-Artefakte gespeichert werden, die das Team erstellen möchte. Der Teamleiter fügt die übrigen Mitglieder des Governance-Teams als Mitarbeiter zur Kategorie "Banking" mit der Rolle "Editor" hinzu, damit sie die Berechtigung zum Erstellen von Governance-Artefakten haben. Anschließend konfiguriert der Teamleiter die Arbeitsabläufe so, dass für die Erstellung jeder Art von Artefakt ein anderes Teammitglied verantwortlich ist. Alle Arbeitsabläufe erfordern einen Genehmigungsschritt durch den Teamleiter.
Ein Mitglied des Governance-Teams importiert eine Reihe von Geschäftsbedingungen aus einer Tabelle. Einige der Geschäftsbedingungen stehen im Zusammenhang mit den Berufen der Privatkunden. Ein anderes Teammitglied erstellt einen Referenzdatensatz, "Berufe", der eine Liste von Berufen enthält, wobei jeder Beruf eine ID-Nummer hat. Ein drittes Teammitglied erstellt eine benutzerdefinierte Datenklasse, "Beruf", um den Beruf von Privatkunden auf der Grundlage des Referenzdatensatzes zu identifizieren.
2. Legen Sie Regeln zum Schutz Ihrer Daten fest
Im nächsten Schritt des Prozesses legt Ihr Team Regeln fest, um die Einhaltung der Datenschutzbestimmungen sicherzustellen, indem kontrolliert wird, wer welche Daten einsehen kann. Ihr Team erstellt Datenschutzregeln, um festzulegen, wie Daten in verwalteten Katalogen geschützt werden sollen. Ihr Team kann diese Datenschutzregeln verwenden, um sensible Daten basierend auf dem Inhalt, dem Format oder der Bedeutung der Daten oder der Identität der Benutzer, die auf die Daten zugreifen, zu verschleiern.
Was Sie verwenden können | Aktion | Am besten zu verwenden, wenn |
---|---|---|
Datenschutzregeln | Schützen Sie sensible Informationen in verwalteten Katalogen vor unbefugtem Zugriff, indem Sie den Zugriff auf Daten verweigern, Datenwerte maskieren oder Zeilen in Datenbeständen filtern. Maskieren Sie Daten in verwalteten Katalogen dynamisch und konsistent auf einer benutzerdefinierten Granularitätsebene. |
Sie müssen den Datenschutz automatisch in allen Ihren verwalteten Katalogen durchsetzen. Sie möchten die Verfügbarkeit und Nützlichkeit von Daten beibehalten und gleichzeitig die Datenschutzbestimmungen einhalten. |
Maskierungsabläufe | Verwenden Sie erweiterte Funktionen zur formaterhaltenden Datenmaskierung, wenn Sie Kopien oder Teilmengen von Produktionsdaten extrahieren. | Sie benötigen anonymisierte Trainingsdaten und Testsätze, die die Datenintegrität wahren. |
Richtlinien und Governance-Regeln | Beschreiben und dokumentieren Sie die Richtlinien, Vorschriften, Standards oder Verfahren Ihrer Organisation für die Datensicherheit. Beschreiben Sie die erforderlichen Verhaltensweisen oder Maßnahmen zur Umsetzung der Governance-Richtlinie. |
Sie möchten, dass die Personen, die die Daten verwenden, die Richtlinien zur Datenverwaltung verstehen. |
Beispiel: Datenschutzbestimmungen der Golden Bank
Um ein Vorhersagemodell für Hypothekengenehmigungen zu erstellen, benötigen die Datenwissenschaftler der Golden Bank Zugriff auf Datensätze, die sensible Daten enthalten. Zum Beispiel möchten die Datenwissenschaftler auf die Tabelle mit Daten über Hypothekenantragsteller zugreifen, die eine Spalte mit Sozialversicherungsnummern enthält.
Ein Mitglied des Governance-Teams erstellt eine Datenschutzregel, die Sozialversicherungsnummern maskiert. Wenn die zugewiesene Datenklasse einer Spalte in einem Datenbestand "US-Sozialversicherungsnummer" ist, werden die Werte in dieser Spalte durch 10 X ersetzt.
Ein Mitglied des Governance-Teams erstellt eine Richtlinie, die die Datenschutzregel enthält. Die Richtlinie beschreibt die geschäftlichen Gründe für die Umsetzung der Regel.
3. Daten für die Weitergabe in Katalogen aufbereiten
Datenverwalter stellen hochwertige Datenbestände in Projekten zusammen und veröffentlichen sie in Katalogen, wo die Personen, die die Daten benötigen, sie finden können. Datenverwalter reichern die Datenbestände an, indem sie Governance-Artefakte als Metadaten zuweisen, die die Daten beschreiben und die semantische Suche nach Daten unterstützen.
Was Sie verwenden können | Aktion | Am besten zu verwenden, wenn |
---|---|---|
Metadata import | Technische Metadaten für die Daten, die mit einer Verbindung verknüpft sind, automatisch importieren, um Datenbestände zu erstellen. | Sie müssen viele Datenbestände aus einer Datenquelle erstellen. Sie müssen die zuvor importierten Datenbestände aktualisieren. |
Metadatenaufbereitung | Mehrere Datenbestände in einem einzigen Durchlauf profilieren, um Datenklassen automatisch zuzuweisen und Datentypen und Formate von Spalten zu identifizieren. Geschäftsbedingungen automatisch zuweisen und auf der Grundlage der Datenklassifizierung Vorschläge für Begriffe generieren. Führen Sie die Import- und Anreicherungsjobs in regelmäßigen Abständen erneut aus, um Änderungen an Datenbeständen zu erkennen und zu bewerten. |
Sie müssen viele Datenbestände, die Sie importiert haben, kuratieren und veröffentlichen. |
Datenqualitätsanalyse | Führen Sie Datenqualitätsprüfungen Ihrer Datensätze durch, um Ihre Daten auf Qualitätsprobleme zu überprüfen. Verfolgen Sie kontinuierlich Änderungen an Inhalt und Struktur von Daten und analysieren Sie geänderte Daten regelmäßig. |
Sie müssen wissen, ob die Qualität Ihrer Daten die Genauigkeit Ihrer Datenanalyse oder Ihrer Modelle beeinträchtigen könnte. Ihre Benutzer müssen ermitteln, welche Datensätze korrigiert werden müssen. |
Datenabstammung | Verfolgen, visualisieren, transformieren und optimieren Sie Ihren Datenfluss vom Ursprung bis zur Nutzung. | Sie müssen die Genauigkeit, das Vertrauen und die Einhaltung sicherstellen, indem Sie den Weg Ihrer Daten nachverfolgen. |
IBM Match 360 | Mit den Konfigurationswerkzeugen in IBM Match 360 können Dateningenieure Kundendaten aus verschiedenen Systemen in Ihrem Unternehmen sammeln und ein automatisch generiertes, anpassbares Datenmodell anzeigen, ohne Tausende von Attributen manuell zuordnen zu müssen. Nachdem Ihre Daten in IBM Match 360 geladen wurden, können Dateningenieure einen Abgleichsalgorithmus ausführen, um angereicherte Stammdatenentitäten zu erstellen. |
Sie möchten einen intelligenten Abgleichsalgorithmus verwenden, den Sie anpassen und trainieren können, um eine einzige, vertrauenswürdige, konsolidierte Ansicht der Daten zu erstellen. |
Beispiel: Datenpflege bei Golden Bank
Die Datenverwalter im Governance-Team beginnen mit dem Import von Metadaten, um Datenbestände in einem Projekt zu erstellen. Nach dem Import der Metadaten verfügt Golden Bank über zwei Datenbestände, die Tabellen mit einer Spalte namens "ID" darstellen. Nach der Anreicherung der Metadaten sind diese Spalten durch die ihnen zugewiesenen Metadaten klar voneinander unterscheidbar:
- Einer Spalte werden die Geschäftsbedingungen "Beruf" und "Tätigkeit" sowie die Datenklasse "Tätigkeit" zugewiesen.
- Die andere Spalte ist mit den Geschäftsbedingungen "Persönliche Kennung" und "Privatperson" sowie der Datenklasse "US-Sozialversicherungsnummer" belegt.
Die Datenverwalter führen eine Datenqualitätsanalyse der Datenbestände durch, um sicherzustellen, dass die Gesamtbewertung der Datenqualität den Schwellenwert der Goldenen Bank von 95 % übersteigt.
Der Leiter des Governance-Teams erstellt einen Katalog, den "Hypothekenbewilligungskatalog", und fügt die Datenverwalter und Datenwissenschaftler als Katalogmitarbeiter hinzu. Die Datenverwalter veröffentlichen die von ihnen im Projekt erstellten Datenbestände im Katalog.
4. Teilen oder arbeiten Sie mit Ihren Daten
Der Katalog hilft Ihren Teams, Ihre Daten zu verstehen und stellt die richtigen Daten für die richtige Verwendung zur Verfügung. Datenwissenschaftler und andere Arten von Benutzern können sich die benötigten Daten selbst beschaffen, während sie die Zugriffs- und Datenschutzrichtlinien des Unternehmens einhalten. Sie können Datenbestände aus einem Katalog in ein Projekt einfügen, in dem sie zusammenarbeiten, um die Daten vorzubereiten, zu analysieren und zu modellieren.
Was Sie verwenden können | Aktion | Am besten zu verwenden, wenn |
---|---|---|
Kataloge | Organisieren Sie Ihre Vermögenswerte, um sie unter den Mitarbeitern in Ihrer Organisation zu teilen. Nutzen Sie die KI-gestützte semantische Suche und Empfehlungen, um Benutzern zu helfen, das zu finden, was sie benötigen. |
Ihre Benutzer müssen die hochwertigen Daten leicht verstehen, zusammenarbeiten, anreichern und darauf zugreifen können. Sie möchten die Sichtbarkeit von Daten und die Zusammenarbeit zwischen Geschäftsbenutzern verbessern. Sie möchten, dass Benutzer Daten anzeigen, darauf zugreifen, sie bearbeiten und analysieren können, ohne ihr physisches Format oder ihren Speicherort zu kennen und ohne sie verschieben oder kopieren zu müssen. Sie möchten, dass Benutzer Assets verbessern, indem sie sie bewerten und überprüfen. |
Globale Suche | Suchen Sie nach Vermögenswerten in allen Projekten, Katalogen und Einsatzbereichen, auf die Sie Zugriff haben. Suchen Sie nach Governance-Artefakten in allen Kategorien, auf die Sie Zugriff haben. |
Sie müssen Daten oder eine andere Art von Vermögenswert oder ein Governance-Artefakt finden. |
Data Product Hub | Datenprodukte teilen: Datenproduzenten können kuratierte Datenprodukte veröffentlichen, um sie mit Datenkonsumenten in ihrer Community zu teilen, und Datenkonsumenten können einfach auf Datenprodukte für Ihre geschäftlichen Anforderungen zugreifen. | Sie müssen Ihre datenreichen Vermögenswerte verpacken, in Produkte umwandeln und teilen. |
Data Refinery | Daten bereinigen, um falsche, unvollständige, falsch formatierte oder doppelte Daten zu korrigieren oder zu entfernen. Daten anpassen, um sie durch Filtern, Sortieren, Kombinieren oder Entfernen von Spalten anzupassen. |
Sie müssen die Qualität oder Nützlichkeit der Daten verbessern. |
Beispiel: Katalog der Golden Bank
Die Datenwissenschaftler finden die benötigten Datenbestände im Katalog und kopieren diese in ein Projekt. In ihrem Projekt können die Datenwissenschaftler die Daten verfeinern, um sie für das Training eines Modells vorzubereiten.
Tutorials für Datenintelligenz
Lernprogramm | Beschreibung | Fachkenntnisse für das Lernprogramm |
---|---|---|
Hochwertige Daten kuratieren | Erstellen Sie hochwertige Datenbestände, indem Sie Ihre Daten anreichern und eine Datenqualitätsanalyse durchführen. | Führen Sie die Tools Metadata import und Metadatenanreicherung aus. |
Eigene Daten schützen | Kontrollieren Sie den Zugriff auf Daten über Cloud Pak for Data as a Service. | Datenschutzregeln erstellen. |
Verbrauchen Sie Ihre Daten | Daten finden, gestalten und analysieren. | Durchsuchen Sie einen Katalog und führen Sie das Tool Data Refinery aus. |
Regierung virtualisierte Daten | Bereichern Sie virtualisierte Daten und stellen Sie sicher, dass virtuelle Daten geschützt sind. | Verwenden Sie die Schnittstelle, Projekte und Kataloge von Data Virtualization, um virtualisierte Daten zu verwalten. |
360-Grad-Ansicht konfigurieren | Erstellen Sie eine konsolidierte Ansicht Ihrer Kunden, indem Sie Ihre Daten einrichten, kartieren und modellieren. | Verwenden Sie die Drag-and-Drop-Oberfläche von Match 360, um Ihre konsolidierte Ansicht zu konfigurieren. |
Erfahren Sie mehr über Data Intelligence
- Anwendungsfall-Tutorials
- IBM Knowledge Catalog überblick
- Einrichten IBM Knowledge Catalog
- Planung der Umsetzung der Datenverwaltung
- Videos
Übergeordnetes Thema: Anwendungsfälle