Sie können Datenqualitätsregeln erstellen und verwalten, um die Qualität der Daten in Ihrem Projekt zu bewerten.
Wenn Sie über die erforderlichen Berechtigungenverfügen, können Sie Datenqualitätsregeln wie folgt verwalten:
- Datenqualitätsregeln erstellen
- Datenqualitätsregel bearbeiten
- Datenqualitätsregeln löschen, die Sie nicht mehr benötigen
Sie können diese Tasks auch mit APIs anstelle der Benutzerschnittstelle ausführen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
- Erforderliche Services
- IBM Knowledge Catalog
- DataStage oder DataStage as a Service Anywhere '
Mit DataStage, können Sie Datenqualitätsregeln in den unterstützten Regionen ausführen. Mit DataStage as a Service Anywhere können Sie Datenqualitätsregeln außerhalb von IBM Cloud ausführen, indem Sie Remote-Engines verwenden. Weitere Informationen zum Einrichten von Remote-Engines finden Sie in der Dokumentation zuDataStage as a Service Anywhere.
Erforderliche Berechtigungen
Zum Anzeigen von Datenqualitätsregeln müssen Sie mindestens über die Rolle Anzeigeberechtigter im Projekt verfügen.
Zum Erstellen, Bearbeiten oder Löschen von Datenqualitätsregeln benötigen Sie die Benutzerberechtigung Datenqualitätsassets verwalten sowie die Rolle Administrator oder die Rolle Editor im Projekt.
Projekteinstellungen für die Regelausführung
Einstellungen auf Projektebene bestimmen bestimmte Aspekte der Ausführung von Datenqualitätsregeln, z. B. ob nachgestellte Leerzeichen in Zeichenfolgewerten bei Gleichheitsprüfungen ignoriert werden. Diese Einstellungen gelten für alle Datenqualitätsregeln für ein bestimmtes Projekt. Sie können diese Einstellungen für jedes Projekt überprüfen oder aktualisieren, indem Sie die IBM Knowledge Catalog API Get project settings for data quality rules und Replace project settings for data quality rules verwenden.
Datenqualitätsregeln erstellen
Sie können verschiedene Typen von Datenqualitätsregeln erstellen:
Datenqualitätsregeln bearbeiten
Sie können eine Datenqualitätsregel bearbeiten, um ihre Beschreibung, die ausgewählte Datenqualitätsdimension, beliebige Geschäftsbegriffszuordnungen oder die Regelkonfiguration zu aktualisieren. Sie können auch die Liste der zugehörigen Elemente verwalten.
Öffnen Sie zum Bearbeiten einer Datenqualitätsregel das Asset und führen Sie die entsprechenden Aktionen aus:
Um die Beschreibung oder die Datenqualitätsdimensionen zu aktualisieren, klicken Sie auf das Bearbeitungssymbol " neben der Eigenschaft.
Rufen Sie zum Verwalten von Geschäftsbegriffen den Abschnitt Governance-Artefakte des Assets auf und fügen Sie nach Bedarf Begriffe hinzu oder entfernen Sie sie.
Wechseln Sie zum Zuweisen oder Löschen von Governance-Regeln zum Abschnitt Governance-Artefakte des Assets und fügen Sie nach Bedarf Governance-Regeln hinzu oder entfernen Sie sie.
Klicken Sie zum Aktualisieren der Regelkonfiguration auf Regel bearbeiten. Wenn Sie die Regelkonfiguration bearbeiten, können Sie auch die Art und Weise ändern, wie die Regel erstellt wird: von der Verwendung von Datenqualitätsdefinitionen bis zur Verwendung von SQL-Anweisungen und umgekehrt. Wenn Sie dies tun, wird jedoch die gesamte vorhandene Regelkonfiguration verworfen und Sie müssen grundsätzlich völlig neu beginnen.
Sie können auch den Ausgabetyp ändern. Abhängig von Ihrer neuen Auswahl werden alle konfigurierten Ausgabeeinstellungen zurückgesetzt oder überschrieben. Die Regelausgabe, die vor der Änderung geschrieben wurde, bleibt unberührt.
Für Datenqualitätsregeln, die Daten direkt binden, wird eine Beziehung Datenqualität von mit jeder gebundenen Spalte und mit dem Asset, das die Spalte enthält, zum Abschnitt Zugehörige Elemente hinzugefügt. Sie können Assets und Spalten mit diesem Beziehungstyp manuell zu allen Datenqualitätsregeln hinzufügen. Wenn Sie Assets und Spalten zu Datenqualitätsregeln mit extern verwalteten Bindungen oder SQL-basierten Datenqualitätsregeln mit dieser Beziehung hinzufügen, tragen diese Regeltypen zu den Datenqualitätsscores des entsprechenden Assets oder der entsprechenden Spalte bei. Der Score und die Probleme, die von der Regel erzeugt werden, werden für alle Assets und Spalten gemeldet, die mit dem Beziehungstyp Validiert die Datenqualität verknüpft sind.
Wenn Sie eine Datenqualitätsregel anzeigen, können Sie auf das Info-Symbol " klicken, um weitere Details wie Ausgabeeinstellungen oder zugehörige Assets anzuzeigen.
Datenqualitätsregeln löschen
Sie können eine Datenqualitätsregel auf eine der folgenden Arten löschen:
- Wählen Sie im Projekt die Datenqualitätsregel aus und klicken Sie auf Löschen.
- Öffnen Sie die Datenqualitätsregel und wählen Sie im Überlaufmenü neben dem Namen der Datenqualitätsregel die Option Löschen aus.
Wenn Sie eine Datenqualitätsregel, ihren Ausführungsverlauf sowie alle zugehörigen DataStage -Workflows und -Jobs löschen, werden diese ebenfalls aus dem Projekt gelöscht. Ausgabetabellen im Projekt und in der Datenbank werden beibehalten. Die von dieser Datenqualitätsregel zurückgegebenen Probleme werden entfernt und die Datenqualität und die Dimensionsscores werden neu berechnet.
Weitere Informationen
Nächste Schritte
Übergeordnetes Thema: Datenqualität verwalten