Sie können Datenqualitätsdefinitionen erstellen und verwalten, um Logik zu definieren, die für die Analyse der Datenqualität in Ihren Datenassets nützlich ist.
Wenn Sie über die erforderlichen Berechtigungenverfügen, können Sie Datenqualitätsdefinitionen wie folgt verwalten:
- Datenqualitätsdefinition erstellen
- Datenqualitätsdefinition veröffentlichen
- Eigenschaften einer Datenqualitätsdefinition bearbeiten
- Datenqualitätsdefinition löschen, die Sie nicht mehr benötigen
Sie können diese Tasks auch mit APIs anstelle der Benutzerschnittstelle ausführen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
Erforderliche Berechtigungen
Zum Anzeigen von Datenqualitätsdefinitionen müssen Sie mindestens über die Rolle Anzeigeberechtigter im Projekt verfügen.
Zum Erstellen, Bearbeiten oder Löschen von Datenqualitätsdefinitionen benötigen Sie die Benutzerberechtigung Datenqualitätsassets verwalten und die Rolle Administrator oder die Rolle Editor im Projekt.
Datenqualitätsdefinition erstellen
So erstellen Sie eine Datenqualitätsdefinition:
Öffnen Sie ein Projekt, klicken Sie auf Neues Asset > Definieren Sie, wie die Datenqualität gemessen wird .
Definieren Sie Details:
- Geben Sie einen Namen für die Datenqualitätsdefinition an.
- Optional: Geben Sie eine Beschreibung an.
- Optional: Wählen Sie eine Datenqualitätsdimension aus, um die primäre Datenqualitätsmetrik für die Regellogik in diesem Asset zu beschreiben. Die ausgewählte Dimension kann als Berichtskategorie, zum Filtern oder zum Visualisieren ausgewählter Daten verwendet werden.
Definieren Sie die Regellogik. Sie können den Editor für freies Format verwenden, um Ihre Regellogik zu erstellen. Geben Sie im Feld Regelausdruck einen Ausdruck ein. Eine Liste der Ausdrücke, die Sie verwenden können, finden Sie unter Bausteine für Regellogik. Überprüfen Sie auch die Gruppe der Beispielregelausdrücke. Diese Beispiele veranschaulichen, wie Sie die Bausteine für Regellogik kombinieren können. Sie können die bereitgestellten Ausdrücke in Ihre eigenen Datenqualitätsdefinitionen kopieren und sie nach Bedarf verwenden oder anpassen.
Besondere Hinweise gelten, wenn Ihr Ausdruck Zeichenfolgen enthält, die in Anführungszeichen eingeschlossen sind. Beispiel:
ucase(trim(var_first_name)) NOT contains "YOU'RE"
Solche Werte werden als Zeichenfolgeliterale behandelt. Wenn Sie jedoch möchten, dass solche Werte als Variablen behandelt werden, können Sie die Projekteinstellung
allow_quoted_variables
intrue
ändern, indem Sie die IBM Knowledge Catalog API Replace project settings for data quality rules verwenden.Als Alternative zum Schreiben Ihrer Ausdrücke im Editor für freies Format können Sie Blockelemente verwenden, um Ihre Regellogik zu erstellen:
Wählen Sie ein Element aus der Gruppe Logik aus, z. B. IF THEN. Sie können die Regellogik mithilfe der Operatoren AND, OR und NOT erweitern.
Wählen Sie Prüfungenaus, wählen Sie den Typ der Prüfung aus, die Sie verwenden wollen, und verbinden Sie sie mit dem IF -Block.
Wählen Sie so viele Bedingungen wie für die Prüfung erforderlich aus den Gruppen Variablen und Literale, Operationen, Datum und Zeit, Allgemein, Mathematischoder Zeichenfolge aus und ziehen Sie sie in die Logik Prüfungen .
Wählen Sie mindestens eine Prüfung in der Gruppe Prüfungen aus und verbinden Sie sie mit dem Blockelement THEN.
Wählen Sie so viele Bedingungen wie für die Prüfung erforderlich aus den Gruppen Variablen und Literale, Operationen, Datum und Zeit, Allgemein, Mathematischoder Zeichenfolge aus und ziehen Sie sie in die Logik Prüfungen .
Zusätzliche Aktionen werden verfügbar, wenn Sie mit der rechten Maustaste auf den Erstellungsbereich oder einen einzelnen Block klicken. Sie können beispielsweise den Block duplizieren oder einen Kommentar hinzufügen.
Tipp:Fügen Sie im Blockabschnitt immer Kommentare hinzu. Die Eingabe oder Aktualisierung von Kommentaren im Textbereich Regelausdruck funktioniert möglicherweise nicht immer wie erwartet.
Sie können ein Blockelement oder das gesamte Konstrukt löschen, indem Sie es in den Papierkorb ziehen.
Überprüfen Sie die Regellogik im Feld Regelausdruck .
Wenn Sie auf Erstellenklicken, wird die Syntax des Ausdrucks überprüft. Wenn sie gültig ist, wird die Datenqualitätsdefinition erstellt. Sie können jetzt Datenqualitätsregeln aus dieser Definition erstellen.
Datenqualitätsdefinition veröffentlichen
Sie können jede Datenqualitätsdefinition für die Wiederverwendung in anderen Projekten verfügbar machen, indem Sie sie in einem Katalog veröffentlichen, aus dem sie einer beliebigen Anzahl von Projekten hinzugefügt werden können. Stellen Sie zuvor sicher, dass die Beschreibung der Datenqualitätsdefinition aussagekräftige Informationen enthält. Solche Informationen helfen anderen Benutzern, die richtige Datenqualitätsdefinition für die Verwendung in ihrem Projekt auszuwählen.
So veröffentlichen Sie eine Datenqualitätsdefinition:
Wählen Sie die Datenqualitätsdefinition in der Liste der Assets aus und klicken auf Im Katalog publizieren. Alternativ können Sie Im Katalog veröffentlichen im Überlaufmenü des Assets auswählen.
Wählen Sie den Katalog aus und füllen Sie die Asseteigenschaften aus.
Wenn bereits ein Assetduplikat im Katalog vorhanden ist, können Sie angeben, welche Aktion in einem derartigen Fall ausgeführt werden soll. Die Optionen, die zur Auswahl stehen, werden durch die Standardeinstellung des Katalogs festgelegt. Weitere Informationen zur Handhabung doppelter Assets finden Sie unter Handhabung doppelter Assets in Katalogen.
Klicken Sie auf Publizieren. Die Assets werden zum Katalog hinzugefügt und Sie sind ihr Eigner. Zugeordnete Geschäftsbegriffe und Tags werden mit dem Asset publiziert. Zugeordnete Governance-Regeln werden nicht veröffentlicht. Sie müssen solche Beziehungen nach der Veröffentlichung der Definition manuell neu erstellen.
Der Regelausdruck und die ausgewählte Datenqualitätsdimension werden ebenfalls publiziert und sind in der Assetvorschau im Katalog verfügbar.
Wenn einer Datenqualitätsdefinition ein Begriff zugeordnet ist, enthält der Abschnitt Datenqualitätsdefinitionen auf der Seite Zugehörige Inhalte des Begriffs einen Eintrag für jeden Container, in dem die Definition mit dieser Beziehung lebt. Dasselbe gilt für Beziehungen mit Governance-Regeln.
Wenn Sie eine Datenqualitätsdefinition aus einem Katalog zu einem Projekt hinzufügen, werden zugewiesene Klassifikationen und eventuell definierte Beziehungen nicht in das Projekt kopiert.
Datenqualitätsdefinition bearbeiten
Sie können eine Datenqualitätsdefinition bearbeiten, um ihren Namen, ihre Beschreibung, die ausgewählte Datenqualitätsdimension, den Regelausdruck oder Zuordnungen von Geschäftsbegriffen oder Governance-Regeln zu aktualisieren.
Um eine Datenqualitätsdefinition zu bearbeiten, öffnen Sie das Asset und führen Sie die entsprechende Aktion aus:
- Klicken Sie auf das Bearbeitungssymbol " neben der Eigenschaft, die Sie ändern möchten.
- Wählen Sie im Überlaufmenü neben dem Assetnamen eine Option aus. Sie können beispielsweise Umbenennen auswählen, um den Assetnamen zu ändern.
Denken Sie daran, dass sich Änderungen am Regelausdruck auf alle Regeln auswirken, die von dieser Datenqualitätsdefinition abgeleitet wurden. Um zu sehen, welche Regeln sich auf diese Datenqualitätsdefinition beziehen, klicken Sie auf das Info-Symbol " .
Datenqualitätsdefinition löschen
Sie können eine Datenqualitätsdefinition auf eine der folgenden Arten löschen:
- Wählen Sie im Projekt die Datenqualitätsdefinition aus und klicken Sie auf Löschen.
- Öffnen Sie die Datenqualitätsdefinition und wählen Sie Löschen im Überlaufmenü neben dem Namen der Datenqualitätsdefinition aus.
Wenn Datenqualitätsregeln auf dieser Datenqualitätsdefinition basieren, müssen Sie diese Regeln löschen, bevor Sie die Definition löschen können.
Weitere Informationen
- Datenqualitätsassets
- Bausteine für Regellogik
- Beispielregelausdrücke
- Datenqualitätsregeln verwalten
- Handhabung doppelter Assets in Katalogen
- IBM Knowledge Catalog API: Datenqualitätsdefinition erstellen
- IBM Knowledge Catalog API: Validierung des Ausdrucks zur Datenqualitätsdefinition
- IBM Knowledge Catalog API: Veröffentlichen eines Assets
- IBM Knowledge Catalog API: Datenqualitätsdefinition aktualisieren
- IBM Knowledge Catalog API: Löschen nicht mehr benötigter Datenqualitätsdefinitionen
Übergeordnetes Thema: Datenqualität verwalten