0 / 0
Zurück zur englischen Version der Dokumentation
Datenqualitätsdefinitionen verwalten
Letzte Aktualisierung: 13. Dez. 2024
Datenqualitätsdefinitionen verwalten

Sie können Datenqualitätsdefinitionen erstellen und verwalten, um Logik zu definieren, die für die Analyse der Datenqualität in Ihren Datenassets nützlich ist.

Wenn Sie über die erforderlichen Berechtigungenverfügen, können Sie Datenqualitätsdefinitionen wie folgt verwalten:

Sie können diese Tasks auch mit APIs anstelle der Benutzerschnittstelle ausführen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.

Erforderliche Berechtigungen

Zum Anzeigen von Datenqualitätsdefinitionen müssen Sie mindestens über die Rolle Anzeigeberechtigter im Projekt verfügen.

Zum Erstellen, Bearbeiten oder Löschen von Datenqualitätsdefinitionen benötigen Sie die Benutzerberechtigung Datenqualitätsassets verwalten und die Rolle Administrator oder die Rolle Editor im Projekt.

Datenqualitätsdefinition erstellen

So erstellen Sie eine Datenqualitätsdefinition:

  1. Öffnen Sie ein Projekt, klicken Sie auf Neues Asset > Definieren Sie, wie die Datenqualität gemessen wird .

  2. Definieren Sie Details:

    • Geben Sie einen Namen für die Datenqualitätsdefinition an.
    • Optional: Geben Sie eine Beschreibung an.
    • Optional: Wählen Sie eine Datenqualitätsdimension aus, um die primäre Datenqualitätsmetrik für die Regellogik in diesem Asset zu beschreiben. Die ausgewählte Dimension kann als Berichtskategorie, zum Filtern oder zum Visualisieren ausgewählter Daten verwendet werden.
  3. Definieren Sie die Regellogik. Sie können den Editor für freies Format verwenden, um Ihre Regellogik zu erstellen. Geben Sie im Feld Regelausdruck einen Ausdruck ein. Eine Liste der Ausdrücke, die Sie verwenden können, finden Sie unter Bausteine für Regellogik. Überprüfen Sie auch die Gruppe der Beispielregelausdrücke. Diese Beispiele veranschaulichen, wie Sie die Bausteine für Regellogik kombinieren können. Sie können die bereitgestellten Ausdrücke in Ihre eigenen Datenqualitätsdefinitionen kopieren und sie nach Bedarf verwenden oder anpassen.

    Besondere Hinweise gelten, wenn Ihr Ausdruck Zeichenfolgen enthält, die in Anführungszeichen eingeschlossen sind. Beispiel: ucase(trim(var_first_name)) NOT contains "YOU'RE"

    Solche Werte werden als Zeichenfolgeliterale behandelt. Wenn Sie jedoch möchten, dass solche Werte als Variablen behandelt werden, können Sie die Projekteinstellung allow_quoted_variables in true ändern, indem Sie die IBM Knowledge Catalog API Replace project settings for data quality rules verwenden.

    Als Alternative zum Schreiben Ihrer Ausdrücke im Editor für freies Format können Sie Blockelemente verwenden, um Ihre Regellogik zu erstellen:

    1. Wählen Sie ein Element aus der Gruppe Logik aus, z. B. IF THEN. Sie können die Regellogik mithilfe der Operatoren AND, OR und NOT erweitern.

    2. Wählen Sie Prüfungenaus, wählen Sie den Typ der Prüfung aus, die Sie verwenden wollen, und verbinden Sie sie mit dem IF -Block.

    3. Wählen Sie so viele Bedingungen wie für die Prüfung erforderlich aus den Gruppen Variablen und Literale, Operationen, Datum und Zeit, Allgemein, Mathematischoder Zeichenfolge aus und ziehen Sie sie in die Logik Prüfungen .

    4. Wählen Sie mindestens eine Prüfung in der Gruppe Prüfungen aus und verbinden Sie sie mit dem Blockelement THEN.

    5. Wählen Sie so viele Bedingungen wie für die Prüfung erforderlich aus den Gruppen Variablen und Literale, Operationen, Datum und Zeit, Allgemein, Mathematischoder Zeichenfolge aus und ziehen Sie sie in die Logik Prüfungen .

    6. Zusätzliche Aktionen werden verfügbar, wenn Sie mit der rechten Maustaste auf den Erstellungsbereich oder einen einzelnen Block klicken. Sie können beispielsweise den Block duplizieren oder einen Kommentar hinzufügen.

    Tipp:

    Fügen Sie im Blockabschnitt immer Kommentare hinzu. Die Eingabe oder Aktualisierung von Kommentaren im Textbereich Regelausdruck funktioniert möglicherweise nicht immer wie erwartet.

    Sie können ein Blockelement oder das gesamte Konstrukt löschen, indem Sie es in den Papierkorb ziehen.

    Überprüfen Sie die Regellogik im Feld Regelausdruck .

    Wenn Sie auf Erstellenklicken, wird die Syntax des Ausdrucks überprüft. Wenn sie gültig ist, wird die Datenqualitätsdefinition erstellt. Sie können jetzt Datenqualitätsregeln aus dieser Definition erstellen.

Datenqualitätsdefinition veröffentlichen

Sie können jede Datenqualitätsdefinition für die Wiederverwendung in anderen Projekten verfügbar machen, indem Sie sie in einem Katalog veröffentlichen, aus dem sie einer beliebigen Anzahl von Projekten hinzugefügt werden können. Stellen Sie zuvor sicher, dass die Beschreibung der Datenqualitätsdefinition aussagekräftige Informationen enthält. Solche Informationen helfen anderen Benutzern, die richtige Datenqualitätsdefinition für die Verwendung in ihrem Projekt auszuwählen.

So veröffentlichen Sie eine Datenqualitätsdefinition:

  1. Wählen Sie die Datenqualitätsdefinition in der Liste der Assets aus und klicken auf Im Katalog publizieren. Alternativ können Sie Im Katalog veröffentlichen im Überlaufmenü des Assets auswählen.

  2. Wählen Sie den Katalog aus und füllen Sie die Asseteigenschaften aus.

  3. Wenn bereits ein Assetduplikat im Katalog vorhanden ist, können Sie angeben, welche Aktion in einem derartigen Fall ausgeführt werden soll. Die Optionen, die zur Auswahl stehen, werden durch die Standardeinstellung des Katalogs festgelegt. Weitere Informationen zur Handhabung doppelter Assets finden Sie unter Handhabung doppelter Assets in Katalogen.

  4. Klicken Sie auf Publizieren. Die Assets werden zum Katalog hinzugefügt und Sie sind ihr Eigner. Zugeordnete Geschäftsbegriffe und Tags werden mit dem Asset publiziert. Zugeordnete Governance-Regeln werden nicht veröffentlicht. Sie müssen solche Beziehungen nach der Veröffentlichung der Definition manuell neu erstellen.

    Der Regelausdruck und die ausgewählte Datenqualitätsdimension werden ebenfalls publiziert und sind in der Assetvorschau im Katalog verfügbar.

Wenn einer Datenqualitätsdefinition ein Begriff zugeordnet ist, enthält der Abschnitt Datenqualitätsdefinitionen auf der Seite Zugehörige Inhalte des Begriffs einen Eintrag für jeden Container, in dem die Definition mit dieser Beziehung lebt. Dasselbe gilt für Beziehungen mit Governance-Regeln.

Wenn Sie eine Datenqualitätsdefinition aus einem Katalog zu einem Projekt hinzufügen, werden zugewiesene Klassifikationen und eventuell definierte Beziehungen nicht in das Projekt kopiert.

Datenqualitätsdefinition bearbeiten

Sie können eine Datenqualitätsdefinition bearbeiten, um ihren Namen, ihre Beschreibung, die ausgewählte Datenqualitätsdimension, den Regelausdruck oder Zuordnungen von Geschäftsbegriffen oder Governance-Regeln zu aktualisieren.

Um eine Datenqualitätsdefinition zu bearbeiten, öffnen Sie das Asset und führen Sie die entsprechende Aktion aus:

  • Klicken Sie auf das Bearbeitungssymbol " Symbol 'Bearbeiten' neben der Eigenschaft, die Sie ändern möchten.
  • Wählen Sie im Überlaufmenü neben dem Assetnamen eine Option aus. Sie können beispielsweise Umbenennen auswählen, um den Assetnamen zu ändern.

Denken Sie daran, dass sich Änderungen am Regelausdruck auf alle Regeln auswirken, die von dieser Datenqualitätsdefinition abgeleitet wurden. Um zu sehen, welche Regeln sich auf diese Datenqualitätsdefinition beziehen, klicken Sie auf das Info-Symbol " Informationssymbol.

Datenqualitätsdefinition löschen

Sie können eine Datenqualitätsdefinition auf eine der folgenden Arten löschen:

  • Wählen Sie im Projekt die Datenqualitätsdefinition aus und klicken Sie auf Löschen.
  • Öffnen Sie die Datenqualitätsdefinition und wählen Sie Löschen im Überlaufmenü neben dem Namen der Datenqualitätsdefinition aus.

Wenn Datenqualitätsregeln auf dieser Datenqualitätsdefinition basieren, müssen Sie diese Regeln löschen, bevor Sie die Definition löschen können.

Weitere Informationen

Übergeordnetes Thema: Datenqualität verwalten

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen