0 / 0
Zurück zur englischen Version der Dokumentation
Ergebnisse der Datenqualitätsanalyse
Letzte Aktualisierung: 13. Dez. 2024
Ergebnisse der Datenqualitätsanalyse

Nachdem ein Datenasset erfolgreich analysiert wurde, werden die Ergebnisse der Analyse auf Datenassetebene und auf Spaltenebene angezeigt. Analyseergebnisse enthalten Informationen zum Inhalt und zur Struktur Ihres Datenassets sowie Metriken zur Gesamtqualität Ihrer Daten.

Die Ergebnisse der Datenqualitätsanalyse sind auf der Seite Datenqualität des Assets in einem Projekt oder Katalog verfügbar. Sie können auch innerhalb einer Metadatenaufbereitung auf sie zugreifen, indem Sie auf den Qualitätsscore eines Assets oder einer Spalte klicken.

Erforderliche Berechtigungen
Zum Anzeigen der Analyseergebnisse müssen Sie ein Mitarbeiter im Arbeitsbereich sein.
Um die Art und Weise zu ändern, wie die Scores berechnet werden, müssen Sie im Projekt über die Rolle Administrator oder Editor verfügen.
Zum Erstellen neuer Datenqualitätsprüfungen müssen Sie über die Rolle Administrator oder Editor im Projekt und über die Berechtigung Datenqualitätsassets verwalten verfügen.
Um die Daten, die zu Datenqualitätsproblemen geführt haben (die Ausgabetabelle), im Regelverlauf oder auf der Seite Datenqualität anzeigen zu können, benötigen Sie die Berechtigung Drill down to issue details. Der Datenbestand im Projekt, der für die Ausgabetabelle erstellt wird, ist jedoch für jeden zugänglich, der auf die Verbindung zugreifen kann. Um den Zugriff auf diesen Datenbestand einzuschränken, sollte die Verbindung zu der Datenquelle, in der die Ausgabetabelle gespeichert ist, mit persönlichen Zugangsdaten eingerichtet werden.

Informationen zur Datenqualität werden wie folgt in einem Projekt oder Katalog verfügbar:

  • In einem Projekt, nachdem die erste Datenqualitätsprüfung für das Datenasset auf eine der folgenden Arten ausgeführt wurde oder wenn ein verbundenes IBM Match 360 -Entitätsdatenasset hinzugefügt wird:

    • Die Datenqualitätsanalyse wird im Rahmen der Metadatenaufbereitung für das Asset ausgeführt.
    • Eine Datenqualitätsregel wird für das Asset ausgeführt.
  • In einem Katalog:

    • Ein Datenasset mit Datenqualitätsinformationen wird im Katalog veröffentlicht.

Die Qualitätsscores werden neu berechnet und die Daten werden wie folgt aktualisiert:

  • In einem Projekt gilt Folgendes: Jedes Mal, wenn eine Datenqualitätsprüfung für das Asset ausgeführt wird oder wenn ein IBM Match 360 -Entitätsdatenasset aktualisiert wird:

    • Eine Datenqualitätsanalyse wird im Kontext der Metadatenaufbereitung ausgeführt.
    • Für das Asset wird eine Datenqualitätsregel ausgeführt.
    • Der Abgleichalgorithmus IBM Match 360 wurde geändert oder potenzielle Übereinstimmungsprobleme wurden behoben.
  • In einem Katalog:

    • Ein Asset wird aus einem Projekt veröffentlicht.

Sie können sofort sehen, wann die Qualitätsscores zuletzt aktualisiert wurden.

Datenqualitätsinformationen für ein Asset

Wenn Sie auf die Datenqualitätsinformationen eines Assets zugreifen, sehen Sie die Gesamtdatenqualitätsscores und die Ergebnisse der Datenqualitätsprüfungen, die für das Asset ausgeführt wurden. Außerdem haben Sie Zugriff auf die Analyseergebnisse für die Assetspalten.

Wenn die SLA-Regeln für die Datenqualität im Rahmen der Metadatenanreicherung bewertet werden, verfügen die Assets, die einer SLA-Regel für die Datenqualität unterliegen, auch über Informationen zur SLA-Einhaltung.

Gesamtscores auf Assetebene

Eine grafische Darstellung der Qualitätsscores gibt Ihnen einen Überblick über die Gesamtqualität des Assets und die Qualitätsstufe in Bezug auf die Dimensionen, die auf das Asset angewendet werden. Für diese Bewertungen zeigen Trendinformationen, wie sich die Gesamtqualität oder der Qualitätsscore für eine Dimension im Zeitverlauf geändert hat. Sie können auswählen, ob der Trend für einen Zeitraum von 30, 90 oder 180 Tagen angezeigt wird. Eine Dimension zeigt keine Trendinformationen an, wenn zuvor keine Prüfung zu dieser Dimension beigetragen hat.

Der Gesamtasset-Score ist der gewichtete Durchschnitt der Scores, die von den Assetspalten bereitgestellt werden. Jeder Dimensionsscore ist der gewichtete Durchschnitt der entsprechenden Dimensionsscores, die von den einzelnen Prüfungen bereitgestellt werden.

Die Gesamt-und Dimensionsbewertungen sowie die Trendinformationen werden für diese Änderungen neu berechnet:

  • Für das Asset wird eine Datenqualitätsprüfung ausgeführt.
  • Die Einstellung Trägt zur Gesamtbewertung bei für eine Prüfung oder eine Spalte wurde geändert.
  • Eine Datenqualitätsregel, die auf das Asset angewendet wurde, wird gelöscht.
  • Das Assetprofil wird auf der Seite Profil des Assets gelöscht.
  • Das Asset wird in IBM Match 360aktualisiert.

Weitere Informationen finden Sie unter Datenqualitätsscores.

Einhaltung der SLA-Regeln für die Datenqualität

Für ein Asset, das einer oder mehreren Datenqualitäts-SLA-Regeln unterliegt, werden die angewandten SLA-Regeln mit ihren Ergebnissen sowie Datum und Uhrzeit der letzten Bewertung aufgelistet. Für eine verletzte SLA-Regel wird die Anzahl der Verletzungen angezeigt, die sich je nach Regelbedingungen auf Tabellen, Spalten oder beides beziehen können, und ob eine Aktion für die Regel konfiguriert wurde. Wenn ein Datenqualitäts-Workflow mit der verletzten Datenqualitäts-SLA-Regel verknüpft ist, können Sie auch den Status aller eingeleiteten Abhilfemaßnahmen sehen.

Sie können die Ergebnisse der einzelnen SLA-Regeln für die Datenqualität aufschlüsseln. Klicken Sie auf den Namen der SLA-Regel, um Details zu den Verstößen und den Prüfungen anzuzeigen, die zu einer Dimensionsbewertung in den Qualitätskriterien der SLA-Regel beigetragen haben. Der Abschnitt Verstöße enthält Informationen über das Element, für das der Verstoß festgestellt wurde, die definierten Qualitätskriterien, die tatsächliche Qualitätsbewertung des Elements und die Abweichung in Prozentpunkten (pp). Sie können auch die Regeldetails anzeigen oder die SLA-Regel bearbeiten, wenn Sie über die erforderlichen Berechtigungen verfügen.

Bei Anlagen, die keiner SLA-Regel zur Datenqualität unterliegen, ist dieser Abschnitt leer.

Informationen über die Einhaltung von Datenqualitäts-SLA-Regeln oder Abhilfemaßnahmen sind in Katalogen nicht verfügbar.

Ergebnisse der Datenqualitätsprüfung auf Assetebene

Hier sehen Sie, welche Prüfungen für das Asset ausgeführt wurden und welche Ergebnisse erzielt wurden. Die Liste wird nach Datum sortiert, wobei die neuesten Prüfungen am Anfang stehen.

Name & Logik

Der Name einer Datenqualitätsregel und der Name der Datenqualitätsdefinition, die die Regellogik enthält, oder der Name einer vordefinierten Datenqualitätsprüfung

Datenqualitätsregeln mit extern verwalteten Bindungen oder SQL-basierte Datenqualitätsregeln tragen zu den Datenqualitätsbewertungen eines Assets bei, wenn dieses Asset als zugehöriges Element zur entsprechenden Regel mit dem Validiert die Datenqualität von Beziehung. Für alle Assets und Spalten, die mit diesem Beziehungstyp verknüpft sind, werden derselbe Score und dieselben Probleme gemeldet.

Die vordefinierten Datenqualitätsprüfungen werden für das gesamte Asset ausgeführt. Es werden jedoch nicht alle Ergebnisse für alle Spalten zurückgegeben. Die Prüfung Fragwürdige Werte ermittelt beispielsweise Ausreißer in numerischen Spalten oder Zeichenfolgespalten mit numerischen Daten, gibt jedoch keine Ergebnisse für Zeichenfolgespalten mit Zeichenfolgewerten zurück. Daher kann die Liste der vordefinierten Datenqualitätsprüfungen für einzelne Spalten kürzer sein.

In einem Projekt können Sie auf den Namen einer Datenqualitätsprüfung klicken, um Details anzuzeigen. Zeigen Sie für vordefinierte Datenqualitätsprüfungen Informationen zu den Ergebnissen an: die Spalten mit Problemen sowie die Anzahl und der Prozentsatz der Werte in diesen Spalten, die als Qualitätsprobleme identifiziert wurden. Wenn eine Ausgabetabelle für diese Probleme eingerichtet ist, können Benutzer mit den entsprechenden Berechtigungen die tatsächlichen Zeilen anzeigen, in denen Daten Qualitätsprobleme verursachen. Für Datenqualitätsregeln können Sie die allgemeine Regelkonfiguration anzeigen und auf die Ausgabetabelle der Regel zugreifen, falls eine solche konfiguriert ist. Wenn Sie die Regelkonfiguration aktualisieren möchten und über die erforderlichen Berechtigungen verfügen, können Sie direkt zum Asset wechseln, indem Sie auf Datenqualitätsregel anzeigenklicken.

Für verbundene IBM Match 360 -Entitätsdatenassets wird hier Potenzielle Übereinstimmungen für den Abgleich angezeigt. Für diese Art der Prüfung werden keine weiteren Informationen bereitgestellt.

Typ

Der Typ der Prüfung, der Datenqualitätsregel, Abgleichoder Profilerstellungsein kann. Übereinstimmende wird für IBM Match 360 -Ergebnisse angezeigt Die Profilerstellung wird für vordefinierte Datenqualitätsprüfungen angezeigt, die im Kontext der Metadatenaufbereitung ausgeführt wurden. Siehe Vordefinierte Datenqualitätsprüfungen.

Dimension

Die Datenqualitätsdimension, an die diese Prüfung gebunden ist Den vordefinierten Datenqualitätsprüfungen, die während der Profilerstellung oder als Teil der Metadatenaufbereitung ausgeführt werden, sind Standarddimensionen zugeordnet. Bei Datenqualitätsregeln weisen Sie Dimensionen nach Bedarf zu.

Für verbundene IBM Match 360 -Entitätsdatenassets wird die Dimension Entity confidence angezeigt.

Wenn keine Dimension festgelegt ist, wird im Feld Keineangezeigt. Weitere Informationen finden Sie unter Datenqualitätsdimensionen und Datenqualitätsscores.

Fokus & Prozentsatz der Daten mit Problemen

Je nach Prüfungstyp kann der Fokus eine oder mehrere Spalten oder eine ganze Tabelle sein. Bei den vordefinierten Datenqualitätsprüfungen liegt der Fokus immer auf der gesamten Tabelle. Prozentsatz der Daten mit Problemen zeigt an, wie viele Daten die in der Prüfung definierten Qualitätskriterien nicht erfüllen.

Daten geprüft & Probleme gefunden

Die Anzahl der geprüften Datensätze und die Anzahl der gefundenen Qualitätsprobleme. Diese Probleme können sich in demselben oder in verschiedenen Datensätzen befinden.

Stichprobenentnahme

Die Art der Stichprobenziehung, die bei der letzten Ausführung der Prüfung angewendet wurde Bei Datenqualitätsregeln wird in dieser Spalte ein Gedankenstrich (-) angezeigt, wenn keine Stichprobenentnahme konfiguriert ist. Beim Abgleich wird in der Spalte immer ein Gedankenstrich angezeigt. Bei den vordefinierten Datenqualitätsprüfungen enthält die Spalte immer einen Wert.

Bewertung

Der Qualitätsscore, den die Prüfung für das Asset zurückgegeben hat

Trägt zum Gesamtscore beim

Diese Einstellung legt fest, ob dieser spezifische Qualitätsscore bei der Berechnung der Gesamtscores berücksichtigt wird. Sie können diese Einstellung nur in einem Projekt ändern. Sie müssen ein Projektadministrator oder Editor sein, um dies zu tun. In einem Katalog ist die Einstellung gesperrt. Siehe Datenqualitätsscores.

Letzte Prüfung

Das Datum und die Uhrzeit der letzten Ausführung der Überprüfung.

Sie können zur Spaltenübersicht wechseln, indem Sie auf Spaltenklicken.

In einem Projekt haben Sie auch die Möglichkeit, neue Datenqualitätsdefinitionen oder Datenqualitätsregeln zu erstellen, wenn die Datenqualitätskomponente vonIBM Knowledge Catalog aktiviert. Sie müssen Projektadministrator oder Bearbeiter sein und über die Berechtigung Datenqualitätsassets verwalten verfügen.

Spaltenübersicht

Informationen zur Datenqualität für die einzelnen Spalten anzeigen:

  • Der Spaltenname.
  • Der Gesamtdatenqualitätsscore der Spalte.
  • Der Qualitätsscore der Spalte für alle Dimensionen, die für das Asset gelten. Ein Gedankenstrich (-) wird angezeigt, wenn keine der Prüfungen, die auf diese Spalte angewendet wurden, zur Dimension beigetragen hat.
  • Die Anzahl der Prüfungen, die für eine Spalte ausgeführt wurden.
  • Gibt an, ob der Datenqualitätsscore der Spalte bei der Berechnung des Gesamtasset-Scores und der Dimensionsscores berücksichtigt wird. Als Projektadministrator oder Editor können Sie diese Einstellung ändern.
  • Gibt an, wann die Spalte zuletzt überprüft wurde.

Anschließend können Sie für jede Spalte einen Drilldown zu den Datenqualitätsdetails durchführen. Siehe Datenqualitätsinformationen für eine Spalte.

Sie können zur Liste der Datenqualitätsprüfungen zurückkehren, indem Sie auf Prüfungenklicken.

Datenqualitätsinformationen für eine Spalte

Wenn Sie auf die Datenqualitätsinformationen für eine Spalte zugreifen, sehen Sie einen Abschnitt mit den Gesamtdatenqualitätsscores und Sie haben Zugriff auf die Ergebnisse der Datenqualitätsprüfungen, die für die Spalte ausgeführt wurden. Der Abgleich trägt nicht zu den Daten auf Spaltenebene bei.

Zusätzlich zu den Qualitätsinformationen können Sie sehen, welche Datenklasse und Geschäftsbegriffe der Spalte zugeordnet sind.

Gesamtscores auf Spaltenebene

Eine grafische Darstellung der Qualitätsscores gibt Ihnen einen Überblick über die Gesamtqualität einer Spalte und die Qualitätsstufe in Bezug auf die Dimensionen, die auf die Spalte angewendet werden. Für diese Bewertungen zeigen Trendinformationen, wie sich die Gesamtqualität oder der Qualitätsscore für eine Dimension im Zeitverlauf geändert hat. Sie können auswählen, ob der Trend für einen Zeitraum von 30, 90 oder 180 Tagen angezeigt wird.

Der Gesamtscore für die Spalte oder eine Dimension ist der gewichtete Durchschnitt der Bewertungen, die von den Datenqualitätsprüfungen bereitgestellt wurden, die auf die Spalte angewendet wurden.

In einem Projekt werden die Gesamt-und Dimensionsbewertungen sowie die Trendinformationen jedes Mal neu berechnet, wenn eine Datenqualitätsprüfung für das Asset ausgeführt wird, die sich auf die Spalte auswirkt. Der Score wird auch neu berechnet, wenn Sie die Einstellung Trägt zur Gesamtbewertung bei für eine Prüfung ändern, die sich auf die Spalte auswirkt, oder wenn Datenqualitätsregeln oder das Assetprofil gelöscht werden.

In einem Katalog werden die Gesamt-und Dimensionsbewertungen sowie die Trendinformationen aktualisiert, wenn ein Asset aus einem Projekt veröffentlicht wird.

Weitere Informationen finden Sie unter Datenqualitätsscores.

Ergebnisse der Datenqualitätsprüfung auf Spaltenebene

Hier sehen Sie, welche Prüfungen auf die Spalte angewendet wurden und was die Ergebnisse waren. Die Liste wird nach Datum sortiert, wobei die neuesten Prüfungen am Anfang stehen.

Name & Logik

Der Name einer Datenqualitätsregel und der Name der Datenqualitätsdefinition, die die Regellogik enthält, oder der Name einer vordefinierten Datenqualitätsprüfung

Datenqualitätsregeln mit extern verwalteten Bindungen oder SQL-basierte Datenqualitätsregeln tragen zu den Datenqualitätsbewertungen einer Spalte bei, wenn diese Spalte als verknüpftes Element zur entsprechenden Regel mit dem Validiert die Datenqualität von Beziehung. Für alle Assets und Spalten, die mit diesem Beziehungstyp verknüpft sind, werden derselbe Score und dieselben Probleme gemeldet.

In einem Projekt können Sie auf den Namen einer Datenqualitätsregel klicken, um die allgemeine Regelkonfiguration und die Ausgabetabelle der Regel (sofern konfiguriert) anzuzeigen. Wenn Sie die Regelkonfiguration aktualisieren möchten und über die erforderlichen Berechtigungen verfügen, können Sie direkt zum Asset wechseln, indem Sie auf Datenqualitätsregel anzeigenklicken.

Typ

Der Typ der Prüfung. Dies kann Datenqualitätsregel oder Profilermittlungsein. Die Profilerstellung wird für vordefinierte Datenqualitätsprüfungen angezeigt, die im Kontext der Metadatenaufbereitung ausgeführt wurden. Siehe Vordefinierte Datenqualitätsprüfungen.

Dimension

Die Datenqualitätsdimension, an die diese Prüfung gebunden ist Den vordefinierten Datenqualitätsprüfungen, die während der Profilerstellung oder als Teil der Metadatenaufbereitung ausgeführt werden, sind Standarddimensionen zugeordnet. Bei Datenqualitätsregeln können Sie Dimensionen nach Bedarf zuordnen. Wenn keine Dimension festgelegt ist, wird im Feld Andereangezeigt. Weitere Informationen finden Sie unter Datenqualitätsdimensionen und Datenqualitätsscores.

Prozentsatz der Daten mit Problemen

Dieser Wert zeigt, wie viele Daten die in der Prüfung definierten Qualitätskriterien nicht erfüllen.

Daten geprüft & Probleme gefunden

Die Anzahl der geprüften Datensätze und die Anzahl der gefundenen Qualitätsprobleme. Diese Probleme können sich in demselben oder in verschiedenen Datensätzen befinden.

Stichprobenentnahme

Die Art der Stichprobenziehung, die bei der letzten Ausführung der Prüfung angewendet wurde Bei Datenqualitätsregeln wird in dieser Spalte ein Gedankenstrich (-) angezeigt, wenn keine Stichprobenentnahme konfiguriert ist. Bei den vordefinierten Datenqualitätsprüfungen enthält die Spalte immer einen Wert.

Bewertung

Der Qualitätsscore, den die Prüfung für die Spalte zurückgegeben hat.

Trägt zum Gesamtscore beim

Diese Einstellung legt fest, ob dieser spezifische Qualitätsscore bei der Berechnung der Gesamtscores berücksichtigt wird. Sie können diese Einstellung nur in einem Projekt ändern. Sie müssen ein Projektadministrator oder Editor sein, um dies zu tun. In einem Katalog ist die Einstellung gesperrt. Siehe Datenqualitätsscores.

Letzte Prüfung

Das Datum und die Uhrzeit der letzten Ausführung der Überprüfung.

IBM Knowledge Catalog API für Datenqualität

Sie können eine Sammlung von REST-APIs verwenden, um Informationen zur Datenqualität zu generieren und abzurufen.

Weitere Informationen

Übergeordnetes Thema: Datenqualität verwalten

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen