Überprüfen Sie die Aufbereitungsergebnisse nach Abschluss des Aufbereitungsjobs. Greifen Sie auf die Ergebnisse zu, indem Sie das Metadatenaufbereitungsasset anzeigen.
- Erforderliche Berechtigungen
- Zum Anzeigen von Aufbereitungsergebnissen müssen Sie mindestens über die Rolle Anzeigeberechtigter im Projekt verfügen.
- Um Ergebnisse bearbeiten zu können, müssen Sie mindestens die Rolle Editor im Projekt haben. Wenn Sie Begriffszuordnungen ändern möchten, benötigen Sie mindestens Anzeigezugriff auf die Kategorien, die in der Aufbereitung verwendet werden.
Assets zur Metadatenaufbereitung werden im Abschnitt Metadatenaufbereitungen auf der Seite Assets des Projekts aufgelistet. Um ein Metadatenaufbereitungsasset anzuzeigen, klicken Sie auf seinen Namen oder im Überlaufmenü des Assets auf Ansicht.
Eine seitliche Anzeige enthält eine Zusammenfassung der relevanten Informationen zur Metadatenaufbereitung.
Die folgenden Indikatoren werden in den Ergebnistabellen und den Detailanzeigen verwendet:
- Purpurroter Punkt für automatisch zugeordnete Begriffe oder Datenklassen
- Ein purpurrotes Quadrat für automatisch zugewiesene Anzeigenamen und für automatisch zugewiesene KI-generierte Beschreibungen
- Ein blauer Punkt für akzeptierte Vorschläge für Anzeigenamen oder Beschreibungen bzw. für bearbeitete Anzeigenamen oder Beschreibungen
Dieser Indikator wird entfernt, wenn das Asset in einem Katalog veröffentlicht wird. - Ein KI-Symbol für KI-vorgeschlagene Beschreibungen
Die Metadatenaufbereitung wird für Assets ausgeführt, die in dem Projekt verfügbar sind. Daher entspricht die Liste der aufbereiteten Assets in den folgenden Fällen möglicherweise nicht dem konfigurierten Geltungsbereich der eingeschlossenen Metadatenimportassets:
- Metadata import war noch nicht abgeschlossen, als die Aufbereitung gestartet wurde.
- Metadata import ist für eine Gruppe von Assets fehlgeschlagen oder vollständig fehlgeschlagen.
Ergebnisse auf Assetebene überprüfen
Auf der Registerkarte Assets werden die folgenden Informationen für jedes Datenasset im Bereich der Metadatenaufbereitung bereitgestellt:
- Assetname. Bei relationalen Daten wird auch der Tabellentyp angezeigt.
- Quelleninformationen.
- Der Anzeigename. Sie können die Namen bearbeiten und vorgeschlagene Namen inline akzeptieren.
- Beschreibung. Sie können die Beschreibungen bearbeiten und von KI vorgeschlagene Beschreibungen inline akzeptieren.
- Zugeordnete Geschäftsbegriffe und die Anzahl der vorgeschlagenen Begriffe.
- Zugewiesene Klassifikationen.
- Zugeordnete Primärschlüssel und die Anzahl der vorgeschlagenen Schlüssel.
- Gesamtdatenqualitätsscore, der in der letzten Aufbereitung erreicht wurde.
- Überprüfen Sie den Status.
- Der Status sowie das Datum und die Uhrzeit der letzten Aufbereitung.
- Veröffentlichungsstatus.
Bis die Aufbereitung mindestens einmal ausgeführt wurde, werden nur die Spalten Name und Kontext gefüllt.
Standardmäßig werden alle Informationen auf der Registerkarte angezeigt. Sie können die Ansicht anpassen und nur die Informationen anzeigen, die Sie benötigen. Klicken Sie auf das Symbol Spalten anpassen und deaktivieren Sie alle Spalten, die Sie ausblenden möchten. Sie können die Spalten auch neu ordnen, indem Sie auf einen Eintrag klicken und ihn an eine neue Position ziehen.
Überprüfen Sie die Assetdetails und die Aufbereitungsergebnisse:
- Details zu Assets und Aufbereitung
- Governance-Informationen
- Informationen zu Primärschlüsseln und Beziehungen
- Datenqualitätsscore
- Überprüfungsstatus
- Aufbereitungsstatus
- Status veröffentlichen
Sie können direkt zu den Spalten eines einzelnen Assets gehen, indem Sie auf den Asset-Namen klicken oder indem Sie auf Spalten anzeigen im Überlaufmenü klicken.
Detaillierte Ergebnisse für jedes Asset sind auch in Assetprofil im Projekt verfügbar. Auf Profildetails auf Spaltenebene kann auch über die Registerkarte Governance in der Anzeige für Spaltendetails zugegriffen werden. Bei Data Virtualization und watsonx.data wird allen Benutzern der Zugriff auf die Profiling-Ergebnisse verweigert, um eine versehentliche Aufdeckung von Wertverteilungen zu verhindern.
Wenn Sie ein bestimmtes Asset aus dem Aufbereitungsbereich entfernen möchten, wählen Sie das Asset aus und klicken Sie im Überlaufmenü auf Asset entfernen.
Details zu Assets und Aufbereitung
Greifen Sie auf Asset- und Aufbereitungsdetails zu, indem Sie auf den Assetnamen klicken oder im Überlaufmenü auf Assetdetails anzeigen klicken. Auf der Registerkarte Details in der Seitenanzeige finden Sie die folgenden Informationen:
- Die Quelle des Datenassets: Verbindung und Datenbank für verbundene Assets. Für Dateien, die von einem lokalen System hochgeladen wurden, wird Projekt in der Spalte Quelle angezeigt.
- Assetdetails: Der Tabellentyp, die Anzahl der Spalten und Zeilen im Asset und sein Datenformat.
- Der Asseteigentümer. Der Asseteigner ist normalerweise der Benutzer, der das Asset zum Projekt hinzugefügt hat, mit Ausnahme von Assets, die aus einem Katalog hinzugefügt wurden. In diesem Fall ist der Eigner des Katalogassets auch der Eigner des Projektasset.
- Die ausgewählten Aufbereitungsoptionen.
- Die Stichprobenmethode.
- Das Datum, an dem das Asset zuletzt angereichert wurde, und ein Link zu den Details dieses Anreicherungsauftrags.
- Die Assetbeschreibung.
Anzeigename
Wenn die Aufbereitungsoptionen die Option Metadaten erweitern enthalten, enthält dieser Abschnitt zunächst einen alternativen Namen für das Datenasset, das durch unscharfe Suche gefunden wurde. Bei der unscharfen Suche wird der Quellenname auf der Basis eines vordefinierten Glossars erweitert, um einen leicht verständlichen Namen bereitzustellen. Der erweiterte Name ist möglicherweise bereits zugeordnet, weil die Konfidenz hoch genug war, oder es ist ein Vorschlag, den Sie akzeptieren können. Sie können den Anzeigenamen jederzeit bearbeiten.
Beschreibung
Dieser Abschnitt kann eine Beschreibung für das Asset enthalten. Wenn die Aufbereitungsoptionen die Option Metadaten erweitern enthalten, enthält dieser Abschnitt zunächst eine AI-generierte Beschreibung. Diese Beschreibung ist möglicherweise bereits zugeordnet, weil die Konfidenz hoch genug war, oder es ist ein Vorschlag, den Sie akzeptieren können. Sie können die Beschreibung jederzeit bearbeiten.
Quelle
In diesem Abschnitt werden die Verbindung und die Datenbank für verbundene Assets angezeigt. Für Dateien, die von einem lokalen System hochgeladen wurden, wird Projekt in der Spalte Quelle angezeigt.
Assetdetails
Assetdetails umfassen die Anzahl der Spalten und Zeilen im Asset und das Datenformat des Assets. Bei relationalen Daten wird auch der Tabellentyp aufgelistet.
Asseteigner
Der Asseteigner ist normalerweise der Benutzer, der das Asset zum Projekt hinzugefügt hat, mit Ausnahme von Assets, die aus einem Katalog hinzugefügt wurden. In diesem Fall ist der Eigner des Katalogassets auch der Eigner des Projektasset.
Aufbereitungsdetails
Die Aufbereitungsdetails umfassen die Liste der ausgewählten Aufbereitungsoptionen, die ausgewählte Stichprobenmethode, das Datum, an dem das Asset zuletzt aufbereitet wurde, und einen Link zur entsprechenden Jobausführung.
Governance-Informationen
Die Governance-Informationen für ein Asset umfassen zugewiesene und vorgeschlagene Geschäftsbegriffe und zugewiesene Klassifizierungen, die in den Spalten Geschäftsbegriffe und Klassifizierungen der Ergebnisse aufgeführt sind. Bei zugewiesenen Begriffen gibt ein purpurroter Punkt an, dass mindestens einer der Begriffe automatisch zugewiesen wurde.
Greifen Sie auf detaillierte Governance-Informationen zu einem Vermögenswert zu, indem Sie auf den Namen des Vermögenswerts oder auf den Link Mehr anzeigen in der Spalte Geschäftsbegriffe oder Klassifizierungen klicken, oder indem Sie auf Vermögenswertdetails anzeigen im Überlaufmenü klicken. Auf der Registerkarte Verwaltung im Seitenbereich können Sie Begriffs- und Klassifizierungszuweisungen verwalten.
Bedingungen
Prüfen Sie zugewiesene und vorgeschlagene Begriffe. Für jeden zugewiesenen oder vorgeschlagenen Begriff wird der Verlässlichkeitsscore angezeigt. Sie können auf einen Begriff klicken, um einige seiner Eigenschaften anzuzeigen: seine Beschreibung, seine primäre und sekundäre Kategorie, eine Liste von Data-Stewards, hierarchische Typbeziehungen sowie zugehörige Klassifikationen und Datenklassen.
Akzeptieren Sie Vorschläge nach Bedarf. Sie können auch nach Geschäftsbegriffen suchen, die nicht als Vorschläge aufgelistet sind, und sie manuell zuordnen. Entfernen Sie alle zugewiesenen Begriffe, die Ihrer Meinung nach ungenau sind. Eine solche negative Rückmeldung wird beim nächsten Aufbereitungslauf berücksichtigt. Begriffe, die Sie massenweise entfernen, werden anders behandelt als Begriffe, die Sie einzeln entfernen. Wenn Sie einen Begriff aus einem einzelnen Asset entfernen, gilt dieser Begriff als abgelehnt. Es wird auch in der seitlichen Anzeige aufgelistet, und Sie können es jederzeit neu zuweisen. Weitere Informationen finden Sie unter Begriffszuordnung.
Klassifikationen
Überprüfen Sie die zugewiesenen Klassifizierungen. Abhängig von den Projekteinstellungen werden bei der automatischen Zuordnung eines Geschäftsbegriffs auch Klassifizierungen zugeordnet, die sich auf einen Geschäftsbegriff beziehen. Sie können zusätzliche Klassifizierungen vergeben oder die vom System vergebenen Klassifizierungen entfernen und durch andere ersetzen. Weitere Informationen zu den Projekteinstellungen finden Sie unter Standardeinstellungen für die Anreicherung: Zuordnung der Klassifizierung.
Informationen zu Primärschlüsseln und Beziehungen
Sie können auf Schlüssel-und Beziehungsinformationen für ein Asset zugreifen, indem Sie auf den Assetnamen klicken, indem Sie auf den Link Weitere anzeigen in der Spalte Primärschlüssel klicken oder indem Sie im Überlaufmenü auf Assetdetails anzeigen klicken. Auf der Registerkarte Tasten in der seitlichen Anzeige können Sie Tastenzuordnungen und Beziehungen verwalten.
Für Primärschlüssel, die über die Primärschlüsselanalyse ermittelt wurden, werden die Anzahl und der Prozentsatz der eindeutigen Werte, die Anzahl und der Prozentsatz der Nullwerte und die Anzahl der analysierten Spalten angezeigt. Diese Informationen sind für einen Schlüssel, der ohne vorherige Primärschlüsselanalyse manuell ausgewählt und zugewiesen wurde, oder für vorgeschlagene Primärschlüssel, die aus einer eingehenden Schlüsselbeziehungsanalyse resultieren, nicht verfügbar.
Der Abschnitt Beziehungen enthält die folgenden Sichten der zugeordneten Beziehungen:
- Registerkarte Übergeordnetes Element von : In Beziehungen zu den aufgelisteten Anlagen stellt die aktuelle Anlage den Primärschlüssel bereit.
- Registerkarte Untergeordnet von : In Beziehungen zu den aufgelisteten Assets stellt das aktuelle Asset den Fremdschlüssel bereit.
Wenn eine Beziehungsanalyse ausgeführt wurde, aber noch keine Beziehungen zugeordnet sind, können Sie auf das Pluszeichen klicken, um die Analyseergebnisse anzuzeigen und mit ihnen zu arbeiten.
Sie können die zugewiesenen Beziehungen jederzeit bearbeiten, indem Sie auf das Stiftsymbol klicken.
Weitere Informationen finden Sie unter Primärschlüssel identifizieren und Beziehungen angeben.
Datenqualitätsscore
Ein Datenqualitätsscore wird nur angezeigt, wenn mindestens eine Datenqualitätsprüfung auf das Asset angewendet wurde. Andernfalls wird ein Gedankenstrich (-) angezeigt. Die für ein Datenasset angezeigte Bewertung ist der gewichtete Durchschnitt der Bewertungen, die von den Spalten im Datenasset bereitgestellt werden. Datenqualitätsscores, die unter dem angegebenen Schwellenwert liegen, sind mit einem roten Punkt markiert. Datenqualitätsscores, die den angegebenen Schwellenwert erreichen oder überschreiten, werden grün markiert.
Ein Deltawert zeigt an, wie sich der Gesamtdatenqualitätsscore im Vergleich zum Score von 90 Tagen vor der letzten Analyse geändert hat.
- Ein grüner Pfeil, der nach rechts oben zeigt (), zeigt an, dass die Datenqualitätsbewertung gestiegen ist.
- Ein roter Pfeil, der nach rechts unten zeigt (), bedeutet, dass die Datenqualität gesunken ist.
Um Assets mit Qualitätsproblemen schnell zu finden, insbesondere wenn der Aufbereitungsbereich groß ist, können Sie die Liste nach Qualitätsscores filtern.
Um Details zu Datenqualitätsproblemen anzuzeigen, wählen Sie ein Asset aus und klicken Sie im Überlaufmenü auf Datenqualitätsdetails anzeigen oder auf den Qualitätsscore.
Weitere Informationen finden Sie unter Ergebnisse der Datenqualitätsanalyse und Datenqualitätsscores.
Überprüfungsstatus
Anfänglich lautet der Überprüfungsstatus aller Assets in der Metadatenaufbereitung Nicht geprüft. Nachdem Sie die Aufbereitungsergebnisse für ein Asset im Assetprofil überprüft haben, können Sie den Überprüfungsstatus des Assets auf Geprüft setzen. Somit ist jedem im Team bewusst, was bereits geprüft wurde und was noch überprüft werden muss. Wenn ein späterer Anreicherungslauf die Ergebnisse eines Assets mit dem Status Geprüft aktualisiert, wird der Überprüfungsstatus des Assets auf Nach Überprüfung neu analysiert () gesetzt. Der Überprüfungsstatus ändert sich nicht bei Aktualisierungen des Assets, die beim Metadatenimport gefunden wurden.
Für Assets, die als geprüft markiert sind, werden Begriffszuordnungen bei erneuten Ausführungen einer Aufbereitung nicht aktualisiert. Weitere Informationen finden Sie unter Wie neue Analyseergebnisse vorhandene Begriffszuordnungen aktualisieren.
Filtern Sie die Liste der Assets nach Prüfstatus, um schnell alle Assets zu finden, die untersucht werden müssen.
Sie können den Überprüfungsstatus eines Assets jederzeit zurücksetzen. Um den Prüfstatus zu ändern, klicken Sie im Überlaufmenü des Assets auf Als geprüft markieren oder Als nicht geprüft markieren. Um den Prüfstatus mehrerer Assets gleichzeitig zu ändern, wählen Sie die Assets aus, klicken Sie auf Mehr und wählen Sie Als geprüft markieren oder Als nicht geprüft markieren aus. Der Prüfstatus eines Assets ist unabhängig davon, welchen Prüfstatus ihre Spalten aufweisen. Sie können auch APIs anstelle der Benutzerschnittstelle verwenden, um den Überprüfungsstatus von Assets festzulegen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
Wenn Sie eine Massenänderung des Überprüfungsstatus vornehmen, wird möglicherweise eine Nachricht über die erfolgreiche Ausführung angezeigt, bevor die Änderungen tatsächlich abgeschlossen sind, abhängig vom Volumen der angeforderten Änderungen. Möglicherweise müssen Sie die Ansicht mehrmals aktualisieren, bevor alle Änderungen angewendet werden.
Aufbereitungsstatus
Die Statusspalte für die Aufbereitung kann die folgenden Werte enthalten:
- Nicht analysiert
- Dieses Asset wurde nach der letzten Aufbereitungsausführung hinzugefügt.
- Fertig
- Die Aufbereitung für dieses Asset ist abgeschlossen. This status is also shown if the enrichment happened outside the current enrichment asset, for example, if the asset was profiled manually before it was added to this enrichment.
- Fehlgeschlagen
- Während der Aufbereitung ist ein Fehler aufgetreten.
- Abgebrochen
- Die Jobausführung für die Aufbereitung wurde abgebrochen.
Sie können die Ergebnisliste nach Aufbereitungsstatus sortieren oder filtern. Beim Sortieren erfolgt die primäre Sortierreihenfolge nach Status. Aufsteigende Reihenfolge ist abgebrochen, fehlgeschlagen und beendet. Abhängig von der allgemeinen Sortierreihenfolge werden Assets mit dem Status Nicht analysiert unsortiert am Anfang oder am Ende der Liste angezeigt.
Status veröffentlichen
In dieser Spalte wird angezeigt, ob ein Asset in einem Katalog veröffentlicht wurde. Veröffentlichungsdetails wie der Zielkatalog oder der Name des Veröffentlichungsjobs sind in den Assetinformationen in der seitlichen Anzeige verfügbar.
Es werden jedoch nur die Details der letzten Veröffentlichungsanforderung angezeigt.
Ergebnisse auf Spaltenebene überprüfen
Auf der Registerkarte Spalten werden die folgenden Informationen für jede Spalte in einem Datenasset im Bereich der Metadatenaufbereitung bereitgestellt:
- Spaltenname. Ein Schlüssel Symbol neben dem Namen zeigt an, dass die Spalte als Primärschlüssel zugewiesen ist.
- Tabelle, zu der die Spalte gehört, und Kontext dieses Assets.
- Der Anzeigename. Sie können die Namen bearbeiten und von KI vorgeschlagene Namen inline akzeptieren.
- Beschreibung. Sie können die Beschreibungen bearbeiten und von KI vorgeschlagene Beschreibungen inline akzeptieren.
- Zugeordnete Geschäftsbegriffe und die Anzahl der vorgeschlagenen Begriffe.
- Zugeordnete Datenklasse.
- Zugewiesene Klassifikationen.
- Datenqualitätsscore für diese Spalte.
- Überprüfen Sie den Status.
Die Registerkarte Spalten ist leer, bis die Aufbereitung mindestens einmal ausgeführt wurde.
Standardmäßig werden alle Informationen auf der Registerkarte angezeigt. Sie können die Ansicht anpassen und nur die Informationen anzeigen, die Sie benötigen. Klicken Sie auf das Symbol Spalten anpassen und deaktivieren Sie alle Spalten, die Sie ausblenden möchten. Sie können die Spalten auch neu ordnen, indem Sie auf einen Eintrag klicken und ihn an eine neue Position ziehen.
Wenn Sie nur die Spalten eines bestimmten Daten-Assets prüfen möchten, klicken Sie auf den Asset-Namen auf der Registerkarte Assets oder klicken Sie auf Spalten anzeigen im Überlaufmenü .
Spaltendetails und Aufbereitungsergebnisse überprüfen:
Spaltendetails
Greifen Sie auf Spalten- und Aufbereitungsdetails zu, indem Sie auf den Spaltennamen oder im Überlaufmenü auf Spaltendetails anzeigen klicken. Auf der Registerkarte Details in der Seitenanzeige finden Sie die folgenden Informationen:
Der Anzeigename. Wenn die Aufbereitungsoptionen die Option Metadaten erweitern enthalten, enthält dieser Abschnitt zunächst einen alternativen Namen für die Spalte, die durch unscharfe Suche gefunden wurde. Bei der unscharfen Suche wird der Quellenname auf der Basis eines vordefinierten Glossars erweitert, um einen leicht verständlichen Namen bereitzustellen. Der erweiterte Name ist möglicherweise bereits zugeordnet, weil die Konfidenz hoch genug war, oder es ist ein Vorschlag, den Sie akzeptieren können. Sie können den Anzeigenamen jederzeit bearbeiten.
Beschreibung. Dieser Abschnitt kann eine Beschreibung für die Spalte enthalten. Wenn die Aufbereitungsoptionen die Option Metadaten erweitern enthalten, enthält dieser Abschnitt zunächst eine AI-generierte Beschreibung. Diese Beschreibung ist möglicherweise bereits zugeordnet, weil die Konfidenz hoch genug war, oder es ist ein Vorschlag, den Sie akzeptieren können. Sie können die Beschreibung jederzeit bearbeiten.
Der Kontext des Assets, zu dem die Spalte gehört, im Abschnitt Quelle.
Statistiken zu den Daten für jede Spalte, wie z. B. die Anzahl der unterschiedlichen Werte, der Prozentsatz der eindeutigen Werte, das Minimum, Maximum oder Mittel und manchmal die Standardabweichung in dieser Spalte. Die Anzahl unterschiedlicher Werte gibt an, wie viele verschiedene Werte in den Stichprobendaten für die Spalte vorhanden sind. Der Prozentsatz eindeutiger Werte gibt den Prozentsatz unterschiedlicher Werte an, die nur einmal in der Spalte angezeigt werden.
Abhängig vom Datenformat einer Spalte variieren die Statistikdaten geringfügig. Statistiken für eine Spalte des Datentyps 'integer' weisen beispielsweise Minimal-, Maximal-und Mittelwerte sowie einen Standardabweichungswert auf, während Statistiken für eine Spalte des Datentyps 'string' Werte für die Mindestlänge, maximale Länge und durchschnittliche Länge aufweisen.
Die Häufigkeitsverteilung der gefundenen Werte und die Anzahl der fehlenden Werte.
Das Datenformat der Spalten in den Stichprobenzeilen.
Der Asseteigentümer.
Detailliertere Ergebnisse für jede Spalte sind im Spaltenprofilverfügbar. So zeigen Sie dieses Profil an:
- Wählen Sie im Überlaufmenü der Spalte Datenprofil anzeigen aus.
- Klicken Sie auf das Profil der offenen Säule-Symbol neben Statistik oder Formate in den Spaltendetails.
- Klicken Sie im Abschnitt Statistik oder Formate auf den Link Alle anzeigen . Gibt an, ob dieser Link abhängig von der Anzahl der Ergebnisse verfügbar ist.
Wenn die Spalte einer Datenschutzregel unterliegt, ist nur ein Teil dieser Informationen verfügbar: die Beschreibung und der Kontext
Bei Data Virtualization und watsonx.data wird allen Benutzern der Zugriff auf die Profiling-Ergebnisse verweigert, um eine versehentliche Aufdeckung von Wertverteilungen zu verhindern.
Governance-Informationen
Zu den Governance-Informationen für eine Spalte gehören zugewiesene und vorgeschlagene Geschäftsbegriffe, die in der Spalte Geschäftsbegriffe der Ergebnisse aufgeführt werden, zugewiesene und vorgeschlagene Datenklassen, die in der Spalte Datenklasse angezeigt werden, und zugewiesene Klassifikationen, die in der Spalte Klassifikationen angezeigt werden. Eine automatisch zugeordnete Datenklasse wird durch einen violetten Punkt neben dem Datenklassennamen gekennzeichnet. Bei zugewiesenen Begriffen gibt der Punkt an, dass mindestens einer der Begriffe automatisch zugewiesen wurde.
Greifen Sie auf detaillierte Governance-Informationen für eine Spalte zu, indem Sie auf den Spaltennamen klicken, indem Sie auf den Link Mehr anzeigen in der Spalte Geschäftsbegriffe, Datenklasse oder Klassifikationen klicken, oder indem Sie auf Spalten-Details anzeigen im Überlaufmenü klicken. Auf der Registerkarte Verwaltung im Seitenbereich können Sie die Zuordnungen von Begriffen, Datenklassen und Klassifikationen verwalten.
Die gleichen Informationen erhalten Sie, wenn Sie auf den Link Mehr anzeigen klicken, der unterhalb des Geschäftsbegriffs, der Datenklasse oder der Klassifizierung erscheint, wenn Sie den Mauszeiger über eine bestimmte Spalte bewegen.
Bedingungen
Prüfen Sie zugewiesene und vorgeschlagene Begriffe. Für jeden zugewiesenen oder vorgeschlagenen Begriff wird der Verlässlichkeitsscore angezeigt. Sie können auf einen Begriff klicken, um einige seiner Eigenschaften anzuzeigen: seine Beschreibung, seine primäre und sekundäre Kategorie, eine Liste von Data-Stewards, seine hierarchischen Typbeziehungen sowie zugehörige Klassifikationen und Datenklassen.
Akzeptieren Sie Vorschläge nach Bedarf. Sie können auch nach Geschäftsbegriffen suchen, die nicht als Vorschläge aufgelistet sind, und sie manuell zuordnen. Entfernen Sie alle zugewiesenen Begriffe, die Ihrer Meinung nach ungenau sind. Eine solche negative Rückmeldung wird beim nächsten Aufbereitungslauf berücksichtigt. Begriffe, die Sie massenweise entfernen, werden anders behandelt als Begriffe, die Sie einzeln entfernen. Wenn Sie einen Begriff aus einer einzelnen Spalte entfernen, gilt dieser Begriff als zurückgewiesen. Es wird auch in der seitlichen Anzeige aufgelistet, und Sie können es jederzeit neu zuweisen. Weitere Informationen finden Sie unter Begriffszuordnung.
Beachten Sie, dass Begriffszuordnungen sich nicht auf Datenklassenzuordnungen auswirken. Wenn ein Term, der einer Datenklasse zugeordnet ist, einer Spalte durch ein ML-Modell oder durch Namensabgleich zugeordnet wird, wird die zugehörige Datenklasse nicht automatisch ebenfalls zugeordnet.
Datenklasse
Überprüfen Sie die zugeordnete Datenklasse und die vorgeschlagenen Datenklassen. Sie können auf eine Datenklasse klicken, um einige ihrer Eigenschaften anzuzeigen: ihre Beschreibung, ihre primäre und sekundäre Kategorie, den Typ des Datenabgleichs, ihre übergeordneten und abhängigen Datenklassen sowie zugehörige Klassifikationen und Datenklassen.
Die Konfidenzbewertung für das Zuweisen oder Vorschlagen einer Datenklasse muss mindestens dem festgelegten Schwellenwert entsprechen. Siehe Einstellungen für Datenklassenzuordnung. Wenn ein Schwellenwert direkt für eine Datenklasse festgelegt wird, hat dieser Schwellenwert Vorrang, wenn Datenklassen zugeordnet werden. Es wird nicht für Vorschläge berücksichtigt. Zusätzlich zum Verlässlichkeitsscore wird die Priorität einer Datenklasse berücksichtigt. Siehe Datenabgleich zu Datenklassen hinzufügen.
Details zu Datenklassen finden Sie unter Datenklassen und Vordefinierte Datenklassen.
Ein Gedankenstrich (-) gibt an, dass während der Analyse keine Datenklasse zugeordnet wurde.
Mehrere Datenklassen sind generische Kennungen, die nur auf Spaltenebene erkannt und zugewiesen werden. Diese Datenklassen werden zugeordnet, wenn keine spezifischere Datenklasse auf der Ebene der Werte identifiziert werden konnte. Generische Identifikatoren umfassen die folgenden Datenklassen: Code, Identifikator, Indikator, Menge und Text
Wenn Sie eine Datenklasse manuell zuordnen (entweder eine vorgeschlagene oder eine völlig andere), werden Begriffe, die dieser Datenklasse zugeordnet sind, im nächsten Aufbereitungslauf zugewiesen. Begriffszuordnungen beinhalten jedoch keine automatische Zuordnung zugeordneter Datenklassen.
Klassifikationen
Überprüfen Sie die zugewiesenen Klassifizierungen. Abhängig von den Projekteinstellungen werden bei der automatischen Zuordnung der Datenklasse oder des Geschäftsbegriffs auch Klassifizierungen zugeordnet, die sich auf die Datenklasse oder den Geschäftsbegriff beziehen. Sie können zusätzliche Klassifizierungen vergeben oder die vom System vergebenen Klassifizierungen entfernen und durch andere ersetzen. Weitere Informationen zu den Projekteinstellungen finden Sie unter Standardeinstellungen für die Anreicherung: Zuordnung der Klassifizierung.
Datenqualitätsscore
Ein Datenqualitätsscore wird nur angezeigt, wenn mindestens eine Datenqualitätsprüfung auf die Spalte angewendet wurde. Andernfalls wird ein Gedankenstrich (-) angezeigt. Datenqualitätsscores werden für jede einzelne Spalte in einem Datenasset basierend auf den Ergebnissen der angewendeten Datenqualitätsprüfungen berechnet. Eine Einstellung in den Ergebnissen der Datenqualitätsanalyse bestimmt, ob der Qualitätskern einer Spalte für die Berechnung der Gesamtasset-und Dimensionsscores berücksichtigt wird.
Ein Deltawert zeigt an, wie sich der Datenqualitätsscore im Vergleich zum Score von 90 Tagen vor der letzten Analyse geändert hat:
- Ein grüner Pfeil, der nach rechts oben zeigt (), zeigt an, dass die Datenqualitätsbewertung gestiegen ist.
- Ein roter Pfeil, der nach rechts unten zeigt (), bedeutet, dass die Datenqualität gesunken ist.
Um Spalten mit Qualitätsproblemen schnell zu finden, insbesondere wenn der Aufbereitungsbereich groß ist, können Sie die Liste nach Qualitätsscores filtern.
Um Details zu Datenqualitätsproblemen anzuzeigen, wählen Sie eine Spalte aus und klicken Sie im Überlaufmenü auf Datenqualitätsdetails anzeigen oder auf den Qualitätsscore der Spalte.
Weitere Informationen finden Sie unter Ergebnisse der Datenqualitätsanalyse und Datenqualitätsscores.
Überprüfungsstatus
Anfänglich lautet der Überprüfungsstatus aller Spalten in der Metadatenaufbereitung Nicht geprüft. Nachdem Sie die Aufbereitungsergebnisse für eine Spalte überprüft haben, können Sie ihren Überprüfungsstatus auf Geprüft setzen. Somit ist jedem im Team bewusst, was bereits geprüft wurde und was noch überprüft werden muss. Wenn ein späterer Anreicherungslauf die Ergebnisse einer Spalte mit dem Status Überprüft aktualisiert, wird der Überprüfungsstatus der Spalte auf Nach Überprüfung neu analysiert () gesetzt. Der Überprüfungsstatus ändert sich nicht für Aktualisierungen, die während des Metadatenimports gefunden wurden.
Beachten Sie, dass Begriffszuordnungen für Spalten, die als geprüft markiert sind, bei erneuten Ausführungen einer Aufbereitung nicht aktualisiert werden. Weitere Informationen finden Sie unter Wie neue Analyseergebnisse vorhandene Begriffszuordnungen aktualisieren.
Sie können den Überprüfungsstatus einer Spalte jederzeit zurücksetzen. Um den Überprüfungsstatus zu ändern, klicken Sie im Überlaufmenü der Spalte auf Als geprüft markieren oder Als nicht geprüft markieren. Um den Überprüfungsstatus mehrerer Spalten gleichzeitig zu ändern, wählen Sie die Spalten aus, klicken Sie auf Mehr und wählen Sie Als geprüft markieren oder Als nicht geprüft markieren aus. Der Prüfstatus einer Spalte ist unabhängig vom Prüfstatus des übergeordneten Assets. Sie können auch APIs anstelle der Benutzerschnittstelle verwenden, um den Überprüfungsstatus von Spalten festzulegen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
Wenn Sie eine Massenänderung des Überprüfungsstatus vornehmen, wird möglicherweise eine Nachricht über die erfolgreiche Ausführung angezeigt, bevor die Änderungen tatsächlich abgeschlossen sind, abhängig vom Volumen der angeforderten Änderungen. Möglicherweise müssen Sie die Ansicht mehrmals aktualisieren, bevor alle Änderungen angewendet werden.
Wenn das integrierte Modell für maschinelles Lernen für die ML-basierte Begriffszuordnung verwendet und aus Projektassets trainiert wird, dienen Spalten, die als überprüft markiert sind und automatisch zugeordnete Geschäftsbegriffe haben, als Trainingsdaten.
Filtern Sie die Liste der Spalten nach Prüfstatus, um schnell alle Spalten zu finden, die untersucht werden müssen.
Nächster Schritt
Weitere Informationen
- Standardeinstellungen für Anreicherung
- Assetprofile
- Profildetails auf Spaltenebene
- Datenqualitätsscores
- Ergebnisse der Datenqualitätsanalyse
- Begriffszuordnung
- Datenabgleich zu Datenklassen hinzufügen
- IBM Knowledge Catalog API: Setzen oder Aktualisieren des Überprüfungsstatus für Assets
- IBM Knowledge Catalog API: Setzen Sie den Asset-Überprüfungsstatus auf Nicht überprüft
- IBM Knowledge Catalog API: Festlegen oder Aktualisieren des Status "Überprüft" für Spalten
- IBM Knowledge Catalog API: Setzen Sie den Überprüfungsstatus der Spalte auf Nicht überprüft
Übergeordnetes Thema: Metadatenaufbereitung verwalten