Konfigurieren Sie die Metadatenaufbereitung und führen Sie sie aus, um Ihren Datenassets mehrere Ebenen von Metadaten hinzuzufügen.
Sie können ein Datenprofil erstellen, um ein Datenasset zu klassifizieren und Statistikdaten zu den Werten zu kompilieren, die es enthält. Erweitern Sie Ihre Assets mit KI-generierten alternativen Spaltennamen und Beschreibungen für Datenassets und die darin enthaltenen Spalten. Verwenden Sie vordefinierte Datenqualitätsprüfungen für eine anfängliche Qualitätsbewertung Ihrer Daten. Erweitern Sie Assets mit Geschäftsvokabular, das die semantische Bedeutung der Daten für Ihr Unternehmen beschreibt. Identifizieren Sie Beziehungen zwischen Datenassets.
Sie können auch Metadatenaufbereitungen mit APIs anstelle der Benutzerschnittstelle erstellen. Die Links zu diesen APIs sind im Abschnitt Weitere Informationen aufgelistet.
So erstellen Sie ein Asset zur Metadatenaufbereitung sowie einen Job zum Aufbereiten von Daten:
Öffnen Sie ein Projekt und klicken Sie auf Neues Asset > Datenassets mit Metadaten anreichern . Nachdem Sie die erste Metadatenaufbereitung auf diese Weise erstellt haben, können Sie neue Assets zur Metadatenaufbereitung auf der Seite Asset des Projekts hinzufügen.
Definieren Sie Details:
- Geben Sie einen Namen für die Metadatenaufbereitung an.
- Optional: Geben Sie eine Beschreibung an.
- Optional: Wählen Sie Tags aus oder erstellen Sie Tags, die dem Asset zur Metadatenaufbereitung zugeordnet werden sollen, um die Suche zu vereinfachen. Sie können neue Tags erstellen, indem Sie den Tagnamen eingeben und die Eingabetaste drücken.
Legen Sie den Anfangsdatenbereich fest.
Wählen Sie die Datenassets, die Sie aufbereiten wollen, unter Datenassets aus. Siehe Anfänglicher Datenbereich. Überprüfen Sie den ausgewählten Bereich, bevor Sie fortfahren. Sie können Assets direkt aus dem Datenbereich löschen oder Sie können den gesamten Bereich nachbearbeiten, indem Sie auf Datenbereich bearbeiten klicken.
Sie können diesen Schritt überspringen, um ein leeres Metadatenanreicherungsasset zu erstellen und den Bereich später festzulegen.
Definieren Sie das Ziel dieses Assets für die Metadatenaufbereitung. Sie können einem Datenasset mehrere Ebenen von Metadaten hinzufügen:
- Erstellen Sie ein Profil der Daten, um sie zu klassifizieren und Statistikdaten zu den Werten zu kompilieren.
- Fügen Sie alternative Namen und KI-generierte Beschreibungen hinzu.
- Erweitern Sie Assets mit Geschäftsvokabular, das die semantische Bedeutung der Daten für Ihr Unternehmen beschreibt.
- Führen Sie vordefinierte Datenqualitätsprüfungen für eine erste Qualitätsbewertung aus.
- Primärschlüssel und Schlüsselbeziehungen identifizieren
- Bewertung der Datenqualität mit SLA-Regeln
Siehe Aufbereitungsziele.
Wählen Sie Kategorien aus, um das Geschäftsvokabular zu bestimmen, das während der Aufbereitung angewendet wird. Siehe Kategorieauswahl.
Wählen Sie einen Stichprobentyp aus. Siehe Stichprobenziehung.
Legen Sie fest, wann der Anreicherungsauftrag ausgeführt wird. Sie können die Anreicherung jederzeit manuell durchführen. Siehe Definition von Run.
Wählen Sie den Datenbereich für die erneuten Ausführungen der Aufbereitung aus (geplante oder manuelle Ausführung). Siehe Umfang der Wiederholungen der Anreicherung.
Überprüfen Sie die Konfiguration für die Metadatenaufbereitung. Um Änderungen vorzunehmen, klicken Sie auf der Kachel auf das Symbol Bearbeiten und aktualisieren Sie die Einstellungen.
Klicken Sie auf Erstellen. Das Metadatenanreicherungs-Asset wird dem Projekt hinzugefügt und ein Metadatenanreicherungsauftrag wird erstellt. Weitere Informationen finden Sie unter Anreicherungsaufträge verwalten.
Je nach Laufdefinition wird die Anreicherung möglicherweise sofort nach der Erstellung des Metadaten-Anreicherungs-Assets ausgeführt.
Nach Abschluss der Aufbereitung können Sie auf eine allgemeine Übersicht der Aufbereitungsergebnisse zugreifen, indem Sie das Metadatenaufbereitungsasset anzeigen. Von dort aus können Sie für jedes Asset einen Drilldown durchführen und mit den Ergebnissen arbeiten. Siehe Mit den Ergebnissen der Aufbereitung arbeiten.
Die Metadatenaufbereitung wird für Assets ausgeführt, die in dem Projekt verfügbar sind. Daher entspricht die Liste der aufbereiteten Assets in den folgenden Fällen möglicherweise nicht dem konfigurierten Geltungsbereich der eingeschlossenen Metadatenimportassets:
- Metadata import war noch nicht abgeschlossen, als die Aufbereitung gestartet wurde.
- Metadata import ist für eine Gruppe von Assets fehlgeschlagen oder vollständig fehlgeschlagen.
Wenn die Metadatenanreicherung für eine große Anzahl von Datenbeständen durchgeführt wird, kann es vorkommen, dass die Verarbeitung für eine Teilmenge der Datenbestände fehlschlägt. Für jedes Asset, das nicht angereichert werden konnte, wird eine Fehlermeldung in das Protokoll des Metadaten-Anreicherungsauftrags geschrieben, so dass Sie diese Assets identifizieren können. Sie können dann die Anreicherung für die Assets, deren Verarbeitung fehlgeschlagen ist, erneut durchführen.
Informationen zum Aktualisieren, erneuten Ausführen oder Löschen einer Metadatenaufbereitung finden Sie unter Vorhandene Metadatenaufbereitung verwalten.
Weitere Informationen
Nächste Schritte
Übergeordnetes Thema: Metadatenaufbereitung verwalten