Metadaten importieren
Sie können Asset-Metadaten und Abstammungsinformationen für die Daten in Ihrem Unternehmen erfassen und importieren. Diese Daten können aus einer Vielzahl von Datenquellen stammen. Wenn Sie Asset-Metadaten importieren, werden Assets erstellt.
- Erforderliche Services
- IBM Knowledge Catalog
- Manta Data Lineage (zum Importieren von Lineage-Metadaten)
- Cloud Object Storage (zum Importieren von Abstammungsmetadaten)
- Erforderliche Berechtigungen
- Zum Erstellen, Verwalten und Ausführen eines Metadatenimports benötigen Sie die Rolle Administrator oder die Rolle Bearbeiter im Projekt.
- Um Metadaten in einen Katalog zu importieren, müssen Sie auch die Rolle Admin oder Editor in dem Katalog haben, in den Sie importieren möchten.
- Um Cloud Object Storage für die Speicherung von Lineage-Metadaten zu konfigurieren, müssen Sie über die Berechtigung Datenlineage verwalten verfügen.
- Unterstützte Verbindungen
- Sie können Assets aus den Datenquellen importieren, die in Unterstützte Datenquellen für Kuration und Datenqualität aufgeführt sind.
Übersicht
Der Import von Metadaten umfasst die Konfiguration der Verbindung zur Datenquelle und die Angabe von Parametern für den Metadaten-Importauftrag. Je nachdem, welche Art von Metadaten Sie importieren, ob es sich um Asset-Metadaten oder Lineage-Metadaten handelt, kann eine vorausgehende Konfiguration erforderlich sein.
Voraussetzungen: Konfigurieren der Datenabfolge
Wenn Sie Lineage-Metadaten importieren möchten, müssen Sie die Daten-Lineage aktivieren und konfigurieren.
- Aktivieren Sie die Datenabfolge-Funktion in den Einstellungen der IBM Knowledge Catalog. Die genauen Schritte finden Sie unter Einrichten des IBM Knowledge Catalog Service: Aktivieren der Datenabfolge.
- Wählen Sie eine Cloud Object Storage zum Speichern von Abstammungsdaten:
- Gehen Sie im Navigationsmenü von Cloud Pak for Data zu Administration > Konfigurationen und Einstellungen und öffnen Sie Data lineage setup.
- Wählen Sie eine Instanz von Cloud Object Storage, in der Sie Abstammungsdaten speichern möchten. Weitere Informationen über IBM Cloud Object Storage finden Sie unter IBM Cloud Object Storage auf Cloud Pak for Data as a Service.
Schritte zum Importieren von Metadaten
Die folgenden Schritte geben einen Überblick über den Prozess des Imports von Metadaten. Folgen Sie den Links zu den einzelnen Schritten, um weitere Einzelheiten zu erfahren.
- Erstellen Sie eine Datenquellendefinition.
- Erstellen Sie eine Verbindung zur Datenquelle in einem Projekt.
- Erstellen Sie einen Metadatenimport.
Jede Datenquelle erfordert verschiedene Verbindungs- und Konfigurationsdetails. Sie finden diese Informationen in jedem Verbindungsthema im Abschnitt Konnektoren und im Abschnitt Unterstützte Konnektoren für den Lineage-Import. Aus welchen Datenquellen Sie Metadaten importieren können, erfahren Sie unter Unterstützte Datenquellen für Kuration und Datenqualität.
Wenn Sie einen Metadaten-Import erstellen, beginnt der Prozess des Metadaten-Imports sofort, es sei denn, Sie haben ihn für eine bestimmte Zeit geplant oder so konfiguriert, dass er überhaupt nicht ausgeführt wird.
Typen von Metadaten
Sie können diese Arten von Metadaten importieren:
- Assetmetadaten
- Asset-Metadaten enthalten die Informationen, die zum Erstellen eines Assets in einem Projekt oder Katalog erforderlich sind. Asset-Metadaten enthalten Asset-Details, Beziehungen und eine Vorschau auf den Inhalt des Assets. Bei Datenbeständen ermöglichen die Metadaten auch die Erstellung von Datenprofilen, die Analyse der Datenqualität und den Zugang zu den Daten für die Mitarbeiter.
- Abstammungsmetadaten
- Die Abstammungs-Metadaten liefern die Abstammungsinformationen für das Datenabstammungsdiagramm. Die Datenabfolge zeigt, woher Ihre Daten stammen, wie sie sich verändern und wohin sie sich im Laufe der Zeit bewegen.
Arten von Assets
Sie können die folgenden Arten von Assets durch den Import von Metadaten erstellen:
- Datenassets
- Datentabellen oder Dateien aus einer Verbindung. Wenn Sie die importierten Assets mit Metadaten anreichern oder Datenqualitätsregeln anwenden möchten, importieren Sie sie in ein Projekt.
- COBOL-Copybooks
- Die Datenstruktur eines COBOL. Sie können Cobol-Copybooks in Projekte und Kataloge importieren. Solche Assets können nicht heruntergeladen, profiliert, durch Metadatenanreicherung angereichert oder in Data Refinery verwendet werden.
- Skript für die Transformation
- Die Datentransformationen, die das Format, die Struktur oder die Werte von Daten ändern und normalerweise Teil von ETL-Prozessen (Extrahieren, Transformieren und Laden) sind.
Nächste Schritte
Weitere Informationen
- Tutorial zur Datenverwaltung: Hochwertige Daten kuratieren
- Unterstützte Datenquellen für Kuration und Datenqualität
- Ein Projekt als sensitiv markieren
- IBM Manta Data Lineage auf Cloud Pak for Data as a Service
Übergeordnetes Thema: Daten kuratieren