Schnelleinstieg: Daten pflegen

Sie können Daten schnell kuratieren, indem Sie Informationen zu ausgewählten Datasets in eine Datenquelle importieren und dann die resultierenden Datenassets in einem Katalog veröffentlichen. Lesen Sie die Informationen zur Datenkuratierung, sehen Sie sich dann ein Video an und führen Sie ein Lernprogramm aus, das für Benutzer mit einigen Kenntnissen zur Datenkuratierung geeignet ist, für das jedoch keine Codierung erforderlich ist.

Erforderliche Rollen Sie müssen über die Rolle Administrator oder Editor in einem Projekt und über die Rolle Administrator oder Editor im Zielkatalog verfügen.

Ihr grundlegender Workflow umfasst die folgenden Tasks:

  1. Sie erstellen ein Projekt. Siehe Projekt erstellen.
  2. Erstellen Sie eine Verbindung zu einer externen Datenquelle. Siehe Verbindungen zu Projekten hinzufügen.
  3. Erstellen Sie ein Asset für den Metadatenimport, um die Importdetails zu konfigurieren, den Importjob auszuführen und die Assets in Ihrem Katalog zu veröffentlichen.

Informationen zur Datenpflege

Sie können Metadaten, die den Datenassets in Ihrem Unternehmen zugeordnet sind, in ein Projekt oder einen Katalog importieren, um diese Assets zu inventarisieren, zu bewerten und zu katalogisieren. Diese Metadaten helfen Benutzern zu entscheiden, ob die Daten für die jeweilige Aufgabe geeignet sind, ob sie den Daten vertrauen können und wie mit den Daten gearbeitet werden kann.

Die Metadaten, die Sie importieren, können später mit anderen Informationen aufbereitet werden, um Benutzern dabei zu helfen, Daten schneller zu finden und zuverlässig zu verwenden. Zu diesen Informationen gehören beispielsweise Begriffe, die die Bedeutung der Daten definieren, und Regeln, die Eigentum dokumentieren oder Qualitätsstandards festlegen, und Rezensionen.

Wenn Sie Metadaten importieren, fügen Sie einem Projekt oder einem Katalog Datenassets hinzu. Wenn Sie die Assets in ein Projekt importieren, sind diese erst dann in einem Katalog sichtbar, wenn Sie sie veröffentlichen. Nachdem Sie sie einem Katalog zur gemeinsamen Nutzung bereitstellen, können andere Katalogbenutzer mit diesen Assets arbeiten.

Weitere Informationen zum Metadatenimport

Video zum Importieren von Assetmetadaten ansehen

Video ansehen In diesem Video wird gezeigt, wie Assetmetadaten aus einer externen Datenquelle importiert werden.

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

Lernprogramm zum Importieren von Metadaten absolvieren

Erstellen Sie ein Asset für den Metadatenimport in einem vorhandenen Projekt, führen Sie einen Job aus und fügen Sie anschließend eine Auswahl von Assets zu einem Katalog hinzu.

Voraussetzung

  1. Ein zuvor erstellter Katalog oder Zugriffsmöglichkeit für die Erstellung eines Katalogs.
  2. Berechtigungsnachweise für Ihre Cloud Object Storage-Instanz.

    1. Klicken Sie im Menü von Cloud Pak for Data auf Services > Serviceinstanzen.
    2. Klicken Sie auf das Symbol neben der Cloud Object Storage-Instanz und melden Sie sich gegebenenfalls bei IBM Cloud an.
    3. Wählen Sie auf der Seite der Cloud Object Storage-Serviceinstanz die Anzeige Serviceberechtigungsnachweise aus, um Ihre Berechtigungsnachweise anzuzeigen. Wenn mehrere Berechtigungsnachweisgruppen aufgelistet sind, wählen Sie Berechtigungsnachweise aus, die cos_hmac_keys enthalten. Sie müssen diese Berechtigungsnachweise zu einem späteren Zeitpunkt in diesem Lernprogramm angeben.
    4. Wählen Sie die Anzeige Endpunkte aus.
    5. Wählen Sie Ihren Standort aus, z. B. us-geo.
    6. Kopieren Sie die öffentliche Anmelde-URL, z. B. https://s3.us.cloud-object-storage.appdomain.cloud.
  3. Ein Beispielprojekt mit Dataset, die in Ihre Cloud Object Storage-Instanz geladen werden.

    1. Greifen Sie auf das Projekt zur Optimierung von Versicherungstarifen (Insurance Pricing Optimization) zu.
    2. Klicken Sie auf Create Project.
    3. Der Name, die Beschreibung und der Speicher werden für Sie ausgefüllt. Klicken Sie auf Erstellen.
    4. Klicken Sie auf Importzusammenfassung anzeigen. Die Datendateien auf der Registerkarte Assets im Projekt wurden Ihrer Cloud Object Storage-Instanz hinzugefügt.

In diesem Lernprogramm führen Sie folgende Tasks aus:

  • Sie erstellen ein Projekt.
  • Importieren Sie Metadaten in ein Projekt.
  • Zeigen Sie die Ergebnisse des Imports an und veröffentlichen Sie Assets in den Katalog.

Für dieses Lernprogramm benötigen Sie ungefähr 20 Minuten.

Schritt 1: Projekt erstellen

{: #step1}Sie benötigen ein Projekt, um die Importmetadatenassets und die erkannten Assets zu speichern.

  1. Wenn Sie über ein anderes Projekt als das Beispielprojekt verfügen, das Sie als Voraussetzung erstellt haben, öffnen Sie dieses Projekt. Wenn kein weiteres Projekt vorhanden ist, klicken Sie auf der Homepage auf Projekt erstellen oder auf der Seite Ihrer Projekte auf Neues Projekt.
  2. Wählen Sie Leeres Projekt erstellen aus.
  3. Fügen Sie in der Anzeige Projekt erstellen einen Namen und optional eine Beschreibung für das Projekt hinzu.
  4. Wählen Sie ein vorhandenes Projekt aus oder erstellen Sie ein neues Projekt.
  5. Klicken Sie auf Erstellen.

Weitere Informationen sowie ein Video finden Sie unter Projekt erstellen.
Weitere Informationen zu Cloud Object Storage finden Sie im Abschnitt Objektspeicher.

Schritt 2: Metadaten in ein Projekt importieren

{: #step2} Erstellen Sie das Metadatenimportasset und geben Sie die Verbindung für den Import an.

  1. Klicken Sie in Ihrem Projekt auf Zu einem Projekt hinzufügen > Metadatenimport.
  2. Geben Sie einen Namen für den Import an. Die Beschreibung ist optional.
  3. Wählen Sie in der Dropdown-Liste Verbindung Neue Verbindung erstellen aus.
  4. Sie können Metadaten aus den aufgelisteten Datenquellen importieren. Wählen Sie für dieses Lernprogramm Cloud Object Storage aus und klicken Sie auf Auswählen.
  5. Geben Sie einen Namen, eine Beschreibung und die Verbindungsdetails mithilfe der Berechtigungsnachweise aus Ihrer Cloud Object Storage-Instanz in IBM Cloud an.
  6. Klicken Sie auf Erstellen, um die Verbindung zu erstellen. Diese neue Verbindung wird in der Dropdown-Liste Quellen- und Zielverbindung definieren aufgelistet.
  7. Sie können auswählen, ob Metadaten in ein Projekt oder einen Katalog importiert werden sollen. In diesem Lernprogramm importieren Sie zunächst die Metadaten in das Projekt und wählen bestimmte Assets aus, die in einem Katalog veröffentlicht werden sollen.
  8. Klicken Sie auf Weiter, um mit dem Datenbereich fortzufahren.

Schritt 3: Datenumfang definieren

{: #step3} Definieren Sie, welche Assets aus der Verbindung importiert werden sollen.

  1. Klicken Sie auf Datenbereich festlegen.
  2. Sie können alle Schemas oder nur Schemas oder Tabellen zum Importieren auswählen. Wenn Sie den Ordner insurancepricingoptimierung auswählen, wird angezeigt, wie viele Elemente er enthält.
  3. Wählen Sie das Kontrollkästchen neben dem Ordner insurancepricingoptimization aus, um alle Assets in diesem Ordner in den für den Bereich zu definieren.
  4. Klicken Sie auf Auswählen, um mit der Definition des Metadatenimportassets fortzufahren.
  5. Klicken Sie auf Weiter, um mit dem Zeitplan fortzufahren.

Schritt 4: Import planen und abschließen

{: #step4}Geben Sie an, dass der Import jetzt ausgeführt oder dass die Ausführung für ein späteres Datum geplant werden soll.

  1. (Optional) Ändern Sie den Standardjobnamen.
  2. (Optional) Wählen Sie die Umschaltfläche zum Ausschalten des Zeitplans aus, um Start- und Wiederholungsdetails anzugeben.
  3. Klicken Sie auf Weiter, um mit der Überprüfung fortzufahren.
  4. Überprüfen Sie die Zusammenfassung des Imports und klicken Sie auf Erstellen.
  5. Der Metadatenimportjob wird gestartet bzw. zum geplanten Zeitpunkt ausgeführt.

Schritt 5: Die Ergebnisse des Imports anzeigen und Assets im Katalog veröffentlichen

{: #step5}Wenn die Jobausführung abgeschlossen ist, wird die Liste der importierten Assets angezeigt.

  1. Wählen Sie eine oder mehrere CSV-Dateien aus der Liste aus und klicken Sie auf Veröffentlichen.
  2. Wählen Sie den Zielkatalog aus, geben Sie eine Beschreibung und Tags an und klicken Sie dann auf Veröffentlichen.
  3. Navigieren Sie zu dem Katalog, um die Datenassets anzuzeigen, die Sie gerade auf der Registerkarte Kürzlich hinzugefügt hinzugefügt haben.

Nächste Schritte

Die Daten können nun verwendet werden. Beispielsweise können Sie oder andere Benutzer eine der folgenden Tasks ausführen:

Zusätzliche Ressourcen

Übergeordnetes Thema: Erste Schritte beim Kuratieren und Regulieren von Daten