Schnelleinstieg: Daten virtualisieren

Mit Watson Query können Sie eine virtuelle Tabelle erstellen, um Daten aus Tabellen zu segmentieren oder zu kombinieren. Watson Query verbindet mehrere Datenquellen zu einer einzelnen Objektgruppe aus Datenquellen oder Datenbanken mit Selbstausgleich. Informieren Sie sich anhand der entsprechenden Abschnitte über das Tool 'Watson Query', sehen Sie sich dann ein Video an und absolvieren Sie ein Lernprogramm, das für Benutzer geeignet ist, die über gewisse Kenntnisse in der Virtualisierung von Daten verfügen, jedoch keine Programmierung erfordert.

Erforderlicher Service Watson Query

Ihr grundlegender Workflow umfasst die folgenden Tasks:

  1. Stellen Sie den Service bereit und erstellen Sie Ihre Serviceberechtigungsnachweise.
  2. Erstellen Sie Datenbanken in mehreren Datenquellen und erfassen Sie Datenbankdetails und Berechtigungsnachweise.
  3. Fügen Sie Verbindungen zu Ihren Datenquellen hinzu.
  4. Erstellen Sie virtuelle Objekte, indem Sie Daten aus allen Datenquellen kombinieren.
  5. Verwalten Sie den Zugriff auf Ihre virtuellen Objekte.
  6. Fügen Sie Ihren Katalogen und Projekten virtualisierte Daten hinzu.
  7. Überwachen Sie Ihre Serviceinstanz mit IBM Db2 Data Management Console.

Weitere Informationen zu Watson Query

Mit dem Service Watson Query können Sie eine Verbindung zu verschiedenen Datenquellen herstellen, virtuelle Assets erstellen und regulieren und die virtualisierten Daten nutzen.

Weitere Informationen zu Watson Query

Video zu Watson Query ansehen

Video ansehen Sehen Sie sich dieses Video an, um herauszufinden, wie Daten mithilfe des Service Watson Query für ein Projekt oder einen Katalog virtualisiert werden können.

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

Lernprogramm zum Virtualisieren von Daten absolvieren

In diesem Lernprogramm führen Sie folgende Tasks aus:

  • Sie erstellen ein Projekt.
  • Die Services Watson Query und Db2 on Cloud einrichten.
  • Laden Sie Daten in Ihre Db2 on Cloud-Serviceinstanz.
  • Fügen Sie Verbindungen zu einer Datenquelle hinzu.
  • Erstellen Sie eine virtualisierte Tabelle aus einer einzelnen Datenquelle.
  • Veröffentlichen Sie virtualisierte Daten in einem Katalog oder Projekt.

Für dieses Lernprogramm benötigen Sie ungefähr 30 Minuten.

Schritt 1: Projekt erstellen

{: #step1}Sie benötigen ein Projekt zum Speichern der virtualisierten Daten.

  1. Wenn Sie über ein bestehendes Projekt verfügen, öffnen Sie es. Wenn Sie nicht über ein Projekt verfügen, klicken Sie auf der Startseite auf Projekt erstellen oder auf der Seite Projekte auf Neues Projekt.
  2. Wählen Sie Leeres Projekt erstellen aus.
  3. Fügen Sie in der Anzeige Projekt erstellen einen Namen und bei Bedarf auch eine Beschreibung für das Projekt hinzu.
  4. Wählen Sie eine vorhandene Instanz des Objektspeicherservice aus oder erstellen Sie eine neue Instanz.
  5. Klicken Sie auf Erstellen.

Weitere Informationen sowie ein Video finden Sie unter Projekt erstellen.

Schritt 2: Services bereitstellen

{: #step2}Für dieses Lernprogramm werden der Service Watson Query sowie ein Db2-Service benötigt.

  1. Klicken Sie im Navigationsmenü auf Services > Serviceinstanzen.
  2. Wenn eine Serviceinstanz für Watson Query aufgelistet wird, muss keine weitere Instanz eingerichtet werden. Andernfalls führen Sie die folgenden Schritte aus:
    1. Klicken Sie auf Service hinzufügen.
    2. Wählen Sie Watson Query aus.
    3. Wählen Sie den Lite-Plan für Watson Query aus.
    4. Klicken Sie auf Erstellen.
  3. Enthält die Liste eine Instanz des Service Db2 on Cloud oder Db2 Warehouse on Cloud, müssen Sie keine weitere Instanz bereitstellen. Andernfalls führen Sie die folgenden Schritte aus:
    1. Klicken Sie auf Service hinzufügen.
    2. Wählen Sie Db2 aus.
    3. Wählen Sie den Lite-Plan für Db2 on Cloud aus.
    4. Klicken Sie auf Erstellen.
  4. Überprüfen Sie, ob die Services auf der Seite Serviceinstanzen bereitgestellt werden.
  5. Rufen Sie das Menü der Db2 on Cloud-Instanz (oder Db2 Warehouse on Cloud-Instanz) auf und wählen Sie In IBM Cloud verwalten aus. Auf diese Weise wird die Seite der entsprechenden Serviceinstanz in IBM Cloud gestartet.
  6. Klicken Sie auf Serviceberechtigungsnachweise.
  7. Wenn keine Berechtigungsnachweise aufgelistet sind, führen Sie die folgenden Schritte aus:
    1. Klicken Sie auf Neuer Berechtigungsnachweis.
    2. Klicken Sie auf Hinzufügen.
  8. Erweitern Sie die Serviceberechtigungsnachweise und kopieren Sie sie in die Zwischenablage. Sie benötigen diese Berechtigungsnachweise später, um eine Verbindung zu konfigurieren, d. h. Sie sollten die Berechtigungsnachweise in einer Textdatei speichern.

Weitere Informationen finden Sie unter Db2 in Cloud Pak for Data as a Service und Watson Query in Cloud Pak for Data as a Service.

Schritt 3: Daten in Db2 on Cloud laden

{: #step3}Die Dateien, die Sie in diesem Lernprogramm verwenden werden, sind in der Gallery verfügbar. Sie müssen diese Dateien in Db2 on Cloud laden.

  1. Wählen Sie auf der Seite Ihrer Db2 on Cloud-Serviceinstanz (oder Db2 Warehouse on Cloud-Serviceinstanz) in IBM Cloud die Anzeige Verwalten aus.
  2. Klicken Sie auf Zur Benutzerschnittstelle wechseln. Die Db2 on Cloud-Konsole wird angezeigt.
  3. Wählen Sie die Anzeige Daten aus.
  4. Greifen Sie auf diese beiden Datasets in der Gallery zu und laden Sie sie auf Ihre lokale Maschine herunter:
  5. Ziehen Sie die Datei customers.csv von Ihrer lokalen Maschine in die Anzeige Daten laden in der Db2 on Cloud-Konsole und klicken Sie auf Weiter.
  6. Wählen Sie ein Schema aus.
  7. Klicken Sie auf Neue Tabelle +, geben Sie customers als Tabellennamen ein und klicken Sie auf Erstellen.
  8. Klicken Sie auf Weiter, um den Vorgang fortzusetzen.
  9. Überprüfen Sie die zu ladenden Daten und klicken Sie auf Weiter.
  10. Überprüfen Sie die Zusammenfassung und klicken Sie auf Ladevorgang starten.
  11. Wenn der Ladevorgang erfolgreich war, klicken Sie auf Weitere Daten laden.
  12. Wiederholen Sie Schritt 5 bis 10, um die Datei sales.csv in dasselbe Schema mit dem Tabellennamen sales zu laden.

Schritt 4: Eine Verbindung zu Ihrer Db2 on Cloud-Instanz hinzufügen

{: #step4}Für das Virtualisieren von Daten müssen Sie zunächst eine Verbindung zur Datenquelle erstellen.

  1. Wechseln Sie zurück zu Cloud Pak for Data as a Service.
  2. Wählen Sie im Hauptnavigationsmenü Daten > Datenvirtualisierung aus. Die Liste der konfigurierten Datenquellen wird angezeigt.
  3. Klicken Sie auf Verbindung hinzufügen > Neue Verbindung.
  4. Wählen Sie Db2 on Cloud (oder Db2 Warehouse on Cloud) aus.
  5. Klicken Sie auf Auswählen.
  6. Vervollständigen Sie die Verbindungsdetails auf der Basis der Berechtigungsnachweise, die Sie für Ihre Instanz in IBM Cloud kopiert haben.
  7. Klicken Sie auf Testen.
  8. Klicken Sie auf Erstellen.

Weitere Informationen finden Sie unter Verbindungen zu Datenquellen in Watson Query hinzufügen und herstellen{: new_window}.

Schritt 5: Tabellen zu Ihren virtualisierten Daten hinzufügen

{: #step5}Nachdem die Verbindung nun definiert ist, können Sie Daten aus der jeweiligen Datenquelle virtualisieren.

  1. Wählen Sie im Menü Datenquellen die Option Virtualisierung > Virtualisieren aus und warten Sie, bis die verfügbaren Tabellen geladen sind.
  2. Suchen Sie die Tabellen customers und sales in der Liste und klicken Sie auf Zum Warenkorb hinzufügen.
  3. Klicken Sie auf Warenkorb anzeigen.
  4. Wählen Sie Virtualisierte Daten aus, um die beiden Tabellen Ihrer Liste virtualisierter Daten hinzuzufügen.
  5. Klicken Sie auf Virtualisieren.
  6. Klicken Sie auf Weiter.
  7. Klicken Sie auf Virtualisierte Daten anzeigen.

Weitere Informationen finden Sie unter Virtuelle Objekte in Watson Query erstellen.

Schritt 6: Virtualisierte Daten in einem Katalog und Projekt veröffentlichen

{: #step6}Verbinden Sie als Nächstes zwei Tabellen, um ein virtualisiertes Asset zu erstellen und in einem Katalog und Projekt zu veröffentlichen.

  1. Wählen Sie in der Anzeige Virtualisierte Daten die Kundentabelle customers und die Vertriebstabelle sales in der Liste aus und klicken Sie auf Verknüpfen.
  2. Suchen Sie bei jeder Tabelle nach salesrep.
  3. Verknüpfen Sie die Spalte SALESREP_ID in den beiden Tabellen.
  4. Klicken Sie auf Weiter.
  5. Überprüfen Sie die verknüpfte Tabelle und klicken Sie auf Weiter.
  6. Geben Sie als Ansichtsnamen joined_customers_sales_table ein.
  7. Wählen Sie ein Projekt in der Liste aus.
  8. Wählen Sie die Option Im Katalog veröffentlichen aus und wählen Sie einen Katalog aus.
  9. Klicken Sie auf Ansicht erstellen.
  10. Wenn der Prozess abgeschlossen ist, können Sie entweder das Projekt oder den Katalog anzeigen, um die virtualisierten Daten in der Vorschau anzuzeigen. Zum Anzeigen der Daten im Projekt oder Katalog benötigen Sie einen IBM Cloud-API-Schlüssel. Weitere Informationen finden Sie unter IBM Cloud-API-Schlüssel erstellen.

Weitere Informationen finden Sie unter Virtuelle Daten in Watson Query regulieren.

Nächste Schritte

Ihre virtuellen Daten können jetzt verwendet werden. Sie können z. B. die folgenden Tasks ausführen:

Zusätzliche Quellen

Übergeordnetes Thema: Einführung in das Vorbereiten von Daten