Schnelleinstieg: Daten virtualisieren
Sie können Data Virtualization zum Erstellen einer virtuelle Tabelle verwenden, um Daten aus einer oder mehreren Tabellen zu segmentieren oder zu kombinieren. Datenvirtualisierung verbindet mehrere Datenquellen zu einer einzelnen, sich selbst ausgleichenden Sammlung von Datenquellen oder Datenbanken. Informieren Sie sich über das Tool Data Virtualization, sehen Sie sich ein Video an und nehmen Sie an einem Lernprogramm teil, das für Benutzer mit Vorkenntnissen in der Datenvirtualisierung geeignet ist, aber keine Programmierkenntnisse erfordert.
- Erforderlicher Service
- Data Virtualization
- Optionale Services
- watsonx.ai Studio
- IBM Knowledge Catalog
Ihr grundlegender Workflow umfasst die folgenden Tasks:
- Stellen Sie den Service bereit und erstellen Sie Ihre Serviceberechtigungsnachweise.
- Erstellen Sie Datenbanken in mehreren Datenquellen und erfassen Sie Datenbankdetails und Berechtigungsnachweise.
- Fügen Sie Verbindungen zu Ihren Datenquellen hinzu.
- Erstellen Sie virtuelle Objekte, indem Sie Daten aus allen Datenquellen kombinieren.
- Verwalten Sie den Zugriff auf Ihre virtuellen Objekte.
- Fügen Sie Ihren Katalogen und Projekten virtualisierte Daten hinzu.
- Überwachen Sie Ihre Serviceinstanz mit IBM Db2 Data Management Console.
Informationen zu Data Virtualization
Mit dem Data Virtualization-Service können Sie eine Verbindung zu mehreren Datenquellen herstellen, virtuelle Assets erstellen und regulieren und die virtualisierten Daten verarbeiten.
- Verbinden: Stellen Sie zunächst eine Verbindung zu Datenquellen her. Sie können eine Verbindung zu mehreren Datenquellenherstellen. Weitere Informationen finden Sie unter Verbinden mit Datenquellen in der Data Virtualization und Unterstützte Datenquellen in der Data Virtualization.
- Verknüpfen, erstellen und regulieren: Erstellen Sie anschließend virtuelle Tabellen, gruppieren Sie Tabellen nach Schema, ordnen Sie Daten Projekten zu und regulieren Sie Ihre virtuellen Assets. Weitere Informationen finden Sie unter Erstellen von virtualisierten Objekten und Verwalten von virtuellen Daten in Data Virtualization.
- Nutzung: Verwenden Sie schließlich virtuelle Tabellen in Projekten, Datenkatalogen und anderen Anwendungen. Weitere Informationen finden Sie unter Daten analysieren und Modelle erstellen.
Video zu Data Virtualization ansehen
In diesem Video sehen Sie, wie Sie mit dem Data Virtualization Daten in einem Projekt oder Katalog virtualisieren.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Lernprogramm zum Virtualisieren von Daten absolvieren
In diesem Lernprogramm werden Sie die folgenden Tasks ausführen:
- Aufgabe 1: Projekt öffnen
- Task 2: Erforderliche Services bereitstellen
- Task 3: Verbindung zur Datenquelle Db2 Warehouse hinzufügen
- Aufgabe 4. Tabellen zu Ihren virtualisierten Daten hinzufügen
- Aufgabe 5: Virtualisierte Daten in einem Katalog oder Projekt veröffentlichen
Für dieses Lernprogramm benötigen Sie ungefähr 30 Minuten.
Tipps zum Durcharbeiten dieses Lernprogramms
Im Folgenden finden Sie einige Tipps für den erfolgreichen Abschluss dieses Lernprogramms.
Verwenden Sie das Videobild im Bild
Die folgende animierte Abbildung zeigt, wie die Funktionen für Videobilder und Inhaltsverzeichnisse verwendet werden:
Hilfe in der Community anfordern
Wenn Sie Hilfe zu diesem Tutorial benötigen, können Sie eine Frage stellen oder eine Antwort im Cloud Pak for Data Community Diskussionsforum finden.
Browserfenster einrichten
Damit Sie dieses Lernprogramm optimal nutzen können, öffnen Sie Cloud Pak for Data in einem Browserfenster und lassen Sie diese Lernprogrammseite in einem anderen Browserfenster geöffnet, um einfach zwischen den beiden Anwendungen zu wechseln. Es empfiehlt sich, die beiden Browserfenster nebeneinander anzuordnen, um die weitere Arbeit zu erleichtern.
Aufgabe 1: Projekt öffnen
Um eine Vorschau dieser Aufgabe zu sehen, schauen Sie sich das Video ab 00:10 an.
Sie benötigen ein Projekt zum Speichern der virtualisierten Daten. Führen Sie die folgenden Schritte aus, um ein vorhandenes Projekt zu öffnen oder ein neues Projekt zu erstellen.
Wählen Sie im Navigationsmenü ' Projekte > Alle Projekte anzeigen
Wenn Sie über ein bestehendes Projekt verfügen, öffnen Sie es.
Wenn kein Projekt vorhanden ist, klicken Sie auf Neues Projekt.
Wählen Sie Leeres Projekt erstellen aus.
Geben Sie einen Namen und optional eine Beschreibung für das Projekt ein.
Wählen Sie eine vorhandene Objektspeicherserviceinstanz aus oder erstellen Sie eine neue.
Klicken Sie auf Erstellen.
Weitere Informationen hierzu oder die Option zum Ansehen eines entsprechenden Videos finden Sie unter Projekt erstellen.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt ein neues, leeres Projekt.
Aufgabe 2: Erforderliche Services bereitstellen
Um eine Vorschau dieser Aufgabe zu sehen, schauen Sie sich das Video ab 00:32 an.
Dieses Tutorial erfordert den Data Virtualization und die optionalen Dienste watsonx.ai Studio und IBM Knowledge Catalog. Gehen Sie wie folgt vor, um diese Services zu erstellen:
Klicken Sie im Navigationsmenü " auf Dienste > Dienstinstanzen.
Wenn ein Data Virtualization-Service aufgelistet ist, ist es nicht erforderlich, eine andere Instanz bereitzustellen. Andernfalls führen Sie die folgenden Schritte aus:
Klicken Sie auf Service hinzufügen.
Wählen Sie Data Virtualization aus.
Wählen Sie den Lite-Plan für Data Virtualization.
Klicken Sie auf Erstellen.
Überprüfen Sie, ob die Services auf der Seite Serviceinstanzen bereitgestellt werden.
Weitere Informationen finden Sie unter Data Virtualization auf Cloud Pak for Data as a Service.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die bereitgestellten Services.
Task 3: Verbindung zur Datenquelle Db2 Warehouse hinzufügen
Um eine Vorschau dieser Aufgabe zu sehen, schauen Sie sich das Video ab 00:58 an.
Bevor Sie die Daten virtualisieren können, müssen Sie eine Verbindung zur Datenquelle herstellen. Führen Sie die folgenden Schritte aus, um eine Verbindung in Data Virtualizationherzustellen:
Wählen Sie im Navigationsmenü " die Option Daten > Data virtualization. Die Liste der konfigurierten Datenquellen wird angezeigt.
Klicken Sie auf Verbindung hinzufügen > Neue Verbindung.
Wählen Sie Db2 Warehouse on Cloudaus und klicken Sie auf Auswählen.
Geben Sie die Verbindungsdetails unter Verwendung der folgenden Informationen an:
- Name:
Db2 Warehouse
- Datenbank:
BLUDB
- Hostname oder IP-Adresse:
db2w-ruggyab.us-south.db2w.cloud.ibm.com
- Port:
50001
- Benutzername:
CPDEMO
- Kennwort:
DataFabric@2022IBM
. - Wählen Sie das Kontrollkästchen Port is SSL-enabled aus.
- Name:
Klicken Sie auf Testen.
Klicken Sie auf Erstellen.
Weitere Informationen finden Sie unter Verbinden mit Datenquellen in der Data Virtualization.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Seite ' Datenquellen'.
Aufgabe 4: Tabellen zu Ihren virtualisierten Daten hinzufügen
Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 01:45 an.
Wenn die Verbindung definiert ist, können Sie Daten aus dieser Datenquelle virtualisieren. Führen Sie die folgenden Schritte aus, um die Tabellen zu Ihren virtualisierten Daten hinzuzufügen.
Wählen Sie im Menü Data Virtualization Virtualisierung > Virtualisierenaus und warten Sie, bis die verfügbaren Tabellen geladen sind.
Suchen Sie die Tabellen customers und sales in der Liste und klicken Sie auf Zum Warenkorb hinzufügen.
Klicken Sie auf Warenkorb anzeigen.
Wählen Sie das Feld Zu Projekt zuordnen ab. Dadurch werden die beiden Tabellen zu Ihrer Liste virtualisierter Daten hinzugefügt, jedoch nicht zu einem Projekt. Später fügen Sie virtualisierte Daten zu Ihrem Projekt hinzu.
Klicken Sie auf Virtualisieren.
Klicken Sie auf Bestätigen.
Klicken Sie auf Zu virtualisierten Daten wechseln.
Weitere Informationen finden Sie unter Erstellen virtueller Objekte in der Data Virtualization.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Seite 'Eigene virtualisierte Daten'.
Aufgabe 5: Virtualisierte Daten in einem Katalog und Projekt veröffentlichen
Eine Vorschau zu dieser Task sehen Sie, wenn Sie die Wiedergabe des Videos bei 02:43 starten.
Führen Sie als Nächstes die folgenden Schritte aus, um zwei Tabellen zu verknüpfen, um ein virtualisiertes Asset zu erstellen und in einem Katalog und Projekt zu veröffentlichen:
Wählen Sie in der Anzeige Virtualisierte Daten die Kundentabelle customers und die Vertriebstabelle sales in der Liste aus und klicken Sie auf Verknüpfen.
Suchen Sie bei jeder Tabelle nach
salesrep
.Verknüpfen Sie die Spalte SALESREP_ID in den beiden Tabellen.
Klicken Sie auf Weiter.
Überprüfen Sie die verknüpfte Tabelle und klicken Sie auf Weiter.
Geben Sie als Ansichtsnamen
joined_customers_sales_table
ein.Wählen Sie ein Projekt in der Liste aus.
Wählen Sie die Option Im Katalog veröffentlichen aus und wählen Sie einen Katalog aus.
Klicken Sie auf Ansicht erstellen.
Wenn der Prozess abgeschlossen ist, können Sie entweder das Projekt oder den Katalog anzeigen, um die virtualisierten Daten in der Vorschau anzuzeigen. Zum Anzeigen der Daten im Projekt oder Katalog benötigen Sie einen IBM Cloud-API-Schlüssel. Weitere Informationen finden Sie unter IBM Cloud-API-Schlüssel erstellen.
Weitere Informationen finden Sie unter Verwaltung virtueller Daten in Data Virtualization.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt das virtualisierte Datenasset im Katalog.
Nächste Schritte
Ihre virtuellen Daten können jetzt verwendet werden. Sie können z. B. die folgenden Tasks ausführen:
Zusätzliche Ressourcen
Weitere Informationen finden Sie unter Videos.
Beispieldatensätze finden Sie in der Ressourcendrehscheibe.
Probieren Sie dieses zusätzliche Tutorial aus, um mehr praktische Erfahrungen mit Data Virtualization zu sammeln: Data Virtualization auf IBM Cloud Pak for Data ' .
Übergeordnetes Thema: Lernprogramme für den Schnelleinstieg