0 / 0
Zurück zur englischen Version der Dokumentation
Lernprogramm zur Datenintegration: Daten integrieren

Lernprogramm zur Datenintegration: Daten integrieren

Verwenden Sie dieses Lernprogramm, um Daten, die in drei externen Datenquellen gespeichert sind, mit dem Data Integration-Anwendungsfall der Data Fabric-Testversion zu transformieren. Ihr Ziel ist es, Daten mit DataStage zu transformieren und diese transformierten Daten anschließend in einer einzigen Ausgabedatei bereitzustellen. Wenn Sie das Lernprogramm Externe Daten virtualisieren abgeschlossen haben, haben Sie viele derselben Tasks mit Watson Query ausgeführt, die in diesem Lernprogramm mit DataStageausgeführt wurden.

Schnelleinstieg: Wenn das Beispielprojekt für dieses Lernprogramm noch nicht erstellt wurde, greifen Sie auf das Beispielprojekt für die Datenintegration im Ressourcenhub zu.

In diesem Lernprogramm muss die Golden Bank eine neue Verordnung einhalten, in der sie keine Kredite an unterqualifizierte Darlehensantragsteller vergeben kann. Als Datenentwickler bei der Golden Bank verwenden Sie derzeit DataStage, um die anonymisierten Hypothekenanträge mit den personenbezogenen Daten der Hypothekenantragsteller zusammenzufassen. Ihre Kreditgeber verwenden diese Informationen, um sie zu entscheiden, ob sie Hypothekenanträge genehmigen oder ablehnen sollten. Ihre Führung hat einige Risikoanalysten hinzugefügt, die täglich berechnen, welchen Zinssatz sie den Kreditnehmern in jedem Scorebereich empfehlen. Sie müssen diese Informationen in das Arbeitsblatt integrieren, das Sie mit den Kreditgebern gemeinsam nutzen. Das Spreadsheet enthält Scoredaten für jeden Antragsteller, die Gesamtschulden des Antragstellers und eine Referenztabelle für den Zinssatz. Laden Sie schließlich Ihre Daten in eine CSV-Zielausgabedatei.

Das folgende animierte Bild bietet eine kurze Vorschau dessen, was Sie am Ende dieses Lernprogramms erreichen werden. Sie werden DataStage verwenden, um Bewerber-und Anwendungsdaten zu verknüpfen, nach Bundesstaat zu filtern, Bewerber-Scorewerte zu verknüpfen, die Gesamtverschuldung zu berechnen, den Hypothekenzinssatz auf der Basis von Scorebewertungsbereichen zu suchen und das Ergebnis in einer CSV-Datei auszugeben. Klicken Sie auf das Bild, um ein größeres Bild anzuzeigen.

Animiertes Bild

Vorschau des Lernprogramms anzeigen

In diesem Lernprogramm werden Sie die folgenden Tasks ausführen:

Video ansehen Sehen Sie sich dieses Video an, um eine Vorschau der Schritte in diesem Lernprogramm anzuzeigen. Möglicherweise gibt es geringfügige Unterschiede in der Benutzerschnittstelle, die im Video angezeigt wird. Das Video ist als Begleiter zum schriftlichen Lernprogramm gedacht.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.





Tipps zum Durcharbeiten dieses Lernprogramms
Im Folgenden finden Sie einige Tipps für den erfolgreichen Abschluss dieses Lernprogramms.

Verwenden Sie das Videobild im Bild

Tipp: Starten Sie das Video. Wenn Sie dann durch das Lernprogramm blättern, wechselt das Video in den Bildmodus. Schließen Sie das Video-Inhaltsverzeichnis für die beste Erfahrung mit Bild-in-Bild. Sie können den Modus "Bild im Bild" verwenden, damit Sie dem Video folgen können, während Sie die Tasks in diesem Lernprogramm ausführen. Klicken Sie auf die Zeitmarken für jede zu befolgende Task.

Die folgende animierte Abbildung zeigt, wie die Funktionen für Videobilder und Inhaltsverzeichnisse verwendet werden:

Verwendung von Bildern und Kapiteln

Hilfe in der Community anfordern

Wenn Sie Hilfe bei diesem Lernprogramm benötigen, können Sie eine Frage stellen oder eine Antwort im Diskussionsforum derCloud Pak for Data Communityfinden.

Browserfenster einrichten

Damit Sie dieses Lernprogramm optimal nutzen können, öffnen Sie Cloud Pak for Data in einem Browserfenster und lassen Sie diese Lernprogrammseite in einem anderen Browserfenster geöffnet, um einfach zwischen den beiden Anwendungen zu wechseln. Es empfiehlt sich, die beiden Browserfenster nebeneinander anzuordnen, um die weitere Arbeit zu erleichtern.

Paralleles Lernprogramm und Benutzerschnittstelle

Tipp: Wenn Sie beim Durcharbeiten dieses Lernprogramms in der Benutzerschnittstelle auf eine geführte Tour stoßen, klicken Sie auf Vielleicht später.



Voraussetzungen einrichten

Voraussetzungen

Für Cloud Pak for Data as a Service anmelden

Sie müssen sich für Cloud Pak for Data as a Service registrieren und die erforderlichen Services für den Anwendungsfall der Datenintegration bereitstellen.

  • Wenn Sie über ein Cloud Pak for Data as a Service -Konto verfügen, können Sie mit diesem Lernprogramm beginnen. Wenn Sie über ein Lite-Plankonto verfügen, kann nur ein Benutzer pro Konto dieses Lernprogramm ausführen.
  • Wenn Sie noch kein Konto für Cloud Pak for Data as a Service haben, melden Sie sich für einen Data-Fabric-Test an.

Symbol 'Video' Sehen Sie sich das folgende Video an, um mehr über das Datenfabric in Cloud Pak for Data.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.

Erforderliche bereitgestellte Services überprüfen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 01:08 an.

Wichtig: Der DataStage -Service ist nur in den Regionen Dallas und Frankfurt verfügbar. Wechseln Sie bei Bedarf in die Region Dallas oder Frankfurt, bevor Sie fortfahren.

Führen Sie die folgenden Schritte aus, um die erforderlichen Services zu überprüfen oder bereitzustellen:

  1. Überprüfen Sie in Cloud Pak for Data, ob Sie sich in der Region Dallas oder Frankfurt befinden. Ist dies nicht der Fall, klicken Sie auf die Dropdown-Liste der Region und wählen Sie dann Dallas oder Frankfurtaus.
    Region ändern

  2. Wählen Sie im Navigationsmenü Cloud Pak for Data Navigationsmenüdie Optionen Services > Serviceinstanzen.

  3. Verwenden Sie die Dropdown-Liste Produkt , um zu ermitteln, ob eine DataStage -Serviceinstanz vorhanden ist.

  4. Wenn Sie eine DataStage-Serviceinstanz erstellen müssen, klicken Sie auf Service hinzufügen.

  5. Wählen Sie DataStage aus.

    1. Wählen Sie für die Region Dallas oder Frankfurtaus.

    2. Wählen Sie den Plan Lite aus.

    3. Klicken Sie auf Erstellen.

  6. Wiederholen Sie diese Schritte, um die folgenden zusätzlichen Services zu überprüfen oder bereitzustellen:

    • IBM Knowledge Catalog
    • Cloud Object Storage

Symbol für Prüfpunkt Fortschritt überprüfen

Die folgende Abbildung zeigt die bereitgestellten Serviceinstanzen:

Bereitgestellte Services

Beispielprojekt erstellen

Vorschau-Lernprogrammvideo Eine Vorschau zu dieser Task sehen Sie, wenn Sie die Wiedergabe des Videos bei 01:44 starten.

Wenn Sie bereits über das Beispielprojekt für dieses Lernprogramm verfügen, fahren Sie mit Aufgabe 1fort. Andernfalls führen Sie die folgenden Schritte aus:

  1. Greifen Sie auf das Beispielprojekt für die Datenintegration im Ressourcenhub zu.

  2. Klicken Sie auf Projekt erstellen.

  3. Wenn Sie aufgefordert werden, das Projekt einer Cloud Object Storage-Instanz zuzuordnen, wählen Sie in der Liste eine Cloud Object Storage-Instanz aus.

  4. Klicken Sie auf Erstellen.

  5. Warten Sie, bis der Projektimport abgeschlossen ist, und klicken Sie auf Neues Projekt anzeigen , um zu überprüfen, ob das Projekt und die Assets erfolgreich erstellt wurden.

  6. Klicken Sie auf die Registerkarte Assets , um die Verbindungen und den DataStage -Ablauf anzuzeigen.

Hinweis: Sie sehen möglicherweise eine geführte Tour mit den Lernprogrammen, die in diesem Anwendungsfall enthalten sind. Die Links in der geführten Tour öffnen diese Lernprogrammanweisungen.

Symbol für Prüfpunkt Fortschritt überprüfen

Die folgende Abbildung zeigt die Registerkarte Assets im Beispielprojekt. Sie können jetzt das Lernprogramm starten.

Beispielprojekt




Aufgabe 1: Vorhandenen DataStage -Ablauf ausführen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 02:29 an.

Beginnen Sie mit einem DataStage -Basisdatenfluss, der die Datasets für Hypothekenantragsteller und Hypothekenanwendungen verknüpft, und geben Sie dann das Ergebnis in eine CSV-Datei im Projekt aus. Führen Sie die folgenden Schritte aus, um den DataStage -Ablauf auszuführen:

  1. Beginnen Sie im Projekt Datenintegration . Wenn Sie das Projekt nicht geöffnet haben, führen Sie die folgenden Schritte aus:

    1. Wählen Sie im Navigationsmenü Cloud Pak for Data Navigationsmenü Projekte > Alle Projekte anzeigenaus.

    2. Öffnen Sie das Projekt Datenintegration .

  2. Klicken Sie auf die Registerkarte Assets , um alle Assets im Projekt anzuzeigen.

  3. Klicken Sie auf Flows > DataStage -Flows.

    Tipp: Wenn Sie keine DataStage -Abläufe sehen, kehren Sie zurück, um Ihre Serviceinstanzen anzuzeigen und zu überprüfen, ob Ihre DataStage -Instanz erfolgreich bereitgestellt wurde. Siehe Bereitstellung der erforderlichen Services.
  4. Klicken Sie in der Liste auf den Nachrichtenfluss Datenintegration , um ihn zu öffnen. Dieser Ablauf verknüpft die Tabellen Hypothekenantragsteller und Hypothekenanwendungen , die in Db2 Warehousegespeichert sind, filtert die Daten für diese Datensätze aus dem Bundesstaat Kalifornien und erstellt eine sequenzielle Datei im CSV-Format als Ausgabe.

  5. Klicken Sie auf das Symbol Vergrößern Vergrößern und das Symbol Verkleinern Verkleinern in der Symbolleiste, um Ihre bevorzugte Ansicht des Erstellungsbereichs festzulegen.

  6. Klicken Sie doppelt auf den Knoten MORTGAGE_APPLICATIONS_1, um die Einstellungen anzuzeigen.

    1. Erweitern Sie den Abschnitt Eigenschaften.

    2. Blättern Sie nach unten und klicken Sie dann auf Datenvorschau. Dieses Dataset enthält Informationen, die in einer Hypothekenanwendung erfasst werden.

    3. Klicken Sie auf Schließen.

  7. Klicken Sie doppelt auf den Knoten MORTGAGE_APPLICATIONS_1, um die Einstellungen anzuzeigen.

    1. Erweitern Sie den Abschnitt Eigenschaften.

    2. Blättern Sie abwärts und klicken Sie auf Datenvorschau. Dieses Dataset enthält Informationen zu Antragstellern für Hypotheken, die einen Kredit beantragt haben.

    3. Optional: Visualisieren Sie die Daten.

      1. Klicken Sie auf die Anzeige Diagramm .

      2. Wählen Sie in der Liste Zu visualisierende Spalten den Eintrag STATUSaus.

      3. Klicken Sie auf Daten visualisieren , um ein Kreisdiagramm anzuzeigen, das die Verteilung der Daten nach Status zeigt.

      4. Klicken Sie auf das Symbol Treemap , um dieselben Daten in einem Treemap-Diagramm anzuzeigen.

    4. Klicken Sie auf Schließen.

  8. Klicken Sie doppelt auf den Knoten Join_on_ID , um die Einstellungen anzuzeigen.

    1. Erweitern Sie den Abschnitt Eigenschaften.

    2. Beachten Sie, dass der Joinschlüssel die ID-Spalte ist.
      Join_on_ID, Joinschlüssel

    3. Klicken Sie auf Abbrechen , um die Einstellungen zu schließen.

  9. Klicken Sie in der Symbolleiste auf das Symbol Protokolle Protokoll anzeigen , um den Fortschritt des Ablaufs zu überwachen.

  10. Klicken Sie auf Kompilieren und anschließend auf Ausführen. Alternativ können Sie auf Ausführen klicken, um den DataStage -Ablauf zu kompilieren und auszuführen. Die Ausführung kann etwa eine Minute dauern.

  11. Zeigen Sie die Protokolle an. Sie können die Gesamtzahl der Zeilen und Zeilen pro Sekunde für jeden Schritt im Ablauf verwenden, um visuell zu überprüfen, ob der Filter wie erwartet funktioniert.

  12. Wenn die Ausführung erfolgreich abgeschlossen wurde, klicken Sie im Navigationspfad auf Datenintegration , um zum Projekt zurückzukehren.
    Navigationspfad

  13. Klicken Sie auf der Registerkarte Assets auf Daten > Datenassets.

  14. Öffnen Sie die Datei MORTGAGE_DATA.CSV. Sie sehen, dass diese Datei die Spalten aus den Datasets 'Hypothekenantragsteller' und 'Hypothekenanträge ' enthält.

Symbol für Prüfpunkt Fortschritt überprüfen

Das folgende Bild zeigt die resultierende CSV-Datei. Die nächste Aufgabe besteht darin, den DataStage-Flow zu bearbeiten.

CSV-Datei




Übersicht: DataStage -Ablauf bearbeiten

Nachdem Sie nun den Hypothekenantragsteller und die Anwendungsdaten verknüpft haben, können Sie den DataStage -Ablauf wie folgt bearbeiten:

  • Aufgabe 2: Schlüsselspalte für die Join-Phase angeben.
  • Aufgabe 3. Kreditbewertungsdaten aus einer PostgreSQL -Datenbank hinzufügen.
  • Aufgabe 4: Fügen Sie eine Join-Phase hinzu, um die Scoredaten mit den Anmelder-und Antragsdaten zu verknüpfen.
  • Aufgabe 5: Fügen Sie eine Transformer-Phase hinzu, um die Gesamtschulden zu berechnen.
  • Aufgabe 6: Zinssatzdaten aus einer MongoDB -Datenbank hinzufügen.
  • Aufgabe 7: Fügen Sie eine Lookup-Phase hinzu, um die Zinssätze für Antragsteller anhand ihrer Scorewerte und der täglichen Zinssatzbereiche der Goldenen Bank zu suchen.



Aufgabe 2: Schlüsselspalte für die Join-Phase angeben

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 04:42 an.

Die Angabe einer Schlüsselspalte zeigt DataStage an, dass die Spalte eindeutige Werte enthält. Der Knoten Join_on_ID verknüpft die Datasets für Hypothekenantragsteller und Hypothekenanwendungen unter Verwendung der ID-Spalte für den Joinschlüssel. In der nächsten Phase wird das Ergebnisdataset mit den Scorebewertungsdaten verknüpft. Später werden Sie die resultierenden gefilterten Daten mit dem Kreditscore-Dataset verknüpfen. Der zweite Join verwendet die Spalte EMAIL_ADDRESS als Joinschlüssel. In dieser Task bearbeiten Sie den DataStage -Ablauf, um die Spalte EMAIL_ADDRESS als Schlüsselspalte für das resultierende Dataset anzugeben, wenn es mit den Scoredaten verknüpft wird.

Die folgende animierte Abbildung stellt eine visuelle Darstellung als Alternative zur Beschreibung der beiden Verbindungsknoten dar. Klicken Sie auf das Bild, um ein größeres Bild anzuzeigen.

Join-Knoten

Führen Sie die folgenden Schritte aus, um die Einstellungen des Verknüpfungsknotens zu ändern:

  1. Klicken Sie im Navigationspfad auf Datenintegration , um zum Projekt zurückzukehren.
    Navigationspfad

  2. Klicken Sie auf der Registerkarte Assets auf Datenflüsse > DataStage -Datenflüsse.

  3. Öffnen Sie den Ablauf Datenintegration .

  4. Klicken Sie doppelt auf den Knoten Join_on_ID, um die Einstellungen zu bearbeiten.

  5. Klicken Sie auf die Registerkarte Ausgabe und erweitern Sie den Abschnitt Spalten, um eine Liste der Spalten im verknüpften Dataset anzuzeigen.

  6. Klicken Sie auf Bearbeiten.

  7. Für den Namen der Spalte EMAIL_ADDRESS wählen Sie Schlüssel aus.

  8. Klicken Sie auf Anwenden und zurückkehren, um zu den Einstellungen des Knotens Join_on_ID zurückzukehren.

  9. Klicken Sie auf Speichern, um die die Einstellungen für den Knoten Join_on_ID zu speichern.

Symbol für Prüfpunkt Fortschritt überprüfen

Die folgende Abbildung zeigt den DataStage -Ablauf mit der bearbeiteten Stage 'Join_on_id'. Nachdem Sie nun die Spalte EMAIL_ADDRESS als Schlüsselspalte angegeben haben, können Sie die PostgreSQL -Daten hinzufügen, die die Scorewerte für Antragsteller enthalten.

Stage 'Join_on_id'




Task 3: Scoredaten aus einer PostgreSQL -Datenbank hinzufügen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 05:23 an.

Führen Sie die folgenden Schritte aus, um die Scoredaten, die in einer PostgreSQL -Datenbank gespeichert sind, zum DataStage -Ablauf hinzuzufügen:

  1. Erweitern Sie in der Knotenpalette den Abschnitt Connectors.

  2. Ziehen Sie den Connector Assetbrowser in den Erstellungsbereich neben den Knoten MORTGAGE_APPLICANTS_1 .

  3. Suchen Sie das Asset, indem Sie Verbindung > Data Fabric Trial- Databases for PostgreSQL > BANKING > CREDIT_SCOREauswählen.

    Hinweis: Klicken Sie auf den Namen der Verbindung oder des Schemas anstelle des Kontrollkästchens, um die Verbindung und das Schema zu erweitern.

    Vorschau des Scorewerts

  4. Klicken Sie auf das Symbol Vorschau Anzeigen , um eine Vorschau der Scoredaten für jeden Antragsteller anzuzeigen.

  5. Klicken Sie auf Hinzufügen.

Symbol für Prüfpunkt Fortschritt überprüfen

Die folgende Abbildung zeigt den DataStage -Ablauf mit dem hinzugefügten Scorebewertungsasset. Nachdem Sie nun die Scorebewertungsdaten zum Erstellungsbereich hinzugefügt haben, müssen Sie die Bewerber-, Antrags-und Scorebewertungsdaten verknüpfen.

Datenasset für Scorewert




Aufgabe 4: Fügen Sie eine Join-Phase hinzu, um die Scoredaten mit den Anmelder-und Antragsdaten zu verknüpfen.

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 05:54 an.

Führen Sie die folgenden Schritte aus, um eine weitere Join-Phase hinzuzufügen, um die gefilterte Hypothekenanwendung und die Daten des Hypothekenantragstellers mit den Scorebewertungsdaten im DataStage -Ablauf zu verknüpfen:

  1. Erweitern Sie in der Knotenpalette den Abschnitt Phasen.

  2. Ziehen Sie die Stage Join in den Erstellungsbereich und legen Sie den Knoten in der Linklinie zwischen den Knoten Filter_State_Code und Sequential_file_1 ab.

  3. Bewegen Sie den Mauszeiger über den Connector CREDIT_SCORE_1, um den Pfeil anzuzeigen. Verbinden Sie den Pfeil mit der Join-Phase.

  4. Klicken Sie doppelt auf den Knoten CREDIT_SCORE_1, um die Einstellungen zu bearbeiten.

    1. Klicken Sie auf die Registerkarte Ausgabe und erweitern Sie den Abschnitt Spalten, um eine Liste der Spalten im verknüpften Dataset anzuzeigen.

    2. Klicken Sie auf Bearbeiten.

    3. Für die Namen der Spalten EMAIL_ADDRESS und CREDIT_SCORE wählen Sie Schlüssel aus.

    4. Klicken Sie auf Anwenden und zurückkehren, um zu den Einstellungen des Knotens CREDIT_SCORE_1 zurückzukehren.

    5. Klicken Sie auf Speichern, um die Einstellungen des Knotens CREDIT_SCORE_1 zu speichern.

  5. Klicken Sie doppelt auf den Knoten Join_1, um die Einstellungen zu bearbeiten.

    1. Erweitern Sie den Abschnitt Eigenschaften.

    2. Klicken Sie auf Schlüssel hinzufügen.

      1. Klicken Sie erneut auf Schlüssel hinzufügen.

      2. Wählen Sie in der Liste der möglichen Schlüssel EMAIL_ADDRESS aus.

      3. Klicken Sie auf Anwenden.

    3. Klicken Sie auf Anwenden und zurückkehren, um zu den Einstellungen für den Knoten Join_1 zurückzukehren.

    4. Ändern Sie den Knotennamen Join_1 in Join_on_email.

    5. Klicken Sie auf Speichern, um die Einstellungen für den Knoten Join_1 zu speichern.

Symbol für Prüfpunkt Fortschritt überprüfen

Die folgende Abbildung zeigt den DataStage -Ablauf mit einer hinzugefügten zweiten Stage 'Join'. Nachdem Sie nun den Bewerbungs-, Bewerber-und Scoredaten beigetreten sind, müssen Sie eine Transformer-Phase hinzufügen, um die Gesamtschulden jedes Bewerbers zu berechnen.

Stage 'Join_on_email'




Aufgabe 5: Fügen Sie eine Transformer-Phase hinzu, um die Gesamtschulden zu berechnen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 07:08 an.

Führen Sie die folgenden Schritte aus, um eine Transformer-Phase hinzuzufügen, die eine neue Spalte durch Summierung der Spalten LOAN_AMOUNT und CREDITCARD_DEBT erstellt:

  1. Ziehen Sie im Abschnitt Stufen die Stage Transformer in den Erstellungsbereich und legen Sie den Knoten in der Linklinie zwischen den Knoten Join_on_email und Sequential_file_1 ab.

  2. Klicken Sie doppelt auf den Knoten Transformator, um die Einstellungen zu bearbeiten.

  3. Klicken Sie auf die Registerkarte Ausgabe.

    1. Klicken Sie auf Spalte hinzufügen.

    2. Blättern Sie in der Liste der Spalten abwärts, um die neue Spalte anzuzeigen.

    3. Benennen Sie die Spalte TOTAL_DEBT.

    4. Klicken Sie auf das Symbol Bearbeiten Bearbeiten in der Spalte Ableitung der Zeile.

    5. Klicken Sie in der Spalte Ableitung auf das Symbol Rechner Rechner , um das Ausdruckserstellungsprogramm zu öffnen.

    6. Suchen Sie nach LOAN_AMOUNT und klicken Sie doppelt auf den Spaltennamen, um ihn dem Ausdruck hinzuzufügen. Beachten Sie, dass die Linknummer an den Spaltennamen angehängt wird.

    7. Geben Sie ein Pluszeichen + ein.

    8. Suchen Sie nach CREDITCARD_DEBTund doppelklicken Sie dann auf den Spaltennamen, um ihn dem Ausdruck hinzuzufügen. Beachten Sie, dass die Linknummer an den Spaltennamen angehängt wird.

    9. Stellen Sie sicher, dass der letzte Ausdruck Link_7.LOAN_AMOUNT + Link_7.CREDITCARD_DEBT ist.

      Hinweis: Ihre Linknummer kann abweichen.
    10. Klicken Sie auf Anwenden und zurückkehren, um zur Seite Transformator zurückzukehren.

    11. Wählen Sie für den Spaltennamen CREDIT_SCORE Schlüsselaus.

  4. Klicken Sie auf die Registerkarte Bühne.

    1. Wählen Sie die Seite Erweitert.

    2. Ändern Sie den Ausführungsmodus auf Sequentiell.

  5. Klicken Sie auf Speichern und zurückkehren, um zum Erstellungsbereich zurückzukehren.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt den DataStage -Ablauf mit hinzugefügter Transformer-Phase. Nachdem Sie nun die Gesamtschulden jedes Antragstellers berechnet haben, müssen Sie die Tabelle der Zinssätze hinzufügen, um basierend auf Scorebereichen anzubieten.

Stage 'Transformer'




Task 6: Zinssatzdaten aus einer MongoDB -Datenbank hinzufügen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 08:15 an.

Führen Sie die folgenden Schritte aus, um die Zinssätze in den Ablauf einzuschließen, indem Sie einen Datenasset-Connector zu einer MongoDB -Datenbank hinzufügen:

  1. Erweitern Sie in der Knotenpalette den Abschnitt Connectors.

  2. Ziehen Sie den Connector Asset-Browser in den Erstellungsbereich neben dem Knoten CREDIT_SCORE_1.

  3. Suchen Sie das Asset, indem Sie Connection > Data Fabric Trial-Mongo DB > DOCUMENT > DS_INTEREST_RATESauswählen.

  4. Klicken Sie auf das Symbol Vorschau Vorschau, um eine Vorschau der Zinssätze für die einzelnen Bonitätsklassen zu erhalten.
    Datenasset anzeigen
    Sie können die Werte in den Spalten STARTING_LIMIT und ENDING_LIMIT verwenden, um den passenden Zinssatz auf der Grundlage der Kreditwürdigkeit des Antragstellers zu ermitteln. Da die ID-Spalte nicht benötigt wird, löschen Sie sie im nächsten Schritt.

  5. Klicken Sie auf Hinzufügen.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt den DataStage -Ablauf mit dem Datenasset für Zinssätze, das aus der externen Quelle MongoDB hinzugefügt wurde. Nachdem Sie nun die Zinssatztabelle hinzugefügt haben, können Sie den entsprechenden Zinssatz für jeden Antragsteller suchen.

Datenasset für Zinssätze




Aufgabe 7. Fügen Sie eine Lookup-Phase hinzu, um nach Zinssätzen für Antragsteller zu suchen.

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 09:00 an.

Basierend auf dem Scorewert jedes Antragstellers möchten Sie den entsprechenden Zinssatz suchen. Führen Sie die folgenden Schritte aus, um eine Lookup-Phase hinzuzufügen und den Bereich für die Start-und Endbewertungslimits für jeden Zinssatz anzugeben:

  1. Ziehen Sie im Abschnitt Stufen die Stage Lookup in den Erstellungsbereich und legen Sie den Knoten auf der Linklinie zwischen den Knoten Transformer_1 und Sequential_file_1 ab.

  2. Verbinden Sie den Connector DS_INTEREST_RATES_1 mit der Phase Lookup_1.

  3. Klicken Sie doppelt auf den Knoten DS_INTEREST_RATES_1, um die Einstellungen zu bearbeiten.

  4. Klicken Sie auf die Registerkarte Ausgabe.

    1. Erweitern Sie den Abschnitt Spalten und klicken Sie auf Bearbeiten.

    2. Wählen Sie die Spalte _ID aus.

    3. Klicken Sie auf das Symbol Löschen Papierkorb, um die Spalte _ID zu löschen.

    4. Klicken Sie auf Anwenden und zurückkehren, um zu den Einstellungen des Knotes DS_INTEREST_RATES_1 zurückzukehren.

    5. Klicken Sie auf Speichern, um die Änderungen am Knoten DS_INTEREST_RATES_1 zu speichern.

  5. Klicken Sie doppelt auf den Knoten Lookup_1, um die Einstellungen zu bearbeiten.

  6. Erweitern Sie den Abschnitt Eigenschaften.

    1. Wählen Sie im Feld Bereich auf Spalten anwenden die Option CREDIT_SCORE aus. Die Felder Referenzlinks, Operatorund Bereichsspalte werden angezeigt.

    2. Wählen Sie für Referenzlinks die Option Link_9 aus.

      Hinweis: Ihre Linknummer kann abweichen.
    3. Wählen Sie für den ersten Operator < =aus.

    4. Wählen Sie für die erste Bereichsspalte die Option ENDING_LIMIT aus.

    5. Wählen Sie für den zweiten Operator > =aus.

    6. Wählen Sie für die zweite Bereichsspalte die Option STARTING_LIMIT aus.

  7. Klicken Sie auf die Registerkarte Ausgabe.

    1. Erweitern Sie den Abschnitt Spalten und klicken Sie auf Bearbeiten.

    2. Wählen Sie die Spalten STARTING_LIMIT und ENDING_LIMIT aus.

    3. Klicken Sie auf das Symbol Löschen Papierkorb, um diese unnötigen Spalten Beginn_LIMIT und Ende_LIMIT zu löschen.

    4. Klicken Sie auf Anwenden und zurückkehren, um zu den Einstellungen des Knotens Lookup_1 zurückzukehren.

    5. Klicken Sie auf Speichern, um die Änderungen am Knoten Lookup_1 zu speichern.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt, dass der DataStage -Ablauf mit der Stage 'Lookup' hinzugefügt wurde. Der DataStage -Ablauf ist jetzt abgeschlossen. Die letzte Task vor der Ausführung des Ablaufs besteht darin, den Namen für die Ausgabedatei anzugeben.

Stage 'Lookup'




Task 8: Sequenzdateiknoten bearbeiten und DataStage -Ablauf ausführen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 10:22 an.

Führen Sie die folgenden Schritte aus, um den Sequenzdateiknoten zu bearbeiten, um eine endgültige Ausgabedatei als Datenasset im Projekt zu erstellen, und anschließend den DataStage -Ablauf zu kompilieren und auszuführen:

  1. Klicken Sie doppelt auf den Knoten Sequential_file_1, um die Einstellungen zu bearbeiten.

  2. Klicken Sie auf die Registerkarte Eingabe.

  3. Erweitern Sie den Abschnitt Eigenschaften.

  4. Kopieren Sie für Zieldateidie Datei MORTGAGE_APPLICANTS_INTEREST_RATES.CSV und fügen Sie sie als Dateinamen ein.

  5. Wählen Sie Datenasset erstellen aus.

  6. Wählen Sie für das Feld First line is column names die Option Trueaus.

  7. Klicken Sie auf Speichern.

  8. Klicken Sie auf Ausführen , um den DataStage -Ablauf zu kompilieren und auszuführen. Die Ausführung des Jobs dauert ungefähr 1 Minute.

  9. Klicken Sie in der Symbolleiste auf Protokolle , um den Fortschritt des Ablaufs zu überwachen. Es ist normal, dass Warnungen während der Ausführung angezeigt werden und Sie dann sehen, dass der Ablauf erfolgreich ausgeführt wurde.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt, dass der DataStage -Ablauf erfolgreich ausgeführt wurde. Nachdem der DataStage -Flow die Ausgabedatei erstellt hat, müssen Sie den Katalog erstellen, in dem Sie die Ausgabedatei veröffentlichen werden.

DataStage -Ausführung abgeschlossen




Task 9: Katalog zum Speichern des publizierten Datenassets erstellen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 11:00 an.

Andere Datenentwickler und Geschäftsanalysten der Golden Bank benötigen Zugang zu den Hypothekenzinsen. Mit dem Lite-Plan IBM Knowledge Catalog können Sie zwei Kataloge erstellen. Wenn Sie bereits über einen Katalog verfügen, überspringen Sie diesen Schritt. Andernfalls führen Sie die folgenden Schritte aus, um einen Katalog zu erstellen, in dem Sie das Dataset für Zinssätze veröffentlichen können.

  1. Wählen Sie aus dem Cloud Pak for Data Navigationsmenü Navigationsmenü Kataloge > Alle Kataloge anzeigen.

  2. Wenn ein Hypothekengenehmigungskatalog auf der Seite Kataloge angezeigt wird, fahren Sie mit Aufgabe 10: Ausgabe anzeigen und in einem Katalog veröffentlichenfort. Andernfalls führen Sie die folgenden Schritte aus, um einen neuen Katalog zu erstellen:

  3. Klicken Sie auf Katalog erstellen.

  4. Kopieren Sie für Nameden Katalognamen genau so, wie er ohne führende oder nachfolgende Leerzeichen angezeigt wird, und fügen Sie ihn ein:

    Mortgage Approval Catalog
    
  5. Wählen Sie Datenschutzregeln umsetzenaus, bestätigen Sie die Auswahl und akzeptieren Sie die Standardwerte für die anderen Felder.

  6. Klicken Sie auf Erstellen.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt Ihren Katalog. Jetzt, da der Hypothekenkatalog vorhanden ist, können Sie die Ausgabedatei im Katalog veröffentlichen.

Hypothekengenehmigungskatalog




Task 10: Ausgabe anzeigen und in einem Katalog veröffentlichen

Vorschau-Lernprogrammvideo Um eine Vorschau auf diese Aufgabe zu erhalten, sehen Sie sich das Video ab 11:31 an.

Führen Sie die folgenden Schritte aus, um die Ausgabedatei im Projekt anzuzeigen und anschließend in einem Katalog zu veröffentlichen:

  1. Wählen Sie aus dem Cloud Pak for Data Navigationsmenü Navigationsmenü Projekte > Alle Projekte anzeigen.

  2. Öffnen Sie das Projekt Datenintegration .

  3. Klicken Sie auf der Registerkarte Assets auf Daten > Datenassets.

  4. Öffnen Sie die Datei MORTGAGE_APPLICANTS_INTEREST_RATES.CSV.

  5. Blättern Sie, um alle Spalten in Ihrem integrierten Dataset mit Zinssätzen am Ende jeder Dateneingabe anzuzeigen.

  6. Klicken Sie im Navigationspfad auf Datenintegration , um zum Projekt zurückzukehren.

  7. On the Vermögenswerte tab, click the Überlauf menu Überlaufmenü at the end of the row for the MORTGAGE_APPLICANTS_INTEREST_RATES.CSV file, and choose Im Katalog veröffentlichen.

    1. Wählen Sie den Hypothekengenehmigungskatalog (oder Ihren Katalognamen) in der Liste aus und klicken Sie auf Next.

    2. Wählen Sie die Option Nach der Veröffentlichung zum Katalog wechselnaus und klicken Sie auf Next.

    3. Prüfen Sie die Assets und klicken Sie auf Veröffentlichen.

  8. Suchen Sie im Katalog nach Mortgage.

  9. Öffnen Sie die Datei MORTGAGE_APPLICANTS_INTEREST_RATES.CSV.

  10. Klicken Sie auf die Registerkarte Asset, um die Daten anzuzeigen.

Symbol für Prüfpunkt Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt MORTGAGE_APPLICANTS_INTEREST_RATES.CSV im Katalog. Die Daten, die Kreditgeber benötigen, um Hypothekenentscheidungen zu treffen, sind jetzt verfügbar.

MORTGAGE_APPLICANTS_INTEREST_RATES.CSV im Katalog



Als Datenentwickler bei der Golden Bank haben Sie Informationen zum Hypothekenantragsteller, zur Anwendung, zur Kreditwürdigkeit und zur Kreditwürdigkeit integriert und diese Daten in einem Katalog veröffentlicht.

Bereinigung (optional)

Wenn Sie die Lernprogramme im Anwendungsfall "Datenintegration" wiederholen möchten, löschen Sie die folgenden Artefakte.

Artefakt Vorgehensweise zum Löschen
Hypothekengenehmigungskatalog Katalog löschen
Beispielprojekt für Datenintegration Projekt löschen

Nächste Schritte

Weitere Informationen

Übergeordnetes Thema: Lernprogramme für Anwendungsfälle

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen