Translation not up to date
Ten kurs służy do transformowania danych przechowywanych w trzech zewnętrznych źródłach danych przy użyciu przypadku użycia integracji danych w wersji próbnej produktu Data Fabric. Celem jest użycie narzędzia DataStage do transformacji danych, a następnie dostarczenie przekształconych danych do pojedynczego pliku wyjściowego. Jeśli ukończono kurs Virtualize external data (Wirtualizowanie danych zewnętrznych), to za pomocą programu Watson Query wykonano wiele tych samych zadań, które zostały wykonane w ramach tego kursu przy użyciu programu DataStage.
Historia kursu jest taka, że Golden Bank musi stosować się do nowego rozporządzenia, w którym nie może pożyczać osobom ubiegającym się o pożyczkę z niepełnym kwalifikacją. Jako inżynier danych w Golden Bank, użytkownik korzysta obecnie z narzędzia DataStage w celu zagregowania danych dotyczących anonimizowanych wniosków o kredyt hipoteczny z danymi osobowymi osób ubiegających się o kredyt hipoteczny. Kredytodawcy używają tych informacji, aby pomóc im w podjęciu decyzji o zatwierdzeniu lub odrzuceniu wniosków o kredyt hipoteczny. Twoja kadra kierownicza dodała analityków ryzyka, którzy codziennie wyliczają, jaką stopę procentową proponują kredytobiorcom w każdym przedziale punktów kredytowych. Należy zintegrować te informacje z arkuszem kalkulacyjnym, który jest współużytkowany z kredytodawcami. Arkusz kalkulacyjny zawiera informacje o wyniku kredytowym dla każdego wnioskodawcy, łączne zadłużenie wnioskodawcy oraz tabelę wyszukiwania stóp procentowych. Na koniec załaduj dane do docelowego wyjściowego pliku CSV.
Poniższy animowany obraz udostępnia szybki podgląd tego, co zostanie wykonane pod koniec tego kursu. Za pomocą narzędzia DataStage można dołączać do danych kandydata i aplikacji, filtrować według stanu, dołączać do ocen kredytowych kandydata, obliczać łączny dług, odszukać hipoteczną stopę procentową do zaoferowania w oparciu o zakresy ocen kredytowych i zapisać wynik w pliku CSV. Kliknij obraz, aby wyświetlić większy obraz.
Podgląd kursu
W tym kursie zostaną wykonane następujące czynności:
- Skonfiguruj wymagania wstępne.
- Czynność 1: Uruchamianie istniejącego przepływu DataStage
- Edytuj przepływ DataStage do:
- Czynność 2: Określanie kolumny klucza dla etapu łączenia
- Czynność 3: Dodawanie danych oceny kredytowej z bazy danych PostgreSQL
- Czynność 4: Dodawanie etapu łączenia w celu połączenia danych oceny zdolności kredytowej z danymi wnioskodawcy i wniosku
- Czynność 5: Dodawanie etapu Transformera w celu obliczenia łącznego długu
- Czynność 6: Dodawanie danych dotyczących stóp procentowych z bazy danych MongoDB
- Czynność 7: Dodawanie etapu wyszukiwania w celu wyszukania stóp procentowych dla kandydatów
- Czynność 8: Edytowanie węzła pliku sekwencyjnego i uruchamianie przepływu DataStage
- Czynność 9: Tworzenie katalogu do przechowywania opublikowanego zasobu danych
- Czynność 10: Wyświetlanie danych wyjściowych i publikowanie w katalogu
- Procedura czyszcząca (opcjonalnie)
Obejrzyj ten film wideo, aby wyświetlić podgląd kroków tego kursu. W interfejsie użytkownika wyświetlanym na filmie wideo mogą występować niewielkie różnice. Film wideo ma być towarzyszem napisanego kursu.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Użyj obrazu wideo
Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:
Uzyskaj pomoc w społeczności
Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.
Konfigurowanie okien przeglądarki
Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.
Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.
Początek strony
Wymagania wstępne
Zarejestruj się, aby korzystać z Cloud Pak for Data as a Service
Należy zarejestrować się w usłudze Cloud Pak for Data as a Service i udostępnić niezbędne usługi na potrzeby integracji danych.
- Jeśli masz istniejące konto Cloud Pak for Data as a Service , możesz rozpocząć ten kurs. Jeśli masz konto planu Lite, tylko jeden użytkownik na konto może uruchomić ten kurs.
- Jeśli nie masz jeszcze konta Cloud Pak for Data as a Service , zarejestruj się w celu skorzystania z wersji próbnej struktury danych.
Obejrzyj następujący film wideo, aby dowiedzieć się więcej o strukturze danych w produkcie Cloud Pak for Data.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Sprawdź wymagane udostępnione usługi
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo rozpoczynający się od strony 01:09.
Ważne: Usługa DataStage jest dostępna tylko w regionach Dallas i Frankfurt. Jeśli to konieczne, przed kontynuacją przejdź do Dallas lub Frankfurtu.Aby sprawdzić lub udostępnić niezbędne usługi, wykonaj następujące kroki:
W programie Cloud Pak for Datasprawdź, czy jesteś w regionie Dallas lub Frankfurcie. Jeśli nie, kliknij menu rozwijane regionu, a następnie wybierz opcję Dallas lub Frankfurt.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Usługi > Instancje usług.
Użyj listy rozwijanej Produkt , aby określić, czy istnieje instancja usługi DataStage .
Aby utworzyć instancję usługi DataStage , kliknij opcję Dodaj usługę.
Wybierz opcję DataStage.
Dla regionu wybierz Dallas lub Frankfurt.
Wybierz plan Lite .
Kliknij makro Create.
Powtórz te kroki, aby sprawdzić lub udostępnić następujące dodatkowe usługi:
- Watson Knowledge Catalog
- Cloud Object Storage
Sprawdź postęp
Na poniższym obrazku przedstawiono udostępnione instancje usługi:
Utwórz przykładowy projekt
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 01:44.
Jeśli dla tego kursu jest już dostępny przykładowy projekt, przejdź do sekcji Czynność 1. W przeciwnym razie wykonaj następujące kroki:
Uzyskaj dostęp do przykładowego projektu integracji danych w galerii.
Kliknij opcję Utwórz projekt.
Jeśli zostanie wyświetlona prośba o powiązanie projektu z instancją Cloud Object Storage , wybierz z listy instancję Cloud Object Storage .
Kliknij makro Create.
Poczekaj na zakończenie importowania projektu, a następnie kliknij opcję Wyświetl nowy projekt , aby sprawdzić, czy projekt i zasoby aplikacyjne zostały pomyślnie utworzone.
Kliknij kartę Zasoby , aby wyświetlić połączenia i przepływ DataStage .
Uwaga: Może zostać wyświetlony przewodnik przedstawiający kursy dołączone do tego przypadku użycia. Odsyłacze w przewodniku otwierają te instrukcje kursu.Sprawdź postęp
Na poniższym obrazku przedstawiono kartę Zasoby w przykładowym projekcie. Teraz można rozpocząć kurs.
Początek strony
Aby wyświetlić podgląd tego zadania, obejrzyj film wideo rozpoczynający się od wersji 02:40.
Rozpocznij od podstawowego przepływu DataStage , który dołącza do zestawów danych aplikacji do obsługi kredytów hipotecznych i kredytów hipotecznych, a następnie wyprowadza wynik do pliku CSV w projekcie. Aby uruchomić przepływ DataStage , wykonaj następujące kroki:
Rozpocznij pracę w projekcie Integracja danych . Jeśli projekt nie jest otwarty, wykonaj następujące kroki:
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Projekty > Wyświetl wszystkie projekty.
Otwórz projekt Integracja danych .
Kliknij kartę Zasoby aplikacyjne , aby wyświetlić wszystkie zasoby aplikacyjne w projekcie.
Kliknij opcję Przepływy > przepływy DataStage.
Wskazówka: Jeśli nie są wyświetlane żadne przepływy DataStage , należy wrócić do wyświetlania instancji usług w celu sprawdzenia, czy instancja DataStage została pomyślnie udostępniona. Patrz sekcja Udostępnianie niezbędnych usług.Kliknij przepływ Integracja danych na liście, aby go otworzyć. Ten przepływ łączy tabele Wnioskodawcy kredytów hipotecznych i Aplikacje kredytów hipotecznych , które są przechowywane w bazie danych Db2 Warehouse, filtruje dane do tych rekordów ze stanu Kalifornia i tworzy sekwencyjny plik w formacie CSV jako dane wyjściowe.
Kliknij ikonę Powiększ i ikonę Pomniejsz na pasku narzędzi, aby ustawić preferowany widok kanwy.
Kliknij dwukrotnie węzeł MORTGAGE_APPLICATIONS_1 , aby wyświetlić ustawienia.
Rozwiń sekcję Właściwości .
Przewiń w dół, a następnie kliknij opcję Podgląd danych. Ten zestaw danych zawiera informacje, które są przechwytywane w aplikacji do obsługi kredytów hipotecznych.
Kliknij opcję Zamknij.
Kliknij dwukrotnie węzeł MORTGAGE_APPLICANTS_1 , aby wyświetlić ustawienia.
Rozwiń sekcję Właściwości .
Przewiń w dół i kliknij opcję Podgląd danych. Ten zestaw danych zawiera informacje na temat wnioskodawców ubiegających się o kredyt hipoteczny.
Opcjonalnie: wizualizuj dane.
Kliknij panel Wykres .
Z listy Kolumny do wizualizacji wybierz pozycję STATE.
Kliknij opcję Wizualizuj dane , aby wyświetlić wykres kołowy przedstawiający rozkład danych według stanu.
Kliknij ikonę Mapa drzewa , aby wyświetlić te same dane na wykresie mapy drzewa.
Kliknij opcję Zamknij.
Kliknij dwukrotnie węzeł Join_on_ID , aby wyświetlić ustawienia.
Rozwiń sekcję Właściwości .
Należy zauważyć, że kluczem łączenia jest kolumna ID.
Kliknij przycisk Anuluj , aby zamknąć ustawienia.
Kliknij ikonę Dzienniki na pasku narzędzi, aby obserwować postęp przepływu.
Kliknij opcję Kompiluj, a następnie kliknij przycisk Uruchom. Alternatywnie można kliknąć opcję Uruchom , która kompiluje, a następnie uruchamia przepływ DataStage . Wykonanie może potrwać około jednej minuty.
Wyświetl dzienniki. Można użyć łącznej liczby wierszy i wierszy na sekundę dla każdego kroku w przepływie, aby wizualnie sprawdzić, czy filtr działa zgodnie z oczekiwaniami.
Po pomyślnym zakończeniu wykonywania kliknij opcję Integracja danych w ścieżce nawigacyjnej, aby powrócić do projektu.
Na karcie Zasoby kliknij opcję Dane > Zasoby danych.
Otwórz stronę MORTGAGE_INTEREST_RATES.CSV . Ten plik zawiera kolumny zarówno z zestawów danych aplikacji do obsługi kredytów hipotecznych, jak i aplikacji do obsługi kredytów hipotecznych.
Sprawdź postęp
Na poniższym obrazku przedstawiono wynikowe MORTGAGE_INTEREST_RATES.CSV CSV. Następnym zadaniem jest edytowanie przepływu DataStage .
Początek strony
Po dołączeniu do danych kandydata na hipotekę i danych aplikacji można edytować przepływ DataStage w celu:
- Czynność 2: należy określić kolumnę klucza dla etapu łączenia.
- Czynność 3: dodawanie danych oceny kredytowej z bazy danych PostgreSQL .
- Czynność 4: Dodaj etap łączenia, aby dołączyć dane oceny kredytowej do danych kandydata i aplikacji.
- Czynność 5: Dodawanie etapu Transformera w celu obliczenia łącznego długu.
- Zadanie 6: dodaj dane dotyczące stóp procentowych z bazy danych MongoDB .
- Czynność 7: należy dodać etap wyszukiwania, aby wyszukać stopy procentowe dla wnioskodawców na podstawie ich wyników kredytowych i dziennych zakresów stóp procentowych Golden Bank.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 04:33.
Identyfikowanie kolumny klucza wskazuje na DataStage , że kolumna zawiera unikalne wartości. Węzeł Join_on_ID łączy zestawy danych aplikacji do obsługi kredytów hipotecznych i kredytów hipotecznych przy użyciu kolumny identyfikatora dla klucza łączenia. Następną fazą jest połączenie wynikowego zestawu danych z danymi oceny kredytowej. Później nastąpi połączenie wynikowych filtrowanych danych z zestawem danych oceny zdolności kredytowej. Drugie łączenie będzie używać kolumny EMAIL_ADDRESS jako klucza łączenia. W tym zadaniu edytowany jest przepływ DataStage w celu określenia kolumny EMAIL_ADDRESS jako kolumny klucza dla wynikowego zestawu danych, gdy jest on łączony z danymi oceny zdolności kredytowej.
Poniższy animowany obraz stanowi alternatywę dla opisu dwóch węzłów łączenia. Kliknij obraz, aby wyświetlić większy obraz.
Aby zmienić ustawienia węzła łączenia, wykonaj następujące kroki:
Kliknij opcję Integracja danych w ścieżce nawigacyjnej, aby powrócić do projektu.
Na karcie Zasoby kliknij opcję Przepływy > DataStage.
Otwórz przepływ Integracja danych .
Kliknij dwukrotnie węzeł Join_on_ID , aby edytować ustawienia.
Kliknij kartę Dane wyjściowe i rozwiń sekcję Kolumny , aby wyświetlić listę kolumn w połączonym zestawie danych.
Kliknij przycisk Edytuj.
Dla nazwy kolumny EMAIL_ADDRESS wybierz Klucz.
Kliknij przycisk Zastosuj i wróć , aby powrócić do ustawień węzła Join_on_ID .
Kliknij przycisk Zapisz , aby zapisać ustawienia węzła Join_on_ID .
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z edytowanym etapem Join_on_id. Po zidentyfikowaniu kolumny EMAIL_ADDRESS jako kolumny klucza można dodać dane PostgreSQL zawierające oceny kredytowe kandydatów.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 05:14.
Wykonaj następujące kroki, aby dodać dane oceny kredytowej zapisane w bazie danych PostgreSQL do przepływu DataStage :
Na palecie węzłów rozwiń sekcję Konektory .
Przeciągnij konektor Przeglądarka zasobów na kanwę obok węzła MORTGAGE_APPLICANTS_1 .
Znajdź zasób, wybierając opcję Połączenie > Data Fabric Trial- Databases for PostgreSQL > BANKING > CREDIT_SCORE.
Uwaga: Kliknij nazwę połączenia lub schematu zamiast pola wyboru, aby rozwinąć połączenie i schemat.Kliknij ikonę Podgląd , aby wyświetlić podgląd danych oceny kredytowej dla każdego kandydata.
Kliknij opcję Dodaj.
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z dodanym zasobem oceny kredytowej. Po dodaniu danych oceny zdolności kredytowej do kanwy należy dołączyć do danych oceny zdolności kredytowej, aplikacji i oceny zdolności kredytowej.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 05:46.
Wykonaj poniższe kroki, aby dodać kolejny etap łączenia w celu dołączenia do filtrowanej aplikacji do obsługi kredytów hipotecznych i danych dotyczących kredytów hipotecznych połączonych z danymi dotyczącymi oceny kredytowej w przepływie DataStage :
Na palecie węzłów rozwiń sekcję Etapy .
Przeciągnij etap Łączenie na kanwę i upuść węzeł w linii łączącej między węzłami Filter_State_Code i Sequential_file_1 .
Umieść wskaźnik myszy nad konektorem CREDIT_SCORE_1 , aby wyświetlić strzałkę. Połącz strzałkę ze etapem Łączenie .
Kliknij dwukrotnie węzeł CREDIT_SCORE_1 , aby edytować ustawienia.
Kliknij kartę Dane wyjściowe i rozwiń sekcję Kolumny , aby wyświetlić listę kolumn w połączonym zestawie danych.
Kliknij przycisk Edytuj.
Dla nazw kolumn EMAIL_ADDRESS i CREDIT_SCORE wybierz Klucz.
Kliknij przycisk Zastosuj i wróć , aby powrócić do ustawień węzła CREDIT_SCORE_1 .
Kliknij przycisk Zapisz , aby zapisać ustawienia węzła CREDIT_SCORE_1 .
Kliknij dwukrotnie węzeł Join_1 , aby edytować ustawienia.
Rozwiń sekcję Właściwości .
Kliknij przycisk Dodaj klucz.
Ponownie kliknij przycisk Dodaj klucz .
Wybierz pozycję EMAIL_ADDRESS z listy możliwych kluczy.
Kliknij przycisk Zastosuj.
Kliknij przycisk Zastosuj i wróć , aby powrócić do ustawień węzła Join_1 .
Zmień nazwę węzła Join_1 na
Join_on_email
.Kliknij przycisk Zapisz , aby zapisać ustawienia węzła Join_1 .
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z dodanym drugim etapem łączenia. Teraz, gdy dołączyłeś do danych dotyczących wniosku, kandydata i wyniku kredytowego, musisz dodać etap Transformer, aby obliczyć całkowity dług każdego z kandydatów.
Początek strony
Aby wyświetlić podgląd tego zadania, obejrzyj film wideo rozpoczynający się od godziny 07:00.
Wykonaj następujące kroki, aby dodać etap Transformera, który tworzy nową kolumnę, sumując kolumny LOAN_AMOUNT i CREDITCARD_DEBT:
W sekcji Etapy przeciągnij etap Transformator na kanwę i upuść węzeł na linii odsyłacza między węzłami Join_on_email i Sequential_file_1 .
Kliknij dwukrotnie węzeł Transformer , aby edytować ustawienia.
Kliknij kartę Raport.
Kliknij opcję Dodaj kolumnę.
Przewiń listę kolumn, aby wyświetlić nową kolumnę.
Nadaj kolumnie nazwę
TOTAL_DEBT
.Kliknij ikonę Edytuj w kolumnie Wyprowadzenie wiersza.
Kliknij ikonę Kalkulator w kolumnie Wyprowadzenie , aby otworzyć program budujący wyrażenia.
Wyszukaj łańcuch
LOAN_AMOUNT
i kliknij dwukrotnie nazwę kolumny, aby dodać ją do wyrażenia. Należy zauważyć, że numer odsyłacza jest dodawany do nazwy kolumny.Wpisz znak plus
+
.Wyszukaj łańcuch
CREDITCARD_DEBT
, a następnie kliknij dwukrotnie nazwę kolumny, aby dodać ją do wyrażenia. Należy zauważyć, że numer odsyłacza jest dodawany do nazwy kolumny.Sprawdź, czy wyrażenie końcowe to
Link_5.LOAN_AMOUNT + Link_5.CREDITCARD_DEBT
.Uwaga: Numer odsyłacza może być inny.Dla nazwy kolumny CREDIT_SCORE wybierz opcję Klucz.
Kliknij przycisk Zastosuj i wróć , aby wrócić do strony Transformator .
Kliknij opcję Zapisz i wróć , aby powrócić do kanwy.
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z dodanym etapem Transformer. Teraz, gdy zaciąłeś łączny dług każdego wnioskodawcy, musisz dodać tabelę stóp procentowych do oferty w oparciu o zakresy punktów kredytowych.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 07:49.
Wykonaj następujące kroki, aby uwzględnić stopy procentowe w przepływie, dodając konektor zasobów danych do bazy danych MongoDB :
Na palecie węzłów rozwiń sekcję Konektory .
Przeciągnij konektor Przeglądarka zasobów na kanwę obok węzła CREDIT_SCORE_1 .
Znajdź zasób aplikacyjny, wybierając opcję Połączenie > Data Fabric Trial-Mongo DB > DOCUMENT > DS_INTEREST_RATES.
Kliknij ikonę Podgląd , aby wyświetlić podgląd stóp procentowych dla każdego zakresu oceny kredytowej.
Wartości w kolumnach STARTING_LIMIT i ENDING_LIMIT umożliwiają określenie odpowiedniej stopy procentowej na podstawie wyniku kredytowego wnioskodawcy. Kolumna ID nie jest potrzebna, dlatego zostanie usunięta w następnym kroku.Kliknij opcję Dodaj.
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z zasobem danych stóp procentowych dodanym ze źródła zewnętrznego MongoDB . Po dodaniu tabeli stóp procentowych można sprawdzić odpowiednią stopę procentową dla każdego wnioskodawcy.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 08:35.
W oparciu o ocenę kredytową każdego kandydata, chcesz sprawdzić odpowiednią stopę procentową. Wykonaj następujące kroki, aby dodać etap wyszukiwania i określić zakres początkowych i końcowych limitów oceny kredytowej dla każdej stopy procentowej:
W sekcji Etapy przeciągnij etap Wyszukiwanie na kanwę i upuść węzeł na linii łączącej między węzłami Transformer_1 i Sequential_file_1 .
Połącz konektor DS_INTEREST_RATES_1 z etapem Lookup_1 .
Kliknij dwukrotnie węzeł DS_INTEREST_RATES_1 , aby edytować ustawienia.
Kliknij kartę Raport.
Rozwiń sekcję Kolumny i kliknij opcję Edytuj.
Wybierz kolumnę _ID .
Kliknij ikonę Usuń , aby usunąć kolumnę _ID .
Kliknij przycisk Zastosuj i wróć , aby powrócić do ustawień węzła DS_INTEREST_RATES_1 .
Kliknij przycisk Zapisz , aby zapisać zmiany w węźle DS_INTEREST_RATES_1 .
Kliknij dwukrotnie węzeł Lookup_1 , aby edytować ustawienia.
Rozwiń sekcję Właściwości .
W polu Zastosuj zakres do kolumn wybierz wartość CREDIT_SCORE. Zostaną wyświetlone pola Odsyłacze, Operatori Kolumna Zakres .
W polu Odsyłaczewybierz wartość Link_9.
Uwaga: Numer odsyłacza może być inny.Dla pierwszego operatorawybierz < =.
Dla pierwszej kolumny zakresuwybierz wartość ENDING_LIMIT.
Dla drugiego operatorawybierz > =.
W drugiej kolumnie Zakreswybierz wartość STARTING_LIMIT.
Kliknij kartę Raport.
Rozwiń sekcję Kolumny i kliknij opcję Edytuj.
Wybierz kolumny STARTING_LIMIT i ENDING_LIMIT .
Kliknij ikonę Usuń , aby usunąć te zbędne kolumny STARTING_LIMIT i ENDING_LIMIT .
Kliknij przycisk Zastosuj i wróć , aby powrócić do ustawień węzła Lookup_1 .
Kliknij przycisk Zapisz , aby zapisać zmiany w węźle Lookup_1 .
Sprawdź postęp
Na poniższym obrazku przedstawiono przepływ DataStage z dodanym etapem wyszukiwania. Przepływ DataStage został zakończony. Ostatnim zadaniem przed uruchomieniem przepływu jest określenie nazwy pliku wyjściowego.
Początek strony
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 09:56.
Wykonaj następujące kroki, aby edytować węzeł pliku sekwencyjnego w celu utworzenia końcowego pliku wyjściowego jako zasobu aplikacyjnego danych w projekcie, a następnie skompiluj i uruchom przepływ DataStage :
Kliknij dwukrotnie węzeł Sequential_file_1 , aby edytować ustawienia.
Kliknij kartę Dane wejściowe .
Rozwiń sekcję Właściwości .
W polu Plik docelowyskopiuj i wklej plik
MORTGAGE_APPLICANTS_INTEREST_RATES.CSV
dla nazwy pliku.Wybierz opcję Utwórz zasób danych.
W polu Pierwszy wiersz to nazwy kolumn wybierz wartość Prawda.
Kliknij przycisk Zapisz.
Kliknij opcję Uruchom , która kompiluje, a następnie uruchamia przepływ DataStage . Wykonanie zadania zajmuje około 1 minuty.
Kliknij przycisk Dzienniki na pasku narzędzi, aby obserwować postęp przepływu. Zwykle ostrzeżenia są wyświetlane podczas wykonywania, a następnie widać, że przepływ przebiegł pomyślnie.
Sprawdź postęp
Na poniższym obrazku przedstawiono pomyślne wykonanie przepływu DataStage . Teraz, gdy przepływ DataStage utworzył plik wyjściowy, należy utworzyć katalog, w którym zostanie opublikowany plik wyjściowy.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 10:28.
Inni inżynierowie danych i analitycy biznesowi w Golden Bank potrzebują dostępu do oprocentowania kredytów hipotecznych. Plan Watson Knowledge Catalog Lite umożliwia utworzenie dwóch katalogów. Jeśli katalog już istnieje, pomiń ten krok. W przeciwnym razie wykonaj następujące kroki, aby utworzyć katalog, w którym można opublikować zestaw danych stóp procentowych.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Katalogi > Wyświetl wszystkie katalogi.
Jeśli na stronie Katalogi jest wyświetlana opcja Katalog zatwierdzenia kredytu hipotecznego , należy przejść do sekcji Czynność 10: Wyświetlanie danych wyjściowych i publikowanie w katalogu. W przeciwnym razie, aby utworzyć nowy katalog, wykonaj następujące kroki:
Kliknij opcję Utwórz katalog.
W polu Nazwaskopiuj i wklej nazwę katalogu dokładnie w takiej postaci, w jakiej jest wyświetlana, bez spacji na początku i na końcu:
Mortgage Approval Catalog
Wybierz opcję Wymuś reguły ochrony danych, potwierdź wybór i zaakceptuj wartości domyślne w innych polach.
Kliknij makro Create.
Sprawdź postęp
Na poniższym obrazku przedstawiono katalog. Teraz, gdy katalog zatwierdzania kredytów hipotecznych już istnieje, można opublikować plik wyjściowy w katalogu.
Początek strony
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 10:57.
Wykonaj następujące kroki, aby wyświetlić plik wyjściowy w projekcie, a następnie opublikować go w katalogu:
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Projekty > Wyświetl wszystkie projekty.
Otwórz projekt Integracja danych .
Na karcie Zasoby kliknij opcję Dane > Zasoby danych.
Otwórz MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .
Przewiń, aby wyświetlić wszystkie kolumny w zintegrowanym zestawie danych ze stopami procentowymi na końcu każdego wpisu danych.
Kliknij opcję Integracja danych w ścieżce nawigacyjnej, aby powrócić do projektu.
Na karcie Zasoby kliknij menu Przepełnienie na końcu wiersza dla MORTGAGE_APPLICANTS_INTEREST_RATES.CSV i wybierz opcję Publikuj w katalogu.
Wybierz z listy pozycję Katalog zatwierdzania kredytów hipotecznych (lub nazwę katalogu) i kliknij opcję Publikuj.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Katalogi > Wyświetl wszystkie katalogi.
Otwórz Katalog zatwierdzania kredytów hipotecznych.
Wyszukaj łańcuch
Mortgage
.Otwórz MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .
Kliknij kartę Zasób , aby wyświetlić dane.
Sprawdź postęp
Na poniższym obrazku przedstawiono wartość zmiennej MORTGAGE_APPLICANTS_INTEREST_RATES.CSV w katalogu. Dane potrzebne kredytodawcom do podejmowania decyzji dotyczących kredytu hipotecznego są teraz dostępne.
Początek strony
Jako inżynier danych w Golden Bank, użytkownik zintegrował informacje o kredycie hipotecznym, wniosku, ratingu kredytowym i wyniku kredytowym, a następnie opublikował te dane w katalogu.
Czyszczenie (opcjonalne)
Jeśli chcesz ponownie skorzystać z kursów w przypadku użycia integracji danych, usuń następujące artefakty.
Artefakt | Usuwanie |
---|---|
Katalog zatwierdzania kredytu hipotecznego | Usuwanie katalogu |
Przykładowy projekt integracji danych | Usuwanie projektu |
Następne kroki
Wypróbuj inne kursy:
Zarejestruj się, aby skorzystać z innego przypadku użycia struktury danych.
Więcej inform.
Temat nadrzędny: Kursy dotyczące struktury danych