Translation not up to date
Ten kurs służy do tworzenia kompleksowego potoku dostarczającego zwięzłe, wstępnie przetworzone i aktualne dane przechowywane w zewnętrznym źródle danych w wersji próbnej produktu Data Fabric. Twoim celem jest wykorzystanie systemu Watson Pipelines do orkiestracji całego przepływu pracy w celu generowania zautomatyzowanych, spójnych i powtarzalnych wyników. Potok korzysta z narzędzi DataStage i AutoAI, które automatyzują kilka aspektów procesu budowania modelu, takich jak inżynieria funkcji i optymalizacja hiperparametrów. AutoAI klasyfikuje algorytmy kandydujące, a następnie wybiera najlepszy model.
Kurs dotyczy tego, że GoldenBank chce rozszerzyć swoją działalność, oferując specjalne odnawianie kredytów hipotecznych o niskiej stopie procentowej dla aplikacji elektronicznych. Aplikacje internetowe rozszerzają zasięg klienta banku i obniżają jego koszty przetwarzania. Zespół będzie korzystać z usługi Watson Pipelines w celu utworzenia potoku danych, który dostarcza aktualne dane dotyczące wszystkich kandydatów do ubiegania się o kredyt hipoteczny, które mogą być używane przez kredytodawców do podejmowania decyzji. Dane są przechowywane w programie Db2 Warehouse. Należy przygotować dane, ponieważ są one potencjalnie niekompletne, nieaktualne i mogą być zaciemnione lub całkowicie niedostępne ze względu na politykę prywatności i suwerenności danych. Następnie zespół musi zbudować model zatwierdzania kredytów hipotecznych na podstawie zaufanych danych, a następnie wdrożyć i przetestować model w środowisku przedprodukcyjnym.
Poniższy animowany obraz udostępnia szybki podgląd tego, co zostanie wykonane pod koniec tego kursu. Użytkownik będzie edytować i uruchamiać potok w celu zbudowania i wdrożenia modelu uczenia maszynowego. Kliknij obraz, aby wyświetlić większy obraz.
Podgląd kursu
W tym kursie zostaną wykonane następujące czynności:
- Skonfiguruj wymagania wstępne.
- Czynność 1: Wyświetlanie zasobów aplikacyjnych w przykładowym projekcie.
- Czynność 2: Eksploracja istniejącego potoku.
- Czynność 3: Dodawanie węzła do potoku.
- Czynność 4: Uruchom potok.
- Czynność 5: Wyświetlanie zasobów, wdrożonego modelu i wdrożenia w trybie z połączeniem.
- Procedura czyszcząca (opcjonalnie)
Obejrzyj ten film wideo, aby wyświetlić podgląd kroków tego kursu. Mogą wystąpić niewielkie różnice w interfejsie użytkownika, który jest wyświetlany w filmie wideo. Film wideo ma być towarzyszem napisanego kursu.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Użyj obrazu wideo
Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:
Uzyskaj pomoc w społeczności
Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.
Konfigurowanie okien przeglądarki
Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.
Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.
Początek strony
Zarejestruj się, aby korzystać z Cloud Pak for Data as a Service
Należy zarejestrować się w usłudze Cloud Pak for Data as a Service i udostępnić niezbędne usługi na potrzeby integracji danych.
- Jeśli masz istniejące konto Cloud Pak for Data as a Service , możesz rozpocząć ten kurs. Jeśli masz konto planu Lite, tylko jeden użytkownik na konto może uruchomić ten kurs.
- Jeśli nie masz jeszcze konta Cloud Pak for Data as a Service , zarejestruj się w celu skorzystania z wersji próbnej struktury danych.
Obejrzyj następujący film wideo, aby dowiedzieć się więcej o strukturze danych w produkcie Cloud Pak for Data.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Sprawdź wymagane udostępnione usługi
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 00:37.
Aby sprawdzić lub udostępnić niezbędne usługi, wykonaj następujące kroki:
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Usługi > Instancje usług.
Użyj listy rozwijanej Produkt , aby określić, czy istnieje istniejąca instancja usługi Watson Studio .
Aby utworzyć instancję usługi Watson Studio , kliknij opcję Dodaj usługę.
Wybierz opcję Watson Studio.
Wybierz plan Lite .
Kliknij makro Create.
Poczekaj, aż usługa Watson Studio zostanie udostępniona, co może potrwać kilka minut.
Powtórz te kroki, aby sprawdzić lub udostępnić następujące dodatkowe usługi:
- Watson Machine Learning
- DataStage
- Cloud Object Storage
Sprawdź postęp
Na poniższym obrazku przedstawiono udostępnione instancje usługi:
Utwórz przykładowy projekt
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 01:14.
Jeśli dla tego kursu jest już dostępny przykładowy projekt, należy pominąć tę czynność. W przeciwnym razie wykonaj następujące kroki:
Uzyskaj dostęp do przykładowego projektu potoku sztucznej inteligencji w galerii.
Kliknij opcję Utwórz projekt.
Jeśli zostanie wyświetlona prośba o powiązanie projektu z instancją Cloud Object Storage , wybierz z listy instancję Cloud Object Storage .
Kliknij makro Create.
Poczekaj na zakończenie importowania projektu, a następnie kliknij opcję Wyświetl nowy projekt , aby sprawdzić, czy projekt i zasoby aplikacyjne zostały pomyślnie utworzone.
Kliknij kartę Zasoby , aby wyświetlić połączenie, przepływy DataStage i definicję danych oraz potok.
Uwaga: Może zostać wyświetlony przewodnik przedstawiający kursy dołączone do tego przypadku użycia. Odsyłacze w przewodniku otwierają te instrukcje kursu.Wskazówka: Jeśli nie są wyświetlane żadne przepływy DataStage , należy wrócić do wyświetlania instancji usług w celu sprawdzenia, czy instancja DataStage została pomyślnie udostępniona. Patrz sekcja Udostępnianie niezbędnych usług.Sprawdź postęp
Na poniższym obrazku przedstawiono kartę Zasoby w przykładowym projekcie. Teraz można rozpocząć kurs.
Powiąż usługę Watson Machine Learning z przykładowym projektem.
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 02:04.
Do utworzenia i wdrożenia modelu będzie używana usługa Watson Machine Learning , dlatego należy wykonać poniższe kroki, aby powiązać instancję usługi Watson Machine Learning z przykładowym projektem.
W projekcie Harmonizacja potoku AI kliknij kartę Zarządzanie.
Kliknij stronę Usługi i integracje .
Kliknij opcję Powiąż usługę.
Zaznacz pole wyboru obok instancji usługi Watson Machine Learning .
Kliknij opcję Powiąż.
Kliknij przycisk Anuluj , aby powrócić do strony Usługi i integracje .
Sprawdź postęp
Na poniższym obrazku przedstawiono stronę Usługi i integracje z wymienioną usługą Watson Machine Learning . Teraz można przystąpić do tworzenia przykładowego projektu.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 02:26.
Przykładowy projekt zawiera kilka zasobów aplikacyjnych, w tym połączenie, definicję danych, dwa przepływy DataStage i potok. Aby wyświetlić te zasoby, wykonaj następujące kroki:
Kliknij kartę Zasoby w projekcie harmonizowania potoku AI, a następnie wyświetl opcję Wszystkie zasoby.
Wszystkie zasoby danych używane w przepływach DataStage i potok są przechowywane w produkcie Data Fabric Trial- Db2 Warehouse w schemacie AI_MORTGAGE . Na poniższym obrazku przedstawiono zasoby aplikacyjne z tego połączenia:
Przepływ Integracja danych dotyczących kredytu hipotecznego DataStage integruje dane dotyczące każdego wnioskodawcy ubiegającego się o kredyt hipoteczny, w tym informacje umożliwiające identyfikację osoby, ze szczegółami jego wniosku, wynikami kredytowymi, statusem nabywcy komercyjnego oraz cenami w wybranym domu każdego kandydata, a następnie tworzy plik sekwencyjny o nazwie
Mortgage_Data.csv
w projekcie zawierającym połączone dane. Na poniższym obrazku przedstawiono przepływ Integracja danych kredytu hipotecznego DataStage .Wskazówka: Jeśli nie są wyświetlane żadne przepływy DataStage , należy wrócić do wyświetlania instancji usług w celu sprawdzenia, czy instancja DataStage została pomyślnie udostępniona. Patrz sekcja Udostępnianie niezbędnych usług.Przepływ Integrowanie zatwierdzeń kredytu hipotecznego DataStage używa danych wyjściowych z pierwszego przepływu DataStage (
Mortgage_Data.csv
) i dalej wzbogaca dane przez integrowanie informacji o każdym zatwierdzeniu wniosku o kredyt hipoteczny. Wynikowy zestaw danych zostanie zapisany w projekcie o nazwieMortgage_Data_with_Approvals.csv
. Na poniższym obrazku przedstawiono przepływ Integrowanie zatwierdzeń kredytów hipotecznych DataStage :Definicja danych Definition_Mortgage_Data dla zasobu danych
Mortgage_Data_with_Approvals.csv
jest tworzona przez przepływ Integrowanie zatwierdzeń kredytu hipotecznego DataStage . Na poniższym obrazku przedstawiono definicję danych:
Sprawdź postęp
Na poniższym obrazku przedstawiono wszystkie zasoby aplikacyjne w przykładowym projekcie. Teraz można przystąpić do eksploracji potoku w przykładowym projekcie.
Początek strony
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo rozpoczynający się od godziny 04:00.
Przykładowy projekt zawiera potok Watson , który automatyzuje następujące zadania:
Uruchom dwa istniejące zadania DataStage .
Utwórz eksperyment AutoAI .
Uruchom eksperyment AutoAI i zapisz model o najlepszej wydajności, który korzysta z wynikowego pliku wyjściowego zadania DataStage jako danych uczących.
Utwórz obszar wdrażania.
Awansuj zapisany model do obszaru wdrażania.
Aby eksplorować potok, wykonaj następujące kroki:
Na karcie Zasoby w projekcie harmonizowania potoku AI wyświetl widok Wszystkie zasoby.
Kliknij opcję Potok zatwierdzania kredytu hipotecznego , aby otworzyć potok.
W początkowej sekcji potoku uruchamiane są kolejno dwa zadania DataStage (Zintegruj Dane Hipoteczne i Integruj zatwierdzenia hipoteczne) w celu połączenia różnych tabel z połączenia Db2 Warehouse on Cloud w spójny zestaw danych, który jest używany jako dane szkoleniowe dla eksperymentu AutoAI .
Kliknij dwukrotnie węzeł Sprawdź status , aby wyświetlić warunek. Ten warunek jest punktem decyzyjnym w potoku w celu potwierdzenia zakończenia pierwszego zadania DataStage z wartością Zakończone lub Zakończone z ostrzeżeniami. Kliknij przycisk Anuluj , aby powrócić do potoku.
Kliknij dwukrotnie węzeł Utwórz eksperyment AutoAI , aby wyświetlić ustawienia. Ten węzeł tworzy eksperyment AutoAI z ustawieniami.
Przejrzyj wartości dla następujących ustawień:
Nazwa eksperymentu AutoAI
Zakres
Typ predykcji
Kolumna predykcji
Klasa dodatnia
Współczynnik podziału danych uczących
Algorytmy do uwzględnienia
Używane algorytmy
Optymalizuj metrykę
Kliknij przycisk Anuluj , aby zamknąć ustawienia.
Kliknij dwukrotnie węzeł Uruchom eksperyment AutoAI , aby wyświetlić ustawienia. Ten węzeł uruchamia eksperyment AutoAI utworzony w węźle Utwórz eksperyment AutoAI , który korzysta z danych wyjściowych zadania DataStage Integrowania Zatwierdzenia Kredytu Hipotecznego .
Przejrzyj wartości dla następujących ustawień:
Eksperyment AutoAI
Zasoby danych treningowych
Przedrostek nazwy modelu
Kliknij przycisk Anuluj , aby zamknąć ustawienia.
Między węzłami Uruchom eksperyment AutoAI i Utwórz obszar wdrażania kliknij dwukrotnie węzeł Czy chcesz wdrożyć model? aby wyświetlić warunek. Wartość Prawda dla tego warunku jest punktem decyzyjnym w potoku, który kontynuuje tworzenie obszaru wdrażania. Kliknij przycisk Anuluj , aby powrócić do potoku.
Kliknij dwukrotnie węzeł Utwórz obszar wdrażania , aby wyświetlić ustawienia. Ten węzeł tworzy nowy obszar wdrażania o podanej nazwie i wymaga danych wejściowych dla usług Cloud Object Storage i Watson Machine Learning .
Przejrzyj wartość ustawienia Nowa nazwa obszaru .
W polu New space COS Instance CRN wybierz z listy instancję Cloud Object Storage .
W polu New space WML Instance CRN wybierz z listy instancję Watson Machine Learning .
Kliknij przycisk Zapisz.
Kliknij dwukrotnie węzeł Awansuj model do obszaru wdrażania , aby wyświetlić ustawienia. Ten węzeł promuje najlepszy model z węzła Uruchom eksperyment AutoAI do obszaru wdrażania utworzonego z węzła Utwórz obszar wdrażania .
Przejrzyj wartości dla następujących ustawień:
Zasoby źródłowe
Docelowa
Kliknij przycisk Anuluj , aby zamknąć ustawienia.
Sprawdź postęp
Na poniższym obrazku przedstawiono początkowy potok. Teraz można przystąpić do edycji potoku w celu dodania węzła.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 06:23.
Potok tworzy model, tworzy obszar wdrażania, a następnie awansuje go do obszaru wdrażania. Aby utworzyć wdrożenie w trybie z połączeniem, należy dodać węzeł. Wykonaj następujące kroki, aby edytować potok w celu zautomatyzowania tworzenia wdrożenia w trybie z połączeniem:
Dodaj węzeł Tworzenie wdrożenia w trybie z połączeniem do kanwy:
Rozwiń sekcję Utwórz na palecie węzłów.
Przeciągnij węzeł Utwórz wdrożenie w trybie z połączeniem na kanwę i upuść go za węzłem Awansuj model do obszaru wdrażania .
Umieść wskaźnik myszy nad węzłem Awansuj model do obszaru wdrażania , aby wyświetlić strzałkę. Połącz strzałkę z węzłem Tworzenie wdrożenia w trybie z połączeniem .
Uwaga: Nazwy węzłów w potoku mogą różnić się od poniższego animowanego obrazu.Połącz komentarz Utwórz wdrożenie w trybie z połączeniem dla awansowanego modelu z węzłem Utwórz wdrożenie w trybie z połączeniem , łącząc kółko w polu komentarza z węzłem.
Uwaga: Nazwy węzłów w potoku mogą różnić się od poniższego animowanego obrazu.Kliknij dwukrotnie węzeł Create online deployment (Utwórz wdrożenie w trybie z połączeniem), aby wyświetlić ustawienia.
Zmień nazwę węzła na
Create Online Deployment
.Obok pola Zasób MLkliknij w menu opcję Wybierz z innego węzła .
Wybierz z listy węzeł Awansuj model do przestrzeni wdrażania . Wybrano identyfikator węzła winning_model .
W polu Nowa nazwa wdrożeniawpisz
mortgage approval model deployment
.W polu Tryb tworzeniawybierz opcję Nadpisz.
Kliknij przycisk Zapisz , aby zapisać ustawienia węzła Utwórz wdrożenie w trybie z połączeniem .
Sprawdź postęp
Na poniższym obrazku przedstawiono ukończony potok. Teraz można uruchomić potok.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 07:38.
Po zakończeniu potoku wykonaj następujące kroki, aby uruchomić potok:
Na pasku narzędzi kliknij opcję Uruchom potok > Uruchom wersję próbną.
Na stronie Definiowanie parametrów potoku wybierz opcję Prawda dla wdrożenia.
Jeśli ma wartość Prawda, wówczas potok weryfikuje wdrożony model i ocenia model.
Jeśli ustawiono wartość Fałsz, potok sprawdza, czy model został utworzony w projekcie przez eksperyment AutoAI , a następnie przegląda informacje o modelu i metryki treningu.
Jeśli jest to pierwsza okazja uruchomienia potoku, zostanie wyświetlona prośba o podanie klucza API. Zasoby rurociągu używają osobistego klucza API IBM Cloud do bezpiecznego uruchamiania operacji bez zakłóceń.
Jeśli masz istniejący klucz API, kliknij opcję Użyj istniejącego klucza API, wklej klucz API i kliknij przycisk Zapisz.
Jeśli nie masz istniejącego klucza API, kliknij opcję Wygeneruj nowy klucz API, podaj nazwę i kliknij przycisk Zapisz. Skopiuj klucz API, a następnie zapisz go do użycia w przyszłości. Po zakończeniu kliknij przycisk Zamknij.
Kliknij przycisk Uruchom , aby uruchomić potok.
Podczas działania potoku przewiń dzienniki skonsolidowane. Wykonanie wersji próbnej może potrwać do 10 minut.
Po zakończeniu każdej operacji wybierz węzeł dla tej operacji na kanwie.
Na karcie Inspektor węzła wyświetl szczegóły operacji.
Kliknij kartę Wyjście węzła , aby wyświetlić podsumowanie wyników dla każdej operacji węzła.
Sprawdź postęp
Na poniższym obrazku przedstawiono potok po zakończeniu okresu próbnego. Teraz można przejrzeć zasoby utworzone przez potok.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 09:48.
Potok utworzył kilka zasobów. Aby wyświetlić zasoby aplikacyjne, wykonaj następujące kroki:
Kliknij nazwę projektu Harmonizuj potok sztucznej inteligencji w ścieżce nawigacji, aby powrócić do projektu.
Na karcie Zasoby wyświetl Wszystkie zasoby.
Wyświetl zasoby danych.
Kliknij zasób danych Mortgage_Data.csv . Ten zasób został utworzony przez zadanie DataStage .
Kliknij nazwę projektu w ścieżce nawigacyjnej, aby powrócić do karty Zasoby aplikacyjne .
Kliknij zasób danych Mortgage_Data_with_Approvals.csv . Ten zasób został utworzony przez zadanie DataStage .
Kliknij nazwę projektu w ścieżce nawigacyjnej, aby powrócić do karty Zasoby aplikacyjne .
Wyświetl model.
Kliknij zasób modelu uczenia maszynowego rozpoczynający się od wartości mortgage_approval_best_model. Eksperyment AutoAI wygenerował kilka kandydatów na model i wybrał ten model jako najlepszy.
Przewiń informacje o modelu.
Kliknij nazwę projektu w ścieżce nawigacyjnej, aby powrócić do karty Zasoby aplikacyjne .
Kliknij kartę Zadania w projekcie, aby wyświetlić informacje o dwóch zadaniach DataStage i jednym uruchomieniu zadania potoku.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Wdrożenia.
Kliknij kartę Obszary .
Kliknij obszar wdrażania Zatwierdzenie kredytu hipotecznego .
Kliknij kartę Zasoby i zapoznaj się z wdrożonym modelem rozpoczynającym się od łańcucha mortgage_approval_best_model.
Kliknij kartę Deployments (Wdrożenia).
Kliknij opcję Wdrażanie modelu zatwierdzenia kredytu hipotecznego , aby wyświetlić wdrożenie.
Wyświetl informacje na karcie Informacje dodatkowe o interfejsie API .
Kliknij kartę Test .
Kliknij kartę Dane wejściowe JSON i zastąp przykładowy tekst następującym tekstem JSON.
{ "input_data": [ { "fields": [ "ID", "NAME", "STREET_ADDRESS", "CITY", "STATE", "STATE_CODE", "ZIP_CODE", "EMAIL_ADDRESS", "PHONE_NUMBER", "GENDER", "SOCIAL_SECURITY_NUMBER", "EDUCATION", "EMPLOYMENT_STATUS", "MARITAL_STATUS", "INCOME", "APPLIEDONLINE", "RESIDENCE", "YRS_AT_CURRENT_ADDRESS", "YRS_WITH_CURRENT_EMPLOYER", "NUMBER_OF_CARDS", "CREDITCARD_DEBT", "LOANS", "LOAN_AMOUNT", "CREDIT_SCORE", "CRM_ID", "COMMERCIAL_CLIENT", "COMM_FRAUD_INV", "FORM_ID", "PROPERTY_CITY", "PROPERTY_STATE", "PROPERTY_VALUE", "AVG_PRICE" ], "values": [ [ null, null, null, null, null, null, null, null, null, null, null, "Bachelor", "Employed", null, 144306, null, "Owner Occupier", 15, 19, 2, 7995, 1, 1483220, 437, null, false, false, null, null, null, 111563 ], [ null, null, null, null, null, null, null, null, null, null, null, "High School", "Employed", null, 45283, null, "Private Renting", 11, 13, 1, 1232, 1, 7638, 706, null, false, false, null, null, null, 547262 ] ] } ] }
Kliknij opcję Predykt. Wyniki wskazują, że pierwszy wnioskodawca nie zostałby zatwierdzony, a drugi wnioskodawca zostanie zatwierdzony.
Sprawdź postęp
Na poniższym obrazku przedstawiono wyniki testu.
Początek strony
Golden Bank użył rozwiązania Watson Pipelines do utworzenia potoku danych, który dostarcza aktualne dane dotyczące wszystkich wnioskodawców ubiegających się o kredyt hipoteczny oraz modelu uczenia maszynowego, który może być używany przez kredytodawców do podejmowania decyzji.
Czyszczenie (opcjonalne)
Aby ponownie wykonać ten kurs, należy usunąć następujące artefakty.
Artefakt | Usuwanie |
---|---|
Wdrażanie modelu zatwierdzania kredytu hipotecznego w obszarze wdrażania zatwierdzania kredytu hipotecznego | Usuwanie wdrożenia |
Obszar wdrażania zatwierdzenia kredytu hipotecznego | Usuwanie obszaru wdrażania |
Harmonizacja przykładowego projektu potoku AI | Usuwanie projektu |
Następne kroki
Wypróbuj następujące kursy:
Zarejestruj się, aby skorzystać z innego przypadku użycia struktury danych.
Więcej inform.
Temat nadrzędny: Kursy dotyczące struktury danych