0 / 0
Go back to the English version of the documentation
Kurs nadzoru nad danymi: wykorzystanie danych
Last updated: 09 lis 2023
Kurs nadzoru nad danymi: wykorzystanie danych

Ten kurs umożliwia pracę z danymi wysokiej jakości i chronionymi po ukończeniu kursu Curate high quality data tutorial i Protect your data tutorial z zastosowaniem nadzoru nad danymi w wersji próbnej struktury danych. Twoim celem jest ocena, udostępnianie, kształtowanie i analizowanie danych w strukturze danych.

Szybki start: Jeśli nie utworzono jeszcze przykładowego projektu dla tego kursu, należy uzyskać dostęp do przykładowego projektu zarządzania danymi w galerii.

Historia kursu jest taka, że Golden Bank ma kilka działów, które wymagają dostępu do wysokiej jakości danych dotyczących kredytów hipotecznych dla klientów. Analityk danych będzie musiał wyszukać i znaleźć odpowiednie dane, zrozumieć i zaufać ich treści, a następnie przygotować je do użycia przez innych analityków danych i analityków danych.

Poniższy animowany obraz udostępnia szybki podgląd tego, co zostanie wykonane na zakończenie tego kursu, w którym można wyświetlać zasoby katalogowe, ręcznie wzbogacać zasoby i tworzyć relacje, wizualizować dane i filtrować dane w celu poprawy jakości. Kliknij obraz, aby wyświetlić większy obraz.

Animowany obraz

Podgląd kursu

W tym kursie zostaną wykonane następujące czynności:

Obejrzyj wideo Obejrzyj ten film wideo, aby wyświetlić podgląd kroków tego kursu. W interfejsie użytkownika wyświetlanym na filmie wideo mogą występować niewielkie różnice. Film wideo ma być towarzyszem napisanego kursu.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.



  • Użyj obrazu wideo

    Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.

    Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:

    Jak korzystać z obrazka w obrazie i rozdziałów

    Uzyskaj pomoc w społeczności

    Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.

    Konfigurowanie okien przeglądarki

    Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.

    Kurs i interfejs użytkownika obok siebie

    Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.

    Początek strony

  • Ukończ wstępnie wymagane kursy

    Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 00:39.

    Ukończ kursy Curate high quality data i Protect your data :

    • Kurs Curate high quality data (Curate High Quality Data) służy do importowania i wzbogacania zasobów danych oraz publikowania ich w katalogu.
    • Kurs Chroń dane dotyczący tworzenia reguł ochrony danych i maskowania przepływów w celu ochrony danych.

    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 01:12.

    Zasoby danych w katalogach to znacznie więcej niż wskaźniki do danych. Zawierają one informacje o formacie i znaczeniu danych oraz statystyki dotyczące wartości danych. Wykonaj następujące kroki, aby zrozumieć wartość zasobów danych:

    1. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Katalogi > Wyświetl wszystkie katalogi.

    2. Otwórz Katalog zatwierdzania kredytów hipotecznych.

    3. Sekcja wyróżnione zasoby zawiera zasoby Ostatnio dodane , zasoby rekomendowane przez produkt Watson , które są sugerowanymi zasobami pochodzącymi ze sztucznej inteligencji i uczenia maszynowego w oparciu o dotychczasowe wykorzystanie i popularność oraz zasoby wysoko ocenione , które zostały ocenione i przejrzane przez współpracowników.

    4. Kliknij opcję Ukryj wyróżnione zasoby , aby zamknąć tę sekcję.

    5. Wyszukaj łańcuch mortgage.

    6. Kliknij opcję MORTGAGE_APPLICANTS_TRUST , aby wyświetlić ten zasób katalogu. Karta Przegląd i panel boczny udostępniają podstawowe informacje o zasobie, takie jak opis, ocena, znaczniki, gdzie znajduje się zasób, warunki biznesowe, klasy danych i elementy pokrewne.

    7. Kliknij kartę Profil . Informacje o profilu ułatwiają zrozumienie treści, jakości i łatwości używania danych.

    8. Przewiń w prawo, aby znaleźć kolumnę ZIP_CODE .

    9. Klasa danych, która została automatycznie przypisana do kolumny ZIP_CODE to Commercial and Government Entity. Należy zauważyć, że automatycznie przypisana klasa danych może być różna. Ponieważ wartości są kodami poczkowymi, można łatwo ponownie sklasyfikować tę kolumnę. Kliknij listę rozwijaną, aby wyświetlić inne możliwe klasy danych i ich poziomy ufności. Wybierz opcję US Zip Code(Kod pocztowy w Stanach Zjednoczonych).

    10. Kliknij kartę Zasób , aby wyświetlić podgląd danych.

    11. Wróć do karty Przegląd , aby wyświetlić więcej metadanych dotyczących kolumn. Na liście kolumn wyszukaj kolumnę EMPLOYMENT_STATUS , aby wyświetlić metadane zawierające przypisane terminy biznesowe.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono zasób MORTGAGE_APPLICANTS_TRUST w katalogu. Przeanalizowano typ informacji, które Watson Knowledge Catalog automatycznie dodaje do zasobów danych podczas wzbogacania metadanych. W następnym zadaniu zostanie ręcznie wzbogacone ten zasób danych.

    Zasób MORTGAGE_APPLICANTS_TRUST


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 02:49.

    Można zwiększyć wartość zasobów, dodając do nich informacje. Na przykład można dodać opinię o zasobie aplikacyjnym, zaktualizować właściwości zasobu aplikacyjnego i utworzyć relacje w celu połączenia zasobów aplikacyjnych. Aby wzbogacić zasoby i utworzyć relacje, wykonaj następujące kroki:

    1. Dla zasobu katalogu MORTGAGE_APPLICANTS_TRUST kliknij kartę Przegląd . Oceń i skomentuj ten zasób, aby inni mogli go łatwo znaleźć.

      1. Jako ocenę wybierz 5 gwiazdek .

      2. W celu przejrzenia należy skopiować i wkleić następujący tekst:

        This contains high quality customer data from the mortgage system.
        
      3. Kliknij przycisk Submit.

    2. Kliknij kartę Przegląd.

    3. Kliknij ikonę Edytuj Ikona Edytuj znajdującą się obok nazwy zasobu aplikacyjnego, aby edytować nazwę zasobu aplikacyjnego.

      1. Zmień nazwę na:

        MORTGAGE_APPLICANTS_TRUST_PROTECT
        
      2. Kliknij przycisk Zastosuj.

    4. W sekcji Opis w panelu po prawej stronie kliknij przycisk Dodaj Ikona Dodaj.

      Uwaga:

      Jeśli ten zasób aplikacyjny ma istniejący opis, zamiast ikony Dodaj będzie wyświetlana ikona Edytuj Ikona Edytuj .

      1. Skopiuj i wklej następujący opis:

        Mortgage applicants from the Mortgage System
        
      2. Kliknij przycisk Zastosuj.

    5. Ponieważ ten zasób aplikacyjny jest powiązany z pożyczkami hipotecznymi, obok opcji Warunki biznesowenależy kliknąć ikonę Dodaj Ikona Dodaj.

      1. W polu Szukaj wpisz loan.

        Uwaga: Po wpisaniu wyszukiwanego terminu nie trzeba naciskać klawisza Enter. Po wpisaniu wyszukiwanego terminu zostanie wyświetlona lista wyników.
      2. Wybierz opcję Kredyt.

      3. Kliknij opcję Dodaj.

    6. Ponieważ ten zasób zawiera dane osobowe, obok opcji Klasyfikacjekliknij ikonę Dodaj Ikona Dodaj .

      1. Wybierz opcję Informacje umożliwiające identyfikację tożsamości.

      2. Kliknij opcję Dodaj.

    7. Ponieważ ten zasób aplikacyjny jest powiązany z innymi zasobami hipotecznymi, obok pola Elementy pokrewnenależy kliknąć opcję Dodaj elementy pokrewne > Dodaj zasoby pokrewne.

      1. Wybierz opcję Jest powiązane zi kliknij przycisk Dalej.

      2. Wybierz zasoby CREDIT_SCORE i MORTGAGE_APPLICATION , a następnie kliknij opcję Dodaj.

    8. Kliknij opcję MORTGAGE_APPLICATION , aby wyświetlić powiązany zasób.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono kartę Przegląd dla zasobu aplikacyjnego MORTGAGE_APPLICANTS_TRUST_PROTECT w katalogu. Dzięki przeglądaniu, aktualizowaniu właściwości i dodawaniu relacji do zasobów aplikacyjnych zasoby te były bardziej wartościowe. W następnym zadaniu do projektu zostanie dodany wzbogacony zasób aplikacyjny.

    MORTGAGE_APPLICANTS_TRUST z powiązanymi zasobami


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 04:09.

    Zespół analityków danych potrzebuje danych osób ubiegających się o kredyt hipoteczny w projekcie analizy kredytu hipotecznego do uszczegółowienia, wizualizacji, analizy i wykorzystania jako dane szkoleniowe dla modeli. Aby dodać wzbogacone dane do projektu, wykonaj następujące kroki:

    1. Kliknij opcję Katalog zatwierdzenia kredytu hipotecznego w ścieżce nawigacyjnej.
      Ścieżka nawigacji

    2. Na końcu wiersza zasobu aplikacyjnego katalogu MORTGAGE_APPLICANTS_TRUST_PROTECT kliknij menu Menu przepełnienia Overflow i wybierz opcję Add to project(Dodaj do projektu).

      1. Z listy rozwijanej Cel wybierz projekt Zarządzanie danymi .

      2. Kliknij opcję Dodaj.

    3. Po wyświetleniu powiadomienia kliknij opcję Idź do projektu. Jeśli powiadomienie nie zostanie wysłane, należy wykonać następujące czynności:

      1. Kliknij Cloud Pak for Data menu nawigacyjne Menu nawigacji, a następnie wybierz opcję Projekty > Wyświetl wszystkie projekty.

      2. Kliknij projekt Zarządzanie danymi .

    4. W projekcie kliknij kartę Zasoby , aby wyświetlić zasób danych MORTGAGE_APPLICANTS_TRUST_PROTECT .

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono zasób aplikacyjny MORTGAGE_APPLICANTS_TRUST_PROTECT w projekcie. Teraz można przystąpić do wizualizacji danych.

    Zasób aplikacyjny MORTGAGE_APPLICANTS_TRUST_PROTECT w projekcie


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo począwszy od wersji 04:39.

    Należy oczyścić i doprecyzować dane kandydatów do obsługi kredytów hipotecznych, aby przygotować je do pracy z narzędziami analitycznymi i modelami. Szybkim i łatwym sposobem określenia, w jaki sposób należy je ukształtować, jest wizualizacja danych w oknie Data Refinery. Wizualizacja jest oparta na pierwszych 5000 wierszy danych. Aby zwizualizować dane, wykonaj następujące kroki:

    1. Kliknij zasób danych MORTGAGE_APPLICANTS_TRUST_PROTECT , aby wyświetlić podgląd danych.

    2. Kliknij opcję Przygotuj dane , aby otworzyć zasób danych w oknie Data Refineryi poczekać na odczytanie i przetworzenie danych.

    3. W panelu Informacje o tym zasobie aplikacyjnym kliknij przycisk X , aby zamknąć panel.

    4. W panelu Kroki kliknij znak X , aby zamknąć panel.

    5. Kliknij kartę Wizualizacje .

    6. W polu Kolumna do wizualizacjiwybierz pozycję EMPLOYMENT_STATUS.

    7. Kliknij opcję Wizualizuj dane. Narzędzie wybiera wykres kołowy jako najlepszy typ wykresu dla tej kolumny, który przedstawia rozkład kandydatów według statusu zatrudnienia. Należy zwrócić uwagę na sugerowane typy wykresów, które są oznaczone niebieską kropką obok słupka, chmury słów i słonecznienia.

    8. W polu Typ wykresuwybierz typ wykresu Bąbelkowy . Wykres bąbelkowy jest jednym z łatwych sposobów szybkiej wizualizacji rozkładu wartości w konkretnym zestawie danych.

    9. Z listy rozwijanej Typ wykresu wybierz typ wykresu Relacja .

    10. Ten typ wykresu wymaga dwóch kolumn. Wybierz następujące kolumny:

      1. W pierwszej kolumnie wybierz pozycję EMPLOYMENT_STATUS.

      2. Kliknij opcję Dodaj kolejną kolumnę.

      3. Dla drugiej kolumnywybierz EDUCATION.

    11. Za pomocą wykresu Relacja można wybrać punkty końcowe w celu wyświetlenia relacji. Na przykład można wyświetlić status zatrudnienia kandydatów według poziomu wykształcenia.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono zasób aplikacyjny MORTGAGE_APPLICANTS_TRUST_PROTECT wizualizowany w obszarze Data Refinery. Teraz można przystąpić do czyszczenia danych.

    Wizualizacja relacji


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 05:59.

    Nie można przetwarzać kandydatów bez numeru ubezpieczenia społecznego, dlatego należy przejrzeć dane i usunąć wszystkich kandydatów bez numeru ubezpieczenia społecznego. Aby przygotować dane MORTGAGE_APPLICANTS_TRUST_PROTECT, wykonaj następujące czynności:

    • Wyświetl częstotliwość wartości w kolumnie Social_Security_Number.
    • Filtrowanie kandydatów z brakującymi wartościami w kolumnie Social_Security_Number.

    Aby przygotować dane, wykonaj następujące kroki:

    1. W oknie Data Refinerykliknij kartę Profile .

    2. Przewiń w prawo, aby znaleźć kolumnę Social_Security_Number . Zwróć uwagę na kilka brakujących wartości.

    3. Kliknij kartę Dane , aby odfiltrować te rekordy. Na pasku statusu w dolnej części ekranu opcja Data Refinery wskazuje, że PEŁNY ZESTAW DANYCH ma wartość 1101 wierszy.

    4. Jeśli panel Kroki nie jest widoczny, kliknij opcję Kroki , aby otworzyć panel.

    5. Kliknij opcję Nowy krok.

      1. W sekcji Czyść wybierz opcję Filtr.

      2. W polu Kolumna wybierz kolumnę Social_Security_Number .

      3. W polu Operator wybierz opcję Nie jest puste.

      4. Kliknij przycisk Zastosuj. Zauważ, że na pasku statusu w dolnej części ekranu opcja Data Refinery wskazuje, że PEŁNY ZESTAW DANYCH ma 1000 wierszy, ponieważ wiersze z brakującymi numerami ubezpieczenia społecznego są odfiltrowane. Zauważ, że na panelu Kroki zostanie wyświetlony nowy krok z operacją Filtr .

    6. Kliknij kartę Profil .

    7. Przewiń w prawo, aby znaleźć kolumnę Social_Security_Number . Należy zauważyć, że brakujące wartości zniknęły.

    8. Na pasku narzędzi kliknij ikonę Ikona zapisywania Zapisz .

    9. Na pasku narzędzi kliknij ikonę Eksportuj i wybierz opcję Eksportuj bieżące dane do pliku CSV.
      Eksportuj jako ikonę csv

      1. Zapisz plik MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv w folderze lokalnym.

      2. Przejdź do tego folderu i otwórz plik CSV, który zawiera 1000 wierszy i żaden kandydat nie ma numeru ubezpieczenia społecznego.

    10. Wróć do obszaru Cloud Pak for Datai kliknij projekt Zarządzanie danymi w ścieżce nawigacji.
      Ścieżka nawigacji

    11. Kliknij opcję Wszystkie zasobyi znajdź nowy zasób przepływu Data Refinery o nazwie MORTGAGE_APPLICANTS_TRUST_PROTECT_flow.

    Wskazówka: Udoskonalony zestaw danych można zapisać w projekcie lub w zewnętrznym źródle danych, takim jak instancja Db2 Warehouse , w której przechowywane są oryginalne zestawy danych. Więcej informacji na ten temat zawiera sekcja Tworzenie zadań w programie Data Refinery.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono plik MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv , który został udoskonalony w sekcji Data Refinery. Ten zestaw danych zawiera informacje na temat tych osób ubiegających się o kredyt hipoteczny, które dostarczyły numer ubezpieczenia społecznego.

    Udoskonalony zasób danych


    Początek strony

Jako analityk danych dla Golden Bank nauczyłeś się, jak wyszukiwać i odnajdywać właściwe dane, rozumieć i ufać ich treści, a następnie przygotowywać je do użycia przez innych analityków danych i analityków danych.

Czyszczenie (opcjonalne)

Aby ponownie skorzystać z kursów w przypadku zarządzania danymi, należy usunąć następujące artefakty.

Artefakt Usuwanie
Zaimportowane terminy biznesowe Usuwanie artefaktów zarządzania
Kategoria bankowa Usuwanie kategorii
Zasady ochrony danych: Informacje poufne i numer ubezpieczenia społecznego Usuwanie reguł ochrony danych
Katalog zatwierdzania kredytu hipotecznego Usuwanie katalogu
Przykładowy projekt nadzoru nad danymi Usuwanie projektu

Następne kroki

Więcej inform.

Temat nadrzędny: Kursy dotyczące struktury danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more