0 / 0
Go back to the English version of the documentation
Kurs integracji danych: wirtualizowanie danych zewnętrznych
Last updated: 09 lis 2023
Kurs integracji danych: wirtualizowanie danych zewnętrznych

Ten kurs umożliwia wirtualizowanie danych przechowywanych w trzech zewnętrznych źródłach danych przy użyciu przypadku użycia integracji danych w wersji próbnej produktu Data Fabric. Twoim celem jest użycie Watson Query do tworzenia tabel wirtualnych i łączenia tabel wirtualnych z istniejącymi danymi, które znajdują się w trzech źródłach danych: w Db2 Warehouse, w bazie danych PostgreSQL i w bazie danych MongoDB . Jeśli ukończono kurs Integrate data (Integracja danych), to przy użyciu narzędzia DataStage wykonałeś wiele z tych samych zadań, które ten kurs zrealizował przy użyciu programu Watson Query.

Szybki start: Jeśli nie utworzono jeszcze przykładowego projektu dla tego kursu, należy uzyskać dostęp do przykładowego projektu integracji danych w galerii.

Historia kursu jest taka, że Golden Bank musi stosować się do nowego rozporządzenia, w którym nie może pożyczać osobom ubiegającym się o pożyczkę z niepełnym kwalifikacją. Produkt Watson Query będzie używany do łączenia danych z różnych źródeł danych bez konieczności przenoszenia danych oraz do udostępniania danych wirtualnych innym analitykom danych i inżynierom danych w projekcie.

Poniższy animowany obraz udostępnia szybki podgląd tego, co zostanie wykonane pod koniec tego kursu. Użytkownik nawiąże połączenie z zewnętrznymi źródłami danych, utworzy wirtualne tabele i widoki oraz doda je do projektu. Kliknij obraz, aby wyświetlić większy obraz.

Animowany obraz

Podgląd kursu

W tym kursie zostaną wykonane następujące czynności:

Obejrzyj wideo Obejrzyj ten film wideo, aby wyświetlić podgląd kroków tego kursu. W interfejsie użytkownika wyświetlanym na filmie wideo mogą występować niewielkie różnice. Film wideo ma być towarzyszem napisanego kursu.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.



  • Użyj obrazu wideo

    Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.

    Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:

    Jak korzystać z obrazka w obrazie i rozdziałów

    Uzyskaj pomoc w społeczności

    Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.

    Konfigurowanie okien przeglądarki

    Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.

    Kurs i interfejs użytkownika obok siebie

    Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.

    Początek strony

  • Zarejestruj się, aby korzystać z Cloud Pak for Data as a Service

    Należy zarejestrować się w usłudze Cloud Pak for Data as a Service i udostępnić niezbędne usługi na potrzeby integracji danych.


    Ikona filmów wideo Obejrzyj następujący film wideo, aby dowiedzieć się więcej o strukturze danych w produkcie Cloud Pak for Data.

    Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.

    Sprawdź wymagane udostępnione usługi

    Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 01:06.

    Aby sprawdzić lub udostępnić niezbędne usługi, wykonaj następujące kroki:

    1. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Usługi > Instancje usług.

    2. Użyj listy rozwijanej Produkt , aby określić, czy istnieje istniejąca instancja usługi Watson Query .

    3. Aby utworzyć instancję usługi Watson Query , kliknij opcję Dodaj usługę.

      1. Wybierz opcję Watson Query.

      2. Wybierz plan Lite .

      3. Kliknij makro Create.

    4. Poczekaj, aż usługa Watson Query zostanie udostępniona, co może potrwać kilka minut.

    5. Powtórz te kroki, aby sprawdzić lub udostępnić następujące dodatkowe usługi:

      • Watson Knowledge Catalog
      • Cloud Object Storage

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono udostępnione instancje usługi:

    Udostępnione usługi

    Utwórz przykładowy projekt

    Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 01:46.

    Jeśli dla tego kursu jest już dostępny przykładowy projekt, przejdź do sekcji Czynność 1. W przeciwnym razie wykonaj następujące kroki:

    1. Uzyskaj dostęp do przykładowego projektu integracji danych w galerii.

    2. Kliknij opcję Utwórz projekt.

    3. Jeśli zostanie wyświetlona prośba o powiązanie projektu z instancją Cloud Object Storage , wybierz z listy instancję Cloud Object Storage .

    4. Kliknij makro Create.

    5. Poczekaj na zakończenie importowania projektu, a następnie kliknij opcję Wyświetl nowy projekt , aby sprawdzić, czy projekt i zasoby aplikacyjne zostały pomyślnie utworzone.

    6. Kliknij kartę Zasoby , aby wyświetlić połączenia i przepływ DataStage .

    Uwaga: Może zostać wyświetlony przewodnik przedstawiający kursy dołączone do tego przypadku użycia. Odsyłacze w przewodniku otwierają te instrukcje kursu.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono kartę Zasoby w przykładowym projekcie. Teraz można rozpocząć kurs.

    Przykładowy projekt


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo począwszy od wersji 02:42.

    Połączenia z zewnętrznymi źródłami danych można dodawać na poziomie platformy lub na poziomie usługi. Po dodaniu połączeń na poziomie platformy za pomocą Platform assets catalogmożna łatwo uwzględnić te połączenia w projektach, katalogach i źródłach danych Watson Query . Wykonaj następujące kroki, aby sprawdzić Platform assets catalog.

    1. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Dane > Połączenia platformy.

    2. Jeśli widoczne są istniejące połączenia, oznacza to, że istnieje już Platform assets catalogi można przejść do Zadania 2. Jeśli nie widać żadnych połączeń, ale jest dostępna opcja utworzenia nowego połączenia, można przejść do Czynności 2.
      Przycisk nowego połączenia

    3. Jeśli nie masz Platform assets catalog, kliknij opcję Utwórz katalog. Utwórz Platform assets catalog

    4. Wybierz z listy Cloud Object Storage .

    5. Zaakceptuj wartość domyślną w polu Obsługa duplikatów zasobów.

    6. Kliknij makro Create. Zostanie wyświetlona strona Połączenia platformy .

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono kartę Kontrola dostępu w połączeniach platformy. Na tej karcie można dodawać współpracowników. Na karcie Połączenia można tworzyć połączenia. Ponieważ przykładowy projekt zawiera połączenia, można dodać połączenia dla zewnętrznych źródeł danych do tego katalogu z przykładowego projektu.

    Katalog połączeń platformy


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 03:22.

    Przykładowy projekt integracji danych obejmuje kilka połączeń z zewnętrznymi źródłami danych. Następnie należy dodać trzy połączenia do Platform assets catalog, a następnie można udostępnić te połączenia w produkcie Watson Query. Wykonaj następujące kroki, aby opublikować połączenia z przykładowego projektu w Platform assets catalog.

    1. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Projekty > Wyświetl wszystkie projekty.

    2. Kliknij projekt Integracja danych .

    3. Kliknij kartę Zasoby.

    4. W obszarze Typy zasobówkliknij opcję Dostęp do danych > Połączenia.

    5. Wybierz następujące zasoby aplikacyjne połączenia:

      • Data Fabric (wersja próbna)- Db2 Warehouse
      • Data Fabric (wersja próbna)- MongoDB
      • Data Fabric (wersja próbna)- Databases for PostgreSQL
    6. Kliknij opcję Publikuj w katalogu.

    7. W polu Celwybierz opcję Platform assets catalog.

    8. Kliknij opcję Publikuj.

    9. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Dane > Połączenia platformy , aby wyświetlić trzy połączenia opublikowane w katalogu.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono połączenia platformy z trzema połączeniami. Teraz można dodać źródła danych.

    Połączenia w połączeniach platformy


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 04:05.

    Teraz można dodać te zewnętrzne źródła danych z Platform assets catalog do produktu Watson Query. Aby dodać źródła danych, wykonaj następujące kroki:

    1. Z Cloud Pak for Data menu nawigacyjnego Menu nawigacjiwybierz opcję Dane > Data virtualization.

      Uwaga: Jeśli zostanie wyświetlone powiadomienie o Skonfiguruj katalog podstawowy w celu wymuszenia nadzoru, można bezpiecznie zamknąć to powiadomienie. Konfigurowanie katalogu podstawowego jest opcjonalne.
    2. Na stronie Źródła danych w widoku Tabelakliknij opcję Dodaj połączenie > Istniejące połączenie platformy.
      Dodaj istniejące połączenie

    3. Wybierz opcję Data Fabric (wersja próbna)- Db2 Warehouse.

    4. Kliknij opcję Dodaj.

    5. Powtórz te kroki, aby dodać połączenia Data Fabric Trial-Mongo DB i Data Fabric Trial- Databases for PostgreSQL .

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono źródła danych. Teraz można utworzyć tabelę wirtualną na podstawie danych zapisanych w tych zewnętrznych źródłach danych.

    Źródła danych


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 04:40.

    Użytkownik chce zwirtualizować tabele MORTGAGE_APPLICATION, MORTGAGE_WNIOSKODAWCAi CREDIT_SCORES . Następnie można połączyć pierwsze dwie tabele wirtualne z trzecią tabelą, aby utworzyć nowy widok łączenia wirtualnego. Aby zwirtualizować tabele danych, wykonaj następujące kroki:

    1. W menu usługi kliknij opcję Wirtualizacja > Wirtualizacja.
      Wirtualizowanie w menu usługi

    2. W razie potrzeby przejdź do widoku Tabele i poczekaj, aż tabele zostaną załadowane, co może potrwać do 30 sekund. Aby wyświetlić pełną listę tabel, może być konieczne kliknięcie przycisku Odśwież . Gdy zostanie wyświetlona opcja Dostępne tabele, zostaną załadowane wszystkie tabele. Liczba tabel może się różnić.
      Wirtualizowanie listy dostępnych tabel

    3. Na karcie Tabele przefiltruj tabele na podstawie następujących kryteriów:

      1. Typ źródła: IBM Db2 Warehouse i PostgreSQL

      2. Baza danych: Data Fabric Trial- Db2 Warehouse i Data Fabric Trial- Databases for PostgreSQL

      3. Schemat: BANKOWANIE

    4. Wybierz tabele MORTGAGE_APPLICATION, MORTGAGE_WNIOSKODAWCAi CREDIT_SCORE do wirtualizowania. Można umieścić wskaźnik myszy nad nazwą tabeli, aby wyświetlić pełną nazwę w celu sprawdzenia, czy wybrano poprawne nazwy tabel.

    5. Kliknij opcję Dodaj do koszyka.

    6. Kliknij opcję Wyświetl koszyk , aby wyświetlić wybraną opcję. W tym miejscu można edytować nazwy tabel i schematów lub usunąć wybór z koszyka.

    7. Na razie usuń zaznaczenie pola wyboru obok opcji Przypisz do projektu. To działanie spowoduje udostępnienie tabel wirtualnych na stronie Zwirtualizowane dane .

    8. Kliknij opcję Virtualize(Wirtualizuj).

    9. Kliknij przycisk Potwierdź , aby rozpocząć wirtualizowanie tabel.

    10. Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzoną tabelę.

    Ikona punktu kontrolnego Sprawdź postęp

    Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można utworzyć tabelę wirtualną, łącząc te tabele wirtualne.

    Dane zwirtualizowane


    Początek strony


  • Chcesz utworzyć wirtualny widok łączenia, łącząc tabele wirtualne MORTGAGE_WNIOSKODAWCA i MORTGAGE_APPLICATION. Następnie należy połączyć wynikowy obiekt wirtualny z tabelą wirtualną CREDIT_SCORE, aby utworzyć drugi widok łączenia wirtualnego.

    Widok łączenia wirtualnego 1: łączenie tabel wirtualnych MORTGAGE_WNIOSKODAWCA i MORTGAGE_APPLICATION

    Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 05:59.

    Aby utworzyć pierwszy wirtualny widok łączenia, wykonaj następujące kroki:

    1. Na stronie Dane zwirtualizowane wybierz tabele MORTGAGE_APPLICATION i MORTGAGE_WNIOSKODAWCA do zwirtualizowania.

    2. Zanotuj nazwę schematu. Ta nazwa będzie potrzebna później do uruchomienia zapytania SQL.

    3. Kliknij Łącz.

    4. Na liście kolumn tabeli MORTGAGE_APPLICATION przeciągnij kolumnę ID , aby połączyć ją z kolumną ID w tabeli MORTGAGE_WNIOSKODAWCA .
      Połącz obiekty wirtualne przy użyciu identyfikatora dla klucza

    5. Kliknij przycisk Podgląd , aby wyświetlić podgląd połączonych tabel.

    6. Zamknij okno podglądu.

    7. Kliknij opcję Otwórz w edytorze SQL, a następnie kliknij przycisk Kontynuuj , aby zauważyć, że nie można wrócić do kanwy łączenia. Edytor SQL umożliwia uruchamianie zapytań dla zestawu danych. W takim przypadku należy wyświetlić podgląd rekordów, które będą zawarte w zestawie danych podczas filtrowania według kandydatów z Kalifornii.

      Otwórz edytor SQL

      1. Skopiuj schemat, a następnie usuń istniejące zapytanie. Konieczne będzie wstawienie schematu w następnej instrukcji SQL.

      2. Skopiuj i wklej następującą instrukcję SELECT dla nowego zapytania. Zastąp symbol <your schema> nazwą schematu, która została zanotowane wcześniej.

        SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
        

        Zapytanie wygląda podobnie do zapytania SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
        SELECT, instrukcja

      3. Kliknij opcję Uruchom wszystko.

      4. Po zakończeniu zapytania wybierz zapytanie na karcie Historia . Na karcie Wyniki widać, że tabela jest filtrowana tylko dla kandydatów ze stanu Kalifornia.

      5. Kliknij przycisk Wstecz , aby zamknąć edytor SQL.

    8. Teraz, gdy został wyświetlony podgląd zestawu danych filtrowanego dla kandydatów z Kalifornii, kryteria filtru zostaną dodane do widoku łączenia wirtualnego. Dla tabeli HIPOTECZNY kandydat skopiuj i wklej następującą instrukcję dla kryteriów filtru. Zastąp symbol <your schema> nazwą schematu, która została zanotowane wcześniej.

      "<your-schema>"."MORTGAGE_APPLICANT"."STATE_CODE"='CA'
      

      Kryteria filtrowania są podobne do "DV_IBMID_663002GN1Q". "MORTGAGE_WNIOSKODAWCA". "STATE_CODE" = 'CA'

      Kryteria filtru

    9. Kliknij przycisk Dalej.

    10. Można edytować nazwy kolumn, aby odróżnić kolumny o takiej samej nazwie w obu tabelach. W takim przypadku należy zachować domyślne nazwy kolumn i kliknąć przycisk Dalej.

    11. Na stronie Przypisz i przejrzyj w polu Nazwa widokuwpisz APPLICANTS_APPLICATIONS_JOINED.

    12. Na razie usuń zaznaczenie opcji Przypisz do projektu . Następnie należy utworzyć obiekt wirtualny i przypisać go do projektu integracji danych.

    13. Kliknij opcję Utwórz widok.

    14. Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzony widok łączenia.

    Ikona punktu kontrolnego Sprawdź postęp

    Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można utworzyć drugi wirtualny widok łączenia.

    Dane zwirtualizowane

    Wirtualny widok łączenia 2: łączenie tabel wirtualnych APPLICANTS_APPLICATIONS_JOINED i CREDIT_SCORE

    Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 07:47.

    Aby utworzyć drugi wirtualny widok łączenia, wykonaj następujące kroki:

    1. Na stronie Dane zwirtualizowane wybierz tabele APPLICANTS_APPLICATIONS_JOINED i CREDIT_SCORE do zwirtualizowania.

    2. Kliknij Łącz.

    3. Na liście kolumn tabeli APPLICANTS_APPLICATIONS_JOINED przeciągnij kolumnę EMAIL_ADDRESS , aby połączyć kolumnę EMAIL_ADDRESS w tabeli CREDIT_SCORE .

    4. Kliknij przycisk Podgląd , aby wyświetlić podgląd połączonych tabel.

    5. Zamknij okno podglądu.

    6. Kliknij przycisk Dalej.

    7. Zaakceptuj domyślne nazwy kolumn i kliknij przycisk Dalej.

    8. Na stronie Przypisz i przejrzyj w polu Nazwa widokuwpisz APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED.

    9. Tym razem pozostaw wybraną opcję Przypisz do projektu , a następnie wybierz projekt Integracja danych .

    10. Kliknij opcję Utwórz widok.

    11. Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzony widok łączenia.

    Ikona punktu kontrolnego Sprawdź postęp

    Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można przystąpić do pracy z danymi wirtualnymi w projekcie.

    Dane zwirtualizowane


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 08:27.

    Aby wyświetlić zwirtualizowane zasoby aplikacyjne, należy podać referencje osobiste w postaci klucza API. Jeśli nie masz jeszcze zapisanego klucza API, wykonaj poniższe kroki, aby utworzyć klucz API.

    1. Uzyskaj dostęp do strony kluczy API w konsoli IBM Cloud . Zaloguj się, jeśli zostanie wyświetlone zapytanie.

    2. Na stronie Klucze API kliknij opcję Utwórz klucz API IBM Cloud. Jeśli istnieją jakiekolwiek klucze API, przycisk może mieć etykietę Utwórz.

    3. Wpisz nazwę i opis.

    4. Kliknij makro Create.

    5. Skopiuj klucz API.

    6. Pobierz klucz API do użycia w przyszłości.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono stronę kluczy API. Teraz można wyświetlić tabelę wirtualną w projekcie.

    Strona kluczy API


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 09:01.

    Tabela wirtualna została dodana do projektu wraz z połączeniem z produktem Watson Query. Wykonaj poniższe kroki, aby otworzyć projekt w celu wyświetlenia danych wirtualnych i informacji o połączeniu, które są wymagane do uzyskania dostępu do danych wirtualnych.

    1. Przełącz się z powrotem na Cloud Pak for Data. Z menu nawigacyjnego Menu nawigacjiwybierz opcję Projekty > Wyświetl wszystkie projekty.

    2. Otwórz projekt Integracja danych .

    3. Kliknij kartę Zasoby.

    4. Otwórz dowolne dane zwirtualizowane. Na przykład kliknij zasób danych rozpoczynający się od nazwy schematu, po której następuje nazwa APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED , aby go wyświetlić.

    5. Podaj referencje, aby uzyskać dostęp do zasobu danych.

    6. W polu Metoda uwierzytelnianiawybierz wartość Klucz API.

    7. Wklej klucz API.
      Wklej klucz API

    8. Kliknij przycisk Połącz.

    9. Przewiń zasób danych, aby wyświetlić wszystkich kandydatów ze stanu Kalifornia.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono dane wirtualne w projekcie. Teraz można przystąpić do analizy danych wirtualnych.

    Wyświetl tabelę wirtualną


    Początek strony

Jako inżynier danych w Golden Bank, użyłeś Watson Query do połączenia danych z różnych źródeł i różnych typów. Użyto składni SQL oraz uzyskano dostęp do danych i dane złożone bez przenoszenia danych.

Czyszczenie (opcjonalne)

Jeśli chcesz ponownie skorzystać z kursów w przypadku użycia integracji danych, usuń następujące artefakty.

Artefakt Usuwanie
Połączenia w Platform assets catalog Usuwanie zasobu z katalogu
Dane zwirtualizowane Przejdź do opcji Dane > Data virtualization. Na stronie Zwirtualizowane dane przejdź do menu Menu przepełnienia Przepełnienie dla tabeli i wybierz opcję Usuń.
Źródła danych Przejdź do opcji Dane > Data virtualization. Na stronie Źródła danych kliknij ikonę Ikona usuwania Usuń dla połączenia.
Przykładowy projekt integracji danych Usuwanie projektu

Następne kroki

Więcej inform.

Temat nadrzędny: Kursy dotyczące struktury danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more