Translation not up to date
Ten kurs umożliwia wirtualizowanie danych przechowywanych w trzech zewnętrznych źródłach danych przy użyciu przypadku użycia integracji danych w wersji próbnej produktu Data Fabric. Twoim celem jest użycie Watson Query do tworzenia tabel wirtualnych i łączenia tabel wirtualnych z istniejącymi danymi, które znajdują się w trzech źródłach danych: w Db2 Warehouse, w bazie danych PostgreSQL i w bazie danych MongoDB . Jeśli ukończono kurs Integrate data (Integracja danych), to przy użyciu narzędzia DataStage wykonałeś wiele z tych samych zadań, które ten kurs zrealizował przy użyciu programu Watson Query.
Historia kursu jest taka, że Golden Bank musi stosować się do nowego rozporządzenia, w którym nie może pożyczać osobom ubiegającym się o pożyczkę z niepełnym kwalifikacją. Produkt Watson Query będzie używany do łączenia danych z różnych źródeł danych bez konieczności przenoszenia danych oraz do udostępniania danych wirtualnych innym analitykom danych i inżynierom danych w projekcie.
Poniższy animowany obraz udostępnia szybki podgląd tego, co zostanie wykonane pod koniec tego kursu. Użytkownik nawiąże połączenie z zewnętrznymi źródłami danych, utworzy wirtualne tabele i widoki oraz doda je do projektu. Kliknij obraz, aby wyświetlić większy obraz.
Podgląd kursu
W tym kursie zostaną wykonane następujące czynności:
- Skonfiguruj wymagania wstępne.
- Czynność 1: Sprawdź Platform assets catalog.
- Czynność 2: Dodaj połączenia danych do Platform assets catalog.
- Czynność 3: Dodaj źródła danych do Watson Query.
- Czynność 4: Wirtualizowanie tabel danych.
- Czynność 5: Tworzenie wirtualnych widoków łączenia przez łączenie tabel wirtualnych.
- Czynność 6: Generowanie klucza API.
- Czynność 7: Dostęp do widoku łączenia wirtualnego w projekcie.
- Procedura czyszcząca (opcjonalnie)
Obejrzyj ten film wideo, aby wyświetlić podgląd kroków tego kursu. W interfejsie użytkownika wyświetlanym na filmie wideo mogą występować niewielkie różnice. Film wideo ma być towarzyszem napisanego kursu.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Użyj obrazu wideo
Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:
Uzyskaj pomoc w społeczności
Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.
Konfigurowanie okien przeglądarki
Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.
Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.
Początek strony
Zarejestruj się, aby korzystać z Cloud Pak for Data as a Service
Należy zarejestrować się w usłudze Cloud Pak for Data as a Service i udostępnić niezbędne usługi na potrzeby integracji danych.
- Jeśli masz istniejące konto Cloud Pak for Data as a Service , możesz rozpocząć ten kurs. Jeśli masz konto planu Lite, tylko jeden użytkownik na konto może uruchomić ten kurs.
- Jeśli nie masz jeszcze konta Cloud Pak for Data as a Service , zarejestruj się w celu skorzystania z wersji próbnej struktury danych.
Obejrzyj następujący film wideo, aby dowiedzieć się więcej o strukturze danych w produkcie Cloud Pak for Data.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Sprawdź wymagane udostępnione usługi
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 01:06.
Aby sprawdzić lub udostępnić niezbędne usługi, wykonaj następujące kroki:
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Usługi > Instancje usług.
Użyj listy rozwijanej Produkt , aby określić, czy istnieje istniejąca instancja usługi Watson Query .
Aby utworzyć instancję usługi Watson Query , kliknij opcję Dodaj usługę.
Wybierz opcję Watson Query.
Wybierz plan Lite .
Kliknij makro Create.
Poczekaj, aż usługa Watson Query zostanie udostępniona, co może potrwać kilka minut.
Powtórz te kroki, aby sprawdzić lub udostępnić następujące dodatkowe usługi:
- Watson Knowledge Catalog
- Cloud Object Storage
Sprawdź postęp
Na poniższym obrazku przedstawiono udostępnione instancje usługi:
Utwórz przykładowy projekt
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 01:46.
Jeśli dla tego kursu jest już dostępny przykładowy projekt, przejdź do sekcji Czynność 1. W przeciwnym razie wykonaj następujące kroki:
Uzyskaj dostęp do przykładowego projektu integracji danych w galerii.
Kliknij opcję Utwórz projekt.
Jeśli zostanie wyświetlona prośba o powiązanie projektu z instancją Cloud Object Storage , wybierz z listy instancję Cloud Object Storage .
Kliknij makro Create.
Poczekaj na zakończenie importowania projektu, a następnie kliknij opcję Wyświetl nowy projekt , aby sprawdzić, czy projekt i zasoby aplikacyjne zostały pomyślnie utworzone.
Kliknij kartę Zasoby , aby wyświetlić połączenia i przepływ DataStage .
Uwaga: Może zostać wyświetlony przewodnik przedstawiający kursy dołączone do tego przypadku użycia. Odsyłacze w przewodniku otwierają te instrukcje kursu.Sprawdź postęp
Na poniższym obrazku przedstawiono kartę Zasoby w przykładowym projekcie. Teraz można rozpocząć kurs.
Początek strony
Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo począwszy od wersji 02:42.
Połączenia z zewnętrznymi źródłami danych można dodawać na poziomie platformy lub na poziomie usługi. Po dodaniu połączeń na poziomie platformy za pomocą Platform assets catalogmożna łatwo uwzględnić te połączenia w projektach, katalogach i źródłach danych Watson Query . Wykonaj następujące kroki, aby sprawdzić Platform assets catalog.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Dane > Połączenia platformy.
Jeśli widoczne są istniejące połączenia, oznacza to, że istnieje już Platform assets catalogi można przejść do Zadania 2. Jeśli nie widać żadnych połączeń, ale jest dostępna opcja utworzenia nowego połączenia, można przejść do Czynności 2.
Jeśli nie masz Platform assets catalog, kliknij opcję Utwórz katalog.
Wybierz z listy Cloud Object Storage .
Zaakceptuj wartość domyślną w polu Obsługa duplikatów zasobów.
Kliknij makro Create. Zostanie wyświetlona strona Połączenia platformy .
Sprawdź postęp
Na poniższym obrazku przedstawiono kartę Kontrola dostępu w połączeniach platformy. Na tej karcie można dodawać współpracowników. Na karcie Połączenia można tworzyć połączenia. Ponieważ przykładowy projekt zawiera połączenia, można dodać połączenia dla zewnętrznych źródeł danych do tego katalogu z przykładowego projektu.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 03:22.
Przykładowy projekt integracji danych obejmuje kilka połączeń z zewnętrznymi źródłami danych. Następnie należy dodać trzy połączenia do Platform assets catalog, a następnie można udostępnić te połączenia w produkcie Watson Query. Wykonaj następujące kroki, aby opublikować połączenia z przykładowego projektu w Platform assets catalog.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Projekty > Wyświetl wszystkie projekty.
Kliknij projekt Integracja danych .
Kliknij kartę Zasoby.
W obszarze Typy zasobówkliknij opcję Dostęp do danych > Połączenia.
Wybierz następujące zasoby aplikacyjne połączenia:
- Data Fabric (wersja próbna)- Db2 Warehouse
- Data Fabric (wersja próbna)- MongoDB
- Data Fabric (wersja próbna)- Databases for PostgreSQL
Kliknij opcję Publikuj w katalogu.
W polu Celwybierz opcję Platform assets catalog.
Kliknij opcję Publikuj.
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Dane > Połączenia platformy , aby wyświetlić trzy połączenia opublikowane w katalogu.
Sprawdź postęp
Na poniższym obrazku przedstawiono połączenia platformy z trzema połączeniami. Teraz można dodać źródła danych.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo począwszy od wersji 04:05.
Teraz można dodać te zewnętrzne źródła danych z Platform assets catalog do produktu Watson Query. Aby dodać źródła danych, wykonaj następujące kroki:
Z Cloud Pak for Data menu nawigacyjnego wybierz opcję Dane > Data virtualization.
Uwaga: Jeśli zostanie wyświetlone powiadomienie o Skonfiguruj katalog podstawowy w celu wymuszenia nadzoru, można bezpiecznie zamknąć to powiadomienie. Konfigurowanie katalogu podstawowego jest opcjonalne.Na stronie Źródła danych w widoku Tabelakliknij opcję Dodaj połączenie > Istniejące połączenie platformy.
Wybierz opcję Data Fabric (wersja próbna)- Db2 Warehouse.
Kliknij opcję Dodaj.
Powtórz te kroki, aby dodać połączenia Data Fabric Trial-Mongo DB i Data Fabric Trial- Databases for PostgreSQL .
Sprawdź postęp
Na poniższym obrazku przedstawiono źródła danych. Teraz można utworzyć tabelę wirtualną na podstawie danych zapisanych w tych zewnętrznych źródłach danych.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 04:40.
Użytkownik chce zwirtualizować tabele MORTGAGE_APPLICATION, MORTGAGE_WNIOSKODAWCAi CREDIT_SCORES . Następnie można połączyć pierwsze dwie tabele wirtualne z trzecią tabelą, aby utworzyć nowy widok łączenia wirtualnego. Aby zwirtualizować tabele danych, wykonaj następujące kroki:
W menu usługi kliknij opcję Wirtualizacja > Wirtualizacja.
W razie potrzeby przejdź do widoku Tabele i poczekaj, aż tabele zostaną załadowane, co może potrwać do 30 sekund. Aby wyświetlić pełną listę tabel, może być konieczne kliknięcie przycisku Odśwież . Gdy zostanie wyświetlona opcja Dostępne tabele, zostaną załadowane wszystkie tabele. Liczba tabel może się różnić.
Na karcie Tabele przefiltruj tabele na podstawie następujących kryteriów:
Typ źródła: IBM Db2 Warehouse i PostgreSQL
Baza danych: Data Fabric Trial- Db2 Warehouse i Data Fabric Trial- Databases for PostgreSQL
Schemat: BANKOWANIE
Wybierz tabele MORTGAGE_APPLICATION, MORTGAGE_WNIOSKODAWCAi CREDIT_SCORE do wirtualizowania. Można umieścić wskaźnik myszy nad nazwą tabeli, aby wyświetlić pełną nazwę w celu sprawdzenia, czy wybrano poprawne nazwy tabel.
Kliknij opcję Dodaj do koszyka.
Kliknij opcję Wyświetl koszyk , aby wyświetlić wybraną opcję. W tym miejscu można edytować nazwy tabel i schematów lub usunąć wybór z koszyka.
Na razie usuń zaznaczenie pola wyboru obok opcji Przypisz do projektu. To działanie spowoduje udostępnienie tabel wirtualnych na stronie Zwirtualizowane dane .
Kliknij opcję Virtualize(Wirtualizuj).
Kliknij przycisk Potwierdź , aby rozpocząć wirtualizowanie tabel.
Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzoną tabelę.
Sprawdź postęp
Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można utworzyć tabelę wirtualną, łącząc te tabele wirtualne.
Początek strony
Chcesz utworzyć wirtualny widok łączenia, łącząc tabele wirtualne MORTGAGE_WNIOSKODAWCA i MORTGAGE_APPLICATION. Następnie należy połączyć wynikowy obiekt wirtualny z tabelą wirtualną CREDIT_SCORE, aby utworzyć drugi widok łączenia wirtualnego.
Widok łączenia wirtualnego 1: łączenie tabel wirtualnych MORTGAGE_WNIOSKODAWCA i MORTGAGE_APPLICATION
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 05:59.
Aby utworzyć pierwszy wirtualny widok łączenia, wykonaj następujące kroki:
Na stronie Dane zwirtualizowane wybierz tabele MORTGAGE_APPLICATION i MORTGAGE_WNIOSKODAWCA do zwirtualizowania.
Zanotuj nazwę schematu. Ta nazwa będzie potrzebna później do uruchomienia zapytania SQL.
Kliknij Łącz.
Na liście kolumn tabeli MORTGAGE_APPLICATION przeciągnij kolumnę ID , aby połączyć ją z kolumną ID w tabeli MORTGAGE_WNIOSKODAWCA .
Kliknij przycisk Podgląd , aby wyświetlić podgląd połączonych tabel.
Zamknij okno podglądu.
Kliknij opcję Otwórz w edytorze SQL, a następnie kliknij przycisk Kontynuuj , aby zauważyć, że nie można wrócić do kanwy łączenia. Edytor SQL umożliwia uruchamianie zapytań dla zestawu danych. W takim przypadku należy wyświetlić podgląd rekordów, które będą zawarte w zestawie danych podczas filtrowania według kandydatów z Kalifornii.
Skopiuj schemat, a następnie usuń istniejące zapytanie. Konieczne będzie wstawienie schematu w następnej instrukcji SQL.
Skopiuj i wklej następującą instrukcję SELECT dla nowego zapytania. Zastąp symbol
<your schema>
nazwą schematu, która została zanotowane wcześniej.SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
Zapytanie wygląda podobnie do zapytania SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
Kliknij opcję Uruchom wszystko.
Po zakończeniu zapytania wybierz zapytanie na karcie Historia . Na karcie Wyniki widać, że tabela jest filtrowana tylko dla kandydatów ze stanu Kalifornia.
Kliknij przycisk Wstecz , aby zamknąć edytor SQL.
Teraz, gdy został wyświetlony podgląd zestawu danych filtrowanego dla kandydatów z Kalifornii, kryteria filtru zostaną dodane do widoku łączenia wirtualnego. Dla tabeli HIPOTECZNY kandydat skopiuj i wklej następującą instrukcję dla kryteriów filtru. Zastąp symbol
<your schema>
nazwą schematu, która została zanotowane wcześniej."<your-schema>"."MORTGAGE_APPLICANT"."STATE_CODE"='CA'
Kryteria filtrowania są podobne do "DV_IBMID_663002GN1Q". "MORTGAGE_WNIOSKODAWCA". "STATE_CODE" = 'CA'
Kliknij przycisk Dalej.
Można edytować nazwy kolumn, aby odróżnić kolumny o takiej samej nazwie w obu tabelach. W takim przypadku należy zachować domyślne nazwy kolumn i kliknąć przycisk Dalej.
Na stronie Przypisz i przejrzyj w polu Nazwa widokuwpisz
APPLICANTS_APPLICATIONS_JOINED
.Na razie usuń zaznaczenie opcji Przypisz do projektu . Następnie należy utworzyć obiekt wirtualny i przypisać go do projektu integracji danych.
Kliknij opcję Utwórz widok.
Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzony widok łączenia.
Sprawdź postęp
Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można utworzyć drugi wirtualny widok łączenia.
Wirtualny widok łączenia 2: łączenie tabel wirtualnych APPLICANTS_APPLICATIONS_JOINED i CREDIT_SCORE
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 07:47.
Aby utworzyć drugi wirtualny widok łączenia, wykonaj następujące kroki:
Na stronie Dane zwirtualizowane wybierz tabele APPLICANTS_APPLICATIONS_JOINED i CREDIT_SCORE do zwirtualizowania.
Kliknij Łącz.
Na liście kolumn tabeli APPLICANTS_APPLICATIONS_JOINED przeciągnij kolumnę EMAIL_ADDRESS , aby połączyć kolumnę EMAIL_ADDRESS w tabeli CREDIT_SCORE .
Kliknij przycisk Podgląd , aby wyświetlić podgląd połączonych tabel.
Zamknij okno podglądu.
Kliknij przycisk Dalej.
Zaakceptuj domyślne nazwy kolumn i kliknij przycisk Dalej.
Na stronie Przypisz i przejrzyj w polu Nazwa widokuwpisz
APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
.Tym razem pozostaw wybraną opcję Przypisz do projektu , a następnie wybierz projekt Integracja danych .
Kliknij opcję Utwórz widok.
Po zakończeniu wirtualizacji kliknij opcję Idź do zwirtualizowanych danych , aby wyświetlić nowo utworzony widok łączenia.
Sprawdź postęp
Poniższy obrazek przedstawia stronę Virtualized data (Dane zwirtualizowane). Teraz można przystąpić do pracy z danymi wirtualnymi w projekcie.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od strony 08:27.
Aby wyświetlić zwirtualizowane zasoby aplikacyjne, należy podać referencje osobiste w postaci klucza API. Jeśli nie masz jeszcze zapisanego klucza API, wykonaj poniższe kroki, aby utworzyć klucz API.
Uzyskaj dostęp do strony kluczy API w konsoli IBM Cloud . Zaloguj się, jeśli zostanie wyświetlone zapytanie.
Na stronie Klucze API kliknij opcję Utwórz klucz API IBM Cloud. Jeśli istnieją jakiekolwiek klucze API, przycisk może mieć etykietę Utwórz.
Wpisz nazwę i opis.
Kliknij makro Create.
Skopiuj klucz API.
Pobierz klucz API do użycia w przyszłości.
Sprawdź postęp
Na poniższym obrazku przedstawiono stronę kluczy API. Teraz można wyświetlić tabelę wirtualną w projekcie.
Początek strony
Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 09:01.
Tabela wirtualna została dodana do projektu wraz z połączeniem z produktem Watson Query. Wykonaj poniższe kroki, aby otworzyć projekt w celu wyświetlenia danych wirtualnych i informacji o połączeniu, które są wymagane do uzyskania dostępu do danych wirtualnych.
Przełącz się z powrotem na Cloud Pak for Data. Z menu nawigacyjnego wybierz opcję Projekty > Wyświetl wszystkie projekty.
Otwórz projekt Integracja danych .
Kliknij kartę Zasoby.
Otwórz dowolne dane zwirtualizowane. Na przykład kliknij zasób danych rozpoczynający się od nazwy schematu, po której następuje nazwa APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED , aby go wyświetlić.
Podaj referencje, aby uzyskać dostęp do zasobu danych.
W polu Metoda uwierzytelnianiawybierz wartość Klucz API.
Wklej klucz API.
Kliknij przycisk Połącz.
Przewiń zasób danych, aby wyświetlić wszystkich kandydatów ze stanu Kalifornia.
Sprawdź postęp
Na poniższym obrazku przedstawiono dane wirtualne w projekcie. Teraz można przystąpić do analizy danych wirtualnych.
Początek strony
Jako inżynier danych w Golden Bank, użyłeś Watson Query do połączenia danych z różnych źródeł i różnych typów. Użyto składni SQL oraz uzyskano dostęp do danych i dane złożone bez przenoszenia danych.
Czyszczenie (opcjonalne)
Jeśli chcesz ponownie skorzystać z kursów w przypadku użycia integracji danych, usuń następujące artefakty.
Artefakt | Usuwanie |
---|---|
Połączenia w Platform assets catalog | Usuwanie zasobu z katalogu |
Dane zwirtualizowane | Przejdź do opcji Dane > Data virtualization. Na stronie Zwirtualizowane dane przejdź do menu Przepełnienie dla tabeli i wybierz opcję Usuń. |
Źródła danych | Przejdź do opcji Dane > Data virtualization. Na stronie Źródła danych kliknij ikonę Usuń dla połączenia. |
Przykładowy projekt integracji danych | Usuwanie projektu |
Następne kroki
Wypróbuj inne kursy:
Zarejestruj się, aby skorzystać z innego przypadku użycia struktury danych.
Więcej inform.
Temat nadrzędny: Kursy dotyczące struktury danych