0 / 0
Wróć do wersji angielskiej dokumentacji
Przypadek użycia Multicloud data integration
Przypadek użycia Multicloud data integration

Przypadek użycia Multicloud data integration

Aby radzić sobie z napływem woluminów i zróżnicowaniem źródeł danych, przedsiębiorstwa muszą budować automatyzację i inteligencję w swoich procesach integracji danych. Cloud Pak for Data as a Service udostępnia platformę i narzędzia umożliwiające dynamiczne i inteligentne harmonizowanie danych w rozproszonym krajobrazie w celu utworzenia wydajnej sieci błyskawicznie dostępnych informacji dla konsumentów danych.

Obejrzyj ten film wideo, aby zobaczyć przypadek użycia sieci Fabric do zaimplementowania rozwiązania Multicloud data integration w Cloud Pak for Data.

Ten film wideo udostępnia metodę wizualną jako alternatywę dla poniższych kroków opisowych w tej dokumentacji.

Wyzwania

W miarę wzrostu ich typów danych i woluminów przedsiębiorstwa stoją przed następującymi wyzwaniami w zakresie integracji danych:

Ingesting data from across the enterprise
Processes need to be able to ingest data from any application or system Niezależnie of whether the data rezyduje on the premises, in the cloud, or in a hybrid environment.

Integrowanie danych z wielu źródeł
Organizacje muszą być w stanie zautomatyzować masową spożycie, czyszczenie i złożone transformacje danych.

Udostępnienie danych dla użytkowników
Inżynierowie danych muszą mieć możliwość publikowania wszystkich zintegrowanych zestawów danych w jednym katalogu, a wszyscy użytkownicy, którzy muszą korzystać z danych, muszą mieć do niego dostęp samoobsługowy.

Te wyzwania można rozwiązać, implementując integrację danych z wieloma chmurami za pomocą sieci światłowodowej Cloud Pak for Data as a Service(Pak dla danych w chmurze dla danych).

Przykład: wyzwania Golden Bank

Podążaj za historią Złotego Banku, ponieważ zespół inżynierii danych wdraża integrację danych multicloud. Złoty Bank ma dużą ilość danych klientów i kredytów hipotecznych, które przechowywane są w trzech zewnętrznych źródłach danych. Nadawcy korzystają z tych informacji, aby pomóc im w decydowaniu o tym, czy powinny zatwierdzać lub odmawiać zastosowania hipoteki. Bank chce zintegrować dane z różnych źródeł, a następnie dostarczyć te przetransformowane dane do pojedynczego pliku wyjściowego, który może być współużytkowany.

Proces

Aby zaimplementować rozwiązanie do integracji danych z wieloma chmurami w przedsiębiorstwie, organizacja może śledzić ten proces:

  1. Integrowanie danych
  2. Współużytkowanie danych

Usługi DataStage, Watson Queryi Watson Knowledge Catalog w środowisku Cloud Pak for Data as a Service udostępniają wszystkie narzędzia i procesy, które muszą być zaimplementowane przez organizację użytkownika w celu zaimplementowania rozwiązania integracji danych w chmurze multicloud.

Obraz przedstawiający przepływ pracy w integracji danych z wieloma chmurami

1. Integrowanie danych

Dzięki architekturze danych Cloud Pak for Data as a Serviceinżynierowie danych mogą optymalizować integrację danych przy użyciu obciążeń i strategii danych w celu wydajnego uzyskiwania dostępu do danych i pracy z nimi oraz łączenia zwirtualizowanych danych z różnych źródeł, typów i chmur, tak jakby dane pochodzą z jednego źródła danych. W tym kroku przetwarzane są dane surowe, spożycie, zwirtualizowane i przekształcone w materiały eksploatacyjne, wysokiej jakości dane, które są gotowe do eksplorowanego, a następnie zaaranżowane w cyklu życia AI.

Co można użyć Co można zrobić Najlepiej używać, gdy
Watson Query Zapytanie o wiele źródeł danych jako jedno. Inżynierowie danych mogą tworzyć wirtualne tabele danych, które mogą łączyć, łączyć lub filtrować dane z różnych relacyjnych źródeł danych.

Inżynierowie danych mogą następnie udostępnić wynikowe połączone dane jako zasoby danych w katalogach. Na przykład można użyć połączonych danych do kanałów kontrolnych, notebooków i przepływów, aby dane mogły być eksplorowane.
Aby wygenerować widoki, należy połączyć dane z wielu źródeł.

Należy udostępnić dane łączne jako zasoby danych w katalogu.
DataStage Inżynierowie danych mogą projektować i uruchamiać złożone przepływy danych, które przenoszą i przekształcają dane. Należy zaprojektować i uruchomić złożone przepływy danych, które obsługują duże ilości danych i łączyć się z szeroką gamą źródeł danych, integrować i transformować dane oraz dostarczać je do systemu docelowego w trybie wsadowym lub w czasie rzeczywistym.
Data Refinery Dostęp i doprecyzowanie danych pochodzących ze zróżnicowanych połączeń źródeł danych.

Materializuje wynikowe zestawy danych jako obrazy stanu w czasie, które mogą łączyć, łączyć, filtrować lub maskować dane w celu wykorzystania ich do analizowania i eksplorowania danych przez naukowców.

Tworzenie wynikowych zestawów danych dostępnych w katalogach.
Należy zwizualizować dane, gdy użytkownik chce wprowadzić zmiany.

Chcesz uprościć proces przygotowywania dużych ilości danych surowych do analizy.


Przykład: integracja danych Golden Bank

Analitycy ryzyka w Golden Bank obliczają dzienną stopę procentową, którą rekomendowały oferowanie kredytobiorcom dla każdego zakresu ocen kredytowych. Inżynierowie danych korzystają z programu DataStage w celu agregowania anonimizowanych danych dotyczących aplikacji hipotecznych z danymi identyfikowanymi przez osoby ubiegające się o kredyt hipoteczny. DataStage integruje te informacje, w tym informacje o wyniku kredytowym dla każdego wnioskodawcy, całkowity dług wnioskodawcy oraz tabelę wyszukiwania stopy oprocentowania. Następnie inżynierowie danych ładują dane do docelowego wyjściowego pliku .csv, który może zostać opublikowany w katalogu i udostępniony do współużytkowania przez kredytodawców i analityków.


2. Udostępnij dane do współużytkowania

Katalog pomaga zespołom zrozumieć dane klienta i udostępnia odpowiednie dane do właściwego użycia. Analitycy danych i inni użytkownicy mogą pomóc sobie w zintegrowanych danych, które są im potrzebne, podczas gdy pozostają one zgodne z zasadami dostępu korporacyjnego i ochrony danych. Mogą one dodawać zasoby danych z katalogu do projektu, w którym współpracują w celu przygotowania, analizy i modelowania danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Katalogi Za pomocą katalogów w Watson Knowledge Catalog można organizować zasoby, które mają być współużytkowane przez współpracowników w organizacji.

skorzystać z wyszukiwania i rekomendacji semantycznych opartych na AI, aby pomóc użytkownikom w znalezieniu tego, czego potrzebują.
Użytkownicy muszą łatwo zrozumieć, współpracować, wzbogacać i uzyskiwać dostęp do wysokiej jakości danych.

Użytkownik chce zwiększyć widoczność danych i współpracę między użytkownikami biznesowymi.

Użytkownicy muszą wyświetlać, uzyskiwać dostęp do danych, manipulować nimi i analizować dane bez zrozumienia jego fizycznego formatu lub lokalizacji, a także bez konieczności przenoszenia lub kopiowania danych.

Użytkownik chce, aby użytkownicy zwiększali zasoby według ocen i przeglądania.


Przykład: katalog Golden Bank

Lider zespołu ds. zarządzania w Golden Bank tworzy katalog, "Mortgage Approval Catalog" (Katalog Zatwierdzania Kredytów Hipotecznych) oraz dodaje zarządców danych i naukowców danych jako współpracowników katalogu. Zarządcy danych publikują zasoby danych, które zostały utworzone w katalogu. Naukowcy danych znajdują zasoby danych, kurowane przez dane zarządcze, w katalogu i kopiują te zasoby aplikacyjne do projektu. W swoim projekcie naukowcy danych mogą dopracować dane, aby przygotować go do szkolenia modelu.


Kurs dla integracji danych z wieloma chmurą

Samouczek Opis Ekspertyza dla kursu
Integrowanie danych Wyodrębnij, odfiltruj, dołączaj i transformuj dane. Użyj interfejsu przeciągania i upuszczania DataStage , aby transformować dane.
Wirtualizowanie danych zewnętrznych Wirtualizowanie i łączenie tabel danych ze źródeł zewnętrznych. Za pomocą interfejsu Watson Query można zwirtualizować dane.


Dodatkowe informacje

Temat nadrzędny: Przegląd rozwiązania dla sieci Fabric