0 / 0
Přejděte zpět na anglickou verzi dokumentace
Případ použití Multicloud data integration
Případ použití Multicloud data integration

Případ použití Multicloud data integration

Aby bylo možné se vypořádat s přílivem svazků a různorodých zdrojů dat, musí podniky sestavovat automatizaci a inteligenci do svých procesů integrace dat. Cloud Pak for Data as a Service poskytuje platformu a nástroje k dynamickému a inteligentnímu koordinování dat v rámci distribuované krajiny za účelem vytvoření vysoce výkonné sítě okamžitě dostupných informací pro spotřebitele dat.

Podívejte se na toto video a prohlédněte si příklad použití datového prostředí Fabric pro implementaci řešení Multicloud data integration v produktu Cloud Pak for Data.

Toto video poskytuje vizuální metodu jako alternativu k následujícím psaným krokům v této dokumentaci.

Výzvy

Vzhledem k tomu, že jejich datové typy a objemy rostou, podniky čelí těmto problémům s integrací dat:

Příjem dat z celého podniku
Procesy musí být schopen přijímat data z jakékoli aplikace nebo systému bez ohledu na to, zda jsou tato data uložena v prostorách, v cloudu nebo v hybridním prostředí.

Integrace dat z více zdrojů
Organizace musí být schopné automatizovat hromadné požití, vyčištění a komplexní transformace dat.

Zpřístupnění dat pro uživatele
Inženýři dat musí být schopni publikovat každou integrovanou datovou sadu do jednoho katalogu a všichni uživatelé, kteří potřebují spotřebovávat data, musí mít k sobě samoobslužný přístup.

Tyto výzvy můžete vyřešit implementací vícehlasné integrace dat s datovým prostředím Fabric na Cloud Pak for Data as a Service.

Příklad: výzvy Golden Bank

Postupujte podle příběhu Golden Bank, protože tým pro data engineering implementuje mnohřadnou integraci dat. Společnost Golden Bank má velké množství zákaznických a hypotečních dat, která jsou uložena ve třech externích zdrojích dat. Odesílatelé používají tyto informace, aby jim pomohly rozhodnout se, zda mají schválit nebo odepřít hypoteční aplikace. Banka chce integrovat data z různých zdrojů a poté dodat, že transformovaná data budou transformována do jednoho výstupního souboru, který lze sdílet.

Zpracování

Chcete-li implementovat vícehlasité řešení integrace dat pro váš podnik, může vaše organizace sledovat tento proces:

  1. Integrace dat
  2. Sdílet data

Služby DataStage, Watson Querya Watson Knowledge Catalog v produktu Cloud Pak for Data as a Service poskytují všechny nástroje a procesy, které vaše organizace potřebuje k implementaci vícehlasového řešení integrace dat.

Obrázek zobrazující tok případu použití integrace s více velkými daty

1. Integrace dat

S architekturou datového prostředí Fabric, která používá Cloud Pak for Data as a Service, mohou datové inženýři optimalizovat integraci dat pomocí pracovních zátěží a zásad pro práci s daty pro efektivní přístup a práci s daty a kombinování virtualizovaných dat z různých zdrojů, typů a cloudů, jako kdyby data byla z jednoho zdroje dat. V tomto kroku procesu jsou nezpracovaná data extrahována, požity, virtualizována a transformována na spotřební, vysoce kvalitní data, která jsou připravena k prozkoumání a poté jsou koordinována ve vašem životním cyklu AI.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Watson Query Dotaz na mnoho zdrojů dat jako jeden. Inženýři dat mohou vytvářet virtuální datové tabulky, které mohou kombinovat, spojovat nebo filtrovat data z různých relačních zdrojů dat.

Data inženýři pak mohou vytvořit výsledná kombinovaná data, která jsou k dispozici jako datová aktiva v katalozích. Sloučenými daty můžete například použít kombinovaná data k posuvu řídicích panelů, notebooků a toků, aby bylo možné prozkoumat data.
Chcete-li generovat zobrazení, musíte zkombinovat data z více zdrojů.

Je třeba, aby byla kombinovaná data dostupná jako datová aktiva v katalogu.
DataStage Datoví inženýři mohou navrhovat a spouštět komplexní toky dat, které přesouvají a transformují data. Je třeba navrhnout a spustit komplexní datové toky, které manipulují s velkými objemy dat a které se připojují k širokému spektru zdrojů dat, integrují a transformují data a doručí je do vašeho cílového systému v dávkách nebo v reálném čase.
Data Refinery Přístup a upřesnění dat z různorodých připojení zdrojů dat.

Materializovat výsledné datové sady jako snímky v čase, který může kombinovat, sloučit, filtrovat nebo maskovat data, aby byla použitelná pro data vědců analyzovat a prozkoumat.

Zpřístupněte výsledné datové sady dostupné v katalozích.
Je třeba vizualizovat data, když chcete provádět změny.

Chcete zjednodušit proces přípravy velkého množství nezpracovaných dat pro analýzu.


Příklad: Integrace dat společnosti Golden Bank

Analytici rizik v Golden Bank vypočítávají denní úrokovou sazbu, kterou doporučují zájemcům vypůjčovatelům za každou úvěrovou bonitu. Datoví inženýři používají DataStage k agregaci anonymizovaných dat aplikace hypotéky s osobními identifikovatelnými informacemi od žadatelů o hypotéky. Volba DataStage integruje tyto informace, včetně informací o skóre úvěru pro každého žadatele, celkového dluhu žadatele a vyhledávací tabulky mezi jednotlivými sazbami. Data inženýři pak načtou data do cílového výstupního souboru CSV, který lze publikovat do katalogu a sdílený pro použití poskytovateli věřitelů a analytiků.


2. Sdílení dat

Katalog pomáhá vašim týmům porozumět vašim zákaznickým datům a poskytuje správné údaje pro správné použití. Vědci dat a další typy uživatelů si mohou pomoci s integrovanými daty, které potřebují, zatímco zůstanou v souladu s podnikovými zásadami přístupu k datům a s ochranou dat. Mohou přidávat datová aktiva z katalogu do projektu, kde spolupracují při přípravě, analýze a modelování dat.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Katalogy Katalogy v produktu Watson Knowledge Catalog použijte k uspořádání vašich aktiv pro sdílení mezi spolupracovníky ve vaší organizaci.

Využijte výhod sémantického vyhledávání a doporučení, které pomohou uživatelům při hledání toho, co potřebují, využívat výhod.
Uživatelé musí snadno pochopit, spolupracovat, obohatit a přistupovat ke kvalitním datům.

Chcete zvýšit viditelnost dat a spolupráci mezi obchodními uživateli.

Potřebujete uživatele k zobrazení, přístupu, manipulaci a analýze dat bez nutnosti porozumět jeho fyzickému formátu nebo umístění a bez nutnosti přesunu nebo kopírování dat.

Chcete, aby uživatelé vylepšili aktiva podle hodnocení a zkontrolovali je.


Příklad: Katalog Golden Bank

Vedoucí týmu správy společnosti Golden Bank vytváří katalog, "program pro schvalování hypoték" a přidává data a vědce dat jako spolupracovníci katalogu. Data stewards publikují datová aktiva, která byla vytvořena do katalogu. Vědci dat vyhledávají datová aktiva, která jsou v katalogu stokována, v katalogu a kopírují tato aktiva do projektu. Ve svém projektu mohou vědci zpřesnit údaje a připravit je na školení modelu.


Výukový program pro integraci s více hlasitými daty

Výukový program Popis Odborné znalosti pro výukový program
Integrovat data Extrahujte, filtrujte, připojujte a transformujte svá data. K transformaci dat použijte přetažení pomocí myši DataStage pro transformaci dat.
Virtualizace externích dat Virtualizujte a slučujte datové tabulky z externích zdrojů. K virtualizaci dat použijte rozhraní produktu Watson Query .


Další informace

Nadřazené téma: Přehled řešení Fabric dat