Przegląd rozwiązania dla sieci Fabric
Po zaimplementowaniu rozwiązania dotyczącego sieci Fabric w produkcie Cloud Pak for Datamożna rozwiązać problemy związane z dostępem do danych, jakością danych, zarządzaniem danymi oraz zarządzaniem danymi i cyklami życia danych i sztucznej inteligencji.
Rozwiązanie do zarządzania danymi w chmurze Cloud Pak for Data udostępnia następujące główne możliwości zarządzania i automatyzowania danych i cykli życia AI:
- Dostęp do danych
- Dostęp do danych można uzyskać w wielu chmurach i w siedzibie w istniejącej architekturze danych.
- Konsumpcja samoobsługowa
- Współużytkowanie i używanie danych oraz innych zasobów aplikacyjnych z całego przedsiębiorstwa w katalogach.
- Skumulowana wiedza
- Należy zapoznać się z danymi za pośrednictwem wspólnego słownika biznesowego. Zaufaj swoim danymi przez historię, pochodzenie i analizę jakości.
- Innowacje grupowe
- Współpraca z innymi osobami w celu wykrycia spostrzeżeń. Przygotowanie danych, analiza danych i budowanie modeli za pomocą zestawu zintegrowanych narzędzi dla wszystkich poziomów doświadczenia.
- Zarządzanie i zgodność
- Zdefiniuj reguły w celu wymuszenia prywatności danych. Śledzenie i dokumentowanie szczegółowej historii modeli AI w celu zapewnienia zgodności.
- Ujednolicony cykl życia
- Automatyzacja budowania, testowania, wdrażania i monitorowania rurociągów danych i modeli AI.
Na poniższej ilustracji pokazano, w jaki sposób sieć światłowodowa danych obsługuje przypadki użycia na platformie Cloud Pak for Data , integrując dostęp do hybrydowych źródeł danych z możliwościami w pojedynczym doświadczeniu interfejsu użytkownika.
Wartość aktywów
Za pomocą struktury danych można transformować dane do zasobów, które gromadzą znaczenie i wartość. Zasoby są czymś więcej niż tylko danymi. Podczas pierwszego tworzenia połączenia ze źródłem danych dostępne są podstawowe informacje na temat uzyskiwania dostępu do danych, tabel, schematów i wartości danych. Dodajesz wartość podczas przyjmowania danych przez wirtualizowanie, transformowanie lub replikowanie w obszarach roboczych nazywanych projektami.
Podczas kuratowania danych należy dodać metadane do zasobów danych. Należy profilować dane w celu sklasyfikowania go i skompilowania statystyk dotyczących wartości. Zasoby aplikacyjne są wzbogacane o słownik biznesowy, który opisuje semantyczne znaczenie danych dla organizacji. Analizujesz jakość danych. Metadane dodawane podczas kuracji są traktowane jako aktywne metadane, ponieważ są generowane automatycznie za pomocą procesów uczenia maszynowego. Po ponownym uruchomieniu kuracji po zmianie danych metadane są aktualizowane w oparciu o zautomatyzowaną analizę danych.
Ponieważ użytkownicy korzystają z zasobów aplikacyjnych w projektach, tworzą one trzeci poziom znaczenia, który opisuje historię wykorzystania zasobu oraz relacje między zasobami. Użytkownicy mogą analizować dane w notebookach lub panelach kontrolnych lub modelach uczenia maszynowego.
Użytkownicy mogą również dodawać informacje do zasobów, takich jak oceny i recenzje, wizualizacje danych, znaczniki i inne relacje.
Na poniższym obrazku pokazano, w jaki sposób zasoby danych akumulują wartość w sieci danych.
Modele są również zasobami. Istnieje możliwość śledzenia wdrożeń i danych wejściowych dla modelu, porównań między modelami, zgodności z protokołami korporacyjnymi i innymi metrykami wydajności.
Przykładowe zastosowania
Cloud Pak for Data as a Service udostępnia cztery przypadki użycia jako części rozwiązania dla sieci Fabric danych. Sieć Fabric danych jest implementowana w sposób przedstawiony w każdym przypadku użycia przez utworzenie jednej lub większej liczby instancji usług, które udostępniają funkcje i narzędzia. Niektóre usługi są uwzględniane w wielu przypadkach użycia.
Przypadki użycia reprezentują sposoby implementowania części rozwiązania w sieci Fabric, dzięki czemu zespoły mogą rozpocząć pracę w trakcie budowania innych części. Możesz zacząć od dowolnego przypadku użycia i dodać innych, tak jak ich potrzebujesz:
- Jeśli model zarządzania danymi jest bardziej dojrzały, należy go uruchomić, ustanawiając słownik biznesowy zgodnie z opisem w przypadku użycia zarządzania danymi.
- Jeśli wymagana jest szybsza wartość czasu, należy rozpocząć od wirtualizacji danych lub nauki o danych, zgodnie z opisem w sekcji Integracja danych oraz przypadków użycia Data Science i MLOps.
- Jeśli konieczne jest zapewnienie zgodności modeli z celami i przepisami organizacji, należy rozpocząć śledzenie modeli zgodnie z opisem w przypadku użycia interfejsu AI do zarządzania.
Zapoznaj się z każdym z przypadków użycia, aby dowiedzieć się, co można osiągnąć oraz narzędzi, których można użyć.
Nadzór nad danymi
Implementowanie zarządzania opartego na metadanych, które zapewnia wiedzę biznesową i definiuje ochronę danych. Udostępnianie wysokiej jakości zasobów danych w katalogach samoobsługowych. Zautomatyzowanie wymuszania zarządzania danymi w celu zapewnienia zgodności z przepisami.
Usługi dla tego przypadku użycia: Watson Knowledge Catalog i IBM Match 360 with Watson.
Integracja danych
Upraszcza i automatyzuje dostęp do wszystkich danych, bez przenoszenia. Harmonizowanie danych w rozproszonym krajobrazie w celu utworzenia sieci natychmiastowych informacji dla konsumentów danych.
Usługi dla tego przypadku użycia: Watson Query, DataStagei Watson Knowledge Catalog.
Data Science and MLOps
Operacjonalizowanie analizy danych i tworzenia modelu za pomocą zautomatyzowanego przepływu pracy, który przygotowuje dane, buduje, wdraża, monitoruje i przepociągi modele.
Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.
Patrz: data Science and MLOps use case.
Zarządzanie AI
Operacjonalizuj zarządzanie sztuczną inteligencją dzięki zautomatyzowanemu przepływowi pracy, który wymusza uczciwość, jakość i wytłumaczalność w modelach.
Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.