Przegląd rozwiązania dla sieci Fabric
Po zaimplementowaniu rozwiązania dotyczącego sieci Fabric w produkcie Cloud Pak for Datamożna rozwiązać problemy związane z dostępem do danych, jakością danych, zarządzaniem danymi oraz zarządzaniem danymi i cyklami życia danych i sztucznej inteligencji.
Rozwiązanie do zarządzania danymi w chmurze Cloud Pak for Data udostępnia następujące główne możliwości zarządzania i automatyzowania danych i cykli życia AI:
Dostęp do danych
Dostęp do danych w wielu chmurach i w siedzibie w istniejącej architekturze danych.
Konsumpcja samoobsługowa
Udostępnij i wykorzystaj dane i inne zasoby aplikacyjne z całego przedsiębiorstwa w katalogach.
Zgromadzona wiedza
Podkreśla swoje dane za pośrednictwem wspólnego słownika biznesowego. Zaufaj swoim danymi przez historię, pochodzenie i analizę jakości.
Collaborative innovation
Współpraca z innymi osobami w celu wykrycia spostrzeżeń. Przygotowanie danych, analiza danych i budowanie modeli za pomocą zestawu zintegrowanych narzędzi dla wszystkich poziomów doświadczenia.
Zarządzanie i zgodność
Definiowanie reguł w celu wymuszenia prywatności danych. Śledzenie i dokumentowanie szczegółowej historii modeli AI w celu zapewnienia zgodności.
Ujednolicony cykl życia
Automatyzacja budowania, testowania, wdrażania i monitorowania rurociągów danych i modeli AI.
Wartość aktywów
Za pomocą struktury danych można transformować dane do zasobów, które gromadzą znaczenie i wartość. Zasoby są czymś więcej niż tylko danymi. Podczas pierwszego tworzenia połączenia ze źródłem danych dostępne są podstawowe informacje na temat uzyskiwania dostępu do danych, tabel, schematów i wartości danych. Dodajesz wartość podczas przyjmowania danych przez wirtualizowanie, transformowanie lub replikowanie w obszarach roboczych nazywanych projektami.
Podczas kuratowania danych należy dodać metadane do zasobów danych. Należy profilować dane w celu sklasyfikowania go i skompilowania statystyk dotyczących wartości. Zasoby aplikacyjne są wzbogacane o słownik biznesowy, który opisuje semantyczne znaczenie danych dla organizacji. Analizujesz jakość danych.
Ponieważ użytkownicy korzystają z zasobów aplikacyjnych w projektach, tworzą one trzeci poziom znaczenia, który opisuje historię wykorzystania zasobu oraz relacje między zasobami. Użytkownicy mogą analizować dane w notebookach lub panelach kontrolnych lub modelach uczenia maszynowego.
Użytkownicy mogą również dodawać informacje do zasobów, takich jak oceny i recenzje, wizualizacje danych, znaczniki i inne relacje.
Na poniższym obrazku pokazano, w jaki sposób zasoby danych akumulują wartość w sieci danych.
Modele są również zasobami. Istnieje możliwość śledzenia wdrożeń i danych wejściowych dla modelu, porównań między modelami, zgodności z protokołami korporacyjnymi i innymi metrykami wydajności.
Przypadki użycia
Cloud Pak for Data as a Service udostępnia cztery przypadki użycia jako części rozwiązania dla sieci Fabric danych. Sieć Fabric danych jest implementowana w sposób przedstawiony w każdym przypadku użycia przez utworzenie jednej lub większej liczby instancji usług, które udostępniają funkcje i narzędzia. Niektóre usługi są uwzględniane w wielu przypadkach użycia.
Przypadki użycia reprezentują sposoby implementowania części rozwiązania w sieci Fabric, dzięki czemu zespoły mogą rozpocząć pracę w trakcie budowania innych części. Możesz zacząć od dowolnego przypadku użycia i dodać innych, tak jak ich potrzebujesz:
- Jeśli model zarządzania danymi jest bardziej dojrzały, należy go uruchomić, ustanawiając słownik biznesowy zgodnie z opisem w przypadku użycia zarządzania danymi.
- Jeśli wymagana jest szybsza wartość czasu, należy rozpocząć od wirtualizacji danych lub nauki o danych, zgodnie z opisem w sekcji Integracja danych oraz przypadków użycia Data Science i MLOps.
- Jeśli konieczne jest zapewnienie zgodności modeli z celami i przepisami organizacji, należy rozpocząć śledzenie modeli zgodnie z opisem w przypadku użycia interfejsu AI do zarządzania.
Zapoznaj się z każdym z przypadków użycia, aby dowiedzieć się, co można osiągnąć oraz narzędzi, których można użyć.
Zarządzanie danymi
Implementowanie zarządzania opartego na metadanych, które zapewnia wiedzę biznesową i definiuje ochronę danych. Udostępnianie wysokiej jakości zasobów danych w katalogach samoobsługowych. Zautomatyzowanie wymuszania zarządzania danymi w celu zapewnienia zgodności z przepisami.
Usługi dla tego przypadku użycia: Watson Knowledge Catalog i IBM Match 360 with Watson.
Patrz sekcja Zarządzanie danymi.
integracja danych
Upraszcza i automatyzuje dostęp do wszystkich danych, bez przenoszenia. Harmonizowanie danych w rozproszonym krajobrazie w celu utworzenia sieci natychmiastowych informacji dla konsumentów danych.
Usługi dla tego przypadku użycia: Watson Query, DataStagei Watson Knowledge Catalog.
Patrz Integracja danych.
Zarządzanie AI
Operacjonalizuj zarządzanie sztuczną inteligencją dzięki zautomatyzowanemu przepływowi pracy, który wymusza uczciwość, jakość i wytłumaczalność w modelach.
Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.
Patrz Zarządzanie sztuczną inteligencją.
Data Science and MLOps
Operacjonalizowanie analizy danych i tworzenia modelu za pomocą zautomatyzowanego przepływu pracy, który przygotowuje dane, buduje, wdraża, monitoruje i przepociągi modele.
Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.
Patrz: data Science and MLOps use case.