0 / 0
Go back to the English version of the documentation
Przegląd rozwiązania do obsługi struktury danych

Przegląd rozwiązania do obsługi struktury danych

Po zaimplementowaniu rozwiązania do obsługi struktury danych w produkcie Cloud Pak for Datamożna rozwiązać problemy związane z dostępem do danych, jakością danych, nadzorem nad danymi oraz zarządzaniem danymi i cyklami życia AI.

Rozwiązanie do obsługi struktury danych w produkcie Cloud Pak for Data udostępnia następujące główne funkcje do zarządzania i automatyzacji cyklu życia danych i sztucznej inteligencji (AI):

Dostęp do danych
Uzyskaj dostęp do danych w wielu chmurach i w środowisku lokalnym w ramach istniejącej architektury danych.
Wykorzystanie samoobsługowe
Współużytkowanie i używanie danych i innych zasobów z całego przedsiębiorstwa w katalogach.
Skumulowana wiedza
Zrozumienie danych za pośrednictwem wspólnego słownika biznesowego. Ufaj swoim danym poprzez analizę historii, pochodzenia i jakości.
Innowacje w pracy grupowej
Współpracuj z innymi osobami w celu uzyskania wglądu. Przygotuj dane, analizuj dane i buduj modele za pomocą zestawu zintegrowanych narzędzi, które pozwolą na osiągnięcie wszystkich poziomów doświadczenia.
Zarządzanie i zgodność
Zdefiniuj reguły wymuszające prywatność danych. Śledzenie i dokumentowanie szczegółowej historii modeli AI w celu zapewnienia zgodności z przepisami.
Ujednolicony cykl życia
Automatyzacja budowania, testowania, wdrażania i monitorowania potoków danych i modeli AI.

Na poniższej ilustracji przedstawiono, w jaki sposób struktura danych obsługuje przypadki użycia na platformie Cloud Pak for Data , integrując dostęp do hybrydowych źródeł danych z funkcjami pojedynczego interfejsu użytkownika.

Obraz przedstawiający strukturę danych z poziomem przypadków użycia, możliwości, źródeł danych i platformy

Wartość aktywów

Dzięki sieci Fabric danych można przekształcić dane w zasoby, które gromadzą znaczenie i wartość. Zasoby są czymś więcej niż tylko danymi. Przy pierwszym tworzeniu połączenia ze źródłem danych dostępne są podstawowe informacje na temat dostępu do danych, tabel, schematów i wartości danych. Użytkownik rozpoczyna dodawanie wartości podczas przyjmowania danych przez wirtualizowanie, transformowanie lub replikowanie ich w obszarach roboczych nazywanych projektami.

Po utworzeniu danych należy dodać metadane do zasobów danych. Dane są profilowane w celu sklasyfikowania ich i skompilowania statystyk dotyczących wartości. Zasoby aplikacyjne wzbogaca się o słownik biznesowy, który opisuje znaczenie semantyczne danych dla organizacji. Analizujesz jakość danych. Metadane dodawane podczas kuracji są traktowane jako aktywne metadane, ponieważ są generowane automatycznie za pomocą procesów uczenia maszynowego. Po ponownym uruchomieniu kuracji po zmianie danych metadane są aktualizowane na podstawie zautomatyzowanej analizy danych.

Gdy użytkownicy korzystają z zasobów aplikacyjnych w projektach, tworzą trzeci poziom znaczenia, który opisuje historię użycia zasobu aplikacyjnego i relacje między zasobami aplikacyjnymi. Użytkownicy mogą analizować dane w notatnikach lub kokpitach albo trenować modele uczenia maszynowego.

Użytkownicy mogą również dodawać informacje do zasobów, takie jak oceny i przeglądy, wizualizacje danych, znaczniki i inne relacje.

Na poniższym obrazku przedstawiono, w jaki sposób zasoby danych gromadzą się w sieci Fabric danych.

Obraz przedstawiający sposób gromadzenia wartości przez zasób danych

Modele są również zasobami. Istnieje możliwość śledzenia wdrożeń i danych wejściowych dla modelu, porównań między modelami, zgodności z protokołami korporacyjnymi i innych metryk wydajności.

Przykładowe zastosowania

Cloud Pak for Data as a Service udostępnia cztery przypadki użycia jako część struktury danych. Sieć Fabric danych można zaimplementować w sposób przedstawiony w każdym przypadku użycia, tworząc co najmniej jedną instancję usługi, która udostępnia funkcje i narzędzia. Niektóre usługi są uwzględniane w wielu przypadkach użycia.

Obraz przedstawiający cztery przypadki użycia struktury danych

Przypadki użycia reprezentują sposoby implementacji części rozwiązania do obsługi struktury danych, dzięki czemu zespoły mogą rozpocząć pracę podczas budowania innych części. Można rozpocząć od dowolnego przypadku użycia i dodać inne w razie potrzeby:

  • Jeśli masz bardziej dojrzały model nadzoru nad danymi, zacznij od utworzenia słownika biznesowego zgodnie z opisem w przypadku użycia funkcji nadzoru nad danymi.
  • Jeśli chcesz szybciej uzyskać korzyści, zacznij od wirtualizacji danych lub analityki danych, zgodnie z opisem w sekcji Integracja danych oraz w sekcji Data Science and MLOps.
  • Aby upewnić się, że modele są zgodne z celami i przepisami organizacji, należy rozpocząć śledzenie modeli zgodnie z opisem w przypadku zastosowania nadzoru nad sztuczną inteligencją.

Zapoznaj się z każdym przypadkiem użycia, aby dowiedzieć się, co można osiągnąć i jakich narzędzi można użyć.

Nadzór nad danymi

Implementacja nadzoru opartego na metadanych, które udostępniają wiedzę biznesową i definiują ochronę danych. Udostępnianie wysokiej jakości zasobów danych w katalogach samoobsługowych. Zautomatyzowane egzekwowanie nadzoru nad danymi w celu zapewnienia zgodności z przepisami.

Usługi dla tego przypadku użycia: Watson Knowledge Catalog i IBM Match 360 with Watson.

Patrz Data governance use case (przypadek użycia zarządzania danymi).

Integracja danych

Upraszcza i automatyzuje dostęp do wszystkich danych bez konieczności ich przenoszenia. Harmonizuje dane w rozproszonym środowisku, tworząc sieć natychmiast dostępnych informacji dla konsumentów danych.

Usługi dla tego przypadku użycia: Watson Query, DataStagei Watson Knowledge Catalog.

Patrz Data integration use case (przypadek użycia integracji danych).

Analityka danych i MLOps

Zautomatyzowany przepływ pracy, który przygotowuje dane, buduje, wdraża, monitoruje i ponownie trenuje modele, pozwala na operowanie analizą danych i tworzeniem modeli.

Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.

Patrz Data Science and MLOps use case (przypadek użycia Data Science and MLOps).

Nadzór nad AI

Usprawnij nadzór nad sztuczną inteligencją dzięki zautomatyzowanemu przepływowi pracy, który egzekwuje sprawiedliwość, jakość i wytłumaczalność w modelach.

Usługi dla tego przypadku użycia: Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog.

Patrz AI governance use case (Zarządzanie sztuczną inteligencją).

Więcej inform.

Temat nadrzędny: Przegląd produktu Cloud Pak for Data as a Service

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more