0 / 0
Go back to the English version of the documentation
Przypadek użycia Data Science i MLOps
Last updated: 27 paź 2023
Przypadek użycia Data Science i MLOps

Aby można było operować analizą danych i tworzeniem modeli, przedsiębiorstwo potrzebuje zintegrowanych systemów i procesów. Cloud Pak for Data as a Service udostępnia procesy i technologie, które umożliwiają przedsiębiorstwu tworzenie i wdrażanie modeli uczenia maszynowego i innych aplikacji do analityki danych.

Obejrzyj ten film wideo, aby zapoznać się z przypadkiem użycia implementacji rozwiązania Data Science and MLOps.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.

Wyzwania

Implementując rozwiązanie Data Science and MLOps, można rozwiązać następujące problemy w przedsiębiorstwie:

Uzyskiwanie dostępu do danych wysokiej jakości
Organizacje muszą zapewnić łatwy dostęp do wysokiej jakości, nadzorowanych danych dla zespołów analityki danych, które wykorzystują te dane do budowania modeli.
Tworzenie i wdrażanie modeli
Organizacje muszą implementować powtarzalne procesy, aby szybko i efektywnie budować i wdrażać modele w środowiskach produkcyjnych.
Monitorowanie i ponowne trenowanie modeli
Organizacje muszą zautomatyzować monitorowanie i ponowne szkolenie modeli w oparciu o opinie produkcyjne.

Przykład: wyzwania związane z Złotym Bankiem

Zobacz historię Golden Bank, wdrażając proces Data Science i MLOps, aby rozszerzyć swoją działalność, oferując niskoprocentowe odnawianie kredytów hipotecznych na potrzeby aplikacji internetowych. Analitycy danych w Golden Bank muszą stworzyć model zatwierdzania kredytów hipotecznych, który pozwoli uniknąć ryzyka i sprawiedliwie traktować wszystkich wnioskodawców. Muszą również zautomatyzować ponowne trenowanie modelu, aby zoptymalizować jego wydajność.

Proces

Aby zaimplementować narzędzia Data Science i MLOps dla przedsiębiorstwa, organizacja może postępować zgodnie z następującym procesem:

  1. Przygotowanie i współużytkowanie danych
  2. Budowanie i trenowanie modeli
  3. Wdrażanie modeli
  4. Modele monitorowania
  5. Automatyzacja cyklu życia sztucznej inteligencji

Usługi Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog w ramach usługi Cloud Pak for Data as a Service udostępniają narzędzia i procesy potrzebne organizacji do zaimplementowania rozwiązania Data Science and MLOps.

Obraz przedstawiający przepływ przypadku użycia analityki danych

1. Przygotowanie i udostępnianie danych

Analitycy danych mogą przygotować własne zestawy danych i udostępnić je w katalogu. Katalog służy jako sklep funkcjonalny, w którym zespoły analityków danych mogą znaleźć wysokiej jakości zasoby danych z funkcjami, których potrzebują. Mogą oni dodawać zasoby danych z katalogu do projektu, w którym współpracują w celu przygotowania, analizowania i modelowania danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Data Refinery Uzyskiwanie dostępu do danych pochodzących z różnych połączeń ze źródłami danych i ich precyzowanie.

Materializowanie wynikowych zestawów danych jako obrazów stanu w czasie, które mogą łączyć, łączyć lub filtrować dane dla innych analityków danych w celu ich analizowania i eksplorowania.

Udostępnianie wynikowych zestawów danych w katalogach.
Dane należy zwizualizować, aby je ukształtować lub oczyścić.

Aby uprościć proces przygotowywania dużych ilości danych surowych do analizy.
Katalogi Katalogi w produkcie Watson Knowledge Catalog mogą być używane jako sklep funkcjonalny do organizowania zasobów, które mają być współużytkowane przez współpracowników w organizacji.

Korzystanie z opartego na sztucznej inteligencji wyszukiwania semantycznego i rekomendacji ułatwiających użytkownikom znajdowanie potrzebnych informacji.
Użytkownicy muszą łatwo zrozumieć, współpracować, wzbogacić i uzyskać dostęp do danych o wysokiej jakości.

Chcesz zwiększyć widoczność danych i współpracę między użytkownikami biznesowymi.

Potrzebni są użytkownicy, którzy mogą wyświetlać, uzyskiwać dostęp do danych, manipulować nimi i je analizować bez zrozumienia ich fizycznego formatu lub położenia oraz bez konieczności przenoszenia lub kopiowania.

Użytkownicy powinni ulepszać zasoby, oceniając je i przeglądając.

Przykład: katalog Golden Bank

Lider zespołu nadzoru tworzy katalog "Mortgage Approval Catalog" (Katalog zatwierdzania kredytów hipotecznych) i dodaje zarządców danych i analityków danych jako współpracowników katalogu. Zarządcy danych publikują utworzone przez siebie zasoby danych w katalogu. Analitycy danych znajdują zasoby danych, którymi kierują się zarządcy danych, w katalogu i kopiują je do projektu. W swoim projekcie analitycy danych mogą udoskonalić dane, aby przygotować je do trenowania modelu.


2. Budowanie i trenowanie modeli

Analitycy danych, analitycy danych, analitycy biznesowi i inżynierowie ds. uczenia maszynowego mogą tworzyć i trenować modele. Analitycy danych korzystają z usług Cloud Pak for Data as a Service do budowania modeli AI, zapewniając, że odpowiednie algorytmy i optymalizacje są używane do tworzenia predykcji, które pomagają w rozwiązywaniu problemów biznesowych.

Co można użyć Co można zrobić Najlepiej używać, gdy
AutoAI Użyj opcji AutoAI w Watson Studio , aby automatycznie wybrać algorytmy, funkcje inżynierskie, wygenerować kandydatów do potoku i kandydatów do potoku modelu.

Następnie oceń ocenione potoki i zapisz najlepsze jako modele.

Wdróż wytrenowane modele w obszarze lub wyeksportuj potok szkoleniowy modelu, który lubisz, z obszaru AutoAI do notatnika, aby go doprecyzować.
Potrzebny jest zaawansowany i zautomatyzowany sposób szybkiego budowania dobrego zestawu potoków i modeli treningowych.

Użytkownik chce mieć możliwość eksportowania wygenerowanych potoków w celu ich doprecyzowania.
Notebooki i skrypty Użyj notatników i skryptów w Watson Studio , aby napisać własny trening z modelem inżynierskim funkcji i kod ewaluacyjny w języku Python lub R. Użyj zestawów danych treningowych, które są dostępne w projekcie, lub połączeń ze źródłami danych, takimi jak bazy danych, jeziora danych lub obiektowa pamięć masowa.

Kod z ulubionymi środowiskami i bibliotekami Open Source.
Chcesz użyć umiejętności programowania w języku Python lub R, aby mieć pełną kontrolę nad kodem używanym do tworzenia, trenowania i oceniania modeli.
przepływySPSS Modeler Przepływy SPSS Modeler w Watson Studio umożliwiają tworzenie własnych przepływów uczenia, ewaluacji i oceniania modeli. Użyj zestawów danych treningowych, które są dostępne w projekcie, lub połączeń ze źródłami danych, takimi jak bazy danych, jeziora danych lub obiektowa pamięć masowa. Potrzebujesz prostego sposobu na eksplorację danych i definiowanie przepływów uczenia, ewaluacji i oceniania modelu.
RStudio Analizuj dane oraz buduj i testuj modele, pracując z R w RStudio. Chcesz użyć środowiska programistycznego do pracy w języku R.
Decision Optimization Przygotuj dane, zaimportuj modele, rozwiąż problemy i porównaj scenariusze, zwizualizuj dane, znajdź rozwiązania, utwórz raporty i zapisz modele do wdrożenia za pomocą rozwiązania Watson Machine Learning. Musisz ocenić miliony możliwości, aby znaleźć najlepsze rozwiązanie problemu z analizą preskryptywną.
Stowarzyszona nauka Wytrenuj wspólny model, który korzysta z danych rozproszonych. Model należy trenować bez przenoszenia, łączenia lub współużytkowania danych, które są rozproszone w wielu lokalizacjach.

Przykład: Budowa i szkolenie modelu Golden Bank

Analitycy danych w Golden Bank tworzą model "Mortgage Approval Model", który pozwala uniknąć nieprzewidzianego ryzyka i sprawiedliwie traktuje wszystkich kandydatów. Chcą śledzić historię i wydajność modelu od początku, więc dodają przypadek użycia modelu do katalogu "Mortgage Approval Catalog" (Katalog zatwierdzania kredytów hipotecznych). Uruchamiają notatnik, aby zbudować model i przewidzieć, którzy kandydaci kwalifikują się do kredytów hipotecznych. Szczegóły treningu modelu są automatycznie przechwytywane jako metadane w przypadku użycia modelu.


3. Wdrażanie modeli

Gdy członkowie zespołu operacyjnego wdrażają modele AI, stają się one dostępne dla aplikacji, które mogą być używane do oceniania i przewidywania w celu wspomagania działań.

Co można użyć Co można zrobić Najlepiej używać, gdy
Interfejs użytkownika przestrzeni Interfejs użytkownika aplikacji Obszary służy do wdrażania modeli i innych zasobów aplikacyjnych z projektów do obszarów. Użytkownik chce wdrożyć modele i wyświetlić informacje o wdrożeniu w grupowym obszarze roboczym.


Przykład: wdrażanie modelu Golden Bank

Członkowie zespołu operacyjnego w banku Golden Bank promują model "Mortgage Approval Model" (Model zatwierdzania kredytów hipotecznych) z projektu do obszaru wdrażania, a następnie tworzą wdrożenie modelu w trybie z połączeniem.


4. Modele wdrożone w programie Monitor

Po wdrożeniu modeli należy je monitorować, aby upewnić się, że działają poprawnie. Analitycy danych muszą obserwować problemy z wydajnością modelu i spójnością danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Watson OpenScale Problemy z jasnością modelu monitorowania w wielu funkcjach.

Wydajność modelu monitorowania i spójność danych w czasie.

Wyjaśnij, w jaki sposób model dotarł do pewnych predykcji z ważonymi czynnikami.

Zachować nadzór nad modelem i jego cykl życia oraz generować raporty na ich temat w całej organizacji.
Istnieją funkcje, które są chronione lub mogą przyczynić się do zapewnienia rzetelności predykcji.

Chcesz śledzić wydajność modelu i spójność danych w czasie.

Chcesz wiedzieć, dlaczego model daje pewne predykcje.

Przykład: monitorowanie modelu Golden Bank

Analitycy danych z Golden Bank używają rozwiązania Watson OpenScale do monitorowania wdrożonego modelu "Mortgage Approval Model" (Model zatwierdzania kredytów hipotecznych), aby zapewnić jego dokładność i sprawiedliwe traktowanie wszystkich wnioskodawców ubiegających się o kredyt hipoteczny z Golden Bank. Użytkownicy uruchamiają notatnik w celu skonfigurowania monitorów dla modelu, a następnie dotrą konfigurację za pomocą interfejsu użytkownika Watson OpenScale . Korzystając z pomiarów z monitora jakości i monitora sprawiedliwości Watson OpenScale , analitycy danych określają, jak dobrze model przewiduje wyniki i czy generuje wyniki obciążone uprzedzeń. Uzyskają również informacje na temat sposobu, w jaki model odnosi się do decyzji, tak aby decyzje można było wyjaśnić wnioskodawcom ubiegającym się o kredyt hipoteczny.


5. Zautomatyzuj cykl życia ML

Dzięki rozwiązaniu Watson PipelinesTwój zespół może zautomatyzować i uprościć cykl życia technologii MLOps i AI.

Co można użyć Co można zrobić Najlepiej używać, gdy
Watson Pipelines Za pomocą potoków można tworzyć powtarzalne i zaplanowane przepływy, które automatyzują potoki notatników, Data Refineryi uczenia maszynowego, od przyjmowania danych do uczenia modelowego, testowania i wdrażania. Chcesz zautomatyzować niektóre lub wszystkie kroki w przepływie MLOps.

Przykład: zautomatyzowany cykl życia ML Golden Bank

Analitycy danych w Golden Bank mogą korzystać z rurociągów do automatyzacji całego cyklu życia i procesów związanych z analityką danych i MLOps, aby uprościć proces przekwalifikowania modelu.


Kursy dotyczące analityki danych i MLOps

Samouczek Opis Wiedza specjalistyczna na potrzeby kursu
Harmonizacja potoku AI z monitorowaniem modelu Wytrenuj model, awansuj go do obszaru wdrażania i wdróż model. Uruchom notatnik.
Harmonizacja potoku AI z integracją danych Utwórz kompleksowy potok, który przygotowuje dane i trenuje model. Aby utworzyć potok, użyj interfejsu Watson Pipelines przeciągania i upuszczania.

Więcej inform.

Temat nadrzędny: Przegląd rozwiązania do obsługi sieci światłowodowej danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more