0 / 0
Wróć do wersji angielskiej dokumentacji
Data Science and MLOps use case
Data Science and MLOps use case

Data Science and MLOps use case

Aby zoperacjonalizować analizę danych i tworzenie modelu, przedsiębiorstwo potrzebuje zintegrowanych systemów i procesów. Cloud Pak for Data as a Service udostępnia procesy i technologie pozwalające przedsiębiorstwu na tworzenie i wdrażanie modeli uczenia maszynowego oraz innych aplikacji do nauki danych.

Obejrzyj ten film wideo, aby wyświetlić przypadek użycia sieci Fabric do zaimplementowania rozwiązania Data Science and MLOps w Cloud Pak for Data.

Ten film wideo udostępnia metodę wizualną jako alternatywę dla poniższych kroków opisowych w tej dokumentacji.

Wyzwania

Tworzenie rozwiązań z dziedziny Data Science i MLOps dla przedsiębiorstw wiąże się z rozwiązywaniem tych wyzwań:

Dostęp do wysokiej jakości danych
Organizacje muszą zapewnić łatwy dostęp do wysokiej jakości danych zarządzanych przez zespoły ds. nauki, które wykorzystują dane do budowania modeli.

Operacjonalizacja budowania modelu i wdrażania
Organizacje muszą implementować powtarzalne procesy, aby szybko i efektywnie budować i wdrażać modele w środowiskach produkcyjnych.

Modele monitorowania i przekwalifikowania
Organizacje muszą zautomatyzować monitorowanie i przekwalifikowanie modeli w oparciu o opinie produkcyjne.

Aby rozwiązać te problemy, należy zaimplementować sieć Fabric danych w systemie Cloud Pak for Data as a Service.


Przykład: wyzwania Golden Bank

Podążaj za historią Złotego Banku, ponieważ wdraża on proces Data Science i MLOps, aby rozszerzyć swoją działalność, oferując niskooprocentowane odnawianie kredytów hipotecznych dla aplikacji internetowych. Analitycy danych w Golden Bank muszą stworzyć model zatwierdzania kredytów hipotecznych, który pozwala uniknąć ryzyka i sprawiedliwie traktuje wszystkich wnioskodawców. Muszą one również zautomatyzować przekwalifikowanie modelu w celu zoptymalizowania wydajności modelu.

Proces

Aby zaimplementować program Data Science i MLOps dla przedsiębiorstwa, organizacja może śledzić ten proces:

  1. Przygotowanie i współużytkowanie danych
  2. Budowanie i szkolenie modeli
  3. Wdrażanie modeli
  4. Modele monitorowania
  5. Zautomatyzuj cykl życia AI

Usługi Watson Studio, Watson Machine Learning, Watson OpenScalei Watson Knowledge Catalog w ramach usługi Cloud Pak for Data as a Service udostępniają narzędzia i procesy, których organizacja potrzebuje do zaimplementowania rozwiązania Data Science i MLOps.

Obraz przedstawiający przepływ wielkości liter w nauce danych

1. Przygotowanie i udostępnianie danych do współużytkowania

Naukowcy danych mogą przygotować własne zestawy danych i udostępniać je w katalogu. Katalog służy jako składnica składników, w której zespoły naukowców danych mogą znaleźć wysokiej jakości zasoby danych z funkcjami, których potrzebują. Mogą one dodawać zasoby danych z katalogu do projektu, w którym współpracują w celu przygotowania, analizy i modelowania danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Data Refinery Dostęp i doprecyzowanie danych pochodzących z różnych połączeń źródeł danych.

Materializuje wynikowe zestawy danych jako obrazy stanu w czasie, które mogą łączyć, łączyć lub filtrować dane dla innych naukowców danych w celu analizowania i eksplorowania.

Utwórz wynikowe zestawy danych dostępne w katalogach.
Należy zwizualizować dane, gdy chcesz je ukształtować lub oczyścić.

Chcesz uprościć proces przygotowywania dużych ilości danych surowych do analizy.
Katalogi Użyj katalogów w Watson Knowledge Catalog jako składnicy składników w celu zorganizowania zasobów do współużytkowania wśród współpracowników w organizacji.

Należy skorzystać z wyszukiwania i rekomendacji semantycznych opartych na AI, aby pomóc użytkownikom w znalezieniu tego, co jest im potrzebne.
Użytkownicy muszą łatwo zrozumieć, współpracować, wzbogacać i uzyskiwać dostęp do wysokiej jakości danych.

Użytkownik chce zwiększyć widoczność danych i współpracę między użytkownikami biznesowymi.

Użytkownicy muszą wyświetlać, uzyskiwać dostęp do danych, manipulować nimi i analizować dane bez zrozumienia jego fizycznego formatu lub lokalizacji, a także bez konieczności przenoszenia lub kopiowania danych.

Chcesz, aby użytkownicy zwiększyli zasoby według ocen i ich przeglądu.


Przykład: katalog Golden Bank

Lider zespołu ds. zarządzania tworzy katalog, "katalog zatwierdzania kredytów hipotecznych" i dodaje zarządców danych i naukowców danych jako współpracowników katalogu. Zarządcy danych publikują zasoby danych, które zostały utworzone w katalogu. Naukowcy danych znajdują zasoby danych, kurowane przez dane zarządcze, w katalogu i kopiują te zasoby aplikacyjne do projektu. W swoim projekcie naukowcy danych mogą dopracować dane, aby przygotować go do szkolenia modelu.


2. Buduj i trenuj modele

Aby uzyskać predykcyjne spostrzeżenia oparte na danych, naukowcy danych, analitycy biznesowi i inżynierowie uczenia maszynowego mogą budować i trenować modele. Analitycy danych używają usług Cloud Pak for Data as a Service do budowania modeli AI, zapewniając, że odpowiednie algorytmy i optymalizacje są używane do tworzenia predykcji, które pomagają w rozwiązywaniu problemów biznesowych.

Co można użyć Co można zrobić Najlepiej używać, gdy
AutoAI Użyj opcji AutoAI w programie Watson Studio , aby automatycznie wybierać algorytmy, funkcje inżyniera, generować kandydatów do rurociągów oraz kandydatów do rurociągów modelu.

Następnie należy ocenić ocenione rurociągi i zapisać najlepsze modele.

Wdróż przeszkolone modele w obszarze lub wyeksportuj gazocię modelową, którą lubisz AutoAI , do notatnika, aby go doprecyzować.
Użytkownik chce, aby zaawansowany i zautomatyzowany sposób zbudował dobry zestaw rurociągów szkoleniowych i modeli.

Chcesz mieć możliwość eksportowania wygenerowanych rurociągów w celu ich dopracowania.
Notebooki i skrypty Za pomocą notatników i skryptów w produkcie Watson Studio można napisać własny kod szkoleniowy i kod oceny w języku Python lub R. Użyj zestawów danych uczących, które są dostępne w projekcie, lub połączeń ze źródłami danych, takimi jak bazy danych, jeziora danych lub obiektowa pamięć masowa.

Kod z ulubionymi otwartymi środowiskami źródłowymi i bibliotekami.
Użytkownik chce użyć umiejętności kodowania Python lub R, aby mieć pełną kontrolę nad kodem, który jest używany do tworzenia, uczenia i oceny modeli.
przepływy programuSPSS Modeler Za pomocą przepływów SPSS Modeler w programie Watson Studio można tworzyć własne modele szkolenia, oceny i oceniania przepływów. Użyj zestawów danych uczących, które są dostępne w projekcie, lub połączeń ze źródłami danych, takimi jak bazy danych, jeziora danych lub pamięć masowa obiektów. Użytkownik chce, aby prosty sposób eksplorowania danych i definiowania modelu szkolenia, oceny i oceniania przepływów.
RStudio Analizowanie danych oraz budowanie i testowanie modeli poprzez pracę z R w RStudio. Użytkownik chce użyć środowiska programistycznego do pracy w R.
Decision Optimization Przygotowywanie danych, importowanie modeli, rozwiązywanie problemów i porównywanie scenariuszy, wizualizowanie danych, znajdowanie rozwiązań, tworzenie raportów i zapisywanie modeli w celu wdrożenia przy użyciu produktu Watson Machine Learning. Musisz ocenić miliony możliwości, aby znaleźć najlepsze rozwiązanie problemu z analityką przepisową.
Uczenie stowarzyszone Trenuj wspólny model, który wykorzystuje dane rozproszone. Należy szkolić model bez przenoszenia, łączenia lub współużytkowania danych, które są rozproszone w wielu lokalizacjach.


Przykład: budowa i szkolenie modelu Golden Bank

Naukowcy danych w Golden Bank tworzą model, "Model zatwierdzania kredytów hipotecznych", który pozwala uniknąć nieprzewidywanego ryzyka i traktuje wszystkich wnioskodawców sprawiedliwie. Chcą śledzić historię i wydajność modelu od samego początku, dlatego dodają do niego model case use do "Mortgage Approval Catalog" (Katalog Zatwierdzania Kredytów Hipotecznych). Oni uruchamiają notatnik, aby zbudować model i przewidzieć, które wnioskodawcy kwalifikują się do hipotek. Szczegóły dotyczące szkolenia modelu są automatycznie przechwytywane jako metadane w przypadku użycia modelu.


3. Wdrażanie modeli

Gdy członkowie zespołu ds. operacji wdrażają modele AI, modele stają się dostępne dla aplikacji, które mają być używane do oceniania i predykcji w celu wspomagania działań w napędzie.

Co można użyć Co można zrobić Najlepiej używać, gdy
Interfejs użytkownika obszarów Interfejs użytkownika Spaces w programie Watson Machine Learning służy do wdrażania modeli i innych zasobów aplikacyjnych z projektów do obszarów. Użytkownik chce wdrożyć modele i wyświetlić informacje o wdrożeniu w grupowym obszarze roboczym.


Przykład: wdrożenie modelu Golden Bank

Członkowie zespołu ds. operacji w Golden Bank promują projekt "Model zatwierdzania kredytów hipotecznych" od projektu do miejsca wdrożenia, a następnie tworzy wdrożenie modelu w trybie z połączeniem.


4. Monitorowanie wdrożonych modeli

Po wdrożeniu modeli ważne jest, aby monitorować je, aby upewnić się, że działają poprawnie. Analitycy danych muszą obserwować, jak modelowa wydajność i spójność danych są modelowe.

Co można użyć Co można zrobić Najlepiej używać, gdy
Watson OpenScale Monitorowanie modelu sprawiedliwości modelu w wielu funkcjach.

Monitorowanie wydajności i spójności danych w czasie.

Wyjaśnij, w jaki sposób model dotarł do określonych predykcji z ważonymi czynnikami.

Obsługa i raportowanie modelu zarządzania i cyklu życia w całej organizacji.
Dostępne są opcje chronione lub które mogą przyczyniać się do zapewnienia rzetelności predykcji.

Użytkownik chce śledzić wydajność modelu i spójność danych w czasie.

Użytkownik chce wiedzieć, dlaczego model daje określone predykcje.


Przykład: Model monitorowania modelu Golden Bank

Analitycy danych w Golden Bank wykorzystują Watson OpenScale do monitorowania wdrożonego modelu "Mortgage Approval Model" (Model Kredytu Hipotecznego) w celu zapewnienia rzetelnego i rzetelnego traktowania wszystkich wnioskodawców kredytów hipotecznych typu Golden Bank (Golden Bank). Użytkownicy uruchamiają notatnik w celu skonfigurowania monitorów dla modelu, a następnie tosłabiają konfigurację za pomocą interfejsu użytkownika Watson OpenScale . Korzystając z pomiarów z monitora jakości Watson OpenScale i monitora wartości godziwości, dane naukowcy określają, jak dobrze model przewiduje wyniki, a także, czy wyniki są tendencyjnie osiągane w sposób dwustronny. Dostają też spostrzeżenia na temat tego, jak model przychodzi do decyzji, aby decyzje można było tłumaczyć aplikantami hipotecznymi.


5. Automatyzacja cyklu życia ML

Zespół ten może zautomatyzować i uprościć cykl życia MLOps i AI przy użyciu programu Watson Pipelines.

Co można użyć Co można zrobić Najlepiej używać, gdy
Watson Pipelines Rurociągi umożliwiają tworzenie powtarzalnych i zaplanowanych przepływów, które automatyzują notatnik, Data Refineryi potokowe uczenie maszynowe, począwszy od przyjmowania danych w celu modelowania, testowania i wdrażania. Użytkownik chce zautomatyzować niektóre lub wszystkie kroki w przepływie MLOps.


Przykład: zautomatyzowany cykl życia ML w Golden Bank

Naukowcy danych w Golden Bank mogą korzystać z rurociągów, aby zautomatyzować swoje kompletne dane Data Science i MLOps, a także procesy upraszczające proces przekwalifikowania modelu.


Kursy dla Data Science i MLOps

Samouczek Opis Ekspertyza dla kursu
Harmonizowanie potoku AI z monitorowaniem modelu Trenuj model, awansuj go do miejsca wdrożenia i wdróż model. Uruchom notatnik.
Harmonizacja i potok AI z integracją danych Utwórz potok typu end-to-end, który przygotowuje dane i pociągi modelu. Za pomocą interfejsu Watson Pipelines przeciągnij i upuść interfejs, aby utworzyć potok.

Dodatkowe informacje

Temat nadrzędny: Przegląd rozwiązania dla sieci Fabric