0 / 0
Přejít zpět na anglickou verzi dokumentace
Případ použití pro Data Science a MLOS

Případ použití pro Data Science a MLOS

K operacionalizaci analýzy dat a vytvoření modelu váš podnik potřebuje integrované systémy a procesy. Cloud Pak for Data as a Service poskytuje procesy a technologie, které vašemu podniku umožňují vyvíjet a implementovat modelové výukové modely a další aplikace pro vědecké poznatky dat.

Podívejte se na toto video, abyste viděli příklad použití datového prostředí Fabric pro implementaci řešení Data Science a MLOS v produktu Cloud Pak for Data.

Toto video poskytuje vizuální metodu jako alternativu k následujícím psaným krokům v této dokumentaci.

Výzvy

Zavedení řešení pro vědu a snižování dat pro podniky zahrnuje řešení těchto problémů:

Přístup k vysoce kvalitním datům
Organizace musí poskytovat snadný přístup k vysoce kvalitním, regulovaným datům týmům pro práci s daty, kteří používají data k sestavení modelů.
Operace budování modelu a implementace
Organizace potřebují implementovat opakovatelné procesy k rychlému a efektivnímu sestavení a implementaci modelů do produkčních prostředí.
Modely monitorování a rekvalifikace
Organizace potřebují automatizovat monitorování a přeškolování modelů na základě zpětné vazby výroby.

Tyto výzvy můžete vyřešit implementací datového prostředí Fabric na Cloud Pak for Data as a Service.


Příklad: výzvy Golden Bank

Sledujte příběh společnosti Golden Bank, protože implementuje proces Data Science a MLOPS, jehož cílem je rozšířit jeho podnikání tím, že nabízí nízkoúrokovou obnovu hypoték pro online aplikace. Vědci dat v Golden Bank musí vytvořit model hypotéční schválení typu, který se vyhýbá riziku a zachází se všemi žadateli spravedlivě. Musí také automatizovat rekvalifikaci na model, aby se optimalizoval výkon modelu.

Proces

Chcete-li implementovat Data Science a MLOps pro váš podnik, může vaše organizace sledovat tento proces:

  1. Připravit a sdílet data
  2. Modely sestavení a vlaku
  3. Implementovat modely
  4. Modely monitorování
  5. Automatizace životního cyklu AI

Produkty Watson Studio, Watson Machine Learning, Watson OpenScalea Watson Knowledge Catalog v produktu Cloud Pak for Data as a Service poskytují nástroje a procesy, které vaše organizace potřebuje k implementaci řešení pro Data Science a MLOps.

Obrázek ukazující tok případu použití dat v oblasti použití dat

1. Příprava a sdílení dat

Vědci dat mohou připravit své vlastní datové sady a sdílet je v katalogu. Katalog slouží jako úložiště funkcí, kde vaše týmy pro práci s daty mohou vyhledávat vysoce kvalitní datová aktiva s funkcemi, které potřebují. Mohou přidávat datová aktiva z katalogu do projektu, kde spolupracují při přípravě, analýze a modelování dat.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Data Refinery Přístup a upřesnění dat z různorodých připojení zdrojů dat.

Materializovat výsledné datové sady jako snímky v čase, které mohou kombinovat, sloučit nebo filtrovat data pro ostatní vědce dat k analýze a prozkoumávání.

Vytvořte výsledné datové sady dostupné v katalozích.
Je třeba vizualizovat data, chcete-li utvářet nebo očistit.

Chcete zjednodušit proces přípravy velkého množství nezpracovaných dat pro analýzu.
Katalogy Katalogy použijte v produktu Watson Knowledge Catalog jako úložiště funkcí k uspořádání vašich aktiv pro sdílení mezi spolupracovníky ve vaší organizaci.

Využijte výhod sémantického vyhledávání a doporučení, které pomohou uživatelům při hledání toho, co potřebují, využívat výhod sémantického vyhledávání a doporučení.
Uživatelé musí snadno pochopit, spolupracovat, obohatit a přistupovat ke kvalitním datům.

Chcete zvýšit viditelnost dat a spolupráci mezi obchodními uživateli.

Potřebujete uživatele k zobrazení, přístupu, manipulaci a analýze dat bez nutnosti porozumět jeho fyzickému formátu nebo umístění a bez nutnosti přesunu nebo kopírování dat.

Chcete, aby uživatelé vylepšili aktiva podle hodnocení a zkontrolovali je.

Příklad: Katalog Golden Bank

Vedoucí týmu správy vytváří katalog "Mortgage Approval Catalog" a přidává data a vědce dat jako spolupracující spolupracovníci. Data stewards publikují datová aktiva, která byla vytvořena do katalogu. Vědci dat vyhledávají datová aktiva, která jsou v katalogu stokována, v katalogu a kopírují tato aktiva do projektu. Ve svém projektu mohou vědci zpřesnit údaje a připravit je na školení modelu.


2. Sestavovací a vlakové modely

Chcete-li získat prediktivní postřehy založené na vašich datech, vědci, obchodní analytici a strojoví inženýři mohou sestavovat a školit modely. Vědci dat používají služby Cloud Pak for Data as a Service k sestavení modelů AI a zajišťují, aby se k vytváření prognóz používaly správné algoritmy a optimalizace, které pomáhají řešit obchodní problémy.

Co lze použít Co můžete dělat Nejlepší pro použití, když
AutoAI Funkci AutoAI v produktu Watson Studio můžete použít k automatickému výběru algoritmů, inženýrských funkcí, generování kandidátů na propojení procesů a školicích kandidátů na propojení procesů.

Potom vyhodnoťte seřazených produktovodů a uložte nejlepší modely jako modely.

Implementujte školené modely na prostor nebo vyexportujte tréninkový plynovod, který se vám líbí z AutoAI , do notebooku, abyste jej vylepšili.
Chcete-li rychle sestavit správnou sadu výukových procesů a modelů, potřebujete pokročilý a automatizovaný způsob sestavení dobré sady výukových programů a modelů.

Chcete-li je upřesnit, chcete exportovat generované produktovody.
Notebooky a skripty Použijte zápisníky a skripty v produktu Watson Studio k zápisu vašeho vlastního kódu školení a vyhodnocení modelu funkce v Python nebo R. Používejte sady dat odborné přípravy, které jsou k dispozici v projektu, nebo připojení ke zdrojům dat, jako jsou databáze, datová jezera nebo úložiště objektů.

Kód s oblíbenými otevřenými zdrojovými rámci a knihovnami.
Chcete použít Python nebo R kódovací schopnosti, abyste měli plnou kontrolu nad kódem, který se používá k vytvoření, trénování a vyhodnocení modelů.
Toky produktuSPSS Modeler Pomocí toků produktu SPSS Modeler v produktu Watson Studio můžete vytvořit vlastní modelování školení, vyhodnocení a hodnocení. Používejte sady dat odborné přípravy, které jsou k dispozici v projektu, nebo připojení ke zdrojům dat, jako jsou databáze, datová jezera nebo úložiště objektů. Chcete jednoduchý způsob prozkoumání dat a definování průběhů modelování, vyhodnocení a přidělení modelu.
Produkt RStudio Analyzujte data a modely sestavení a testování pomocí práce s R v produktu RStudio. Chcete použít vývojové prostředí pro práci v R.
Decision Optimization Připravte data, importujte modely, vyřešte problémy a porovnejte scénáře, vizualizujte data, najděte řešení, vytvářete sestavy a uložte modely pro implementaci s produktem Watson Machine Learning. Musíte vyhodnotit miliony možností, jak najít to nejlepší řešení pro prescriptivní problém analýzy.
Federované učení Vypravovat společný model, který používá distribuovaná data. Je třeba školit model bez přesunu, kombinování nebo sdílení dat, která jsou distribuována na více místech.

Příklad: Modelová budova Golden Bank a odborná příprava

Vědci dat v Golden Bank vytvářejí model, "Model schválení hypotéky", který se vyhýbá nepředpokládanému riziku a zachází se všemi žadateli spravedlivě. Chtějí sledovat historii a výkon modelu od začátku, takže přidají příklad použití modelu do katalogu "Mortgage Approval Catalog". Mají zápisník, který sestaví model a předpovídá, kteří uchazeči mají nárok na hypotéky. Podrobnosti o školení modelu jsou automaticky zachyceny jako metadata v případu použití modelu.


3. Implementace modelů

Když členové týmu implementují vaše modely AI, jsou modely k dispozici pro aplikace, které se mají použít pro přidělení skóre a předpovědi, aby pomohly řídit akce.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Uživatelské rozhraní prostoru Použijte uživatelské rozhraní prostoru k implementaci modelů a dalších aktiv z projektů do prostorů. Chcete implementovat modely a zobrazit informace o implementaci v pracovním prostoru spolupráce.


Příklad: Implementace modelu Golden Bank

Členové operačního týmu na společnosti Golden Bank podporují projekt "Mortgage Approval Model" z projektu na prostor implementace a poté vytvoří implementaci modelu online.


4. Monitorování implementovaných modelů

Po implementaci modelů je důležité je monitorovat, aby se ujistil, že fungují dobře. Vědci dat musí sledovat výkonnost modelu a problémy s konzistencí dat.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Watson OpenScale Monitorujte problémy se spravedlností modelu v rámci více funkcí.

Monitor výkonu modelu a konzistence dat v čase.

Vysvětlete, jak model dorazil k určitým předpovědím s váženými faktory.

Údržba a vytváření sestav o řízení a životním cyklu modelu v rámci vaší organizace.
Máte funkce, které jsou chráněné nebo které mohou přispět k poctivosti předpovědí.

Chcete trasovat výkon modelu a data nekonzistencí dat v čase.

Chcete vědět, proč model dává určité předpovědi.

Příklad: Monitorování modelu Golden Bank

Vědci dat v Golden Bank používají produkt Watson OpenScale k monitorování implementovaného modelu "Mortgage Approval Model", aby bylo zajištěno, že je přesné a zda se všemi hypotékami na hypoteční úvěr společnosti Golden Bank spravedlivě zachází. Spuštění notebooku k nastavení monitorů pro model a poté tweak konfigurace pomocí uživatelského rozhraní Watson OpenScale . Díky metrikám z monitoru kvality produktu Watson OpenScale a monitorování spravedlnosti vám vědci určují, jak dobře model předpovídá výsledky, a za předpokladu, že výsledkem bude zkreslené výsledky. Získává také přehled o tom, jak model přichází k rozhodnutím, aby bylo možné rozhodnutí vysvětlit uchazečům o hypotéku.


5. Automatizace životního cyklu ML

Váš tým může automatizovat a zjednodušit životní cyklus MLOps a AI pomocí produktu Watson Pipelines.

Co lze použít Co můžete dělat Nejlepší pro použití, když
Watson Pipelines Použijte kolony k vytvoření opakovatelných a naplánovaných toků, které zautomatizují zápisník, Data Refinerya ropovody, od požití dat až po modelování školení, testování a nasazení. Chcete automatizovat některé nebo všechny kroky v toku MLOS.

Příklad: Automatizovaný životní cyklus společnosti Golden Bank

Datoví vědci v Golden Bank mohou využívat plynovody k automatizaci kompletního životního cyklu a procesů MLOS, aby zjednodušili proces přeškolení modelu.


Výukové programy pro Data Science a MLOps

Výukový program Popis Odborné znalosti pro výukový program
Koordinujte kolonu AI s monitorováním modelu Vycvičte model, povyšte jej do prostoru implementace a implementujte model. Spusťte notebook.
Instrumentovat propojení procesů AI s integrací dat Vytvořte koncovou kolonu, která připraví data a vlaky vytvoří model. Pomocí přetažení pomocí myši přetáhněte rozhraní Watson Pipelines k vytvoření propojení procesů.

Další informace

Nadřazené téma: Přehled řešení Fabric dat

WatsonX Search