0 / 0
Go back to the English version of the documentation
Příklad použití datové vědy a MLOps
Last updated: 27. 10. 2023
Příklad použití datové vědy a MLOps

Chcete-li provádět analýzu dat a vytváření modelů, váš podnik potřebuje integrované systémy a procesy. Produkt Cloud Pak for Data as a Service poskytuje procesy a technologie, které vašemu podniku umožňují vyvíjet a implementovat modely strojového učení a další aplikace pro datové vědy.

Podívejte se na toto video, abyste viděli případ použití pro implementaci řešení Data Science a MLOps.

Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.

Výzvy

Můžete vyřešit následující výzvy pro váš podnik implementací příkladu použití datové vědy a MLOps:

Přístup k vysoce kvalitním datům
Organizace musí poskytovat snadný přístup k vysoce kvalitním a řízeným datům pro týmy zabývající se datovými vědou, které tato data používají k sestavování modelů.
Operace sestavení a implementace modelu
Organizace musí implementovat opakovatelné procesy, aby mohly rychle a efektivně sestavovat a implementovat modely do produkčních prostředí.
Modely monitorování a opětovného trénování
Organizace potřebují automatizovat monitorování a retrénování modelů na základě produkční zpětné vazby.

Příklad: výzvy zlaté banky

Sledujte příběh Golden Bank, protože implementuje proces datové vědy a MLOps, aby rozšířil své podnikání tím, že nabízí nízkorozpočtové hypotéky pro online aplikace. Datoví vědci ve společnosti Golden Bank musí vytvořit model schvalování hypoték, který se vyhýbá riziku a chová se ke všem žadatelům spravedlivě. Musí také automatizovat retrénování modelu, aby optimalizovali výkon modelu.

Proces

Chcete-li implementovat datové vědy a MLOps pro váš podnik, může vaše organizace postupovat podle tohoto procesu:

  1. Příprava a sdílení dat
  2. Sestavení a trénování modelů
  3. Implementovat modely
  4. Modely monitorování
  5. Automatizace životního cyklu AI

Služby Watson Studio, Watson Machine Learning, Watson OpenScalea Watson Knowledge Catalog v produktu Cloud Pak for Data as a Service poskytují nástroje a procesy, které vaše organizace potřebuje k implementaci řešení Data Science and MLOps.

Obrázek ukazující tok příkladu použití datové vědy

1. Připravte a sdílejte data

Datoví vědci mohou připravit vlastní datové sady a sdílet je v katalogu. Katalog slouží jako úložiště funkcí, kde vaše týmy datových vědců mohou najít vysoce kvalitní datová aktiva s funkcemi, které potřebují. Mohou přidávat datová aktiva z katalogu do projektu, kde spolupracují na přípravě, analýze a modelování dat.

Co můžete použít Co můžete udělat Nejlepší použít, když
Data Refinery Přístup k datům z různých připojení zdrojů dat a jejich upřesnění.

Materializujte výsledné datové sady jako snímky v čase, které mohou sloučit, spojit nebo filtrovat data pro další datové specialisty, aby je mohli analyzovat a zkoumat.

Zpřístupněte výsledné datové sady v katalozích.
Potřebujete vizualizovat data, když je chcete formovat nebo vyčistit.

Chcete zjednodušit proces přípravy velkého množství nezpracovaných dat pro analýzu.
Katalogy Katalogy v produktu Watson Knowledge Catalog použijte jako úložiště funkcí k uspořádání aktiv, která mají být sdílena mezi spolupracovníky ve vaší organizaci.

Využijte výhod sémantického vyhledávání založeného na umělé inteligenci a doporučení, která uživatelům pomohou najít to, co potřebují.
Uživatelé musí snadno pochopit, spolupracovat, obohatit a přistupovat k vysoce kvalitním datům.

Chcete-li zvýšit viditelnost dat a spolupráci mezi firemními uživateli.

Potřebujete, aby uživatelé zobrazovali, přistupovali, manipulovali a analyzovali data bez pochopení jejich fyzického formátu nebo umístění a aniž by je museli přesouvat nebo kopírovat.

Chcete, aby uživatelé rozšířili svá aktiva jejich hodnocením a přezkoumáním.

Příklad: Katalog zlaté banky

Vedoucí týmu řízení vytvoří katalog "Katalog schvalování hypoték" a přidá datové správce a datové specialisty jako katalogové spolupracovníky. Správci dat publikují datová aktiva, která vytvořili, do katalogu. Datoví analytikové naleznou datová aktiva, jejichž kurátorem jsou správci dat, v katalogu a zkopírují je do projektu. Ve svém projektu mohou datoví vědci data upřesnit a připravit je na trénování modelu.


2. Stavět a trénovat modely

Chcete-li získat prediktivní poznatky na základě vašich dat, mohou datoví vědci, obchodní analytici a inženýři strojového učení sestavovat a trénovat modely. Datoví vědci používají služby Cloud Pak for Data as a Service k sestavení modelů AI a zajišťují, aby byly použity správné algoritmy a optimalizace k vytváření předpovědí, které pomáhají řešit obchodní problémy.

Co můžete použít Co můžete udělat Nejlepší použít, když
AutoAI Pomocí volby AutoAI v produktu Watson Studio můžete automaticky vybrat algoritmy, navrhnout funkce, generovat kandidáty na propojení procesů a trénovat kandidáty na propojení procesů.

Poté vyhodnoťte ohodnocená propojení procesů a uložte to nejlepší jako modely.

Nasaďte natrénované modely do prostoru nebo vyexportujte propojení procesů trénování modelu, které se vám líbí, z AutoAI do zápisníku, abyste jej upřesnili.
Chcete rozšířený a automatizovaný způsob, jak rychle vytvořit dobrou sadu trénovacích kanálů a modelů.

Chcete být schopni vyexportovat vygenerované kanály, abyste je upřesnili.
Notebooky a skripty Použijte zápisníky a skripty v produktu Watson Studio k napsání vlastního kódu pro školení a vyhodnocení inženýrských modelů funkcí v jazyce Python nebo R. Použijte trénovací datové sady, které jsou k dispozici v projektu, nebo připojení ke zdrojům dat, jako jsou databáze, jezera dat nebo úložiště objektů.

Kód s oblíbenými rámci a knihovnami typu open source.
Chcete použít Python nebo R kódovací dovednosti, abyste měli úplnou kontrolu nad kódem, který se používá k vytváření, trénování a vyhodnocování modelů.
SPSS Modeler toků Pomocí toků SPSS Modeler v produktu Watson Studio můžete vytvářet vlastní toky trénování modelu, vyhodnocování a vyhodnocování. Použijte trénovací datové sady, které jsou k dispozici v projektu, nebo připojení ke zdrojům dat, jako jsou databáze, jezera dat nebo úložiště objektů. Chcete jednoduchý způsob, jak prozkoumat data a definovat toky trénování modelu, vyhodnocení a přidělení skóre.
RStudio Analyzujte data a sestavujte a testujte modely pomocí R v RStudio. Chcete použít vývojové prostředí pro práci v R.
Decision Optimization Příprava dat, import modelů, řešení problémů a porovnání scénářů, vizualizace dat, hledání řešení, vytváření sestav a ukládání modelů pro implementaci pomocí produktu Watson Machine Learning. Musíte vyhodnotit miliony možností, abyste našli nejlepší řešení problému s preskriptivní analýzou.
Federované učení Trénujte obecný model, který používá distribuovaná data. Musíte trénovat model bez přesouvání, kombinování nebo sdílení dat, která jsou distribuována na více místech.

Příklad: Modelová budova a školení Golden Bank

Datoví vědci ze společnosti Golden Bank vytvořili model "Model schvalování hypoték", který se vyhýbá neočekávanému riziku a zachází se všemi žadateli spravedlivě. Chtějí sledovat historii a výkon modelu od začátku, takže přidají příklad použití modelu do "katalogu schválení hypotéky". Spustí zápisník, aby sestavili model a předpověděli, kteří žadatelé se kvalifikují pro hypotéky. Podrobnosti trénování modelu jsou automaticky zachyceny jako metadata v příkladu použití modelu.


3. Nasazení modelů

Když členové provozního týmu implementují vaše modely AI, budou tyto modely k dispozici pro aplikace, které budou používat pro hodnocení a předpovědi, které vám pomohou řídit akce.

Co můžete použít Co můžete udělat Nejlepší použít, když
Uživatelské rozhraní prostorů Použijte uživatelské rozhraní prostorů k implementaci modelů a dalších aktiv z projektů do prostorů. Chcete implementovat modely a zobrazit informace o implementaci v pracovním prostoru pro spolupráci.


Příklad: Implementace modelu zlaté banky

Členové operačního týmu ve společnosti Golden Bank propagují "Model schválení hypotéky" z projektu do prostoru implementace a poté vytvoří online implementaci modelu.


4. Implementované modely monitorování

Po implementaci modelů je důležité je monitorovat, abyste se ujistili, že si vedou dobře. Datoví vědci musí sledovat problémy s výkonem modelu a konzistencí dat.

Co můžete použít Co můžete udělat Nejlepší použít, když
Watson OpenScale Problémy se spravedlností modelu monitorování v rámci více funkcí.

Výkon modelu monitorování a konzistence dat v průběhu času.

Vysvětlete, jak model dospěl k určitým předpovědím s váženými faktory.

Udržujte a vykazujte řízení modelu a životní cyklus v rámci vaší organizace.
Máte funkce, které jsou chráněné, nebo které mohou přispět ke spravedlnosti předpovědí.

Chcete trasovat výkon modelu a konzistenci dat v průběhu času.

Chcete vědět, proč model poskytuje určité předpovědi.

Příklad: Monitorování modelu Golden Bank

Datoví vědci ze společnosti Golden Bank používají Watson OpenScale k monitorování nasazeného "modelu schválení hypotéky", aby se zajistilo, že je přesný a že se všemi žadateli o hypotéku Golden Bank zachází spravedlivě. Spustí zápisník pro nastavení monitorů pro model a poté vyladí konfiguraci pomocí uživatelského rozhraní Watson OpenScale . Pomocí metrik z monitoru kvality Watson OpenScale a spravedlivého monitorování určují datoví vědci, jak dobře model předpovídá výsledky a zda vytváří zkreslené výsledky. Také získají přehled o tom, jak model přichází k rozhodnutím, aby rozhodnutí mohla být vysvětlena žadatelům o hypotéku.


5. Automatizace životního cyklu ML

Váš tým může automatizovat a zjednodušit životní cyklus MLOps a AI pomocí Watson Pipelines.

Co můžete použít Co můžete udělat Nejlepší použít, když
Watson Pipelines Pomocí kanálů můžete vytvářet opakovatelné a naplánované toky, které automatizují přenosný počítač, Data Refinerya kanály pro strojové učení, od příjmu dat až po trénování, testování a implementaci modelu. Chcete automatizovat některé nebo všechny kroky v toku MLOps.

Příklad: Automatizovaný životní cyklus ML společnosti Golden Bank

Datoví vědci ze společnosti Golden Bank mohou využívat potrubní systémy k automatizaci svého kompletního životního cyklu Data Science a MLOps a procesů ke zjednodušení procesu rekvalifikace modelu.


Výukové programy pro datové vědy a MLOps

Výukový program Popis Odborné znalosti pro výukový program
Koordinace propojení procesů AI s monitorováním modelu Natrénujte model, povyšte jej do prostoru implementace a implementujte model. Spusťte zápisník.
Koordinovat propojení procesů AI s integrací dat Vytvořte komplexní propojení procesů, které připraví data a trénuje model. K vytvoření propojení procesů použijte rozhraní Watson Pipelines .

Další informace

Nadřízené téma: Přehled řešení datového prostředí Fabric

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more