0 / 0
Go back to the English version of the documentation
Výukový program AutoAI : Sestavení modelu binární klasifikace
Last updated: 18. 8. 2023
Výukový program AutoAI : Sestavení modelu binární klasifikace

Tento výukový program vás provede tréninkovým modelem a předpovídá, zda zákazník pravděpodobně koupí stan z obchodu s venkovními zařízeními.

Vytvořte experiment AutoAI pro sestavení modelu, který analyzuje data a vybere nejlepší typ modelu a algoritmy pro vytváření, přípravu a optimalizaci kolon. Po přezkoumání ropovodů, uložte jej jako model, implementujte jej a poté otestujte, abyste získali předpověď.

Podívejte se na toto video a prohlédněte si náhled kroků v tomto výukovém programu.

Právní omezení pro video: Některé méně významné kroky a grafické prvky v tomto videu se mohou lišit od vaší platformy.

Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

  • Transkripce videa
    Čas transcript
    00.00 V tomto videu uvidíte, jak sestavit binární model klasifikace, který hodnotí pravděpodobnost, že zákazník outdoorové společnosti si zakoupí stan.
    00:11 Toto video používá datovou sadu s názvem "GoSales", kterou najdete v Galerii.
    00:16 Zobrazte datovou sadu.
    00:20 Sloupce funkcí jsou "GENDER", "AGE", "MARITAL_STATUS" a "PROFESSION" a obsahují atributy, na kterých bude model výuky počítače vycházet z predikcí.
    00:31 Sloupce popisků jsou "IS_TENT", "PRODUCT_LINE" a "PURCHASE_AMOUNT" a obsahují historické výsledky, které modely mohou být vycvičeny k předpovědi.
    00:44 Přidejte tuto datovou sadu do projektu "Machine Learning" a poté přejděte do projektu.
    00:56 Soubor GoSales.csv najdete spolu s ostatními datovými aktivy.
    01:02 Přidejte do projektu "AutoAI experiment".
    01:08 Tento projekt již má přidruženou službu Watson Machine Learning .
    01:13 Pokud jste tak dosud neučinili, podívejte se nejprve na video ukazující, jak spustit test AutoAI založený na ukázce.
    01:22 Zadejte název experimentu a poté klepněte na tlačítko "Vytvořit".
    01:30 Zobrazí se tvůrce experimentů AutoAI .
    01:33 Nejprve je třeba načíst údaje o školení.
    01:36 V takovém případě bude datová sada z projektu.
    01:40 Vyberte ze seznamu soubor GoSales.csv.
    01:45 Funkce AutoAI přečte datovou sadu a vypíše sloupce nalezené v datové sadě.
    01:50 Protože chcete, aby model předpověděl pravděpodobnost, že daný zákazník zakoupí stan, vyberte sloupec "IS_TENT" jako sloupec, který má být předpověděl.
    01:59 Nyní upravte nastavení experimentu.
    02:03 Nejprve se podívejte na nastavení pro zdroj dat.
    02:06 Máte-li velkou datovou sadu, můžete test spustit na dílčím vzorku řádků a můžete nakonfigurovat, jak velká část dat bude použita pro školení a kolik se jich použije pro vyhodnocení.
    02:19 Předvolba je 90% /10% split, kde 10% z dat je vyhrazeno pro vyhodnocení.
    02:27 Můžete také vybrat sloupce z datové sady, které mají být zahrnuty při spuštění experimentu.
    02:35 Na panelu "Předpověď" můžete vybrat typ předpovědi.
    02:39 V tomto případě AutoAI analyzovala vaše data a zjistila, že sloupec "IS_TENT" obsahuje informace o pravdivých nepravdivých informacích, takže tato data jsou vhodná pro model "Binární klasifikace".
    02:52 Kladná třída je "TRUE" a doporučená metrika je "Přesnost".
    03:01 Pokud chcete, můžete zvolit specifický algoritmus, který bude pro tento experiment zvažovat, a počet nejlepších algoritmů pro AutoAI k testování, které určuje počet vytvořených kolon.
    03:16 Na panelu "Běhová komponenta" si můžete prohlédnout další podrobnosti o experimentu.
    03:21 V tomto případě akceptování předvolených nastavení učiní nejrozumnější.
    03:25 Nyní, spusťte ten experiment.
    03:28 Funkce AutoAI nejprve načte datovou sadu a pak rozdělí data na data o školení a data holdout.
    03:37 Pak počkejte, protože se vyplňují "Pipeline leaderboard", aby se vygenerovaly vygenerované kolony pomocí různých odhadců, jako je např. klasifikátor XGBoost, nebo vylepšení, jako je optimalizace hyperparametru a produktového inženýrství, s ropovody ohodnocenou na základě metriky přesnosti.
    03:58 Optimalizace hyperparametru je mechanismus pro automatické zkoumání prostoru vyhledávání pro potenciální hyperparametry, sestavení řady modelů a porovnání modelů pomocí metrik, které vás zajímají.
    04:10 Technické pokusy o transformaci prvotních dat do kombinace funkcí, které nejlépe představují problém k dosažení co nejpřesnější predikce.
    04:21 Dobře, běh se dokončil.
    04:24 Ve výchozím nastavení uvidíte "Mapa vztahů".
    04:28 Chcete-li však zobrazit mapu "Průběh zpracování", můžete přehodit pohledy.
    04:32 Možná budete chtít začít se srovnáním ropovodů.
    04:36 Tento graf poskytuje metriky pro osm produktovodů, zobrazené podle skóre validace nebo podle skóre holdout.
    04:46 Můžete vidět ropovody ohodnocené podle jiných metrik, jako je například průměrná přesnost.
    04:55 Zpět na kartě "Experimentální přehled" rozbalte propojení procesů s cílem zobrazit měřítka vyhodnocení modelu a křivku ROC.
    05:03 Během školení AutoAI je vaše datová sada rozdělena do dvou částí: údaje o školení a data o holdutu.
    05:11 Údaje o školení používají fáze školení AutoAI pro generování modelových propojení procesů a výsledky křížových ověření platnosti se používají k jejich hodnocení.
    05:21 Po odborné přípravě se pro výsledné vyhodnocení modelu potrubí a výpočet údajů o výkonu, jako jsou křivky ROC a matoucí matrice, použijí údaje z údajů o holdovacích výhledech.
    05:33 Můžete zobrazit jednotlivé propojení procesů a zobrazit další podrobnosti kromě zmatkových matic, přesnosti vyvolání přesnosti, informací o modelu a důležitosti funkcí.
    05:46 Tento kolona měl nejvyšší hodnocení, takže jej můžete uložit jako strojový model počítače.
    05:52 Stačí přijmout výchozí nastavení a uložit model.
    05:56 Nyní, když jste vycvičili model, jste připraveni zobrazit model a implementovat jej.
    06:04 Na kartě "Přehled" je zobrazen souhrn modelu a vstupní schéma.
    06:09 Chcete-li implementovat model, je třeba ho povýšit na prostor implementace.
    06:15 Vyberte ze seznamu prostor implementace, přidejte popis modelu a klepněte na tlačítko "Povýšit".
    06:24 Použijte odkaz pro přechod na prostor implementace.
    06:28 Tady je model, který jste právě vytvořili a který můžete nyní implementovat.
    06:33 V takovém případě se bude jednat o implementaci online.
    06:37 Zadejte název implementace a klepněte na tlačítko "Vytvořit".
    06:41 Pak počkejte, zatímco se model naimplementuje.
    06:44 Po dokončení implementace modelu zobrazte implementaci.
    06:49 Na kartě "Referenční informace rozhraní API" najdete koncový bod hodnocení pro budoucí odkazy.
    06:56 Také najdete úseky kódu pro různé programovací jazyky, abyste mohli tuto implementaci využít z vaší aplikace.
    07:05 Na kartě "Test" můžete otestovat předpověď modelu.
    07:09 Můžete buď zadat vstupní data testu, nebo vložit vstupní data JSON, a poté klepnout na tlačítko "Predict".
    07:20 To ukazuje, že je velmi vysoká pravděpodobnost, že první zákazník koupí stan a velmi vysoká pravděpodobnost, že druhý zákazník nebude kupovat stan.
    07:33 A zpět v projektu najdete experiment AutoAI a model na kartě "Aktiva".
    07:44 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .

Přehled datových sad

Ukázková data jsou strukturována (v řádcích a sloupcích) a uložena ve formátu souboru CSV.

Vzorový datový soubor si můžete prohlédnout v textovém editoru nebo tabulkovém kalkulátoru:
Tabulka datové sady Prodej Go, která obsahuje informace o zákazníkovi a nákupu

Co chceš předpovídat?

Zvolte sloupec, jehož hodnoty předpovídá váš model.

V tomto výukovém programu model předpovídá hodnoty sloupce IS_TENT :

  • IS_TENT: Zda si zákazník zakoupil stan

Model, který je sestaven v tomto výukovém programu, předpovídá, zda si zákazník pravděpodobně koupí stan.

Přehled úloh

Tento výukový program představuje základní kroky pro sestavení a školení modelu výukového programu v počítači s AutoAI:

  1. Vytvořit projekt
  2. Vytvořte experiment AutoAI
  3. Školení experimentu
  4. Implementace školeného modelu
  5. Testovat implementovaný model
  6. Vytvoření dávky pro skóre modelu

Úloha 1: Vytvořit projekt

  1. V části Ukázkystáhněte soubor datové sady GoSales do lokálního počítače.
  2. Na stránce Projekty vyberte volbu Nový projekt, chcete-li vytvořit nový projekt.
    a. Vyberte volbu Vytvořit prázdný projekt.
    b. Zahrňte název projektu.
    c. Klepněte na volbu Vytvořit.

Úloha 2: Vytvořit experiment AutoAI

  1. Na kartě Aktiva ve svém projektu klepněte na volbu Nová úloha > Sestavit výukové modely počítačů automaticky.

  2. Zadejte název a volitelný popis nového experimentu.

  3. Vyberte odkaz Přidružit instanci služby Machine Learning k přidružení instance Watson Machine Learning Server k vašemu projektu. Klepnutím na tlačítko Znovu načíst potvrďte svou konfiguraci.

  4. Chcete-li přidat zdroj dat, můžete vybrat jednu z těchto voleb:
    a. Pokud jste soubor stáhli lokálně, odešlete jej z lokálního počítače na soubor tréninkových dat GoSales.csv. Přetáhněte soubor na panel dat nebo klepněte na tlačítko procházet a postupujte podle pokynů.
    b. Pokud jste soubor již odeslali do svého projektu, klepněte na volbu Vybrat z projektu, poté vyberte kartu Datové aktivum a vyberte volbu GoSales.csv.

Úloha 3: Školení experimentu

  1. V sekci Podrobnosti konfiguracevyberte volbu Ne pro volbu vytvoření prognózy časové řady.

  2. Zvolte IS_TENT jako sloupec, který má být předpověděl. Funkce AutoAI analyzuje vaše data a určuje, že sloupec IS_TENT obsahuje informace True a False, takže tato data jsou vhodná pro binární klasifikační model. Výchozí metrika pro binární klasifikaci je ROC/AUC.

    Konfigurace podrobností experimentu. Nejsou k dispozici prognózy časové řady a IS TENT jako sloupec, který má být předpověděl.

  3. Klepněte na volbu Spustit experiment. Jak modelový vlak, infografika ukazuje proces budování plynovodů.

    Pozn.:

    Mohou se vyskytnout mírné rozdíly ve výsledcích na základě platformy Cloud Pak for Data a verze, kterou používáte.

    Experimentování souhrnů generovaných ropovodů AutoAI

    Seznam algoritmů nebo odhadců, které jsou k dispozici s každou technikou učení v počítači AutoAI, najdete v tématu AutoAI.

  4. Když jsou vytvořeny všechny ropovody, můžete porovnat jejich přesnost na Pipeline leaderboard.

    Leaderboard ropovod, který hodnotí generované potrubí založené na přesnosti

  5. Vyberte propojení procesů s očíslované pořadí 1 a klepnutím na tlačítko Uložit jako vytvořte svůj model. Poté vyberte volbu Vytvořit. Tato volba uloží propojení procesů pod sekci Modely na kartě Aktiva .

Úloha 4: Implementace trénovaného modelu

  1. Model můžete implementovat ze stránky s podrobnostmi o modelu. K stránce s podrobnostmi modelu můžete přistupovat jedním z těchto způsobů:

    1. Klepnutí na název modelu v oznámení zobrazeném po uložení modelu.
    2. Otevřete kartu Aktiva pro projekt, vyberte sekci Modely a vyberte název modelu.
  2. Klepněte na volbu Povýšit na prostor implementace a poté vyberte nebo vytvořte prostor, ve kterém bude model implementován.

    1. Chcete-li vytvořit prostor implementace:
      1. Zadejte název.
      2. Přidružte jej ke službě Machine Learning Service.
      3. Vyberte volbu Vytvořit.
  3. Po vytvoření prostoru implementace nebo vyberte existující prostor, vyberte volbu Postoupit.

  4. Klepněte na odkaz na prostor implementace v oznámení.

  5. Na kartě Aktiva prostoru implementace:

    1. Podržte ukazatel myši nad názvem modelu a klepněte na ikonu implementace Ikona implementace.
      1. Na stránce, která se otevře, dokončete pole:
        1. Vyberte volbu Online jako Typ implementace.
        2. Zadejte název implementace.
        3. Klepněte na volbu Vytvořit.

Vytvoření online prostoru implementace pro povýšení modelu

Po dokončení implementace klepněte na volbu Implementace a vyberte název implementace, chcete-li zobrazit stránku s podrobnostmi.

Úloha 5: Testování implementovaného modelu

Implementovaný model můžete testovat ze stránky podrobností implementace:

  1. Na kartě Test na stránce podrobností implementace vyplňte formulář s hodnotami testu, nebo zadejte testovací data JSON klepnutím na ikonu terminálu Ikona terminálu , abyste poskytli následující vstupní data JSON.

    
    {"input_data":[{
    
    "fields":
    
    ["GENDER","AGE","MARITAL_STATUS","PROFESSION","PRODUCT_LINE","PURCHASE_AMOUNT"],
    
    "values": [["M",27,"Single", "Professional","Camping Equipment",144.78]]
    
    }]}
    
    

    Poznámka: Testovací data replikují datová pole pro model, kromě pole predikce.

  2. Klepněte na tlačítko Předpovědět , chcete-li předpovědět, zda bude zákazník s zadanými atributy pravděpodobně zakoupen stan. Výsledná předpověď označuje, že zákazník s zadanými atributy má vysokou pravděpodobnost zakoupení stanu.

Výsledek předpovědi modelu Tent. Předpověď se rovná pravému, pravděpodobné, že si koupí stan

Úloha 6: Vytvoření dávkové úlohy pro hodnocení modelu

V případě dávkové implementace poskytnete vstupní data, také známá jako informační obsah modelu, v souboru CSV. Data musí být strukturována stejně jako data školení se stejnými záhlavími sloupců. Dávková úloha zpracovává každý řádek dat a vytváří odpovídající předpověď.

Ve skutečném scénáři byste do modelu zadali nová data, abyste získali skóre. Tento výukový program však používá stejné tréninkové údaje GoSales-updated.csv , které jste stáhli v rámci nastavení výukového programu. Ujistěte se, že jste odstranili sloupec IS_TENT a uložili soubor před odesláním do dávkové úlohy. Při implementaci modelu můžete přidat data informačního obsahu do projektu, odeslat ji do prostoru nebo se k němu připojit v úložišti úložiště, jako je sektor Cloud Object Storage . V rámci tohoto výukového programu odešlete soubor přímo do prostoru implementace.

Krok 1: Přidání dat do prostoru

Na stránce Aktiva prostoru implementace:

  1. Klepněte na volbu Přidat do prostoru a poté vyberte volbu Data.
  2. Odešlete soubor GoSales-updated.csv , který jste uložili lokálně.

Krok 2: Vytvoření dávkové implementace

Nyní můžete definovat dávkovou implementaci.

  1. Klepněte na ikonu implementace vedle názvu modelu.
  2. Zadejte název implementace.
    1. Vyberte Dávku jako Typ implementace.
    2. Vyberte nejmenší hardwarovou specifikaci.
    3. Klepněte na volbu Vytvořit.

Krok 3: Vytvořte dávkovou úlohu

Dávková úloha spustí implementaci. Chcete-li vytvořit úlohu, musíte uvést vstupní data a název výstupního souboru. Můžete nastavit úlohu, která se má spustit na plánu nebo okamžitě spustit.

  1. Klepněte na Nová úloha.
  2. Zadejte název úlohy
  3. Konfigurace na nejmenší hardwarové specifikace
  4. (Volitelné): Chcete-li nastavit plán a přijmout oznámení.
  5. Odešlete vstupní soubor: GoSales-updated.csv
  6. Pojmenujte výstupní soubor: GoSales-output.csv
  7. Zkontrolujte a klepněte na tlačítko Vytvořit a spusťte úlohu.

Krok 4: Zobrazení výstupu

Když se stav implementace změní na Implementováno, vraťte se na stránku Aktiva pro prostor implementace. Soubor GoSales-output.csv byl vytvořen a přidán do vašeho seznamu aktiv.

Klepněte na ikonu stažení vedle výstupního souboru a otevřete soubor v editoru. Můžete přezkoumat výsledky předpovědi pro informace o zákazníkovi, které jsou odeslány pro dávkové zpracování.

Predikce, která je vrácena, označuje skóre spolehlivosti toho, zda si zákazník koupí stan.

Další kroky

Sestavení experimentu AutoAI

Nadřízené téma: PřehledAutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more