Translation not up to date
Tento výukový program vás provede tréninkovým modelem a předpovídá, zda zákazník pravděpodobně koupí stan z obchodu s venkovními zařízeními.
Vytvořte experiment AutoAI pro sestavení modelu, který analyzuje data a vybere nejlepší typ modelu a algoritmy pro vytváření, přípravu a optimalizaci kolon. Po přezkoumání ropovodů, uložte jej jako model, implementujte jej a poté otestujte, abyste získali předpověď.
Podívejte se na toto video a prohlédněte si náhled kroků v tomto výukovém programu.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Transkripce videa Čas transcript 00.00 V tomto videu uvidíte, jak sestavit binární model klasifikace, který hodnotí pravděpodobnost, že zákazník outdoorové společnosti si zakoupí stan. 00:11 Toto video používá datovou sadu s názvem "GoSales", kterou najdete v Galerii. 00:16 Zobrazte datovou sadu. 00:20 Sloupce funkcí jsou "GENDER", "AGE", "MARITAL_STATUS" a "PROFESSION" a obsahují atributy, na kterých bude model výuky počítače vycházet z predikcí. 00:31 Sloupce popisků jsou "IS_TENT", "PRODUCT_LINE" a "PURCHASE_AMOUNT" a obsahují historické výsledky, které modely mohou být vycvičeny k předpovědi. 00:44 Přidejte tuto datovou sadu do projektu "Machine Learning" a poté přejděte do projektu. 00:56 Soubor GoSales.csv najdete spolu s ostatními datovými aktivy. 01:02 Přidejte do projektu "AutoAI experiment". 01:08 Tento projekt již má přidruženou službu Watson Machine Learning . 01:13 Pokud jste tak dosud neučinili, podívejte se nejprve na video ukazující, jak spustit test AutoAI založený na ukázce. 01:22 Zadejte název experimentu a poté klepněte na tlačítko "Vytvořit". 01:30 Zobrazí se tvůrce experimentů AutoAI . 01:33 Nejprve je třeba načíst údaje o školení. 01:36 V takovém případě bude datová sada z projektu. 01:40 Vyberte ze seznamu soubor GoSales.csv. 01:45 Funkce AutoAI přečte datovou sadu a vypíše sloupce nalezené v datové sadě. 01:50 Protože chcete, aby model předpověděl pravděpodobnost, že daný zákazník zakoupí stan, vyberte sloupec "IS_TENT" jako sloupec, který má být předpověděl. 01:59 Nyní upravte nastavení experimentu. 02:03 Nejprve se podívejte na nastavení pro zdroj dat. 02:06 Máte-li velkou datovou sadu, můžete test spustit na dílčím vzorku řádků a můžete nakonfigurovat, jak velká část dat bude použita pro školení a kolik se jich použije pro vyhodnocení. 02:19 Předvolba je 90% /10% split, kde 10% z dat je vyhrazeno pro vyhodnocení. 02:27 Můžete také vybrat sloupce z datové sady, které mají být zahrnuty při spuštění experimentu. 02:35 Na panelu "Předpověď" můžete vybrat typ předpovědi. 02:39 V tomto případě AutoAI analyzovala vaše data a zjistila, že sloupec "IS_TENT" obsahuje informace o pravdivých nepravdivých informacích, takže tato data jsou vhodná pro model "Binární klasifikace". 02:52 Kladná třída je "TRUE" a doporučená metrika je "Přesnost". 03:01 Pokud chcete, můžete zvolit specifický algoritmus, který bude pro tento experiment zvažovat, a počet nejlepších algoritmů pro AutoAI k testování, které určuje počet vytvořených kolon. 03:16 Na panelu "Běhová komponenta" si můžete prohlédnout další podrobnosti o experimentu. 03:21 V tomto případě akceptování předvolených nastavení učiní nejrozumnější. 03:25 Nyní, spusťte ten experiment. 03:28 Funkce AutoAI nejprve načte datovou sadu a pak rozdělí data na data o školení a data holdout. 03:37 Pak počkejte, protože se vyplňují "Pipeline leaderboard", aby se vygenerovaly vygenerované kolony pomocí různých odhadců, jako je např. klasifikátor XGBoost, nebo vylepšení, jako je optimalizace hyperparametru a produktového inženýrství, s ropovody ohodnocenou na základě metriky přesnosti. 03:58 Optimalizace hyperparametru je mechanismus pro automatické zkoumání prostoru vyhledávání pro potenciální hyperparametry, sestavení řady modelů a porovnání modelů pomocí metrik, které vás zajímají. 04:10 Technické pokusy o transformaci prvotních dat do kombinace funkcí, které nejlépe představují problém k dosažení co nejpřesnější predikce. 04:21 Dobře, běh se dokončil. 04:24 Ve výchozím nastavení uvidíte "Mapa vztahů". 04:28 Chcete-li však zobrazit mapu "Průběh zpracování", můžete přehodit pohledy. 04:32 Možná budete chtít začít se srovnáním ropovodů. 04:36 Tento graf poskytuje metriky pro osm produktovodů, zobrazené podle skóre validace nebo podle skóre holdout. 04:46 Můžete vidět ropovody ohodnocené podle jiných metrik, jako je například průměrná přesnost. 04:55 Zpět na kartě "Experimentální přehled" rozbalte propojení procesů s cílem zobrazit měřítka vyhodnocení modelu a křivku ROC. 05:03 Během školení AutoAI je vaše datová sada rozdělena do dvou částí: údaje o školení a data o holdutu. 05:11 Údaje o školení používají fáze školení AutoAI pro generování modelových propojení procesů a výsledky křížových ověření platnosti se používají k jejich hodnocení. 05:21 Po odborné přípravě se pro výsledné vyhodnocení modelu potrubí a výpočet údajů o výkonu, jako jsou křivky ROC a matoucí matrice, použijí údaje z údajů o holdovacích výhledech. 05:33 Můžete zobrazit jednotlivé propojení procesů a zobrazit další podrobnosti kromě zmatkových matic, přesnosti vyvolání přesnosti, informací o modelu a důležitosti funkcí. 05:46 Tento kolona měl nejvyšší hodnocení, takže jej můžete uložit jako strojový model počítače. 05:52 Stačí přijmout výchozí nastavení a uložit model. 05:56 Nyní, když jste vycvičili model, jste připraveni zobrazit model a implementovat jej. 06:04 Na kartě "Přehled" je zobrazen souhrn modelu a vstupní schéma. 06:09 Chcete-li implementovat model, je třeba ho povýšit na prostor implementace. 06:15 Vyberte ze seznamu prostor implementace, přidejte popis modelu a klepněte na tlačítko "Povýšit". 06:24 Použijte odkaz pro přechod na prostor implementace. 06:28 Tady je model, který jste právě vytvořili a který můžete nyní implementovat. 06:33 V takovém případě se bude jednat o implementaci online. 06:37 Zadejte název implementace a klepněte na tlačítko "Vytvořit". 06:41 Pak počkejte, zatímco se model naimplementuje. 06:44 Po dokončení implementace modelu zobrazte implementaci. 06:49 Na kartě "Referenční informace rozhraní API" najdete koncový bod hodnocení pro budoucí odkazy. 06:56 Také najdete úseky kódu pro různé programovací jazyky, abyste mohli tuto implementaci využít z vaší aplikace. 07:05 Na kartě "Test" můžete otestovat předpověď modelu. 07:09 Můžete buď zadat vstupní data testu, nebo vložit vstupní data JSON, a poté klepnout na tlačítko "Predict". 07:20 To ukazuje, že je velmi vysoká pravděpodobnost, že první zákazník koupí stan a velmi vysoká pravděpodobnost, že druhý zákazník nebude kupovat stan. 07:33 A zpět v projektu najdete experiment AutoAI a model na kartě "Aktiva". 07:44 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .
Přehled datových sad
Ukázková data jsou strukturována (v řádcích a sloupcích) a uložena ve formátu souboru CSV.
Vzorový datový soubor si můžete prohlédnout v textovém editoru nebo tabulkovém kalkulátoru:
Co chceš předpovídat?
Zvolte sloupec, jehož hodnoty předpovídá váš model.
V tomto výukovém programu model předpovídá hodnoty sloupce IS_TENT
:
IS_TENT
: Zda si zákazník zakoupil stan
Model, který je sestaven v tomto výukovém programu, předpovídá, zda si zákazník pravděpodobně koupí stan.
Přehled úloh
Tento výukový program představuje základní kroky pro sestavení a školení modelu výukového programu v počítači s AutoAI:
Úloha 1: Vytvořit projekt
- V části Ukázkystáhněte soubor datové sady GoSales do lokálního počítače.
- Na stránce Projekty vyberte volbu Nový projekt, chcete-li vytvořit nový projekt.
a. Vyberte volbu Vytvořit prázdný projekt.
b. Zahrňte název projektu.
c. Klepněte na volbu Vytvořit.
Úloha 2: Vytvořit experiment AutoAI
Na kartě Aktiva ve svém projektu klepněte na volbu Nová úloha > Sestavit výukové modely počítačů automaticky.
Zadejte název a volitelný popis nového experimentu.
Vyberte odkaz Přidružit instanci služby Machine Learning k přidružení instance Watson Machine Learning Server k vašemu projektu. Klepnutím na tlačítko Znovu načíst potvrďte svou konfiguraci.
Chcete-li přidat zdroj dat, můžete vybrat jednu z těchto voleb:
a. Pokud jste soubor stáhli lokálně, odešlete jej z lokálního počítače na soubor tréninkových dat GoSales.csv. Přetáhněte soubor na panel dat nebo klepněte na tlačítko procházet a postupujte podle pokynů.
b. Pokud jste soubor již odeslali do svého projektu, klepněte na volbu Vybrat z projektu, poté vyberte kartu Datové aktivum a vyberte volbu GoSales.csv.
Úloha 3: Školení experimentu
V sekci Podrobnosti konfiguracevyberte volbu Ne pro volbu vytvoření prognózy časové řady.
Zvolte
IS_TENT
jako sloupec, který má být předpověděl. Funkce AutoAI analyzuje vaše data a určuje, že sloupecIS_TENT
obsahuje informace True a False, takže tato data jsou vhodná pro binární klasifikační model. Výchozí metrika pro binární klasifikaci je ROC/AUC.Klepněte na volbu Spustit experiment. Jak modelový vlak, infografika ukazuje proces budování plynovodů.
Pozn.:Mohou se vyskytnout mírné rozdíly ve výsledcích na základě platformy Cloud Pak for Data a verze, kterou používáte.
Seznam algoritmů nebo odhadců, které jsou k dispozici s každou technikou učení v počítači AutoAI, najdete v tématu AutoAI.
Když jsou vytvořeny všechny ropovody, můžete porovnat jejich přesnost na Pipeline leaderboard.
Vyberte propojení procesů s očíslované pořadí 1 a klepnutím na tlačítko Uložit jako vytvořte svůj model. Poté vyberte volbu Vytvořit. Tato volba uloží propojení procesů pod sekci Modely na kartě Aktiva .
Úloha 4: Implementace trénovaného modelu
Model můžete implementovat ze stránky s podrobnostmi o modelu. K stránce s podrobnostmi modelu můžete přistupovat jedním z těchto způsobů:
- Klepnutí na název modelu v oznámení zobrazeném po uložení modelu.
- Otevřete kartu Aktiva pro projekt, vyberte sekci Modely a vyberte název modelu.
Klepněte na volbu Povýšit na prostor implementace a poté vyberte nebo vytvořte prostor, ve kterém bude model implementován.
- Chcete-li vytvořit prostor implementace:
- Zadejte název.
- Přidružte jej ke službě Machine Learning Service.
- Vyberte volbu Vytvořit.
- Chcete-li vytvořit prostor implementace:
Po vytvoření prostoru implementace nebo vyberte existující prostor, vyberte volbu Postoupit.
Klepněte na odkaz na prostor implementace v oznámení.
Na kartě Aktiva prostoru implementace:
- Podržte ukazatel myši nad názvem modelu a klepněte na ikonu implementace .
- Na stránce, která se otevře, dokončete pole:
- Vyberte volbu Online jako Typ implementace.
- Zadejte název implementace.
- Klepněte na volbu Vytvořit.
- Na stránce, která se otevře, dokončete pole:
- Podržte ukazatel myši nad názvem modelu a klepněte na ikonu implementace .
Po dokončení implementace klepněte na volbu Implementace a vyberte název implementace, chcete-li zobrazit stránku s podrobnostmi.
Úloha 5: Testování implementovaného modelu
Implementovaný model můžete testovat ze stránky podrobností implementace:
Na kartě Test na stránce podrobností implementace vyplňte formulář s hodnotami testu, nebo zadejte testovací data JSON klepnutím na ikonu terminálu , abyste poskytli následující vstupní data JSON.
{"input_data":[{ "fields": ["GENDER","AGE","MARITAL_STATUS","PROFESSION","PRODUCT_LINE","PURCHASE_AMOUNT"], "values": [["M",27,"Single", "Professional","Camping Equipment",144.78]] }]}
Poznámka: Testovací data replikují datová pole pro model, kromě pole predikce.
Klepněte na tlačítko Předpovědět , chcete-li předpovědět, zda bude zákazník s zadanými atributy pravděpodobně zakoupen stan. Výsledná předpověď označuje, že zákazník s zadanými atributy má vysokou pravděpodobnost zakoupení stanu.
Úloha 6: Vytvoření dávkové úlohy pro hodnocení modelu
V případě dávkové implementace poskytnete vstupní data, také známá jako informační obsah modelu, v souboru CSV. Data musí být strukturována stejně jako data školení se stejnými záhlavími sloupců. Dávková úloha zpracovává každý řádek dat a vytváří odpovídající předpověď.
Ve skutečném scénáři byste do modelu zadali nová data, abyste získali skóre. Tento výukový program však používá stejné tréninkové údaje GoSales-updated.csv , které jste stáhli v rámci nastavení výukového programu. Ujistěte se, že jste odstranili sloupec IS_TENT
a uložili soubor před odesláním do dávkové úlohy. Při implementaci modelu můžete přidat data informačního obsahu do projektu, odeslat ji do prostoru nebo se k němu připojit v úložišti úložiště, jako je sektor Cloud Object Storage . V rámci tohoto výukového programu odešlete soubor přímo do prostoru implementace.
Krok 1: Přidání dat do prostoru
Na stránce Aktiva prostoru implementace:
- Klepněte na volbu Přidat do prostoru a poté vyberte volbu Data.
- Odešlete soubor GoSales-updated.csv , který jste uložili lokálně.
Krok 2: Vytvoření dávkové implementace
Nyní můžete definovat dávkovou implementaci.
- Klepněte na ikonu implementace vedle názvu modelu.
- Zadejte název implementace.
- Vyberte Dávku jako Typ implementace.
- Vyberte nejmenší hardwarovou specifikaci.
- Klepněte na volbu Vytvořit.
Krok 3: Vytvořte dávkovou úlohu
Dávková úloha spustí implementaci. Chcete-li vytvořit úlohu, musíte uvést vstupní data a název výstupního souboru. Můžete nastavit úlohu, která se má spustit na plánu nebo okamžitě spustit.
- Klepněte na Nová úloha.
- Zadejte název úlohy
- Konfigurace na nejmenší hardwarové specifikace
- (Volitelné): Chcete-li nastavit plán a přijmout oznámení.
- Odešlete vstupní soubor: GoSales-updated.csv
- Pojmenujte výstupní soubor: GoSales-output.csv
- Zkontrolujte a klepněte na tlačítko Vytvořit a spusťte úlohu.
Krok 4: Zobrazení výstupu
Když se stav implementace změní na Implementováno, vraťte se na stránku Aktiva pro prostor implementace. Soubor GoSales-output.csv byl vytvořen a přidán do vašeho seznamu aktiv.
Klepněte na ikonu stažení vedle výstupního souboru a otevřete soubor v editoru. Můžete přezkoumat výsledky předpovědi pro informace o zákazníkovi, které jsou odeslány pro dávkové zpracování.
Predikce, která je vrácena, označuje skóre spolehlivosti toho, zda si zákazník koupí stan.
Další kroky
Nadřízené téma: PřehledAutoAI