Translation not up to date
Modely můžete vytvářet, školit a implementovat pomocí produktu SPSS Modeler. Přečtěte si o produktu SPSS Modeler, poté se podívejte na video a postupujte podle výukového programu, který je vhodný pro začátečníky a nevyžaduje žádné kódování.
Váš základní sled prací zahrnuje tyto úlohy:
- Otevřete projekt sandboxu. Projekty jsou místem, kde můžete spolupracovat s ostatními na práci s daty.
- Přidejte tok produktu SPSS Modeler do projektu.
- Nakonfigurujte uzly na plátně a spusťte tok.
- Zkontrolujte podrobnosti modelu a uložte model.
- Implementujte a otestujte svůj model.
Přečtěte si o produktu SPSS Modeler
Pomocí toků produktu SPSS Modeler můžete rychle vyvíjet prediktivní modely pomocí obchodních odborných znalostí a implementovat je do obchodních operací za účelem zlepšení tvorby rozhodnutí. Rozhraní toků je navrženo s použitím dlouhodobě zavedeného klientského softwaru SPSS Modeler a modelu standardů CRISP-DM, které používá pro daný průmysl, rozhraní toků podporuje celý proces vytěžování dat, od dat k lepším obchodním výsledkům.
Produkt SPSS Modeler nabízí různé modelovací metody převzaté od strojového učení, umělé inteligence a statistiky. Metody dostupné na paletě uzlů umožňují odvodit nové informace ze svých dat a vyvíjet prediktivní modely. Každá metoda má určité silné stránky a je nejvhodnější pro konkrétní typy problémů.
Podívejte se na video o vytvoření modelu pomocí produktu SPSS Modeler
Podívejte se na toto video, abyste viděli, jak vytvořit a spustit tok SPSS Modeler k vycvičení modelu strojového učení.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Zkuste výukový program vytvořit model pomocí produktu SPSS Modeler
V tomto výukovém programu provedete tyto úlohy:
- Úloha 1: Otevřít projekt.
- Úloha 2: Přidejte datovou sadu do svého projektu.
- Úloha 3: Vytvoření toku produktu SPSS Modeler .
- Úloha 4: Přidejte uzly do toku produktu SPSS Modeler .
- Úloha 5: Spusťte tok produktu SPSS Modeler a prozkoumejte podrobnosti modelu.
- Úloha 6: Vyhodnocení modelu.
- Úloha 7: Implementovat a testovat model s novými daty.
Dokončení tohoto výukového programu bude trvat přibližně 30 minut.
Příklad dat
Datová sada použitá v tomto výukovém programu je z University of California, Irvine, a je výsledkem rozsáhlé studie založené na hospitalizaci v určitém časovém úseku. Tento model bude používat tři důležité faktory, které pomohou předvídat chronické onemocnění ledvin.
Použití obrazového videa v obraze
Tip: Spustit video a poté, co se přetáhne výukovým programem, se video přesune do režimu obrázků s picse-in-picture. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim picture-in-picture tak, abyste mohli sledovat video, jak dokončujete úlohy v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, která se má sledovat.Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:
Získejte pomoc v komunitě
Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.
Nastavení oken prohlížeče
Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.
Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.
Zpět na začátek
Chcete-li uložit tok produktu SPSS Modeler , potřebujete projekt. Projekt prostředí sandbox můžete použít nebo vytvořit projekt.
V navigační nabídce vyberte volbu Projekty > Zobrazit všechny projekty .
Otevřete projekt sandboxu. Chcete-li použít nový projekt:
Klepněte na volbu Nový projekt.
Vyberte volbu Vytvořit prázdný projekt.
Zadejte název a nepovinný popis projektu.
Vyberte existující instanci služby úložiště objektů nebo vytvořte novou.
Klepněte na volbu Vytvořit.
Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje nový projekt.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:13.
Tento výukový program používá vzorovou datovou sadu. Chcete-li přidat ukázková data do svého projektu, postupujte takto:
Přistupte k úložišti UCI ML Repository: datová sada pro chronické onemocnění ledvin v části Ukázky.
Klepněte na tlačítko Náhled. Existují tři důležité faktory, které pomáhají předpovídat chronické onemocnění ledvin, které jsou k dispozici jako součást této analýzy: věk testovaného předmětu, výsledky testů sérového kreatininu a výsledky testů diabetu. A hodnota třídy udává, zda byl pacient již dříve diagnostikován pro onemocnění ledvin.
Klepněte na volbu Přidat do projektu.
Vyberte projekt ze seznamu a klepněte na tlačítko Přidat.
Klepněte na volbu Zobrazit projekt.
Na stránce Aktiva vašeho projektu vyhledejte soubor UCI ML Repository Chronická onemocnění ledvin Set.csv .
Zkontrolujte svůj pokrok
Následující obrázek ukazuje kartu Aktiva v projektu.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:11.
Postupujte takto, chcete-li vytvořit tok SPSS Modeler v projektu:
Klepněte na volbu Nová úloha > Sestavit modely jako vizuální tok.
Zadejte název a popis toku.
V případě definice běhového prostředí přijměte definici Výchozí SPSS Modeler S .
Klepněte na volbu Vytvořit. Otevře se Editor toků, který budete používat k vytvoření toku.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje editor toku.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:31.
Po načtení dat musíte transformovat data. Vytvořte jednoduchý tok přetažením transformátorů a odhadců na plátno a jejich připojením ke zdroji dat. Z palety použijte následující uzly:
Datová aktiva: načte soubor csv z projektu
Oddíl: rozděluje data na segmenty školení a testování
Typ: nastavuje datový typ. Použijte jej k označení pole
class
jako typutarget
.C5.0: klasifikační algoritmus
Analýza: zobrazit model a zkontrolovat jeho přesnost
Tabulka: náhled dat s predikcemi
Chcete-li vytvořit tok, postupujte takto:
Přidejte uzel datového aktiva:
V sekci Importovat přetáhněte uzel Aktivum dat na plátno.
Poklepejte na uzel Datové aktivum , abyste vybrali datovou sadu.
Vyberte Datové aktivum > UCI ML úložiště Chronická onemocnění ledvin Data Set.csv.
Klepněte na volbu Vybrat.
Zobrazit vlastnosti aktiva dat.
Klepněte na tlačítko Uložit.
Přidejte uzel oblasti:
V sekci Operace pole přetáhněte uzel Oblast na plátno.
Připojte uzel Datové aktivum k uzlu Oblast .
Poklepejte na uzel Oblast , abyste zobrazili jeho vlastnosti. Výchozí rozdělení rozdělí polovinu dat na školení a druhou polovinu pro testování.
Klepněte na tlačítko Uložit.
Přidejte uzel typu:
V sekci Operace pole přetáhněte uzel Typ na plátno.
Připojte uzel Oblast k uzlu Typ .
Poklepejte na uzel Typ , abyste zobrazili jeho vlastnosti. Uzel Typ uvádí úroveň měření pro každé pole. Tento zdrojový datový soubor používá čtyři různé úrovně měření: Souvislé, Categorical, Nominal, Ordinal a Flag.
Hledejte pole
class
. Pro každé pole role označuje část, kterou každé pole hraje při modelování. Změňteclass
Role na Cíl -pole, které chcete předpovídat.Klepněte na tlačítko Uložit.
Přidejte uzel algoritmu klasifikace C5.0 :
V sekci Modelování přetáhněte uzel C5.0 na plátno.
Připojte uzel Typ k uzlu C5.0 .
Poklepejte na uzel C5.0 , abyste zobrazili jeho vlastnosti. Ve výchozím nastavení je v algoritmu C5.0 vytvořen rozhodovací strom. Model C5.0 pracuje rozdělením vzorku na základě pole, které poskytuje maximální nárůst informací. Každý dílčí vzorek definovaný při prvním rozdělení je poté opět rozdělen, obvykle založený na jiném poli a proces se opakuje, dokud dílčí vzorky nemohou být dále rozděleny. A konečně se překontrolují lowes-level dělení a ty, které významně nepřispívají k hodnotě modelu, se odstraní.
Přepnout na Použít nastavení definovaná v tomto uzlu.
Pro Cílvyberte třídu.
V sekci Vstupy klepněte na volbu Přidat sloupce.
Zrušte zaškrtnutí políčka vedle pole Název pole.
Vyberte age, sc, dm.
Klepněte na tlačítko OK.
Klepněte na tlačítko Uložit.
Zkontrolujte svůj pokrok
Na následujícím obrázku je zobrazen dokončený tok.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:20.
Nyní, když jste navrhli tok, proveďte následující kroky ke spuštění toku a prohlédněte si diagram stromu, abyste viděli rozhodovací body:
Klepněte pravým tlačítkem myši na uzel C5.0 a vyberte volbu Spustit. Spuštění toku vygeneruje nový model nugget na plátně.
Klepněte pravým tlačítkem myši na model nugget a vyberte volbu Zobrazit model , abyste zobrazili podrobnosti modelu.
Podívejte se na Informace o modelu , která poskytuje souhrn modelu.
Klepněte na volbu Pravidla pro nejvyšší rozhodnutí. Tabulka zobrazuje posloupnost pravidel, která byla použita pro přiřazení jednotlivých záznamů k podřízeným uzlům na základě hodnot různých vstupních polí.
Klepněte na volbu Důležitost funkce. Graf zobrazuje relativní důležitost jednotlivých prediktorů při odhadování modelu. Z toho si můžete prohlédnout, že sérového kreatininu je snadno nejdůležitějším faktorem, přičemž diabetes je dalším nejvýznamnějším faktorem.
Klepněte na volbu Diagram stromu. Stejný model se zobrazuje ve formě stromu, s uzlem v každém bodu rozhodnutí.
Ponechte ukazatel myši nad horním uzlem, který poskytuje souhrn pro všechny záznamy v datové sadě. Téměř 40% případů zařazených do souboru údajů je klasifikováno jako nediagnostikováno s onemocněním ledvin. Strom může poskytnout další vodítka k tomu, jaké faktory mohou být zodpovědné.
Všimněte si dvou větví pocházejících z horního uzlu, které ukazují rozdělení podle sérového kreatininu.
Přezkoumejte větev, která zobrazuje záznamy, kde je hodnota kreatininu v séru vyšší než 1.25. V tomto případě, 100% z těchto pacientů má pozitivní diagnózu onemocnění ledvin.
Přezkoumejte větev, která zobrazuje záznamy, kde je sérový kreatinin menší než nebo roven 1.25. Téměř 80% z těchto pacientů nemá pozitivní diagnózu onemocnění ledvin, ale téměř 20% s nižší hladinou sérového kreatininu byly stále diagnostikovány s onemocněním ledvin.
Všimněte si větví pocházejících z sc<=1.250, které je rozděleno na diabetes.
Přezkoumejte větev, která zobrazuje pacienty s nízkým sérovým kreatininem (sc<=1.250) a diagnostikovaným diabetem (dm = ano). 100% z těchto pacientů bylo také diagnostikováno s onemocněním ledvin.
Prověřujte větev, která ukazuje pacienty s nízkým sérovým kreatininem (sc<=1.250) a bez diabetu (dm = ne), 85% nebylo diagnostikováno s onemocněním ledvin, ale 15% z nich bylo diagnostikováno s onemocněním ledvin.
Všimněte si větví pocházejících z dm = no, který je rozdělen posledním významným faktorem age.
Prohlédněte si větev, která zobrazuje pacienty ve věku 14 let nebo mladší (věk < = 14). Tato větev ukazuje, že 75% mladých pacientů s nízkým sérovým kreatininem a bez diabetu bylo u pacientů s rizikem vzniku onemocnění ledvin.
Revidujte větev, která zobrazuje pacienty starší než 14 let (věk > 14 let). Tato větev ukazuje, že pouze 12% pacientů ve věku nad 14 let s nízkým sérovým kreatininem a bez diabetu bylo ohroženo onemocnění ledvin.
Zavřete podrobnosti modelu.
Zkontrolujte svůj pokrok
Následující obrázek znázorňuje stromový diagram.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 07:24.
Chcete-li použít uzly analýzy a tabulky k vyhodnocení modelu, postupujte takto:
V sekci Výstupy přetáhněte uzel Analýza na plátno.
Připojte uzel Model k uzlu Analýza .
Klepněte pravým tlačítkem myši na uzel Analýza a vyberte volbu Spustit.
Na panelu Výstupy otevřete Analýza, která ukazuje, že model správně předpověděl diagnózu onemocnění ledvin téměř 95% času. Zavřete položku Analýza.
Klepněte pravým tlačítkem myši na uzel Analýza a vyberte volbu Uložit větev jako model.
Do pole Název modeluzadejte
Kidney Disease Analysis
.Klepněte na tlačítko Uložit.
Klepněte na Zavřít.
V sekci Výstupy přetáhněte uzel Tabulka na plátno.
Připojte řetězec Model k uzlu Tabulka .
Klepněte pravým tlačítkem myši na uzel Tabulka a vyberte volbu Zobrazit náhled dat.
Když se zobrazí Náhled, posuňte se na poslední dva sloupce. Sloupec $C-Class obsahuje prognózu onemocnění ledvin a sloupec $CC-Class označuje skóre důvěry pro tuto předpověď.
Zavřete položku Náhled.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje tabulku náhledu s předpověďmi.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 09:10.
Nakonec postupujte podle následujících kroků k implementaci tohoto modelu a předvídání výsledku s novými daty.
Vraťte se na kartu Aktiva projektu.
Klepněte na sekci Modely a otevřete model Analýza onemocnění ledvin .
Klepněte na volbu Povýšit na prostor implementace.
Vyberte existující prostor implementace. Pokud nemáte prostor implementace, můžete vytvořit nový:
Poskytněte název prostoru.
Vyberte službu úložiště.
Vyberte počítačovou službu učení.
Klepněte na volbu Vytvořit.
Klepněte na Zavřít.
Vyberte volbu Přejít na model v prostoru po jeho povýšení.
Klepněte na tlačítko Povýšit
Když se model zobrazí uvnitř prostoru implementace, klepněte na volbu Nová implementace.
Vyberte volbu Online jako Typ implementace.
Zadejte název implementace.
Klepněte na volbu Vytvořit.
Po dokončení implementace klepněte na název implementace a zobrazte stránku s podrobnostmi o implementaci.
Přejděte na kartu Test . Nasazený model můžete testovat ze stránky podrobností implementace dvěma způsoby: testem s formulářem nebo testem s kódem JSON.
Klepněte na volbu Vstup JSON, potom zkopírujte následující testovací data a vložte ji, chcete-li nahradit existující text JSON:
{ "input_data": [ { "fields": [ "age", "bp", "sg", "al", "su", "rbc", "pc", "pcc", "ba", "bgr", "bu", "sc", "sod", "pot", "hemo", "pcv", "wbcc", "rbcc", "htn", "dm", "cad", "appet", "pe", "ane", "class" ], "values": [ [ "62", "80", "1.01", "2", "3", "normal", "normal", "notpresent", "notpresent", "423", "53", "1.8", "", "", "9.6", "31", "7500", "", "no", "yes", "no", "poor", "no", "yes", "ckd" ] ] } ] }
Klepněte na tlačítko Předpovědět , chcete-li předpovědět, zda je 62 let s diabetem a s poměrem kreatininu v séru 1.8 pravděpodobně diagnostikován s onemocněním ledvin. Výsledná předpověď ukazuje, že tento pacient má vysokou pravděpodobnost diagnózy onemocnění ledvin.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje kartu Test pro implementaci modelu s predikcí.
Zpět na začátek
Další kroky
Nyní můžete tuto datovou sadu použít k další analýze. Můžete například provádět úlohy jako:
Další prostředky
Vyhledat další výukové programy produktu SPSS Modeler
Vyzkoušejte tyto jiné metody k sestavení modelů:
Prohlédněte si další videa.
Nalezení ukázkových datových sad, projektů, modelů, výzev k zadání a notebooků v ukázkách za účelem získání znalostí o zkušenostech:
Zápisníky , které můžete přidat do svého projektu, abyste mohli začít analyzovat data a sestavovat modely.
Projekty , které můžete importovat obsahující zápisníky, datové sady, výzvy k zadání a další aktiva.
Datové sady , které můžete přidat do svého projektu za účelem upřesnění, analýzy a sestavení modelů.
výzvy , které můžete použít v rámci testovacího pracoviště výzev k zadání základního modelu.
Modely nadace , které můžete použít v laboratoři výzev k zadání.
Přispívat do komunity SPSS Modeler
Nadřízené téma: Výukové programy Stručný úvod