0 / 0
Go back to the English version of the documentation
Stručný úvod: Sestavte model pomocí produktu SPSS Modeler
Last updated: 09. 11. 2023
Stručný úvod: Sestavte model pomocí produktu SPSS Modeler

Modely můžete vytvářet, školit a implementovat pomocí produktu SPSS Modeler. Přečtěte si o produktu SPSS Modeler, poté se podívejte na video a postupujte podle výukového programu, který je vhodný pro začátečníky a nevyžaduje žádné kódování.

Váš základní sled prací zahrnuje tyto úlohy:

  1. Otevřete projekt sandboxu. Projekty jsou místem, kde můžete spolupracovat s ostatními na práci s daty.
  2. Přidejte tok produktu SPSS Modeler do projektu.
  3. Nakonfigurujte uzly na plátně a spusťte tok.
  4. Zkontrolujte podrobnosti modelu a uložte model.
  5. Implementujte a otestujte svůj model.

Přečtěte si o produktu SPSS Modeler

Pomocí toků produktu SPSS Modeler můžete rychle vyvíjet prediktivní modely pomocí obchodních odborných znalostí a implementovat je do obchodních operací za účelem zlepšení tvorby rozhodnutí. Rozhraní toků je navrženo s použitím dlouhodobě zavedeného klientského softwaru SPSS Modeler a modelu standardů CRISP-DM, které používá pro daný průmysl, rozhraní toků podporuje celý proces vytěžování dat, od dat k lepším obchodním výsledkům.

Produkt SPSS Modeler nabízí různé modelovací metody převzaté od strojového učení, umělé inteligence a statistiky. Metody dostupné na paletě uzlů umožňují odvodit nové informace ze svých dat a vyvíjet prediktivní modely. Každá metoda má určité silné stránky a je nejvhodnější pro konkrétní typy problémů.

Přečtěte si více o produktu SPSS Modeler

Informace o dalších metodách sestavení modelů

Podívejte se na video o vytvoření modelu pomocí produktu SPSS Modeler

Zhlédnout video Podívejte se na toto video, abyste viděli, jak vytvořit a spustit tok SPSS Modeler k vycvičení modelu strojového učení.

Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

Zkuste výukový program vytvořit model pomocí produktu SPSS Modeler

V tomto výukovém programu provedete tyto úlohy:

Dokončení tohoto výukového programu bude trvat přibližně 30 minut.

Příklad dat

Datová sada použitá v tomto výukovém programu je z University of California, Irvine, a je výsledkem rozsáhlé studie založené na hospitalizaci v určitém časovém úseku. Tento model bude používat tři důležité faktory, které pomohou předvídat chronické onemocnění ledvin.



  • Použití obrazového videa v obraze

    Tip: Spustit video a poté, co se přetáhne výukovým programem, se video přesune do režimu obrázků s picse-in-picture. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim picture-in-picture tak, abyste mohli sledovat video, jak dokončujete úlohy v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, která se má sledovat.

    Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:

    Jak používat obrázky v obraze a kapitoly

    Získejte pomoc v komunitě

    Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.

    Nastavení oken prohlížeče

    Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.

    Vedlejší výukový program a uživatelské rozhraní

    Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.

    Zpět na začátek


  • Chcete-li uložit tok produktu SPSS Modeler , potřebujete projekt. Projekt prostředí sandbox můžete použít nebo vytvořit projekt.

    1. V navigační nabídce Navigační nabídkavyberte volbu Projekty > Zobrazit všechny projekty .

    2. Otevřete projekt sandboxu. Chcete-li použít nový projekt:

      1. Klepněte na volbu Nový projekt.

      2. Vyberte volbu Vytvořit prázdný projekt.

      3. Zadejte název a nepovinný popis projektu.

      4. Vyberte existující instanci služby úložiště objektů nebo vytvořte novou.

      5. Klepněte na volbu Vytvořit.

    Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje nový projekt.

    Následující obrázek ukazuje nový projekt.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:13.

    Tento výukový program používá vzorovou datovou sadu. Chcete-li přidat ukázková data do svého projektu, postupujte takto:

    1. Přistupte k úložišti UCI ML Repository: datová sada pro chronické onemocnění ledvin v části Ukázky.

    2. Klepněte na tlačítko Náhled. Existují tři důležité faktory, které pomáhají předpovídat chronické onemocnění ledvin, které jsou k dispozici jako součást této analýzy: věk testovaného předmětu, výsledky testů sérového kreatininu a výsledky testů diabetu. A hodnota třídy udává, zda byl pacient již dříve diagnostikován pro onemocnění ledvin.

    3. Klepněte na volbu Přidat do projektu.

    4. Vyberte projekt ze seznamu a klepněte na tlačítko Přidat.

    5. Klepněte na volbu Zobrazit projekt.

    6. Na stránce Aktiva vašeho projektu vyhledejte soubor UCI ML Repository Chronická onemocnění ledvin Set.csv .

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje kartu Aktiva v projektu.

    Následující obrázek ukazuje kartu Aktiva v projektu.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:11.

    Postupujte takto, chcete-li vytvořit tok SPSS Modeler v projektu:

    1. Klepněte na volbu Nová úloha > Sestavit modely jako vizuální tok.

    2. Zadejte název a popis toku.

    3. V případě definice běhového prostředí přijměte definici Výchozí SPSS Modeler S .

    4. Klepněte na volbu Vytvořit. Otevře se Editor toků, který budete používat k vytvoření toku.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje editor toku.

    Následující obrázek ukazuje editor toku.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:31.

    Po načtení dat musíte transformovat data. Vytvořte jednoduchý tok přetažením transformátorů a odhadců na plátno a jejich připojením ke zdroji dat. Z palety použijte následující uzly:

    • Datová aktiva: načte soubor csv z projektu

    • Oddíl: rozděluje data na segmenty školení a testování

    • Typ: nastavuje datový typ. Použijte jej k označení pole class jako typu target .

    • C5.0: klasifikační algoritmus

    • Analýza: zobrazit model a zkontrolovat jeho přesnost

    • Tabulka: náhled dat s predikcemi

    Chcete-li vytvořit tok, postupujte takto:

    1. Přidejte uzel datového aktiva:

      1. V sekci Importovat přetáhněte uzel Aktivum dat na plátno.

      2. Poklepejte na uzel Datové aktivum , abyste vybrali datovou sadu.

      3. Vyberte Datové aktivum > UCI ML úložiště Chronická onemocnění ledvin Data Set.csv.

      4. Klepněte na volbu Vybrat.

      5. Zobrazit vlastnosti aktiva dat.

      6. Klepněte na tlačítko Uložit.

    2. Přidejte uzel oblasti:

      1. V sekci Operace pole přetáhněte uzel Oblast na plátno.

      2. Připojte uzel Datové aktivum k uzlu Oblast .

      3. Poklepejte na uzel Oblast , abyste zobrazili jeho vlastnosti. Výchozí rozdělení rozdělí polovinu dat na školení a druhou polovinu pro testování.

      4. Klepněte na tlačítko Uložit.

    3. Přidejte uzel typu:

      1. V sekci Operace pole přetáhněte uzel Typ na plátno.

      2. Připojte uzel Oblast k uzlu Typ .

      3. Poklepejte na uzel Typ , abyste zobrazili jeho vlastnosti. Uzel Typ uvádí úroveň měření pro každé pole. Tento zdrojový datový soubor používá čtyři různé úrovně měření: Souvislé, Categorical, Nominal, Ordinal a Flag.

      4. Hledejte pole class . Pro každé pole role označuje část, kterou každé pole hraje při modelování. Změňte class Role na Cíl -pole, které chcete předpovídat.

      5. Klepněte na tlačítko Uložit.

    4. Přidejte uzel algoritmu klasifikace C5.0 :

      1. V sekci Modelování přetáhněte uzel C5.0 na plátno.

      2. Připojte uzel Typ k uzlu C5.0 .

      3. Poklepejte na uzel C5.0 , abyste zobrazili jeho vlastnosti. Ve výchozím nastavení je v algoritmu C5.0 vytvořen rozhodovací strom. Model C5.0 pracuje rozdělením vzorku na základě pole, které poskytuje maximální nárůst informací. Každý dílčí vzorek definovaný při prvním rozdělení je poté opět rozdělen, obvykle založený na jiném poli a proces se opakuje, dokud dílčí vzorky nemohou být dále rozděleny. A konečně se překontrolují lowes-level dělení a ty, které významně nepřispívají k hodnotě modelu, se odstraní.

      4. Přepnout na Použít nastavení definovaná v tomto uzlu.

      5. Pro Cílvyberte třídu.

      6. V sekci Vstupy klepněte na volbu Přidat sloupce.

        1. Zrušte zaškrtnutí políčka vedle pole Název pole.

        2. Vyberte age, sc, dm.

        3. Klepněte na tlačítko OK.

      7. Klepněte na tlačítko Uložit.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Na následujícím obrázku je zobrazen dokončený tok.

    tok zobrazující uzel datového aktiva, uzel oblasti, uzel typu a uzel třídy C5.0


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:20.

    Nyní, když jste navrhli tok, proveďte následující kroky ke spuštění toku a prohlédněte si diagram stromu, abyste viděli rozhodovací body:

    1. Klepněte pravým tlačítkem myši na uzel C5.0 a vyberte volbu Spustit. Spuštění toku vygeneruje nový model nugget na plátně.

    2. Klepněte pravým tlačítkem myši na model nugget a vyberte volbu Zobrazit model , abyste zobrazili podrobnosti modelu.

    3. Podívejte se na Informace o modelu , která poskytuje souhrn modelu.

    4. Klepněte na volbu Pravidla pro nejvyšší rozhodnutí. Tabulka zobrazuje posloupnost pravidel, která byla použita pro přiřazení jednotlivých záznamů k podřízeným uzlům na základě hodnot různých vstupních polí.

    5. Klepněte na volbu Důležitost funkce. Graf zobrazuje relativní důležitost jednotlivých prediktorů při odhadování modelu. Z toho si můžete prohlédnout, že sérového kreatininu je snadno nejdůležitějším faktorem, přičemž diabetes je dalším nejvýznamnějším faktorem.

    6. Klepněte na volbu Diagram stromu. Stejný model se zobrazuje ve formě stromu, s uzlem v každém bodu rozhodnutí.

      1. Ponechte ukazatel myši nad horním uzlem, který poskytuje souhrn pro všechny záznamy v datové sadě. Téměř 40% případů zařazených do souboru údajů je klasifikováno jako nediagnostikováno s onemocněním ledvin. Strom může poskytnout další vodítka k tomu, jaké faktory mohou být zodpovědné.

      2. Všimněte si dvou větví pocházejících z horního uzlu, které ukazují rozdělení podle sérového kreatininu.

        • Přezkoumejte větev, která zobrazuje záznamy, kde je hodnota kreatininu v séru vyšší než 1.25. V tomto případě, 100% z těchto pacientů má pozitivní diagnózu onemocnění ledvin.

        • Přezkoumejte větev, která zobrazuje záznamy, kde je sérový kreatinin menší než nebo roven 1.25. Téměř 80% z těchto pacientů nemá pozitivní diagnózu onemocnění ledvin, ale téměř 20% s nižší hladinou sérového kreatininu byly stále diagnostikovány s onemocněním ledvin.

      3. Všimněte si větví pocházejících z sc<=1.250, které je rozděleno na diabetes.

        • Přezkoumejte větev, která zobrazuje pacienty s nízkým sérovým kreatininem (sc<=1.250) a diagnostikovaným diabetem (dm = ano). 100% z těchto pacientů bylo také diagnostikováno s onemocněním ledvin.

        • Prověřujte větev, která ukazuje pacienty s nízkým sérovým kreatininem (sc<=1.250) a bez diabetu (dm = ne), 85% nebylo diagnostikováno s onemocněním ledvin, ale 15% z nich bylo diagnostikováno s onemocněním ledvin.

      4. Všimněte si větví pocházejících z dm = no, který je rozdělen posledním významným faktorem age.

        • Prohlédněte si větev, která zobrazuje pacienty ve věku 14 let nebo mladší (věk < = 14). Tato větev ukazuje, že 75% mladých pacientů s nízkým sérovým kreatininem a bez diabetu bylo u pacientů s rizikem vzniku onemocnění ledvin.

        • Revidujte větev, která zobrazuje pacienty starší než 14 let (věk > 14 let). Tato větev ukazuje, že pouze 12% pacientů ve věku nad 14 let s nízkým sérovým kreatininem a bez diabetu bylo ohroženo onemocnění ledvin.

      5. Zavřete podrobnosti modelu.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek znázorňuje stromový diagram.

    Následující obrázek znázorňuje stromový diagram.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 07:24.

    Chcete-li použít uzly analýzy a tabulky k vyhodnocení modelu, postupujte takto:

    1. V sekci Výstupy přetáhněte uzel Analýza na plátno.

    2. Připojte uzel Model k uzlu Analýza .

    3. Klepněte pravým tlačítkem myši na uzel Analýza a vyberte volbu Spustit.

    4. Na panelu Výstupy otevřete Analýza, která ukazuje, že model správně předpověděl diagnózu onemocnění ledvin téměř 95% času. Zavřete položku Analýza.

    5. Klepněte pravým tlačítkem myši na uzel Analýza a vyberte volbu Uložit větev jako model.

      1. Do pole Název modeluzadejte Kidney Disease Analysis.

      2. Klepněte na tlačítko Uložit.

      3. Klepněte na Zavřít.

    6. V sekci Výstupy přetáhněte uzel Tabulka na plátno.

      1. Připojte řetězec Model k uzlu Tabulka .

      2. Klepněte pravým tlačítkem myši na uzel Tabulka a vyberte volbu Zobrazit náhled dat.

      3. Když se zobrazí Náhled, posuňte se na poslední dva sloupce. Sloupec $C-Class obsahuje prognózu onemocnění ledvin a sloupec $CC-Class označuje skóre důvěry pro tuto předpověď.

      4. Zavřete položku Náhled.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje tabulku náhledu s předpověďmi.

    Následující obrázek ukazuje tabulku náhledu s předpověďmi.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 09:10.

    Nakonec postupujte podle následujících kroků k implementaci tohoto modelu a předvídání výsledku s novými daty.

    1. Vraťte se na kartu Aktiva projektu.

    2. Klepněte na sekci Modely a otevřete model Analýza onemocnění ledvin .

    3. Klepněte na volbu Povýšit na prostor implementace.

    4. Vyberte existující prostor implementace. Pokud nemáte prostor implementace, můžete vytvořit nový:

      1. Poskytněte název prostoru.

      2. Vyberte službu úložiště.

      3. Vyberte počítačovou službu učení.

      4. Klepněte na volbu Vytvořit.

      5. Klepněte na Zavřít.

    5. Vyberte volbu Přejít na model v prostoru po jeho povýšení.

    6. Klepněte na tlačítko Povýšit

    7. Když se model zobrazí uvnitř prostoru implementace, klepněte na volbu Nová implementace.

      1. Vyberte volbu Online jako Typ implementace.

      2. Zadejte název implementace.

      3. Klepněte na volbu Vytvořit.

    8. Po dokončení implementace klepněte na název implementace a zobrazte stránku s podrobnostmi o implementaci.

    9. Přejděte na kartu Test . Nasazený model můžete testovat ze stránky podrobností implementace dvěma způsoby: testem s formulářem nebo testem s kódem JSON.

    10. Klepněte na volbu Vstup JSON, potom zkopírujte následující testovací data a vložte ji, chcete-li nahradit existující text JSON:

      {
         "input_data": [
            {
               "fields": [
                           "age",
                           "bp",
                           "sg",
                           "al",
                           "su",
                           "rbc",
                           "pc",
                           "pcc",
                           "ba",
                           "bgr",
                           "bu",
                           "sc",
                           "sod",
                           "pot",
                           "hemo",
                           "pcv",
                           "wbcc",
                           "rbcc",
                           "htn",
                           "dm",
                           "cad",
                           "appet",
                           "pe",
                           "ane",
                           "class"
               ],
               "values": [
                          [
                          "62",
                           "80",
                           "1.01",
                           "2",
                           "3",
                           "normal",
                           "normal",
                           "notpresent",
                           "notpresent",
                           "423",
                           "53",
                           "1.8",
                           "",
                           "",
                           "9.6",
                           "31",
                           "7500",
                           "",
                           "no",
                           "yes",
                           "no",
                           "poor",
                           "no",
                           "yes",
                           "ckd"
                           ]
               ]
            }
         ]
      }
      
      
    11. Klepněte na tlačítko Předpovědět , chcete-li předpovědět, zda je 62 let s diabetem a s poměrem kreatininu v séru 1.8 pravděpodobně diagnostikován s onemocněním ledvin. Výsledná předpověď ukazuje, že tento pacient má vysokou pravděpodobnost diagnózy onemocnění ledvin.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje kartu Test pro implementaci modelu s predikcí.

    Na následujícím obrázku je zobrazena karta Test pro implementaci modelu s predikcí.


    Zpět na začátek

Další kroky

Nyní můžete tuto datovou sadu použít k další analýze. Můžete například provádět úlohy jako:

Další prostředky

Nadřízené téma: Výukové programy Stručný úvod

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more