0 / 0
Go back to the English version of the documentation
Szybki start: Budowanie modelu za pomocą programu SPSS Modeler
Last updated: 14 lis 2023
Szybki start: Budowanie modelu za pomocą programu SPSS Modeler

Modele można tworzyć, trenować i wdrażać za pomocą programu SPSS Modeler. Przeczytaj o programie SPSS Modeler, a następnie obejrzyj film wideo i postępuj zgodnie z kursem, który jest odpowiedni dla początkujących i nie wymaga pisania kodu.

Wymagane usługi
Watson Studio (w tym SPSS Modeler)
Watson Machine Learning

Podstawowy przepływ pracy obejmuje następujące zadania:

  1. Utwórz projekt. Projekty to miejsca, w których można współpracować z innymi osobami w celu pracy z danymi.
  2. Dodaj przepływ SPSS Modeler do projektu.
  3. Skonfiguruj węzły na kanwie i uruchom przepływ.
  4. Przejrzyj szczegóły modelu i zapisz model.
  5. Wdróż i przetestuj model.

Przeczytaj informacje na temat SPSS Modeler

Przepływy SPSS Modeler umożliwiają szybkie opracowywanie modeli predykcyjnych z wykorzystaniem wiedzy specjalistycznej i wdrażanie ich w procesach biznesowych w celu usprawnienia procesu podejmowania decyzji. Interfejs przepływów, zaprojektowany z myślą o oprogramowaniu klienckim SPSS Modeler i używanym przez niego modelu CRISP-DM, obsługuje cały proces eksploracji danych, od danych do lepszych wyników biznesowych.

Program SPSS Modeler oferuje wiele metod modelowania opartych na sztucznej inteligencji, uczeniu maszynowym i statystykach. Metody dostępne na palecie węzłów umożliwiają uzyskiwanie nowych informacji na podstawie danych i tworzenie modeli predykcyjnych. Każda metoda ma określone mocne strony i jest dostosowana do rozwiązywania określonych problemów.

Więcej informacji o programie SPSS Modeler

Dowiedz się więcej o innych sposobach budowania modeli

Obejrzyj film wideo na temat tworzenia modelu za pomocą programu SPSS Modeler

Obejrzyj wideo Obejrzyj ten film wideo, aby zobaczyć, jak utworzyć i uruchomić przepływ SPSS Modeler w celu wytrenowania modelu uczenia maszynowego.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.

Wypróbuj kurs, aby utworzyć model za pomocą programu SPSS Modeler

W tym kursie zostaną wykonane następujące czynności:

Ukończenie tego kursu zajmie około 30 minut.

Dane przykładowe

Zestaw danych używany w tym samouczku pochodzi z Uniwersytetu Kalifornijskiego w Irvine i jest wynikiem obszernego badania opartego na przyjęć do szpitala w czasie. Model będzie korzystać z trzech ważnych czynników, aby pomóc przewidzieć przewlekłe choroby nerek.



  • Użyj obrazu wideo

    Wskazówka: Rozpocznij film wideo, a następnie podczas przewijania kursu film wideo przechodzi do trybu obrazowania. Zamknij spis treści wideo, aby uzyskać najlepsze doświadczenia z obrazem. Istnieje możliwość użycia trybu obrazowania w obrazie, dzięki czemu można śledzić film wideo podczas wykonywania zadań w tym kursie. Kliknij znaczniki czasu dla każdego zadania, które ma być wykonywane.

    Poniższy animowany obraz przedstawia sposób korzystania z funkcji obrazków wideo i spisu treści:

    Jak korzystać z obrazka w obrazie i rozdziałów

    Uzyskaj pomoc w społeczności

    Aby uzyskać pomoc dotyczącą tego kursu, można zadać pytanie lub znaleźć odpowiedź na forum dyskusyjnym społeczności Cloud Pak for Data.

    Konfigurowanie okien przeglądarki

    Aby uzyskać optymalne dopasowanie do tego kursu, otwórz stronę Cloud Pak for Data w jednym oknie przeglądarki i pozostaw ten kurs otwarty w innym oknie przeglądarki, aby łatwo przełączać się między dwiema aplikacjami. Rozważ rozmieszczenie dwóch okien przeglądarki obok siebie, aby ułatwić sobie śledzenie.

    Kurs i interfejs użytkownika obok siebie

    Wskazówka: Jeśli podczas wykonywania tego kursu w interfejsie użytkownika pojawi się prezentacja z przewodnikiem, kliknij opcję Być może później.

    Początek strony


  • Do zapisania przepływu SPSS Modeler potrzebny jest projekt. Można użyć istniejącego projektu lub utworzyć projekt.

    1. Z menu nawigacyjnego Menu nawigacjiwybierz opcję Projekty > Wyświetl wszystkie projekty .

    2. Otwórz istniejący projekt. Aby użyć nowego projektu:

      1. Kliknij opcję Nowy projekt.

      2. Wybierz opcję Utwórz pusty projekt.

      3. Wprowadź nazwę i opcjonalny opis projektu.

      4. Wybierz istniejącą instancję usługi obiektowej pamięci masowej lub utwórz nową.

      5. Kliknij makro Create.

    Aby uzyskać więcej informacji lub obejrzeć film wideo, należy zapoznać się z sekcją Tworzenie projektu.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono nowy projekt.

    Na poniższym obrazku przedstawiono nowy projekt.


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo o godzinie 00:13.

    Ten kurs korzysta z przykładowego zestawu danych. Aby dodać przykładowy zestaw danych do projektu, wykonaj następujące kroki:

    1. Przejdź do repozytorium UCI ML Repository: Chronic Nerek Disease Data Set w Galerii.

    2. Kliknij opcję Podgląd. Istnieją trzy ważne czynniki, które pomagają przewidzieć przewlekłe choroby nerek, które są dostępne w ramach tej analizy: wiek osoby badanej, wyniki testu stężenia kreatyniny w surowicy i wyniki testu cukrzycy. Wartość klasy wskazuje, czy pacjent został wcześniej zdiagnozowany z powodu choroby nerek.

    3. Kliknij opcję Dodaj do projektu.

    4. Wybierz projekt z listy i kliknij przycisk Dodaj.

    5. Kliknij opcję Wyświetl projekt.

    6. Na stronie Zasoby projektu znajdź plik UCI ML Repository Chronic Nerek Disease Data Set.csv .

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono kartę Zasoby aplikacyjne w projekcie.

    Na poniższym obrazku przedstawiono kartę Zasoby w projekcie.


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo rozpoczynający się od strony 01:11.

    Wykonaj następujące kroki, aby utworzyć przepływ SPSS Modeler w projekcie:

    1. Kliknij opcję Nowy zasób > SPSS Modeler.

    2. Wpisz nazwę i opis przepływu.

    3. Jako definicję środowiska wykonawczego zaakceptuj definicję Default SPSS Modeler S .

    4. Kliknij makro Create. Spowoduje to otwarcie edytora przepływu, który będzie używany do tworzenia przepływu.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono edytor przepływu.

    Na poniższym obrazku przedstawiono edytor przepływu.


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo rozpoczynający się od strony 01:31.

    Po załadowaniu danych należy je przetransformować. Utwórz prosty przepływ, przeciągając transformatory i estymatory na kanwę i łącząc je ze źródłem danych. Użyj następujących węzłów z palety:

    • Zasób danych: ładuje plik csv z projektu

    • Podział: dzieli dane na segmenty szkoleniowe i testowe

    • Typ: ustawia typ danych. Użyj go do określenia pola class jako typu target .

    • C5.0: algorytm klasyfikacji

    • Analiza: wyświetlanie modelu i sprawdzanie jego dokładności

    • Tabela: podgląd danych z predykcjami

    Aby utworzyć przepływ, wykonaj następujące kroki:

    1. Dodaj węzeł zasobu danych:

      1. Z sekcji Import przeciągnij węzeł Zasób aplikacyjny danych na kanwę.

      2. Kliknij dwukrotnie węzeł Zasób danych , aby wybrać zestaw danych.

      3. Wybierz opcję Zasób danych > Repozytorium UCI ML Dane o przewlekłej chorobie nerek Set.csv.

      4. Kliknij przycisk Wybierz.

      5. Wyświetl właściwości zasobu danych.

      6. Kliknij przycisk Zapisz.

    2. Dodaj węzeł podziału na partycje:

      1. Z sekcji Operacje na zmiennych przeciągnij węzeł Podział na kanwę.

      2. Połącz węzeł Zasób danych z węzłem Partycja .

      3. Kliknij dwukrotnie węzeł Partycja , aby wyświetlić jego właściwości. Podział domyślny dzieli połowę danych na potrzeby treningu, a drugą połowę na potrzeby testowania.

      4. Kliknij przycisk Zapisz.

    3. Dodaj węzeł typu:

      1. Z sekcji Operacje na zmiennych przeciągnij węzeł Typ na kanwę.

      2. Połącz węzeł Partycja z węzłem Typ .

      3. Kliknij dwukrotnie węzeł Typ , aby wyświetlić jego właściwości. Węzeł Typ określa poziom pomiaru dla każdej zmiennej. W tym źródłowym pliku danych używane są cztery różne poziomy pomiaru: ilościowy, jakościowy, nominalny, porządkowy i flaga.

      4. Wyszukaj pole class . Dla każdej zmiennej rola wskazuje rolę, jaką każda zmienna odgrywa w modelowaniu. Zmień wartość class Rola na Przewidywana -zmienna, która ma być przewidywana.

      5. Kliknij przycisk Zapisz.

    4. Dodaj węzeł algorytmu klasyfikacji C5.0 :

      1. Z sekcji Modelowanie przeciągnij węzeł C5.0 na kanwę.

      2. Połącz węzeł Typ z węzłem C5.0 .

      3. Kliknij dwukrotnie węzeł C5.0 , aby wyświetlić jego właściwości. Domyślnie algorytm C5.0 buduje drzewo decyzyjne. Model C5.0 działa, dzieląc próbę na podstawie zmiennej, która zapewnia maksymalny zysk informacji. Każda podpróba zdefiniowana przez pierwszy podział jest następnie dzielona ponownie, zwykle na podstawie innej zmiennej, a proces jest powtarzany do momentu, gdy podpróby nie mogą być dalej dzielone. Na koniec ponownie analizowane są podziały na najniższym poziomie, a te, które nie przyczyniają się znacząco do wartości modelu, są usuwane.

      4. Włącz lub wyłącz opcję Użyj ustawień zdefiniowanych w tym węźle.

      5. W polu Celwybierz wartość class.

      6. W sekcji Wejścia kliknij opcję Dodaj kolumny.

        1. Usuń zaznaczenie pola wyboru obok pola Nazwa pola.

        2. Wybierz wiek, sc, dm.

        3. Kliknij przycisk OK.

      7. Kliknij przycisk Zapisz.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono ukończony przepływ.

    przepływ przedstawiający węzeł Zasób danych, węzeł Podział, węzeł Typ i węzeł klasy C5.0


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tej czynności, należy obejrzeć film wideo począwszy od wersji 04:20.

    Po zaprojektowania przepływu wykonaj następujące kroki, aby uruchomić przepływ, i sprawdź diagram drzewa, aby wyświetlić punkty decyzyjne:

    1. Kliknij prawym przyciskiem myszy węzeł C5.0 i wybierz opcję Uruchom. Uruchomienie przepływu powoduje wygenerowanie nowego modelu użytkowego na kanwie.

    2. Kliknij prawym przyciskiem myszy model użytkowy i wybierz opcję Wyświetl model , aby wyświetlić szczegóły modelu.

    3. Wyświetl Informacje o modelu , które udostępniają podsumowanie modelu.

    4. Kliknij opcję Najważniejsze reguły decyzyjne. Tabela zawiera szereg reguł, które zostały użyte do przypisania pojedynczych rekordów do węzłów podrzędnych na podstawie wartości różnych zmiennych wejściowych.

    5. Kliknij opcję Ważność elementów. Wykres przedstawia względną ważność każdego predyktora przy szacowaniu modelu. Z tego, widać, że stężenie kreatyniny w surowicy jest łatwo najważniejszym czynnikiem, z cukrzycą jest kolejnym najważniejszym czynnikiem.

    6. Kliknij opcję Diagram drzewa. Ten sam model jest wyświetlany w postaci drzewa z węzłem w każdym punkcie decyzyjnym.

      1. Umieść wskaźnik myszy nad węzłem najwyższego poziomu, który udostępnia podsumowanie dla wszystkich rekordów w zestawie danych. Prawie 40% przypadków w zestawie danych jest sklasyfikowanych jako nie zdiagnozowane z chorobą nerek. Drzewo może dostarczyć dodatkowych wskazówek co do czynników, które mogą być odpowiedzialne.

      2. Zwróć uwagę na dwie gałęzie pochodzące z górnego węzła, które wskazują na podział według stężenia kreatyniny w surowicy.

        • Przejrzyj gałąź, która przedstawia rekordy, w których stężenie kreatyniny w surowicy jest większe niż 1.25. W tym przypadku, 100% tych pacjentów ma pozytywną diagnozę choroby nerek.

        • Przejrzyj gałąź, która przedstawia rekordy, w których stężenie kreatyniny w surowicy jest mniejsze lub równe 1.25. Prawie 80% tych pacjentów nie ma pozytywnej diagnozy choroby nerek, ale prawie 20% z niższym stężeniem kreatyniny w surowicy nadal zdiagnozowano choroby nerek.

      3. Zwróć uwagę na gałęzie pochodzące z sc<=1.250, które są dzielone przez cukrzycę.

        • Przejrzyj gałąź, w której znajdują się pacjenci z niskim stężeniem kreatyniny w surowicy (sc<=1.250) i rozpoznaną cukrzycą (dm = yes). U 100% z tych pacjentów rozpoznano również chorobę nerek.

        • Należy przejrzeć gałąź, w której znajdują się pacjenci z niskim stężeniem kreatyniny w surowicy (sc<=1.250) i bez cukrzycy (dm = no), u 85% nie rozpoznano choroby nerek, ale u 15% z nich nadal rozpoznano chorobę nerek.

      4. Zwróć uwagę na gałęzie pochodzące od dm = no, które są podzielone przez ostatni istotny czynnik, age.

        • Przejrzyj gałąź, która przedstawia pacjentów w wieku 14 lat lub młodszych (wiek < = 14). Gałąź ta wskazuje, że 75% młodych pacjentów z niskim stężeniem kreatyniny w surowicy i bez cukrzycy było zagrożonych chorobą nerek.

        • Należy przejrzeć gałąź, w której znajdują się pacjenci w wieku powyżej 14 lat (wiek > 14 lat). Ta gałąź wskazuje, że tylko 12% pacjentów w wieku powyżej 14 lat z niskim stężeniem kreatyniny w surowicy i bez cukrzycy było zagrożonych chorobą nerek.

      5. Zamknij szczegóły modelu.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono diagram drzewa.

    Na poniższym obrazku przedstawiono diagram drzewa.


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo rozpoczynający się od godziny 07:24.

    Wykonaj następujące kroki, aby użyć węzłów analizy i tabeli do oceny modelu:

    1. Z sekcji Wyniki przeciągnij węzeł Analiza na kanwę.

    2. Połącz model użytkowy Model z węzłem Analiza .

    3. Kliknij prawym przyciskiem myszy węzeł Analiza i wybierz opcję Uruchom.

    4. W panelu Wyjścia otwórz okno Analiza, które pokazuje, że model prawidłowo przewidywał diagnozę choroby nerek prawie przez 95% czasu. Zamknij okno Analiza.

    5. (Opcjonalnie) Na pasku narzędzi kliknij ikonę Pobierz , aby zapisać model jako plik .str.

    6. Kliknij prawym przyciskiem myszy węzeł Analiza i wybierz opcję Zapisz gałąź jako model.

      1. W polu Nazwa modeluwpisz Kidney Disease Analysis.

      2. Kliknij przycisk Zapisz.

      3. Kliknij opcję Zamknij.

    7. Z sekcji Wyjścia przeciągnij węzeł Tabela na kanwę.

      1. Połącz model użytkowy Model z węzłem Tabela .

      2. Kliknij prawym przyciskiem myszy węzeł Tabela i wybierz opcję Podgląd danych.

      3. Po wyświetleniu podglądu przewiń ekran do dwóch ostatnich kolumn. Kolumna $C-Class zawiera prognozę choroby nerek, a kolumna $CC-Class wskazuje ocenę ufności dla tej predykcji.

      4. Zamknij okno Podgląd.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono tabelę podglądu z predykcjami.

    Na poniższym obrazku przedstawiono tabelę podglądu z predykcjami.


    Początek strony


  • Film wideo z kursu podglądu Aby wyświetlić podgląd tego zadania, należy obejrzeć film wideo o godzinie 09:10.

    Na koniec wykonaj poniższe kroki, aby wdrożyć ten model i przewidzieć wynik przy użyciu nowych danych.

    1. Wróć do karty Zasoby aplikacyjne projektu.

    2. Kliknij sekcję Modele i otwórz model Analiza chorób nerek .

    3. Kliknij opcję Awansuj do obszaru wdrażania.

    4. Wybierz istniejący obszar wdrażania. Jeśli nie masz obszaru wdrażania, możesz utworzyć nowy:

      1. Podaj nazwę obszaru.

      2. Wybierz usługę pamięci masowej.

      3. Wybierz usługę uczenia maszynowego.

      4. Kliknij makro Create.

      5. Kliknij opcję Zamknij.

    5. Wybierz opcję Idź do modelu w obszarze po awansowaniu go.

    6. Kliknij opcję Awansuj.

    7. Po wyświetleniu modelu w obszarze wdrażania kliknij opcję Nowe wdrożenie.

      1. W polu Typ wdrożeniawybierz opcję Tryb z połączeniem .

      2. Podaj nazwę wdrożenia.

      3. Kliknij makro Create.

    8. Po zakończeniu wdrażania kliknij nazwę wdrożenia, aby wyświetlić stronę szczegółów wdrożenia.

    9. Przejdź do karty Test . Wdrożony model można przetestować na stronie szczegółów wdrożenia na dwa sposoby: przetestować przy użyciu formularza lub przetestować przy użyciu kodu JSON.

    10. Kliknij opcję Dane wejściowe JSON, a następnie skopiuj następujące dane testowe i wklej je, aby zastąpić istniejący tekst JSON:

      {
         "input_data": [
            {
               "fields": [
                           "age",
                           "bp",
                           "sg",
                           "al",
                           "su",
                           "rbc",
                           "pc",
                           "pcc",
                           "ba",
                           "bgr",
                           "bu",
                           "sc",
                           "sod",
                           "pot",
                           "hemo",
                           "pcv",
                           "wbcc",
                           "rbcc",
                           "htn",
                           "dm",
                           "cad",
                           "appet",
                           "pe",
                           "ane",
                           "class"
               ],
               "values": [
                          [
                          "62",
                           "80",
                           "1.01",
                           "2",
                           "3",
                           "normal",
                           "normal",
                           "notpresent",
                           "notpresent",
                           "423",
                           "53",
                           "1.8",
                           "",
                           "",
                           "9.6",
                           "31",
                           "7500",
                           "",
                           "no",
                           "yes",
                           "no",
                           "poor",
                           "no",
                           "yes",
                           "ckd"
                           ]
               ]
            }
         ]
      }
      
      
    11. Kliknij opcję Predykcja , aby przewidzieć, czy u 62. roku życia z cukrzycą i współczynnikiem kreatyniny w surowicy krwi wynoszącym 1.8 może wystąpić choroba nerek. Wynikająca z tego prognoza wskazuje, że ten pacjent ma wysokie prawdopodobieństwo rozpoznania choroby nerek.

    Ikona punktu kontrolnego Sprawdź postęp

    Na poniższym obrazku przedstawiono kartę Test dla wdrożenia modelu z predykcją.

    Na poniższym obrazku przedstawiono kartę Test dla wdrożenia modelu z predykcją.


    Początek strony

Następne kroki

Teraz można użyć tego zestawu danych do dalszej analizy. Można na przykład wykonać następujące zadania:

Zasoby dodatkowe

Temat nadrzędny: Kursy szybkiego startu

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more