Translation not up to date
Model to zestaw reguł, formuł lub równań, które mogą być używane do przewidywania danych wynikowych w oparciu o zestaw zmiennych wejściowych. Na przykład instytucja finansowa może używać modelu do przewidywania, czy osoby ubiegające się o kredyt są obarczone wysokim czy niskim poziomem ryzyka, w oparciu o uzyskane informacje na temat poprzednich wnioskujących.
Zastrzeżenie wideo: Niektóre drobne kroki i elementy graficzne w tych filmikach mogą różnić się od używanej platformy.
https://video.ibm.com/embed/recorded/131116287
Możliwość przewidywania wyniku to centralny cel analizy predykcyjnej, a zrozumienie procesu modelowania jest kluczem do używania przepływów w produkcie Watson Studio.
W tym przykładzie użyto modelu drzewa decyzyjnego , który klasyfikuje rekordy (i predykuje odpowiedź) przy użyciu szeregu reguł decyzyjnych. Na przykład:
IF income = Medium
AND cards <5
THEN -> 'Good'
W tym przykładzie użyto modelu CHAID (Chi-kwadrat Automatic Interaction Detection), który jest przeznaczony jako ogólne wprowadzenie, a większość pojęć jest szeroko stosowana do innych typów modelowania w produkcie Watson Studio.
Aby zrozumieć dowolny model, należy najpierw zapoznać się z danymi, które się do niego trafiają. Dane w tym przykładzie zawierają informacje na temat klientów banku. Używane są następujące zmienne:
Nazwa pola | Opis |
---|---|
Credit_rating | Ocena kredytowa: 0=pozytywna, 1=negatywna, 9=brak wartości |
Wiek | Wiek w latach |
Przychód | Poziom przychodu: 1=niski, 2=średni, 3=wysoki |
Credit_cards | Liczba posiadanych kart kredytowych: 1=mniej niż pięć, 2=pięć lub więcej |
Edukacja | Poziom wykształcenia: 1=wyższe, 2=średnie |
Car_loans | Liczba zaciągniętych kredytów samochodowych: 1=brak lub jeden, 2=więcej niż dwa |
Bank opracowuje bazę danych zawierającą historyczne informacje o klientach, którym bank udzielił kredytu, z uwzględnieniem faktu, czy kredyty te spłacili (Ocena kredytowa = pozytywna) czy nie (Ocena kredytowa = negatywna). Korzystając z istniejących danych, bank zamierza utworzyć model, który umożliwi przewidywanie prawdopodobieństwa, że przyszli wnioskujący o kredyt nie będą spłacać zobowiązań.
Używając modelu drzewa decyzyjnego, można przeprowadzić analizę cech dwóch grup klientów i przewidzieć prawdopodobieństwo niespłacania kredytu.
W tym przykładzie używany jest przepływ o nazwie Introduction to Modeling(Wprowadzenie do modelowania), który jest dostępny w przykładowym projekcie. Plik danych to tree_credit.csv.
Przyjrzyjmy się przepływowi.
- Otwórz Przykładowy projekt.
- Przewiń w dół do sekcji Projektant przepływów , kliknij opcję Wyświetl wszystko, a następnie wybierz przepływ Wprowadzenie do modelowania .