Translation not up to date
Regresja liniowa to często stosowana technika statystyczna przeznaczona do klasyfikowania rekordów na podstawie wartości numerycznych zmiennych wejściowych. Regresja liniowa dopasowuje prostą linię lub powierzchnię, która minimalizuje rozbieżności między wartościami przewidywanymi a rzeczywistymi wynikami.
Wymagania. W przypadku modelu regresji liniowej można stosować tylko zmienne numeryczne. Konieczne jest posiadanie dokładnie jednego pola docelowego (z rolą ustawioną na Target
) i jednego lub większej liczby predyktorów (z rolą ustawionej na Input
). Pola o roli Both
lub None
są ignorowane, podobnie jak pola inne niż liczbowe. (W razie potrzeby zmienne nienumeryczne mogą być rejestrowane przy użyciu węzła wyliczeń).
Mocne strony. Modele regresji są stosunkowo proste i zapewniają łatwy w interpretacji wzór matematyczny do generowania predykcji. Regresja liniowa jest od dawna stosowana jako procedura statystyczna, dlatego właściwości tych modeli są dobrze zrozumiałe. Uczenie modeli regresji zwykle przebiega bardzo szybko. Węzeł Regresja udostępnia metody automatycznego wyboru zmiennych w celu wyeliminowania z równania nieistotnych zmiennych wejściowych.
yes
/no
lub churn
/don't churn
, jako alternatywę można użyć regresji logistycznej. Regresja logistyczna zapewnia także pokrycie nienumerycznych zmiennych wejściowych, co eliminuje potrzebę ponownego kodowania tych zmiennych. Więcej informacji na ten temat zawiera sekcja Węzeł logistyczny .