Translation not up to date
Węzeł Auto Grupowanie szacuje i porównuje modele skupień identyfikujące grupy rekordów o podobnej charakterystyce. Węzeł działa tak samo, jak pozostałe zautomatyzowane węzły modelowania, umożliwiając eksperymentowanie z wieloma kombinacjami opcji w pojedynczym przebiegu modelowania. Modele można porównywać, korzystając z miar bazowych, które pozwalają podejmować próby filtrowania i oceny przydatności modelu skupień oraz udostępniają miary bazujące na istotności poszczególnych zmiennych.
Modele skupień są często używane do identyfikacji grup, które mogą być używane jako dane wejściowe do dalszej analizy. Możesz na przykład chcieć docelowe grupy klientów w oparciu o cechy demograficzne, takie jak dochód, lub na podstawie usług, które kupiły w przeszłości. Można to zrobić bez wcześniejszej wiedzy o grupach i ich cechach-może nie wiadomo, ile grup jest poszukiwać, czy jakie funkcje użyć podczas definiowania ich. Modele skupień nazywane są często modelami uczenia nienadzorowanego, ponieważ nie korzystają ze zmiennej przewidywanej i nie zwracają konkretnej predykcji o wartości prawda albo fałsz. Wartość modelu skupień określana jest przez jego zdolność do wykrywania interesujących skupień w danych i oferowania użytecznych opisów tych skupień.
Wymagania. Jedna lub więcej zmiennych definiujących interesujące nas cechy. W modelach skupień nie są używane zmienne przewidywane, tak jak w innych modelach, ponieważ modele skupień nie generują konkretnych predykcji o wartości prawda albo fałsz. Zamiast tego są one używane do identyfikowania grup obserwacji, które mogą być powiązane. Na przykład nie można użyć modelu klastra w celu przewidywania, czy dany klient będzie oddany do oferty, czy też nie odpowie na ofertę. Ale można użyć takiego modelu do przypisywania klientów do grup na podstawie ich tendencji do podejmowania takich decyzji. Zmienne wagi i częstości nie są używane.
Pola ewaluacji. Mimo że nie jest używana zmienna przewidywana, można opcjonalnie określić jedną lub wiele zmiennych ewaluacyjnych, które posłużą do porównywania modeli. Użyteczność modelu skupień można ocenić, mierząc, na ile dobrze (lub źle) skupienia różnicują te zmienne.
Obsługiwane typy modeli
Do obsługiwanych typów modeli należą: Dwustopniowa, K-średnie, Kohonen, SVM z jedną klasą i K-średnie-AS.