Translation not up to date
Węzły podziału na podzbiory służą do generowania zmiennej dzielącej na podzbiory, która dzieli dane na osobne podzbiory lub próby wykorzystywane podczas uczenia, testowania i walidacji w procesie budowania modelu. Korzystając z jednej próby do generowania modelu oraz innej do testowania go, można uzyskać wiarygodne informacje o tym, jak dobrze model pozwala uogólnić większe zbiory danych, podobne do danych bieżących.
Węzeł Partycja generuje zmienną nominalną z rolą ustawioną na Partycja. Alternatywnie, jeśli w danych istnieje już odpowiednia zmienna, można ją wyznaczyć jako partycję, korzystając z węzła Typy. W takim przypadku nie jest wymagany osobny węzeł podziału na podzbiory. Określona zmienna nominalna z dwoma lub trzema wartościami może być używana jako podzbiór; zmienne flagi nie mogą być używane.
W przepływie można zdefiniować wiele pól partycji, ale jeśli tak, to w każdym węźle modelowania, który korzysta z partycjonowania, musi być wybrane pole pojedynczej partycji. (Jeśli obecna jest tylko jedna zmienna dzieląca na podzbiory, jest ona automatycznie używana po aktywowaniu dzielenia).
Aby utworzyć zmienną dzielącą na podzbiory na podstawie innego kryterium, takiego jak zakres dat lub lokalizacja, można także użyć węzła Wyliczanie. Więcej informacji na ten temat zawiera sekcja Węzeł wyliczeń .
Przykład. Podczas budowania przepływu RFM w celu zidentyfikowania ostatnich klientów, którzy pozytywnie odpowiedzieli na poprzednie kampanie marketingowe, dział marketingu firmy zajmujący się sprzedażą korzysta z węzła partycji w celu podzielenia danych na partycje szkoleniowe i testowe.