Partitionsknoten werden zur Generierung eines Partitionsfelds verwendet, das Daten in getrennte Subsets bzw. Stichproben für die Trainings-, Test- und Validierungsphase der Modellerstellung aufteilt. Indem Sie das Modell mit einer Stichprobe generieren und dann mit einer anderen Stichprobe testen, erhalten Sie einen guten Hinweis dafür, wie gut das Modell sich für größere Datasets verallgemeinern lässt, die den aktuellen Daten ähneln.
Der Partitionsknoten generiert ein nominales Feld, dessen Rolle auf Partition eingestellt ist. Wenn ein geeignetes Feld bereits in Ihren Daten vorhanden ist, kann dieses alternativ mithilfe eines Typknotens als Partition gekennzeichnet werden. In diesem Fall ist kein gesonderter Partitionsknoten erforderlich. Jedes instanziierte nominale Feld mit zwei oder drei Werten kann verwendet werden, nicht jedoch Flagfelder.
In einem Ablauf können mehrere Partitionsfelder definiert werden. Wenn dies geschieht, muss allerdings bei jedem Modellierungsknoten, der Partitionierung verwendet, ein einzelnes Partitionsfeld ausgewählt werden. (Wenn nur eine einzige Partition vorhanden ist, wird diese immer automatisch verwendet, wenn die Partitionierung aktiviert ist.)
Um ein Partitionsfeld auf der Grundlage eines anderen Kriteriums, wie beispielsweise Datumsbereich oder Standort, zu erstellen, können Sie auch einen Ableitungsknoten verwenden. Weitere Informationen finden Sie unter Ableitungsknoten .
Beispiel. Bei der Erstellung eines RFM-Ablaufs zur Ermittlung aktueller Kunden, die positiv auf frühere Marketingkampagnen reagiert haben, verwendet die Marketingabteilung einer Vertriebsgesellschaft einen Partitionsknoten, um die Daten in Trainings- und Test-Partitionen zu unterteilen.