I nodi Partizione vengono utilizzati per generare un campo partizione che suddivide i dati in sottoinsiemi distinti o campioni destinati alle fasi di addestramento, test e convalida della creazione del modello. Utilizzando un campione per generare il modello e un altro campione per sottoporlo a verifica, è possibile ottenere una valida indicazione del modo in cui il modello potrà essere esteso a insiemi di dati di dimensioni maggiori, più simili ai dati correnti.
Il nodo Partizione genera un campo nominale con il ruolo impostato su Partizione. In alternativa, se nei dati esiste già un campo appropriato, è possibile definirlo come una partizione utilizzando un nodo Tipo. In questo caso non è necessario un nodo Partizione distinto. Come partizione è possibile utilizzare qualsiasi campo nominale istanziato con due o tre valori, ma non è possibile utilizzare i campi indicatore.
È possibile definire più campi partizione in un flusso, ma in questo caso è necessario selezionare un singolo campo partizione in ogni nodo di modellazione che utilizza il partizionamento. Se è presente un'unica partizione, verrà utilizzata automaticamente quando si attiva il partizionamento.
Per creare un campo partizione in base ad altri criteri, per esempio un intervallo di date o una posizione, è inoltre possibile utilizzare un nodo Ricava. Per ulteriori informazioni, vedere Nodo Nuovo campo .
Esempio. Durante la creazione di un flusso RFM per individuare i clienti recenti che hanno risposto in modo favorevole alle precedenti campagne di marketing, la divisione marketing di un'azienda utilizza un nodo Partizione per suddividere i dati in partizioni di addestramento e di test.