Les noeuds Partitionner sont utilisés pour générer un champ de partition qui sépare les données en sous-ensembles ou en échantillons distincts pour les phases d'apprentissage, de test et de validation de la génération de modèle. L'utilisation d'un échantillon pour la génération du modèle et d'un échantillon distinct pour le tester vous permet d'avoir une bonne indication de la manière dont le modèle peut se généraliser à des jeux de données plus importants, semblables aux données actuelles.
Le noeud Partitionner génère un champ nominal dont le rôle est configuré sur Partitionner. Si vos données comportent déjà un champ adapté, vous pouvez également le désigner en tant que partition à l'aide d'un noeud Typer. Dans ce cas, vous n'avez pas besoin d'un noeud Partitionner distinct. Tout champ nominal instancié comportant deux ou trois valeurs peut être utilisé en tant que partition à l'exception des champs indicateurs.
Vous pouvez définir plusieurs champs de partition dans un flux, mais vous devrez alors sélectionner un champ de partition unique dans chaque noeud de modélisation qui utilise le partitionnement. (Dans le cas d'une seule partition, cette partition est automatiquement utilisée lorsque la fonction de partition est activée.)
Pour créer un champ de partition en fonction de certains critères, tels qu'un intervalle de date ou un emplacement, vous pouvez également utiliser un noeud Calculer. Pour plus d'informations, voir Noeud Calculer .
Exemple. Lors de la création d'un flux RFM pour identifier les clients récents qui ont réagi favorablement aux précédentes campagnes de marketing, le service marketing d'une société de ventes utilise un noeud Partitionner pour diviser les données en partitions de formation et de test.