Définition du rôle de champ
Le rôle d'un champ contrôle la façon dont il est utilisé dans la génération de modèles - par exemple, si un champ est une entrée ou une cible (la chose prévue).
Les rôles suivants sont disponibles :
Entrée. Le champ est utilisé comme entrée pour l'apprentissage automatique (champ prédicteur).
Cible. Le champ est utilisé comme sortie ou cible pour l'apprentissage automatique (l'un des champs que le modèle essaie de prédire).
Les deux. Le champ est utilisé comme entrée et sortie par le noeud Apriori. Tous les autres noeuds modélisation ignorent ce champ.
Aucun. Le champ est ignoré par l'apprentissage automatique. Les champs dont le niveau de mesure est défini sur Sans type sont automatiquement définis sur Aucun dans la colonne Rôle.
Partition. Indique un champ utilisé pour partitionner les données en échantillons distincts pour l'apprentissage, le test et la validation (facultatif). Le champ doit être un type d'ensemble instancié avec deux ou trois valeurs possibles (telles qu'elles sont définies dans les paramètres avancés en cliquant sur l'icône d'engrenage). La première valeur représente l'échantillon d'apprentissage, le second l'échantillon de test et le troisième (s'il existe) l'échantillon de validation. Toutes les valeurs supplémentaires sont ignorées et les champs indicateurs ne peuvent pas être utilisés. Notez que pour utiliser la partition dans une analyse, le partitionnement doit être activé dans les paramètres du noeud de création de modèle ou d'analyse approprié. Les enregistrements du champ de partition comportant des valeurs nulles sont exclus de l'analyse lorsque la fonction de partition est activée. Si vous avez défini plusieurs champs de partition dans le flux, vous devez spécifier un champ de partition unique dans les paramètres de noeud pour chaque noeud de modélisation applicable. Si aucun champ adapté n'existe encore dans vos données, vous pouvez en créer un via un noeud Partitionner ou Calculer. Pour plus d'informations, voir Noeud de partition .
Scission. (Champs nominal, ordinal et indicateur uniquement.) Indique qu'un modèle est généré pour chaque valeur possible du champ.
Fréquence. (Champs numériques uniquement.) La définition de ce rôle permet d'utiliser la valeur du champ comme un facteur de pondération de fréquence pour l'enregistrement. Cette fonction est prise en charge par les noeuds C & R Tree, CHAID, QUEST et Linear uniquement ; tous les autres noeuds ignorent ce rôle. La pondération de fréquence est activée au moyen de l'option Utiliser la pondération de fréquence dans les paramètres des noeuds de modélisation prenant en charge la fonction.
ID enregistrement. Le champ est utilisé comme identificateur d'enregistrement unique. Cette fonction est ignorée par la plupart des noeuds ; cependant, elle est prise en charge par les modèles linéaires.