propriétés de featureselectionnode
Dernière mise à jour : 11 févr. 2025
Le noeud Sélection de fonction filtre les champs d'entrée en vue de leur suppression, en fonction d'un ensemble de critères donné (tel que le pourcentage de valeurs manquantes) ; il classe ensuite les entrées restantes selon leur importance par rapport à la cible indiquée. Si l'on prend, par exemple, un de l'ensemble de données comportant des centaines d'entrées potentielles, quelles sont celles susceptibles d'être les plus utiles dans la modélisation des résultats de patients ?
Exemple
node = stream.create("featureselection", "My node") node.setPropertyValue("screen_single_category", True) node.setPropertyValue("max_single_category", 95) node.setPropertyValue("screen_missing_values", True) node.setPropertyValue("max_missing_values", 80) node.setPropertyValue("criteria", "Likelihood") node.setPropertyValue("unimportant_below", 0.8) node.setPropertyValue("important_above", 0.9) node.setPropertyValue("important_label", "Check Me Out!") node.setPropertyValue("selection_mode", "TopN") node.setPropertyValue("top_n", 15)
Propriétés
|
Valeurs | Description de la propriété |
---|---|---|
|
Zone | Les modèles Sélection de fonction classent les prédicteurs par rapport à la cible spécifiée. Les champs de pondération et de fréquence ne sont pas utilisés. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
|
option | Si , filtre les champs contenant trop d'enregistrements qui tombent dans la même catégorie par rapport au nombre total d'enregistrements. |
|
number | Indique le seuil utilisé lorsque est . |
|
option | Si , filtre les champs contenant trop de valeurs manquantes, exprimées en pourcentage du nombre total d'enregistrements. |
|
number | |
|
option | Si , filtre les champs contenant trop de catégories par rapport au nombre total d'enregistrements. |
|
number | |
|
option | Si , filtre les champs dont l'écart type est inférieur ou égal au minimum spécifié. |
|
number | |
|
option | Si , filtre les champs dont le coefficient de variance est inférieur ou égal au minimum spécifié. |
|
number | |
|
|
Lors du classement des prédicteurs indépendants par rapport à une cible catégorielle, indique la mesure sur laquelle est basée la valeur d'importance. |
|
number | Indique les valeurs p du seuil, utilisées pour classer les variables comme étant importantes, marginales ou non significatives. Accepte des valeurs de 0,0 à 1,0. |
|
number | Accepte des valeurs de 0,0 à 1,0. |
|
chaîne | Indique le libellé du classement non significatif. |
|
chaîne | |
|
chaîne | |
|
|
|
|
option | Lorsque est défini sur , indique si des champs importants doivent être sélectionnés. |
|
option | Lorsque est défini sur , indique si les champs marginaux doivent être sélectionnés. |
|
option | Lorsque est défini sur , indique s'il faut sélectionner des champs sans importance. |
|
number | Lorsque est défini sur , indique la valeur limite à utiliser. Accepte des valeurs de 0 à 100. |
|
Integer | Lorsque est défini sur , indique la valeur limite à utiliser. Accepte des valeurs de 0 à 1000. |
La rubrique a-t-elle été utile ?
0/1000