propriétés de rfnode | IBM Cloud Pak for Data as a Service

Retourner à la version anglaise de la documentation

propriétés de rfnode

Dernière mise à jour : 07 oct. 2024

propriétés de rfnode

Icône de noeud Random Forest Le noeud Random Forest utilise une implémentation avancée d'un algorithme de bagging employant un modèle d'arbre comme modèle de base. Ce noeud de modélisation Random Forest dans SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque scikit-learn© Python .

Tableau 1. Propriétés de rfnode
`rfnode`propriétés	Type de données	Description de la propriété
`custom_fields`	Booléen	Cette option indique au noeud d'utiliser les informations du champ spécifiées ici au lieu des informations données dans un noeud type en amont. Après avoir sélectionné cette option, spécifiez les zones suivantes, selon les besoins.
`inputs`	Zone	Liste des noms de champ pour l'entrée.
`target`	Zone	Un nom de champ pour la cible.
`fast_build`	Booléen	Utilisez plusieurs coeurs d'UC pour améliorer la création de modèles.
`role_use`	chaîne	Spécifiez `predefined` pour utiliser des rôles prédéfinis ou `custom` pour utiliser des affectations de champ personnalisées. La valeur par défaut est "Predefined".
`splits`	Zone	Liste des noms de champ pour la scission.
`n_estimators`	Integer	Nombre d'arbres à construire. La valeur par défaut est `10`.
`specify_max_depth`	Booléen	Indique le nombre de niveaux maximum. Si `false`, les noeuds sont développés jusqu'à ce que toutes les feuilles soient épurées ou jusqu'à ce qu'elles contiennent moins d'information que les échantillons `min_samples_split`. La valeur par défaut est `false`.
`max_depth`	Integer	Profondeur maximale de l'arbre. La valeur par défaut est `10`.
`min_samples_leaf`	Integer	Taille minimale du noeud feuille. La valeur par défaut est `1`.
`max_features`	chaîne	Nombre de fonctions à prendre en compte pour déterminer le meilleur fractionnement : Si `auto`, alors utilisez `max_features=sqrt(n_features)` pour le classificateur et `max_features=sqrt(n_features)` pour la régression. Si `sqrt`, alors utilisez `max_features=sqrt(n_features)`. Si `log2`, alors utilisez `max_features=log2 (n_features)`. La valeur par défaut est `auto`.
`bootstrap`	Booléen	Indique si des échantillons de bootstrap sont utilisés lors de la génération d'arbres. La valeur par défaut est `true`.
`oob_score`	Booléen	Utilisez les échantillons out-of-bag pour estimer la précision de la généralisation. La valeur par défaut est `false`.
`extreme`	Booléen	Utilisez des arbres extrêmement aléatoires. La valeur par défaut est `false`.
`use_random_seed`	Booléen	Indiquez ce choix pour obtenir des résultats répliqués. La valeur par défaut est `false`.
`random_seed`	Integer	Valeur de départ aléatoire à utiliser lors de la génération d'arbres. Indiquez un nombre entier.
`cache_size`	Float	Taille du cache du noyau en Mo. La valeur par défaut est `200`.
`enable_random_seed`	Booléen	Active le paramètre `random_seed`. Indiquez true ou false. La valeur par défaut est `false`.
`enable_hpo`	Booléen	Spécifiez `true` ou `false` pour activer ou désactiver les options HPO. Si la valeur est `true`, Rbfopt est appliqué pour déterminer automatiquement le « meilleur » modèle de forêt aléatoire, qui atteint la valeur d'objectif cible définie par l'utilisateur avec le paramètre `target_objval` suivant.
`target_objval`	Float	La valeur de fonction objective (taux d'erreur du modèle sur les échantillons) que vous voulez atteindre (par exemple, la valeur de l'optimum inconnu). Définissez ce paramètre sur la valeur appropriée si l'optimum est inconnu (par exemple, `0.01`).
`max_iterations`	Integer	Nombre maximal d'itérations d'essai du modèle. La valeur par défaut est `1000`.
`max_evaluations`	Integer	Nombre maximal d'évaluations de fonction pour essayer le modèle, la précision étant préférée à la rapidité. La valeur par défaut est `300`.