0 / 0
Retourner à la version anglaise de la documentation
propriétés de rfnode
Dernière mise à jour : 07 oct. 2024
propriétés de rfnode

Icône de noeud Random ForestLe noeud Random Forest utilise une implémentation avancée d'un algorithme de bagging employant un modèle d'arbre comme modèle de base. Ce noeud de modélisation Random Forest dans SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque scikit-learn© Python .

Tableau 1. Propriétés de rfnode
rfnodepropriétés Type de données Description de la propriété
custom_fields Booléen Cette option indique au noeud d'utiliser les informations du champ spécifiées ici au lieu des informations données dans un noeud type en amont. Après avoir sélectionné cette option, spécifiez les zones suivantes, selon les besoins.
inputs Zone Liste des noms de champ pour l'entrée.
target Zone Un nom de champ pour la cible.
fast_build Booléen Utilisez plusieurs coeurs d'UC pour améliorer la création de modèles.
role_use chaîne Spécifiez predefined pour utiliser des rôles prédéfinis ou custom pour utiliser des affectations de champ personnalisées. La valeur par défaut est "Predefined".
splits Zone Liste des noms de champ pour la scission.
n_estimators Integer Nombre d'arbres à construire. La valeur par défaut est 10.
specify_max_depth Booléen Indique le nombre de niveaux maximum. Si false, les noeuds sont développés jusqu'à ce que toutes les feuilles soient épurées ou jusqu'à ce qu'elles contiennent moins d'information que les échantillons min_samples_split. La valeur par défaut est false.
max_depth Integer Profondeur maximale de l'arbre. La valeur par défaut est 10.
min_samples_leaf Integer Taille minimale du noeud feuille. La valeur par défaut est 1.
max_features chaîne Nombre de fonctions à prendre en compte pour déterminer le meilleur fractionnement :
  • Si auto, alors utilisez max_features=sqrt(n_features) pour le classificateur et max_features=sqrt(n_features) pour la régression.
  • Si sqrt, alors utilisez max_features=sqrt(n_features).
  • Si log2, alors utilisez max_features=log2 (n_features).
La valeur par défaut est auto.
bootstrap Booléen Indique si des échantillons de bootstrap sont utilisés lors de la génération d'arbres. La valeur par défaut est true.
oob_score Booléen Utilisez les échantillons out-of-bag pour estimer la précision de la généralisation. La valeur par défaut est false.
extreme Booléen Utilisez des arbres extrêmement aléatoires. La valeur par défaut est false.
use_random_seed Booléen Indiquez ce choix pour obtenir des résultats répliqués. La valeur par défaut est false.
random_seed Integer Valeur de départ aléatoire à utiliser lors de la génération d'arbres. Indiquez un nombre entier.
cache_size Float Taille du cache du noyau en Mo. La valeur par défaut est 200.
enable_random_seed Booléen Active le paramètre random_seed. Indiquez true ou false. La valeur par défaut est false.
enable_hpo Booléen Spécifiez true ou false pour activer ou désactiver les options HPO. Si la valeur est true, Rbfopt est appliqué pour déterminer automatiquement le « meilleur » modèle de forêt aléatoire, qui atteint la valeur d'objectif cible définie par l'utilisateur avec le paramètre target_objval suivant.
target_objval Float La valeur de fonction objective (taux d'erreur du modèle sur les échantillons) que vous voulez atteindre (par exemple, la valeur de l'optimum inconnu). Définissez ce paramètre sur la valeur appropriée si l'optimum est inconnu (par exemple, 0.01).
max_iterations Integer Nombre maximal d'itérations d'essai du modèle. La valeur par défaut est 1000.
max_evaluations Integer Nombre maximal d'évaluations de fonction pour essayer le modèle, la précision étant préférée à la rapidité. La valeur par défaut est 300.