Retourner à la version anglaise de la documentationpropriétés de autoclassifiernode
propriétés de autoclassifiernode
Dernière mise à jour : 07 oct. 2024
Le noeud Classificateur automatique crée et compare les résultats binaires de plusieurs modèles différents (oui ou non, avec ou sans attrition, etc.), ce qui vous permet de choisir la meilleure approche pour une analyse donnée. Plusieurs algorithmes de modélisation sont pris en charge. Vous pouvez alors sélectionner les méthodes que vous souhaitez utiliser, les options spécifiques pour chacune d'elles et le critère de comparaison des résultats. Le noeud génère un ensemble de modèles basé sur les options spécifiées et classe les meilleurs candidats en fonction des critères indiqués.
Exemple
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
Propriétés autoclassifiernode |
Valeurs | Description de la propriété |
---|---|---|
target |
Zone | Pour les cibles indicateur, le noeud Classificateur automatique requiert un seul champ cible et un ou plusieurs champs d'entrée. Il est également possible de spécifier des champs de pondération et de fréquence. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
ranking_measure |
Accuracy Area_under_curve Profit Lift Num_variables |
|
ranking_dataset |
Training Test |
|
number_of_models |
Integer | Nombre de modèles à inclure dans le nugget de modèle. Indiquez un entier compris entre 1 et 100. |
calculate_variable_importance |
option | |
enable_accuracy_limit |
option | |
accuracy_limit |
Integer | Entier compris entre 0 et 100. |
enable_area_under_curve_limit |
option | |
area_under_curve_limit |
number | Nombre réel compris entre 0,0 et 1,0. |
enable_profit_limit |
option | |
profit_limit |
number | Entier supérieur à 0. |
enable_lift_limit |
option | |
lift_limit |
number | Nombre réel supérieur à 1.0. |
enable_number_of_variables_limit |
option | |
number_of_variables_limit |
number | Entier supérieur à 0. |
use_fixed_cost |
option | |
fixed_cost |
number | Nombre réel supérieur à 0.0. |
variable_cost |
Zone | |
use_fixed_revenue |
option | |
fixed_revenue |
number | Nombre réel supérieur à 0.0. |
variable_revenue |
Zone | |
use_fixed_weight |
option | |
fixed_weight |
number | Nombre réel supérieur à 0,0. |
variable_weight |
Zone | |
lift_percentile |
number | Entier compris entre 0 et 100. |
enable_model_build_time_limit |
option | |
model_build_time_limit |
number | Entier défini sur le nombre de minutes devant être utilisé pour limiter le temps nécessaire à la création de chaque modèle. |
enable_stop_after_time_limit |
option | |
stop_after_time_limit |
number | Nombre réel défini sur le nombre d'heures servant à limiter le temps global passé pour une exécution de Classificateur automatique. |
enable_stop_after_valid_model_produced |
option | |
use_costs |
option | |
<algorithm> |
option | Active ou désactive l'utilisation d'un algorithme particulier. |
<algorithm>.<property> |
chaîne | Définit une valeur de propriété pour un algorithme spécifique. Pour plus d'informations, voir Définition des propriétés d'algorithme . |
use_cross_validation |
Zone | Les champs ajoutés à cette liste peuvent recevoir le rôle condition ou le rôle prévision dans les règles générées par le modèle. Ceci opère règle par règle et donc un champ peut constituer une condition dans une règle et une prévision dans une autre. |
number_of_folds |
Integer | Paramètre Nombre de niveaux pour la validation croisée, avec une plage de 3 à 10. |
set_random_seed |
Booléen | Définir une valeur de départ aléatoire vous permet de dupliquer des analyses. Spécifiez un entier ou cliquez sur Générer, ce qui crée un entier pseudo-aléatoire compris entre 1 et 2147483647, inclus. Par défaut, les analyses sont dupliquées avec une valeur de départ de 229176228. |
random_seed |
Integer | Valeur aléatoire de départ |
stop_if_valid_model |
Booléen | |
filter_individual_model_output |
Booléen | Supprime de la sortie tous les champs supplémentaires générés par les modèles individuels qui sont intégrés au noeud Ensemble. Sélectionnez cette option si vous n'êtes intéressé que par le score combiné de tous les modèles d'entrée. Assurez-vous que cette option est désélectionnée si, par exemple, vous souhaitez utiliser un noeud d'analyse ou d'évaluation pour comparer l'exactitude du score combiné à celui de chacun des modèles d'entrée individuels |
set_ensemble_method |
"Voting" |
Méthode d'ensemble pour les cibles définies. |
set_voting_tie_selection |
"Random" |
En cas d'égalité des votes, sélectionnez une valeur aléatoire ou en utilisant la plus grande confiance. |
flag_ensemble_method |
"Voting" |
Méthode de l'ensemble pour les cibles d'indicateur. |
flag_voting_tie_selection |
"Random" |
En cas d'égalité des votes, sélectionnez la valeur de façon aléatoire, avec la plus grande confiance, ou avec une propension brute. |