Retourner à la version anglaise de la documentationpropriétés de autonumericnode
propriétés de autonumericnode
Dernière mise à jour : 04 oct. 2024
Le noeud Numérisation automatique évalue et compare des modèles pour des résultats d'intervalle numérique continus par le biais de différentes méthodes. Le noeud fonctionne de la même manière que le noeud Classificateur automatique, vous permettant ainsi de choisir les algorithmes à utiliser et à tester avec différentes combinaisons d'options en un seul passage de modélisation. Les algorithmes pris en charge comprennent les réseaux de neurones, l'algorithme d'arbre C&RT, CHAID, la régression linéaire, la régression linéaire généralisée et Support Vector Machines (SVM). Les modèles peuvent être comparés selon la corrélation, l'erreur relative ou le nombre de variables utilisées.
Exemple
node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)
Propriétés autonumericnode |
Valeurs | Description de la propriété |
---|---|---|
custom_fields |
option | Si cette valeur est définie sur True (vrai), les paramètres de champ personnalisés seront utilisés à la place des paramètres du noeud type. |
target |
Zone | Le noeud Numérisation automatique requiert un seul champ cible et un ou plusieurs champs d'entrée. Il est également possible de spécifier des champs de pondération et de fréquence. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
inputs |
[field1 … field2] | |
partition |
Zone | |
use_frequency |
option | |
frequency_field |
Zone | |
use_weight |
option | |
weight_field |
Zone | |
use_partitioned_data |
option | Si un champ de partition est défini, seules les données d'apprentissage sont utilisées pour la génération de modèles. |
ranking_measure |
Correlation NumberOfFields |
|
ranking_dataset |
Test Training |
|
number_of_models |
Integer | Nombre de modèles à inclure dans le nugget de modèle. Indiquez un entier compris entre 1 et 100. |
calculate_variable_importance |
option | |
enable_correlation_limit |
option | |
correlation_limit |
Integer | |
enable_number_of_fields_limit |
option | |
number_of_fields_limit |
Integer | |
enable_relative_error_limit |
option | |
relative_error_limit |
Integer | |
enable_model_build_time_limit |
option | |
model_build_time_limit |
Integer | |
enable_stop_after_time_limit |
option | |
stop_after_time_limit |
Integer | |
stop_if_valid_model |
option | |
<algorithm> |
option | Active ou désactive l'utilisation d'un algorithme particulier. |
<algorithm>.<property> |
chaîne | Définit une valeur de propriété pour un algorithme spécifique. Pour plus d'informations, voir Définition des propriétés d'algorithme . |
use_cross_validation |
Booléen | Au lieu d'utiliser une partition unique, une partition de validation croisée est utilisée. |
number_of_folds |
Integer | Paramètre Nombre de niveaux pour la validation croisée, avec une plage de 3 à 10. |
set_random_seed |
Booléen | Définir une valeur de départ aléatoire vous permet de dupliquer des analyses. Spécifiez un entier ou cliquez sur Générer, ce qui crée un entier pseudo-aléatoire compris entre 1 et 2147483647, inclus. Par défaut, les analyses sont dupliquées avec une valeur de départ de 229176228. |
random_seed |
Integer | Valeur aléatoire de départ |
filter_individual_model_output |
Booléen | Supprime de la sortie tous les champs supplémentaires générés par les modèles individuels qui sont intégrés au noeud Ensemble. Sélectionnez cette option si vous n'êtes intéressé que par le score combiné de tous les modèles d'entrée. Assurez-vous que cette option est désélectionnée si, par exemple, vous voulez utiliser un noeud Analyse ou Evaluation pour comparer la précision du score combiné avec chacun des modèles d'entrée individuels. |
calculate_standard_error |
Booléen | Pour une cible continue (plage numérique), un calcul d'erreur standard s'exécute par défaut pour calculer la différence entre les valeurs mesurées ou estimées et les valeurs réelles, et pour indiquer la proximité de ces estimations. |