Volver a la versión inglesa de la documentaciónpropiedades de autoclassifiernode
propiedades de autoclassifiernode
Última actualización: 07 oct 2024
El nodo Clasificador automático crea y compara varios modelos diferentes para obtener resultados binarios (sí o no, abandono o no de clientes, etc.), lo que le permite seleccionar el mejor enfoque para un análisis determinado. Son compatibles varios algoritmos de modelado, por lo que es posible seleccionar los métodos que desee utilizar, las opciones específicas para cada uno y los criterios para comparar los resultados. El nodo genera un conjunto de modelos basado en las opciones especificadas y clasifica los mejores candidatos en función de los criterios que especifique.
Ejemplo
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
Propiedades de autoclassifiernode |
Valores | Descripción de la propiedad |
---|---|---|
target |
campo | En objetivos de marca, el nodo Clasificador binario requiere un único campo objetivo y uno o más campos de entrada. También se puede especificar campos de ponderación y frecuencia. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
ranking_measure |
Accuracy Area_under_curve Profit Lift Num_variables |
|
ranking_dataset |
Training Test |
|
number_of_models |
entero | Número de modelos que se incluirán en el nugget de modelo. Especifique un entero entre 1 y 100. |
calculate_variable_importance |
distintivo | |
enable_accuracy_limit |
distintivo | |
accuracy_limit |
entero | Entero entre 0 y 100. |
enable_area_under_curve_limit |
distintivo | |
area_under_curve_limit |
número | Número real entre 0,0 y 1,0. |
enable_profit_limit |
distintivo | |
profit_limit |
número | Entero mayor que 0. |
enable_lift_limit |
distintivo | |
lift_limit |
número | Número real mayor que 1,0. |
enable_number_of_variables_limit |
distintivo | |
number_of_variables_limit |
número | Entero mayor que 0. |
use_fixed_cost |
distintivo | |
fixed_cost |
número | Número real mayor que 0.0. |
variable_cost |
campo | |
use_fixed_revenue |
distintivo | |
fixed_revenue |
número | Número real mayor que 0.0. |
variable_revenue |
campo | |
use_fixed_weight |
distintivo | |
fixed_weight |
número | Número real mayor que 0,0 |
variable_weight |
campo | |
lift_percentile |
número | Entero entre 0 y 100. |
enable_model_build_time_limit |
distintivo | |
model_build_time_limit |
número | Entero que indica el número máximo de minutos que se puede tardar en generar cada uno de los modelos. |
enable_stop_after_time_limit |
distintivo | |
stop_after_time_limit |
número | Número real que indica el número máximo de horas que puede tardar una ejecución del clasificador automático. |
enable_stop_after_valid_model_produced |
distintivo | |
use_costs |
distintivo | |
<algorithm> |
distintivo | Activa o desactiva el uso de un determinado algoritmo. |
<algorithm>.<property> |
serie | Define un valor de propiedad para un algoritmo específico. Consulte Establecimiento de propiedades de algoritmo para obtener más información. |
use_cross_validation |
campo | Los campos añadidos a esta lista pueden tomar el rol de condición o predicción en las reglas generadas por el modelo. Esto se realiza para cada regla, por lo que un campo podría ser una condición en una regla y ser una predicción en otra regla. |
number_of_folds |
entero | El parámetro de número de subconjuntos para la validación cruzada, con el rango de 3 a 10. |
set_random_seed |
Boolean | Al establecer una semilla aleatoria podrá replicar análisis. Especifique un entero o pulse en Generar, lo que creará un entero pseudo-aleatorio entre 1 y 2147483647, ambos inclusive. De forma predeterminada, los análisis se replican con la semilla 229176228. |
random_seed |
entero | Semilla aleatoria |
stop_if_valid_model |
Boolean | |
filter_individual_model_output |
Boolean | Elimina los resultados de todos los campos adicionales que generan los modelos individuales que contiene el nodo Conjunto. Seleccione esta opción si sólo está interesado en la puntuación combinada de todos los modelos de entrada. Asegúrese de que esta opción se deselecciona si, por ejemplo, desea utilizar un nodo Análisis o un nodo Evaluación para comparar la precisión de la puntuación combinada con la de cada uno de los modelos de entrada individuales. |
set_ensemble_method |
"Voting" |
Método de conjunto para establecer destinos. |
set_voting_tie_selection |
"Random" |
Si la votación está empatada, seleccione un valor al azar o utilizando la confianza más alta. |
flag_ensemble_method |
"Voting" |
Método de conjunto para objetivos de distintivo. |
flag_voting_tie_selection |
"Random" |
Si la votación está empatada, seleccione el valor de forma aleatoria, con la mayor confianza, o con la propensión en bruto. |