Volver a la versión inglesa de la documentaciónpropiedades de autonumericnode
propiedades de autonumericnode
Última actualización: 07 oct 2024
El nodo Autonumérico calcula y compara modelos para resultados de rango numérico continuo utilizando cierto número de métodos diferentes. El nodo funciona de la misma manera que el nodo Clasificador automático, lo que le permite seleccionar los algoritmos que desee utilizar y experimentar con varias combinaciones de opciones en una única pasada de modelado. Los algoritmos admitidos incluyen redes neuronales, C&RT, CHAID, regresión lineal, regresión lineal generalizada y máquinas de vectores de soporte (SVM). Los modelos se pueden comparar basándose en la correlación, el error relativo o el número de variables utilizado.
Ejemplo
node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)
Propiedades de autonumericnode |
Valores | Descripción de la propiedad |
---|---|---|
custom_fields |
distintivo | Si es verdadero, se utilizará la configuración de campos personalizada en lugar de la configuración del nodo Tipo. |
target |
campo | El nodo Autonumérico requiere un único campo objetivo y uno o más campos de entrada. También se puede especificar campos de ponderación y frecuencia. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
inputs |
[field1 … field2] | |
partition |
campo | |
use_frequency |
distintivo | |
frequency_field |
campo | |
use_weight |
distintivo | |
weight_field |
campo | |
use_partitioned_data |
distintivo | Si se define un campo de partición, sólo se utilizan los datos de entrenamiento para la creación de modelos. |
ranking_measure |
Correlation NumberOfFields |
|
ranking_dataset |
Test Training |
|
number_of_models |
entero | Número de modelos que se incluirán en el nugget de modelo. Especifique un entero entre 1 y 100. |
calculate_variable_importance |
distintivo | |
enable_correlation_limit |
distintivo | |
correlation_limit |
entero | |
enable_number_of_fields_limit |
distintivo | |
number_of_fields_limit |
entero | |
enable_relative_error_limit |
distintivo | |
relative_error_limit |
entero | |
enable_model_build_time_limit |
distintivo | |
model_build_time_limit |
entero | |
enable_stop_after_time_limit |
distintivo | |
stop_after_time_limit |
entero | |
stop_if_valid_model |
distintivo | |
<algorithm> |
distintivo | Activa o desactiva el uso de un determinado algoritmo. |
<algorithm>.<property> |
serie | Define un valor de propiedad para un algoritmo específico. Consulte Establecimiento de propiedades de algoritmo para obtener más información. |
use_cross_validation |
Boolean | En lugar de utilizar una sola partición, se utiliza una partición de validación cruzada. |
number_of_folds |
entero | El parámetro de número de subconjuntos para la validación cruzada, con el rango de 3 a 10. |
set_random_seed |
Boolean | Al establecer una semilla aleatoria podrá replicar análisis. Especifique un entero o pulse en Generar, lo que creará un entero pseudo-aleatorio entre 1 y 2147483647, ambos inclusive. De forma predeterminada, los análisis se replican con la semilla 229176228. |
random_seed |
entero | Semilla aleatoria |
filter_individual_model_output |
Boolean | Elimina los resultados de todos los campos adicionales que generan los modelos individuales que contiene el nodo Conjunto. Seleccione esta opción si sólo está interesado en la puntuación combinada de todos los modelos de entrada. Asegúrese de que esta opción no está seleccionada si, por ejemplo, desea utilizar un nodo Análisis o Evaluación para comparar la precisión de la puntuación combinada con la de cada uno de los modelos de entrada individuales. |
calculate_standard_error |
Boolean | Para un destino continuo (rango numérico), se ejecuta de forma predeterminada un cálculo de error estándar para calcular la diferencia entre los valores medidos o estimados y los valores reales; y para mostrar la exactitud de coincidencia de esas estimaciones. |