propiedades de featureselectionnode
Última actualización: 11 feb 2025
El nodo Selección de características filtra los campos de entrada para su eliminación en función de un conjunto de criterios (como el porcentaje de valores perdidos); a continuación, clasifica el grado de importancia del resto de entradas de acuerdo con un objetivo específico. Por ejemplo, a partir de un conjunto de datos dado con cientos de entradas potenciales, ¿cuáles tienen mayor probabilidad de ser útiles para el modelado de resultados de pacientes?
Ejemplo
node = stream.create("featureselection", "My node") node.setPropertyValue("screen_single_category", True) node.setPropertyValue("max_single_category", 95) node.setPropertyValue("screen_missing_values", True) node.setPropertyValue("max_missing_values", 80) node.setPropertyValue("criteria", "Likelihood") node.setPropertyValue("unimportant_below", 0.8) node.setPropertyValue("important_above", 0.9) node.setPropertyValue("important_label", "Check Me Out!") node.setPropertyValue("selection_mode", "TopN") node.setPropertyValue("top_n", 15)
Propiedades de
|
Valores | Descripción de la propiedad |
---|---|---|
|
campo | Los modelos de selección de características ordenan predictores por rangos con respecto a su objetivo específico. Los campos de ponderación y frecuencia no se usan. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
|
distintivo | Si , filtra los campos que tienen demasiados registros en la misma categoría en relación con el número total de registros. |
|
número | Especifica el umbral utilizado cuando es . |
|
distintivo | Si , muestra los campos con demasiados valores perdidos, expresado como un porcentaje del número total de registros. |
|
número | |
|
distintivo | Si , filtra los campos con demasiadas categorías en relación al número total de registros. |
|
número | |
|
distintivo | Si , muestra los campos con una desviación estándar menor o igual que el mínimo especificado. |
|
número | |
|
distintivo | Si , muestra los campos con un coeficiente de varianza menor o igual al mínimo especificado. |
|
número | |
|
|
Al clasificar los predictores categóricos en función de un objetivo categórico, especifica la medida en la que se basa el valor de importancia. |
|
número | Especifica los valores p de umbral utilizados para clasificar las variables como importantes, marginales o sin importancia. Acepta valores de 0,0 a 1,0. |
|
número | Acepta valores de 0,0 a 1,0. |
|
serie | Especifica la etiqueta para la clasificación como 'Sin importancia'. |
|
serie | |
|
serie | |
|
|
|
|
distintivo | Cuando se establece en , especifica si se deben seleccionar campos importantes. |
|
distintivo | Cuando se establece en , especifica si se deben seleccionar campos marginales. |
|
distintivo | Cuando se establece en , especifica si se deben seleccionar campos sin importancia. |
|
número | Cuando se establece en , especifica el valor de corte que se debe utilizar. Acepta valores de 0 a 100. |
|
entero | Cuando se establece en , especifica el valor de corte que se debe utilizar. Acepta valores de 0 a 1000. |
¿Fue útil el tema?
0/1000