Volver a la versión inglesa de la documentaciónpropiedades de binningnode
propiedades de binningnode
Última actualización: 04 oct 2024
El nodo Intervalos crea automáticamente nuevos campos nominales (conjunto) en función de los valores de uno o más campos continuos (rango numérico) existentes. Por ejemplo, puede transformar un campo de ingresos continuo en un campo categórico nuevo que contenga grupos de ingresos como desviaciones desde la media. Después de crear intervalos para el nuevo campo, puede generar un nodo Derivar basado en los puntos de corte.
Ejemplo
node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
Propiedades de binningnode |
Tipo de datos | Descripción de la propiedad |
---|---|---|
fields |
[field1 field2 ... campon] | Los campos continuos (rango numérico) pendientes de transformación. Se pueden crear intervalos de varios campos de forma simultánea. |
method |
FixedWidth EqualCount Rank SDev Optimal |
Método utilizado para determinar los puntos de corte de los intervalos de campo nuevos (categorías). |
recalculate_bins |
Always IfNecessary |
Especifica si se vuelven a calcular los intervalos y los datos se colocan en el intervalo adecuado cada vez que se ejecuta el nodo o si los datos sólo se añaden a los intervalos existentes y cualquier nuevo intervalo que se haya añadido. |
fixed_width_name_extension |
serie | La extensión predeterminada es _BIN. |
fixed_width_add_as |
Suffix Prefix |
Determina si la extensión se debe añadir al principio (prefijo) o al final (sufijo) del nombre de campo. La extensión predeterminada es income_BIN. |
fixed_bin_method |
Width Count |
|
fixed_bin_count |
entero | Especifica un número entero para determinar el número de intervalos de anchura fija (categorías) para los nuevos campos. |
fixed_bin_width |
real | Valor (entero o real) para calcular el ancho del intervalo. |
equal_count_name_ extension |
serie | La extensión predeterminada es _TILE. |
equal_count_add_as |
Suffix Prefix |
Especifica una extensión, sufijo o prefijo, utilizada para el nombre de los campos generados con p-tiles estándar. La extensión predeterminada es _TILE más N, donde N es el número de cuantil. |
tile4 |
distintivo | Genera cuatro intervalos de cuantiles, cada uno con el 25% de los casos. |
tile5 |
distintivo | Genera cinco intervalos de quintiles. |
tile10 |
distintivo | Genera 10 intervalos de deciles. |
tile20 |
distintivo | Genera 20 intervalos de veintiles. |
tile100 |
distintivo | Genera 100 intervalos de percentiles. |
use_custom_tile |
distintivo | |
custom_tile_name_extension |
serie | La extensión predeterminada es _TILEN. |
custom_tile_add_as |
Suffix Prefix |
|
custom_tile |
entero | |
equal_count_method |
RecordCount ValueSum |
El método RecordCount busca asignar un número igual de registros a cada intervalo, mientras que ValueSum asigna registros para que la suma de los valores de cada intervalo sea igual. |
tied_values_method |
Next Current Random |
Especifica en qué intervalo se van a insertar los datos de valor empatado. |
rank_order |
Ascending Descending |
Esta propiedad incluye Ascending (el valor más bajo es 1) o Descending (el valor más alto se marca como 1). |
rank_add_as |
Suffix Prefix |
Esta opción se aplica al rango, rango fraccional y rango como porcentaje. |
rank |
distintivo | |
rank_name_extension |
serie | La extensión predeterminada es _RANK. |
rank_fractional |
distintivo | Establece rangos de casos en los que el valor del campo nuevo es igual al rango dividido por la suma de las ponderaciones de los casos que no están perdidos. Los rangos fraccionales están dentro del rango 0–1. |
rank_fractional_name_ extension |
serie | La extensión predeterminada es _F_RANK. |
rank_pct |
distintivo | Cada rango se divide por el número de registros con valores válidos y se multiplica por 100. Los rangos fraccionales de porcentaje están dentro del rango 1–100. |
rank_pct_name_extension |
serie | La extensión predeterminada es _P_RANK. |
sdev_name_extension |
serie | |
sdev_add_as |
Suffix Prefix |
|
sdev_count |
One Two Three |
|
optimal_name_extension |
serie | La extensión predeterminada es _OPTIMAL. |
optimal_add_as |
Suffix Prefix |
|
optimal_supervisor_field |
campo | Campo elegido como campo supervisor, con el que se relacionan los campos seleccionados para los intervalos. |
optimal_merge_bins |
distintivo | Especifica que todos los intervalos con un número pequeño de casos se añadirán a un intervalo vecino de mayor tamaño. |
optimal_small_bin_threshold |
entero | |
optimal_pre_bin |
distintivo | Indica si debe agruparse previamente en intervalos el conjunto de datos. |
optimal_max_bins |
entero | Especifica un límite superior con el fin de evitar que se genere un número desmesurado de intervalos. |
optimal_lower_end_point |
Inclusive Exclusive |
|
optimal_first_bin |
Unbounded Bounded |
|
optimal_last_bin |
Unbounded Bounded |