0 / 0
Volver a la versión inglesa de la documentación
propiedades de binningnode
Última actualización: 04 oct 2024
propiedades de binningnode

Icono de nodo de agrupaciónEl nodo Intervalos crea automáticamente nuevos campos nominales (conjunto) en función de los valores de uno o más campos continuos (rango numérico) existentes. Por ejemplo, puede transformar un campo de ingresos continuo en un campo categórico nuevo que contenga grupos de ingresos como desviaciones desde la media. Después de crear intervalos para el nuevo campo, puede generar un nodo Derivar basado en los puntos de corte.

Ejemplo

node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
Tabla 1. propiedades de binningnode
Propiedades de binningnode Tipo de datos Descripción de la propiedad
fields [field1 field2 ... campon] Los campos continuos (rango numérico) pendientes de transformación. Se pueden crear intervalos de varios campos de forma simultánea.
method FixedWidth EqualCount Rank SDev Optimal Método utilizado para determinar los puntos de corte de los intervalos de campo nuevos (categorías).
recalculate_bins Always IfNecessary Especifica si se vuelven a calcular los intervalos y los datos se colocan en el intervalo adecuado cada vez que se ejecuta el nodo o si los datos sólo se añaden a los intervalos existentes y cualquier nuevo intervalo que se haya añadido.
fixed_width_name_extension serie La extensión predeterminada es _BIN.
fixed_width_add_as Suffix Prefix Determina si la extensión se debe añadir al principio (prefijo) o al final (sufijo) del nombre de campo. La extensión predeterminada es income_BIN.
fixed_bin_method Width Count  
fixed_bin_count entero Especifica un número entero para determinar el número de intervalos de anchura fija (categorías) para los nuevos campos.
fixed_bin_width real Valor (entero o real) para calcular el ancho del intervalo.
equal_count_name_ extension serie La extensión predeterminada es _TILE.
equal_count_add_as Suffix Prefix Especifica una extensión, sufijo o prefijo, utilizada para el nombre de los campos generados con p-tiles estándar. La extensión predeterminada es _TILE más N, donde N es el número de cuantil.
tile4 distintivo Genera cuatro intervalos de cuantiles, cada uno con el 25% de los casos.
tile5 distintivo Genera cinco intervalos de quintiles.
tile10 distintivo Genera 10 intervalos de deciles.
tile20 distintivo Genera 20 intervalos de veintiles.
tile100 distintivo Genera 100 intervalos de percentiles.
use_custom_tile distintivo  
custom_tile_name_extension serie La extensión predeterminada es _TILEN.
custom_tile_add_as Suffix Prefix  
custom_tile entero  
equal_count_method RecordCount ValueSum El método RecordCount busca asignar un número igual de registros a cada intervalo, mientras que ValueSum asigna registros para que la suma de los valores de cada intervalo sea igual.
tied_values_method Next Current Random Especifica en qué intervalo se van a insertar los datos de valor empatado.
rank_order Ascending Descending Esta propiedad incluye Ascending (el valor más bajo es 1) o Descending (el valor más alto se marca como 1).
rank_add_as Suffix Prefix Esta opción se aplica al rango, rango fraccional y rango como porcentaje.
rank distintivo  
rank_name_extension serie La extensión predeterminada es _RANK.
rank_fractional distintivo Establece rangos de casos en los que el valor del campo nuevo es igual al rango dividido por la suma de las ponderaciones de los casos que no están perdidos. Los rangos fraccionales están dentro del rango 0–1.
rank_fractional_name_ extension serie La extensión predeterminada es _F_RANK.
rank_pct distintivo Cada rango se divide por el número de registros con valores válidos y se multiplica por 100. Los rangos fraccionales de porcentaje están dentro del rango 1–100.
rank_pct_name_extension serie La extensión predeterminada es _P_RANK.
sdev_name_extension serie  
sdev_add_as Suffix Prefix  
sdev_count One Two Three  
optimal_name_extension serie La extensión predeterminada es _OPTIMAL.
optimal_add_as Suffix Prefix  
optimal_supervisor_field campo Campo elegido como campo supervisor, con el que se relacionan los campos seleccionados para los intervalos.
optimal_merge_bins distintivo Especifica que todos los intervalos con un número pequeño de casos se añadirán a un intervalo vecino de mayor tamaño.
optimal_small_bin_threshold entero  
optimal_pre_bin distintivo Indica si debe agruparse previamente en intervalos el conjunto de datos.
optimal_max_bins entero Especifica un límite superior con el fin de evitar que se genere un número desmesurado de intervalos.
optimal_lower_end_point Inclusive Exclusive  
optimal_first_bin Unbounded Bounded  
optimal_last_bin Unbounded Bounded  
Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información