Nodo Equilibrar
Los nodos Equilibrar se pueden usar para corregir los desequilibrios de los conjuntos de datos de modo que cumplan determinados criterios de comprobación.
Por ejemplo, supongamos que un conjunto de datos sólo tiene dos valores --low
o high
-- y que el 90% de los casos son low
mientras que sólo el 10% de los casos son high
. Muchas técnicas de modelado presentan problemas con estos datos sesgados, puesto que tenderán a aprender sólo el resultado bajo y omitirán el valor alto, puesto que es más inusual. Si los datos están bien equilibrados con un número aproximadamente igual de resultados low
y high
, los modelos tendrán más posibilidades de encontrar patrones que distingan los dos grupos. En este caso, un nodo Equilibrar resulta útil para la creación de una directiva de equilibrado que reduzca los casos con un resultado bajo.
El equilibrado se lleva a cabo mediante el duplicado y posterior descarte de registros basándose en las condiciones especificadas. Los registros para los que no se establece ninguna condición siempre se pasan. Como este proceso funciona duplicando y descartando registros, la ruta original de los datos se pierde en las operaciones efectuadas más abajo. Asegúrese de derivar cualquier valor relacionado con la ruta antes de añadir un nodo Equilibrar a la ruta de datos.