La normalización de los campos de entrada es un paso previo importante para utilizar las técnicas de puntuación tradicionales, como la regresión, la regresión logística y el análisis discriminante. Estas técnicas implican ciertos supuestos sobre las distribuciones normales de datos que pueden no ser ciertas para muchos archivos de datos sin procesar. Un método para trabajar con datos reales es aplicar transformaciones para convertir un elemento de los datos brutos hacia una distribución más normal. Además, los campos normalizados se pueden comparar fácilmente entre sí: por ejemplo, los ingresos y la edad son escalas completamente diferentes en un archivo de datos sin procesar, pero, si se normalizan, se puede interpretar fácilmente el impacto relativo de cada uno de ellos.
El nodo Transformación proporciona un visor de resultados que permite realizar una rápida evaluación visual de la mejor transformación que se puede utilizar. Con sólo un vistazo, puede ver si las variables están distribuidas normalmente y, si es necesario, seleccionar la transformación necesaria y aplicarla. Puede elegir varios campos y realizar una transformación en cada uno.
Tras seleccionar las transformaciones preferidas para los campos, puede generar nodos Derivar o Rellenar para realizar las transformaciones y conectar estos nodos al flujo. El nodo Derivar crea nuevos campos, mientras que el nodo Rellenar transforma los campos ya existentes.
Valores de los campos del nodo de transformación
En la sección Campos de las propiedades del nodo, puede especificar los campos de los datos que desea utilizar para ver las posibles transformaciones y aplicarlas. Sólo es posible transformar los campos numéricos. Seleccione uno o varios campos numéricos.