La normalizzazione dei campi di input rappresenta un'operazione importante prima dell'utilizzo delle tecniche di calcolo dei punteggi tradizionali, quali regressione, regressione logistica e analisi discriminante. Queste tecniche implicano delle congetture relative alle normali distribuzioni dei dati che potrebbero non essere vere per molti file di dati grezzi. Un modo per gestire i dati reali consiste nell'applicare trasformazioni che avvicinano un elemento di dati grezzo a una distribuzione più normale. Inoltre, i campi normalizzati possono essere facilmente confrontati tra loro, ad esempio reddito ed età si trovano su scale completamente differenti in un file di dati non elaborato ma, quando viene eseguita la normalizzazione, l'impatto relativo di ciascun campo può essere facilmente interpretato.
Il nodo Trasformazioni è dotato di un Visualizzatore output che consente di valutare visivamente e rapidamente la migliore trasformazione da utilizzare. A prima vista è possibile capire se le variabili sono distribuite normalmente e, quando necessario, scegliere la trasformazione desiderata e applicarla. È possibile scegliere più campi ed eseguire una trasformazione per campo.
Dopo avere selezionato le trasformazioni desiderate per i campi, è possibile generare nodi Ricava o Riempimento che eseguono le trasformazioni e collegare questi nodi al flusso. Il nodo Ricava crea campi nuovi, mentre il nodo Riempimento trasforma i campi esistenti.
Impostazioni dei campi del nodo Trasformazioni
Sotto la sezione CAMPI nelle proprietà del nodo, è possibile specificare quali campi dei dati utilizzare per visualizzare le possibili trasformazioni e applicarle. Solo i campi numerici possono essere trasformati. Selezionare uno o più campi numerici.