CLEM (Control Language for Expression Manipulation) è un linguaggio potente per analizzare e manipolare i dati che passano attraverso un flusso SPSS Modeler . I data miner fanno ampio ricorso al linguaggio CLEM nelle operazioni di flusso per eseguire attività sia semplici, come la derivazione dei profitti dai dati relativi ai costi e alle entrate, sia complesse, come la trasformazione dei dati di log web in una serie di campi e record contenenti informazioni utilizzabili.
CLEM viene utilizzato in SPSS Modeler per:
- Confrontare e valutare le condizioni nei campi record
- Deriva valori per nuovi campi
- Derivare nuovi valori per i campi esistenti
- Motivo della sequenza di record
- Inserire i dati dai record nei report
Le espressioni CLEM sono indispensabili per la preparazione dei dati in SPSS Modeler e possono essere utilizzate in un'ampia gamma di nodi, dalle operazioni su record e campi (Seleziona, Balance, Riempimento) ai grafici e all'output (Analisi, Report, Tabella). Per esempio, è possibile utilizzare CLEM in un nodo Nuovo campo per creare un nuovo campo basato su una formula come il rapporto.
Le espressioni CLEM possono essere utilizzate anche per le operazioni di ricerca e sostituzione globali. Ad esempio, l'espressione @NULL(@FIELD)
può essere utilizzata in un nodo Riempimento per sostituire valori mancanti di sistema con il valore intero 0. Per sostituire i valori mancanti definiti dall'utente, detti anche spazi vuoti, utilizzare la funzione @BLANK
.
È inoltre possibile creare espressioni CLEM più complesse. Ad esempio, è possibile derivare nuovi campi in base a un insieme condizionale di regole, come una nuova categoria di valori creata utilizzando le espressioni seguenti: If: CardID = @OFFSET(CardID,1), Then: @OFFSET(ValueCategory,1), Else:
'exclude'
.
Questo esempio utilizza la funzione @OFFSET
per dire: se il valore del campo CardID per un determinato record è lo stesso del record precedente, restituire il valore del campo denominato ValueCategory per il record precedente. In caso contrario, assegnare la stringa "exclude". In altre parole, se i campi id_carta per i record adiacenti sono identici, dovranno essere assegnati alla stessa categoria di valore. (È possibile includere i record con la stringa exclude in un momento successivo tramite un nodo Seleziona).