Control Language for Expression Manipulation (CLEM) は、SPSS Modeler フローでストリームするデータを分析および操作するための強力な言語です。 CLEM を使用すれば、経費と収入データから利益を算出するような簡単な操作から、Web ログ・データを有益な情報を含む一連のフィールドやレコードに変換するような複雑な操作まで、さまざまなフロー操作を行うことができます。
CLEMはSPSS Modeler内で以下の目的で使用されます。
- レコード・フィールドの条件の比較および評価
- 新規フィールドの値の作成
- 既存のフィールドの新しい値を取得
- レコードの順序に関する推論
- レコードからレポートへのデータの挿入
CLEM 式は SPSS Modeler でデータを準備するために不可欠であり、レコードとフィールドの操作 (選択、バランス、置換) からプロットと出力 (分析、レポート、表) まで、幅広いノードで使用できます。 例えば、フィールド作成ノードで CLEM を使用すると、比率などの式に基づいて新しいフィールドを作成できます。
CLEM式はグローバル検索および置換操作にも使用できます。 例えば、置換ノードで式@NULL(@FIELD)
を使用して、システム欠損値を整数値 0 に置き換えることができます。 (ブランクとも呼ばれるユーザー欠損値を置き換えるには、@BLANK
関数を使用します。)
より複雑なCLEM式を作成することもできます。 例えば、If: CardID = @OFFSET(CardID,1), Then: @OFFSET(ValueCategory,1), Else:
'exclude'
という式を使用して作成された新しい値カテゴリーなど、条件付きルール・セットに基づいて新しいフィールドを派生させることができます。
この例では、@OFFSET
関数を使用して、指定されたレコードのフィールド CardID の値が前のレコードの値と同じである場合、前のレコードの ValueCategory という名前のフィールドの値を返します。 それ以外の場合は、文字列「exclude」を割り当てます。 つまり、隣接するレコードの CardID が同じ場合は、同じ値カテゴリーを割り当てる必要があります。 ( 除外文字列のあるレコードは、後で選択ノードを使用して計算できます。 )