自動クラスタリング・ノードは、同様の特性を持つレコードのグループを識別するクラスタリング・モデルを推定し、比較します。 ノードは他の自動化モデル作成ノードと同じように動作し、複数の組み合わせのオプションを単一のモデル作成の実行で検証できます。 モデルは、クラスター・モデルの有用性をフィルタリングおよびランク付けする基本的な指標を使用して比較し、特定のフィールドの重要度に基づいて指標を提供します。
クラスタリング・モデルは、後続の分析で入力として使用できるグループを識別するために使用されます。 例えば、収入など人口統計的な特性に基づいて、または過去に購入したサービスに基づいて顧客のグループを対象に設定する場合があります。 この操作は、グループの特性に関する知識がなくても (例えば、処理するグループの数や、グループを定義するための機能について知らなくても)、実行することができます。 対象フィールドを使用せず、真または偽として評価できる特定の予測を返さないため、クラスタリング・モデルは、教師なし学習モデルとも呼ばれます。 クラスタリング・モデルの価値は、データのグループ構成を把握し、それらのグループについて役に立つ説明を提供できるかどうかで決まります。
要件。 重要な特性を定義する 1 つまたは複数のフィールド。 真または偽として評価できる特定の予測を行わないため、クラスター・モデルは、対象フィールドを他のモデルと同じ方法で使用しません。 代わりに、関連するケースのグループを識別するために使用します。 例えば、クラスター・モデルを使用して、特定の顧客が解約するか、またはオファーに反応するかを予測することはできません。 ただし、クラスター・モデルを使用して、これらのことを実行する傾向に基づいて、顧客をグループに割り当てることができます。 重みフィールドおよび度数フィールドは使用しません。
評価フィールド: 対象フィールドが使用されていない場合、オプションで、モデルを比較する際に使用する評価フィールドを 1 つまたは複数指定できます。 クラスター・モデルの有用性は、クラスターがこれらのフィールドをどれだけ良く (または悪く) 識別しているかを測定することによって評価できます。
サポートするモデル タイプ
サポートするモデル タイプは、TwoStep、K-Means、Kohonen、One-Class SVM、および K-Means-AS です。