資料の 英語版 に戻るkmeansasnode プロパティー
kmeansasnode プロパティー
最終更新: 2024年9月10日
K-Means は、最も一般的に使用されるクラスタリング アルゴリズムの 1 つです。 このアルゴリズムは、データ ポイントをクラスタリングして、事前定義された数のクラスタを作成します。 SPSS Modeler の K-Means-AS ノードは Spark で実装されています。 k-means アルゴリズムの詳細については、クラスタリング.1 を参照のこと
注意: K-Means-ASノードは、カテゴリー変数に対して自動的にワンホットエンコーディングを行います。
kmeansasnode プロパティー |
値 | プロパティーの説明 |
---|---|---|
roleUse |
string | 事前定義された役割を使用する場合はpredefined を指定し、カスタム・フィールド割り当てを使用する場合はcustom を指定します。 デフォルトはpredefined です。 |
autoModel |
ブール値 | 新しく生成されるスコアリング・フィールドにデフォルト名 ($S-prediction ) を使用する場合はtrue を指定し、カスタム名を使用する場合はfalse を指定します。 デフォルトはtrue です。 |
features |
フィールド | roleUse プロパティーがcustom に設定されている場合の入力用フィールド名のリストです。 |
name |
string | autoModel プロパティーがfalse に設定されている場合の、新しく生成されたスコアリング・フィールドの名前です。 |
clustersNum |
整数 | 作成するクラスターの数。 デフォルトは5 です。 |
initMode |
string | 初期化アルゴリズム。 可能な値はk-means|| またはrandom です。 デフォルトはk-means|| です。 |
initSteps |
整数 | initMode がk-means|| に設定されている場合の初期化ステップの数です。 デフォルトは2 です。 |
advancedSettings |
ブール値 | 以下の 4 つのプロパティーを使用可能にするには、true を指定します。 デフォルトはfalse です。 |
maxIteration |
整数 | クラスタリングの最大反復数。 デフォルトは20 です。 |
tolerance |
string | 反復を停止する許容度。 可能な設定は、1.0E-1 、1.0E-2 、...、1.0E-6 です。デフォルトは1.0E-4 です。 |
setSeed |
ブール値 | カスタム・ランダム・シードを使用するには、true を指定します。 デフォルトはfalse です。 |
randomSeed |
整数 | setSeed プロパティーがtrue の場合のカスタム・ランダム・シードです。 |
displayGraph |
ブール値 | 出力にグラフを含める場合は、このオプションを選択します。 |
1 "クラスタリング - RDDベースのAPI" Apache Spark. MLlib: Main Guide. 2024年8月