資料の 英語版 に戻る
kmeansasnode プロパティー
kmeansasnode プロパティー
最終更新: 2025年2月11日
K-Means は、最も一般的に使用されるクラスタリング アルゴリズムの 1 つです。 このアルゴリズムは、データ ポイントをクラスタリングして、事前定義された数のクラスタを作成します。 SPSS Modeler の K-Means-AS ノードは Spark で実装されています。 k-means アルゴリズムの詳細については、クラスタリング.1 を参照のこと
注意: K-Means-ASノードは、カテゴリー変数に対して自動的にワンホットエンコーディングを行います。
プロパティー |
値 | プロパティーの説明 |
---|---|---|
|
string | 事前定義された役割を使用する場合は を指定し、カスタム・フィールド割り当てを使用する場合は を指定します。 デフォルトは です。 |
|
ブール値 | 新しく生成されるスコアリング・フィールドにデフォルト名 ( ) を使用する場合は を指定し、カスタム名を使用する場合は を指定します。 デフォルトは です。 |
|
フィールド | プロパティーが に設定されている場合の入力用フィールド名のリストです。 |
|
string | プロパティーが に設定されている場合の、新しく生成されたスコアリング・フィールドの名前です。 |
|
整数 | 作成するクラスターの数。 デフォルトは です。 |
|
string | 初期化アルゴリズム。 可能な値は または です。 デフォルトは です。 |
|
整数 | が に設定されている場合の初期化ステップの数です。 デフォルトは です。 |
|
ブール値 | 以下の 4 つのプロパティーを使用可能にするには、 を指定します。 デフォルトは です。 |
|
整数 | クラスタリングの最大反復数。 デフォルトは です。 |
|
string | 反復を停止する許容度。 可能な設定は、 、 、...、 です。デフォルトは です。 |
|
ブール値 | カスタム・ランダム・シードを使用するには、 を指定します。 デフォルトは です。 |
|
整数 | プロパティーが の場合のカスタム・ランダム・シードです。 |
|
ブール値 | 出力にグラフを含める場合は、このオプションを選択します。 |
1 "クラスタリング - RDDベースのAPI" Apache Spark. MLlib: Main Guide. 2024年8月
トピックは役に立ちましたか?
0/1000