資料の 英語版 に戻るhdbscannode のプロパティー
hdbscannode のプロパティー
最終更新: 2024年10月04日
Hierarchical Density-Based Spatial Clustering (HDBSCAN)© は、教師なし学習を使用してデータ・セットのクラスター (つまり、密度の高い領域) を検出します。 SPSS Modeler の HDBSCAN ノードは、HDBSCAN ライブラリーのコア機能およびよく使用されるパラメーターを公開します。 このノードは Python で実装されており、最初にグループの性質が分からない場合にデータ・セットを異なるグループにクラスター化するために使用できます。
hdbscannode プロパティー |
データ・タイプ | プロパティーの説明 |
---|---|---|
custom_fields | ブール値 | このオプションは、ノードに対し、上流のデータ型ノードのフィールド情報ではなく、ここで指定するフィールド情報を使用するように指示します。 このオプションを選択した後、必要に応じて以下のフィールドを指定します。 |
inputs |
フィールド | クラスタリングの入力フィールド。 |
useHPO |
ブール値 | Rbfopt に基づく Hyper-Parameter Optimization (HPO) を有効または無効にするには、 true または false を指定します。Rbfopt は、パラメーターの最適な組み合わせを自動的に検出して、モデルがサンプル上で期待されるエラー率または低いエラー率を達成できるようにします。 デフォルトはfalse です。 |
min_cluster_size |
整数 | クラスターの最小サイズ。 整数を指定します。 デフォルトは5 です。 |
min_samples |
整数 | あるポイントがコア ポイントと見なされるための近傍のサンプル数。 整数を指定します。 0 に設定すると、min_cluster_size が使用されます。 デフォルトは0 です。 |
algorithm |
string | 使用するアルゴリズム (best 、generic 、prims_kdtree 、prims_balltree 、boruvka_kdtree 、またはboruvka_balltree ) を指定します。 デフォルトはbest です。 |
metric |
string | フィーチャー配列内のインスタンス間の距離を計算する際に使用するメトリック (euclidean 、cityblock 、L1 、L2 、manhattan 、braycurtis 、canberra 、chebyshev 、correlation 、minkowski 、またはsqeuclidean ) を指定します。 デフォルトはeuclidean です。 |
useStringLabel |
ブール値 | ストリング・クラスター・ラベルを使用する場合はtrue 、数値クラスター・ラベルを使用する場合はfalse を指定します。 デフォルトはfalse です。 |
stringLabelPrefix |
string | useStringLabel パラメーターがtrue に設定されている場合は、ストリング・ラベル接頭部の値を指定します。 デフォルトの接頭部はcluster です。 |
approx_min_span_tree |
ブール値 | 概算の最小スパンニング・ツリーを受け入れる場合はtrue を指定し、正確さのために速度を犠牲にする場合はfalse を指定します。 デフォルトはtrue です。 |
cluster_selection_method |
string | 圧縮ツリーからクラスターを選択するために使用する方法 (eom またはleaf ) を指定します。 デフォルトはeom (過剰質量アルゴリズム) です。 |
allow_single_cluster |
ブール値 | 単一クラスターの結果を許可する場合は、true を指定します。 デフォルトはfalse です。 |
p_value |
二重 | メトリックにminkowski を使用している場合は、使用するp value を指定します。 デフォルトは1.5 です。 |
leaf_size |
整数 | スペース・ツリー・アルゴリズム (boruvka_kdtree またはboruvka_balltree ) を使用する場合は、ツリーのリーフ・ノードのポイント数を指定します。 デフォルトは40 です。 |
outputValidity |
ブール値 | true またはfalse を指定して、妥当性インデックス・グラフをモデル出力に含めるかどうかを制御します。 |
outputCondensed |
ブール値 | 圧縮ツリー・グラフをモデル出力に含めるかどうかを制御するには、true またはfalse を指定します。 |
outputSingleLinkage |
ブール値 | 単一リンケージ・ツリー・グラフをモデル出力に含めるかどうかを制御するには、true またはfalse を指定します。 |
outputMinSpan |
ブール値 | 最小スパン・ツリー・グラフをモデル出力に含めるかどうかを制御するには、true またはfalse を指定します。 |
is_split |