0 / 0
資料の 英語版 に戻る
hdbscannode のプロパティー
最終更新: 2024年10月04日
hdbscannode のプロパティー

HDBSCAN ノードのアイコンHierarchical Density-Based Spatial Clustering (HDBSCAN)© は、教師なし学習を使用してデータ・セットのクラスター (つまり、密度の高い領域) を検出します。 SPSS Modeler の HDBSCAN ノードは、HDBSCAN ライブラリーのコア機能およびよく使用されるパラメーターを公開します。 このノードは Python で実装されており、最初にグループの性質が分からない場合にデータ・セットを異なるグループにクラスター化するために使用できます。

表 1. hdbscannode プロパティー
hdbscannodeプロパティー データ・タイプ プロパティーの説明
custom_fields ブール値 このオプションは、ノードに対し、上流のデータ型ノードのフィールド情報ではなく、ここで指定するフィールド情報を使用するように指示します。 このオプションを選択した後、必要に応じて以下のフィールドを指定します。
inputs フィールド クラスタリングの入力フィールド。
useHPO ブール値 Rbfopt に基づく Hyper-Parameter Optimization (HPO) を有効または無効にするには、 true または false を指定します。Rbfopt は、パラメーターの最適な組み合わせを自動的に検出して、モデルがサンプル上で期待されるエラー率または低いエラー率を達成できるようにします。 デフォルトはfalseです。
min_cluster_size 整数 クラスターの最小サイズ。 整数を指定します。 デフォルトは5です。
min_samples 整数 あるポイントがコア ポイントと見なされるための近傍のサンプル数。 整数を指定します。 0に設定すると、min_cluster_sizeが使用されます。 デフォルトは0です。
algorithm string 使用するアルゴリズム (bestgenericprims_kdtreeprims_balltreeboruvka_kdtree、またはboruvka_balltree) を指定します。 デフォルトはbestです。
metric string フィーチャー配列内のインスタンス間の距離を計算する際に使用するメトリック (euclideancityblockL1L2manhattanbraycurtiscanberrachebyshevcorrelationminkowski、またはsqeuclidean) を指定します。 デフォルトはeuclideanです。
useStringLabel ブール値 ストリング・クラスター・ラベルを使用する場合はtrue、数値クラスター・ラベルを使用する場合はfalseを指定します。 デフォルトはfalseです。
stringLabelPrefix string useStringLabelパラメーターがtrueに設定されている場合は、ストリング・ラベル接頭部の値を指定します。 デフォルトの接頭部はclusterです。
approx_min_span_tree ブール値 概算の最小スパンニング・ツリーを受け入れる場合はtrueを指定し、正確さのために速度を犠牲にする場合はfalseを指定します。 デフォルトはtrueです。
cluster_selection_method string 圧縮ツリーからクラスターを選択するために使用する方法 (eomまたはleaf) を指定します。 デフォルトはeom (過剰質量アルゴリズム) です。
allow_single_cluster ブール値 単一クラスターの結果を許可する場合は、trueを指定します。 デフォルトはfalseです。
p_value 二重 メトリックにminkowskiを使用している場合は、使用するp valueを指定します。 デフォルトは1.5です。
leaf_size 整数 スペース・ツリー・アルゴリズム (boruvka_kdtreeまたはboruvka_balltree) を使用する場合は、ツリーのリーフ・ノードのポイント数を指定します。 デフォルトは40です。
outputValidity ブール値 trueまたはfalseを指定して、妥当性インデックス・グラフをモデル出力に含めるかどうかを制御します。
outputCondensed ブール値 圧縮ツリー・グラフをモデル出力に含めるかどうかを制御するには、trueまたはfalseを指定します。
outputSingleLinkage ブール値 単一リンケージ・ツリー・グラフをモデル出力に含めるかどうかを制御するには、trueまたはfalseを指定します。
outputMinSpan ブール値 最小スパン・ツリー・グラフをモデル出力に含めるかどうかを制御するには、trueまたはfalse を指定します。
is_split
生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細