資料の 英語版 に戻るtwostepnode プロパティー
twostepnode プロパティー
最終更新: 2024年10月04日
TwoStep ノードで、2 段階のクラスター化手法が使用されます。 最初のステップでは、データを 1 度通過させて、未処理の入力データを管理可能な一連のサブクラスターに圧縮します。 2 番目のステップでは、階層クラスター化手法を使用して、サブクラスターをより大きなクラスターに結合させていきます。 TwoStep には、学習データに最適なクラスター数を自動的に推定するという利点があります。 また、フィールド・タイプの混在や大規模データ・セットも効率よく処理できます。
例
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)
twostepnode プロパティー |
値 | プロパティーの説明 |
---|---|---|
inputs |
[field1 ... fieldN] | TwoStep モデルは対象フィールドでなく、入力フィールドのリストを使用します。 重みフィールドおよび度数フィールドは認識されません。 詳しくは、 モデル作成ノードの共通プロパティー を参照してください。 |
standardize |
フラグ | |
exclude_outliers |
フラグ | |
percentage |
数値 | |
cluster_num_auto |
フラグ | |
min_num_clusters |
数値 | |
max_num_clusters |
数値 | |
num_clusters |
数値 | |
cluster_label |
String Number |
|
label_prefix |
string | |
distance_measure |
Euclidean Loglikelihood |
|
clustering_criterion |
AIC BIC |