資料の 英語版 に戻るfeatureselectionnode プロパティー
featureselectionnode プロパティー
最終更新: 2024年10月07日
特徴量選択ノードで、(欠損値の割合などの)諸基準に基づいて入力フィールドをスクリーニングして削除にかけ、指定した目標に相対的な残りの入力フィールドの重要度をランク付けします。 例えば、数百の潜在的入力フィールドを含むデータセットがあるとして、患者予後のモデリングにはどれが役に立つのでしょう?
例
node = stream.create("featureselection", "My node")
node.setPropertyValue("screen_single_category", True)
node.setPropertyValue("max_single_category", 95)
node.setPropertyValue("screen_missing_values", True)
node.setPropertyValue("max_missing_values", 80)
node.setPropertyValue("criteria", "Likelihood")
node.setPropertyValue("unimportant_below", 0.8)
node.setPropertyValue("important_above", 0.9)
node.setPropertyValue("important_label", "Check Me Out!")
node.setPropertyValue("selection_mode", "TopN")
node.setPropertyValue("top_n", 15)
featureselectionnode プロパティー |
値 | プロパティーの説明 |
---|---|---|
target |
フィールド | 特徴量選択モデルは指定対象に関連した予測フィールドをランク付けします。 重みフィールドおよび度数フィールドは使用しません。 詳しくは、 モデル作成ノードの共通プロパティー を参照してください。 |
screen_single_category |
フラグ | True の場合、レコードの総数に対して、同じカテゴリーに分類されるレコードの数が多すぎるフィールドをスクリーニングします。 |
max_single_category |
数値 | screen_single_category がTrue の場合に使用されるしきい値を指定します。 |
screen_missing_values |
フラグ | True の場合、欠損値が多すぎるフィールドをスクリーニングし、レコードの総数に対するパーセントで表示します。 |
max_missing_values |
数値 | |
screen_num_categories |
フラグ | True の場合、レコードの総数に対して、カテゴリーが多すぎるフィールドをスクリーニングします。 |
max_num_categories |
数値 | |
screen_std_dev |
フラグ | True の場合、標準偏差が指定の最小値以下のフィールドをスクリーニングします。 |
min_std_dev |
数値 | |
screen_coeff_of_var |
フラグ | True の場合、指定された最小値以下の分散係数でフィールドをスクリーニングします。 |
min_coeff_of_var |
数値 | |
criteria |
Pearson Likelihood CramersV Lambda |
カテゴリー対象に対するカテゴリー予測値のランク付けのときに、重要な値が基準とする測定単位を指定します。 |
unimportant_below |
数値 | 重要、境界、非重要として変数をランク付けするときに使用される閾値 p を指定します。 0.0 から 1.0 の値を指定します。 |
important_above |
数値 | 0.0 から 1.0 の値を指定します。 |
unimportant_label |
string | 非重要ランクのラベルを指定します。 |
marginal_label |
string | |
important_label |
string | |
selection_mode |
ImportanceLevel ImportanceValue TopN |
|
select_important |
フラグ | selection_mode がImportanceLevel に設定されている場合に、重要なフィールドを選択するかどうかを指定します。 |
select_marginal |
フラグ | selection_mode がImportanceLevel に設定されている場合に、限界フィールドを選択するかどうかを指定します。 |
select_unimportant |
フラグ | selection_mode がImportanceLevel に設定されている場合に、重要でないフィールドを選択するかどうかを指定します。 |
importance_value |
数値 | selection_mode がImportanceValue に設定されている場合、使用するカットオフ値を指定します。 0 から 100 の値を指定します。 |
top_n |
整数 | selection_mode がTopN に設定されている場合、使用するカットオフ値を指定します。 0 から 1000 の値を指定します。 |