資料の 英語版 に戻るbinningnode プロパティー
binningnode プロパティー
最終更新: 2024年10月04日
データ分割ノードで、既存の 1 つまたは複数の連続型 (数値範囲) フィールドの値に基づいて、自動的に新しい名義型 (セット型) フィールドを作成します。 例えば、連続型収入フィールドを、平均からの偏差による収入グループを含む、新しいカテゴリー・フィールドに変換することができます。 新規フィールドのビンを作成した後に、分割点に基づいてフィールド作成ノードを生成できます。
例
node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
binningnode プロパティー |
データ・タイプ | プロパティーの説明 |
---|---|---|
fields |
[field1 field2 ... フィールド n] | 変換保留中の連続型 (数値範囲) フィールド。 複数のフィールドを同時にビンに分割できます。 |
method |
FixedWidth EqualCount Rank SDev Optimal |
新規フィールドのビン (カテゴリー) の分割点を決める方法。 |
recalculate_bins |
Always IfNecessary |
ノードが実行されるごとに、ビンが再計算され、適切なビンの中にデータが配置されるか、またはデータが既存のビンおよび追加された新規のビンに追加されるだけかを指定します。 |
fixed_width_name_extension |
string | デフォルトの拡張子は _BIN です。 |
fixed_width_add_as |
Suffix Prefix |
拡張子をフィールド名の最後に追加するか (Suffix)、または先頭に追加するか (Prefix) を指定します。 デフォルトの拡張子は income_BIN です。 |
fixed_bin_method |
Width Count |
|
fixed_bin_count |
整数 | 新規フィールドの固定幅ビン (カテゴリー) 数を決定するのに使用する整数を指定します。 |
fixed_bin_width |
リアル | ビンの幅を算出するために使用する値 (整数または実数)。 |
equal_count_name_ extension |
string | デフォルトの拡張子は _TILE です。 |
equal_count_add_as |
Suffix Prefix |
標準の分位を使用して生成されるフィールドに対して使用される拡張子が、Suffix (接頭辞) か Prefix (接尾辞) かを指定します。 デフォルトの拡張子は、_TILE に N を付けたものになります。N は分位数です。 |
tile4 |
フラグ | それぞれが 25 % のケースを含む、4 分位のビンを生成します。 |
tile5 |
フラグ | 5 つの 5 分位ビンを生成します。 |
tile10 |
フラグ | 10 個の十分位 (デシル) ビンを生成します。 |
tile20 |
フラグ | 20 個の二十分位ビンを生成します。 |
tile100 |
フラグ | 100 個の百分位 (パーセンタイル) ビンを生成します。 |
use_custom_tile |
フラグ | |
custom_tile_name_extension |
string | デフォルトの拡張子は _TILEN です。 |
custom_tile_add_as |
Suffix Prefix |
|
custom_tile |
整数 | |
equal_count_method |
RecordCount ValueSum |
RecordCount メソッドは、各ビンに等しい数のレコードを割り当てようとします。一方、ValueSum は、各ビンの値の合計が等しくなるようにレコードを割り当てます。 |
tied_values_method |
Next Current Random |
可否同数の値のデータに配置されるビンを指定。 |
rank_order |
Ascending Descending |
このプロパティーには、Ascending (最小値は 1 とマークされます) またはDescending (最大値は 1 とマークされます) が含まれます。 |
rank_add_as |
Suffix Prefix |
このオプションは、ランク、ランクの比率、およびランクのパーセンテージに適用されます。 |
rank |
フラグ | |
rank_name_extension |
string | デフォルトの拡張子は _RANK です。 |
rank_fractional |
フラグ | 新規フィールドの値が、ランクを非欠損ケースの重みの合計で除算した値になるように、ケースをランク付けします。 小数点付き順位の範囲は 0 から 1 までです。 |
rank_fractional_name_ extension |
string | デフォルトの拡張子は _F_RANK です。 |
rank_pct |
フラグ | 各ランクが、有効な値を持つレコード数で除算された後、100 倍されます。 パーセンテージの小数点付き順位の範囲は 1 から 100 までです。 |
rank_pct_name_extension |
string | デフォルトの拡張子は _P_RANK です。 |
sdev_name_extension |
string | |
sdev_add_as |
Suffix Prefix |
|
sdev_count |
One Two Three |
|
optimal_name_extension |
string | デフォルトの拡張子は _OPTIMAL です。 |
optimal_add_as |
Suffix Prefix |
|
optimal_supervisor_field |
フィールド | データ分割のために選択されたフィールドが関係する監督フィールドとして選ばれたフィールド。 |
optimal_merge_bins |
フラグ | ケース度数が小さいビンをより大きな近傍ビンに追加することを指定します。 |
optimal_small_bin_threshold |
整数 | |
optimal_pre_bin |
フラグ | データセットの事前データ分割を実行することを示します。 |
optimal_max_bins |
整数 | 過度に多数のビンを作成しないように、上限を指定します。 |
optimal_lower_end_point |
Inclusive Exclusive |
|
optimal_first_bin |
Unbounded Bounded |
|
optimal_last_bin |
Unbounded Bounded |