資料の 英語版 に戻る

autoclassifiernode プロパティー

最終更新: 2025年2月11日
autoclassifiernode プロパティー

自動分類ノードのアイコン自動分類ノードは、2種類の結果 (yes/no、 churn/don't churn など) を生じる多くの異なるモデルを作成および比較し、与えられた分析への最善のアプローチを選ぶことができるようになります。 多くのモデル作成アルゴリズムに対応し、希望する方法、各特定のオプション、そして結果を比較するための基準を選択することができます。 このノードで、指定されたオプションに基づいてモデルのセットが生成され、指定された基準に基づいて最善の候補がランク付けされます。

node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
表 1. autoclassifiernode プロパティー
autoclassifiernodeプロパティー プロパティーの説明
target フィールド フラグ型対照の場合、自動分類ノードは 1 つの対象フィールドおよび 1 つ以上の入力フィールドを使用します。 重みフィールドおよび度数フィールドも指定することができます。 詳しくは、 モデル作成ノードの共通プロパティー を参照してください。
ranking_measure Accuracy
Area_under_curve
Profit
Lift
Num_variables
 
ranking_dataset Training
Test
 
number_of_models 整数 モデル・ナゲットに含まれるモデルの数。 1 と 100の間の整数を指定します。
calculate_variable_importance フラグ  
enable_accuracy_limit フラグ  
accuracy_limit 整数 0 と 100 の間の整数です。
enable_area_under_curve_limit フラグ  
area_under_curve_limit 数値 0.0 と 1.0 の間の実数。
enable_profit_limit フラグ  
profit_limit 数値 1 以上の整数。
enable_lift_limit フラグ  
lift_limit 数値 1.0 を超える実数。
enable_number_of_variables_limit フラグ  
number_of_variables_limit 数値 1 以上の整数。
use_fixed_cost フラグ  
fixed_cost 数値 0.0 を超える実数。
variable_cost フィールド  
use_fixed_revenue フラグ  
fixed_revenue 数値 0.0 を超える実数。
variable_revenue フィールド  
use_fixed_weight フラグ  
fixed_weight 数値 0.0 を超える実数。
variable_weight フィールド  
lift_percentile 数値 0 と 100 の間の整数です。
enable_model_build_time_limit フラグ  
model_build_time_limit 数値 個々のモデルのそれぞれを構築するためにかかる時間を制限するために分数を設定する整数。
enable_stop_after_time_limit フラグ  
stop_after_time_limit 数値 自動分類の実行のための全体経過時間を制限するために時間数を設定する実数。
enable_stop_after_valid_model_produced フラグ  
use_costs フラグ  
<algorithm> フラグ 特定のアルゴリズムの使用の有効、無効を切り替えます。
<algorithm>.<property> string 特定のアルゴリズムのプロパティー値を設定します。 詳しくは、 アルゴリズム・プロパティーの設定 を参照してください。
use_cross_validation フィールド このリストに追加されたフィールドは、モデルが生成したルールにおいて、条件または予測のいずれかの役割を取得します。 これは、ルールに応じて異なります。したがって、フィールドは、ルールによっては、条件になる場合も予測になる場合もあります。
number_of_folds 整数 交差検証の分割数パラメーター (3 から 10 の範囲)。
set_random_seed ブール値 ランダム・シードを設定すると、分析を再現することができます。 整数を指定するか、「生成」をクリックします。「生成」をクリックすると、1 から 2147483647 までの整数の疑似乱数が作成されます。 デフォルトでは、分析は、シード 229176228 で複製されます。
random_seed 整数 ランダム シード
stop_if_valid_model ブール値
filter_individual_model_output ブール値 アンサンブル・ノードに使用する個々のモデルで生成されたすべての追加フィールドを、出力から削除します。 すべての入力モデルの結合スコアのみに関心がある場合は、このオプションを選択します。 例えば、分析ノードまたは評価ノードを使用して、結合スコアの精度を個々の入力モデルの精度と比較する場合は、このオプションの選択を解除してください。
set_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"HighestConfidence"
セット型対象のアンサンブル方法です。
set_voting_tie_selection "Random"
"HighestConfidence"
投票が結合されている場合は、値をランダムに選択するか、最も高い信頼度を使用して選択します。
flag_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"RawPropensityWeightedVoting"
"HighestConfidence"
"AverageRawPropensity"
フラグ型対象のアンサンブル方法です。
flag_voting_tie_selection "Random"
"HighestConfidence"
"RawPropensity"
投票が結合されている場合は、値をランダムに選択するか、信頼性が最も高いか、または傾向が未調整の値を選択します。