資料の 英語版 に戻る

chaidnode プロパティー

最終更新: 2025年2月11日
chaidnode プロパティー

CHAID ノード・アイコンCHAID ノードは、最適な分割を識別するためにカイ 2 乗統計量を使用してディシジョン・ツリーを生成します。 C&R Tree および QUEST ノードと違って、CHAID は、非 2 分岐ツリーを生成できます。これは、ある分岐が 3 個以上のブランチを持つことを意味します。 対象フィールドおよび入力フィールドは、数値範囲 (連続型) またはカテゴリーとなります。 Exhaustive CHAID は CHAID の修正版で、可能性のある分割すべてを調べることで、よりよい結果を得られますが、計算時間も長くなります。

stream = modeler.script.stream()
sourcenode = stream.findByID("id46WRP1285C")

node = stream.createAt("chaid", "My node", 200, 100)
stream.link(sourcenode, node)

node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "CHAID")
node.setPropertyValue("method", "Chaid")
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", "Test")
node.setPropertyValue("split_alpha", 0.03)
node.setPropertyValue("merge_alpha", 0.04)
node.setPropertyValue("chi_square", "Pearson")
node.setPropertyValue("use_percentage", False)
node.setPropertyValue("min_parent_records_abs", 40)
node.setPropertyValue("min_child_records_abs", 30)
node.setPropertyValue("epsilon", 0.003)
node.setPropertyValue("max_iterations", 75)
node.setPropertyValue("split_merged_categories", True)
node.setPropertyValue("bonferroni_adjustment", True)
表 1. chaidnode プロパティー
chaidnodeプロパティー データ型または値 プロパティーの説明
target フィールド CHAID モデルは単一の対象フィールドおよび 1 つ以上の入力フィールドを使用します。 頻度を指定することもできます。 詳しくは、 一般的なモデル作成ノードのプロパティーを参照してください。
continue_training_existing_model フラグ  
objective
  • Standard
  • Boosting
  • Bagging
  • psm
psm は大規模なデータ・セットに使用され、サーバー接続を必要とします。
model_output_type
  • Single
  • InteractiveBuilder
 
use_tree_directives フラグ  
tree_directives string  
method
  • Chaid
  • ExhaustiveChaid
 
use_max_depth
  • Default
  • Custom
 
max_depth 整数 最大ツリー深さ (0 から 1000)。 use_max_depth = Customの場合にのみ使用されます。
use_percentage フラグ  
min_parent_records_pc 数値  
min_child_records_pc 数値  
min_parent_records_abs 数値  
min_child_records_abs 数値  
use_costs フラグ  
costs 構造化 構造化プロパティー。
trails 数値 ブーストまたはバグのコンポーネント・モデル数。
set_ensemble_method
  • Voting
  • HighestProbability
  • HighestMeanProbability
カテゴリー型対象を結合するためのデフォルト・ルール。
range_ensemble_method
  • Mean
  • Median
連続型対象のデフォルト結合ルール。
large_boost フラグ 大規模なデータ・セットにブースティングを適用します。
split_alpha 数値 分割の有意水準。
merge_alpha 数値 結合の有意水準。
bonferroni_adjustment フラグ Bonferroni 法を使用して有意確率値を調整します。
split_merged_categories フラグ マージしたカテゴリーの再分割を許可。
chi_square
  • Pearson
  • LR
カイ 2 乗統計量の計算に使用する方法: Pearson または尤度比
epsilon 数値 期待されるセル度数の最小変化量。
max_iterations 数値 収束のための最大反復回数。
set_random_seed 整数  
seed 数値  
calculate_variable_importance フラグ  
calculate_raw_propensities フラグ  
calculate_adjusted_propensities フラグ  
adjusted_propensity_partition
  • Test
  • Validation
 
maximum_number_of_models 整数  
train_pct 二重 アルゴリズムは、内部でレコードをモデル構築セットとオーバーフィット防止セットに分割します。 オーバーフィット防止セットは、学習中にエラーを追跡するために使用されるデータ・レコードの独立したセットです。これにより、手法でデータの可能性の変動をモデル化することができなくなります。 レコードの割合を指定します。 デフォルトは 30 です。
use_customize_layer ブール値 デフォルト値は falseです。 デシジョン・ツリーを分割するポイントとして特定のフィールドを指定する場合は、このプロパティーを true に設定できます。
customize_layer list このプロパティーは、 use_customize_layertrueに設定されている場合にのみ使用されます。
このプロパティーは、オブジェクトのリストです。 各オブジェクトには、以下の 2 つの属性があります。
  • Layer は、カスタマイズするデシジョン・ツリー内の特定の n 番目の層を示す整数です。 SPSS Modelerでは、レイヤーは 0 (ルート) から始まります。
  • Fields は名前のリストです。 それぞれの名前は、その Layerで意思決定ツリーを分割する可能性があるフィールドの 1 つです。 これらのフィールドは、リストされている順序で SPSS Modeler によって評価されます。
SPSS Modeler フローが実行されると、CHAID アルゴリズムは、各層の p 値に基づいて、分割するフィールドの候補リストを評価して返します。 カスタム・レイヤーの場合、レイヤーに指定した各フィールドが、フィールドの完全な候補リストと比較されます。 候補リストのフィールドと一致する最初のフィールドが分割に使用されます。 指定された残りのフィールドは無視されます。 どのフィールドも一致しない場合は、警告メッセージが表示され、ツリーは通常どおりに分割されます。