資料の 英語版 に戻る
chaidnode プロパティー
chaidnode プロパティー
最終更新: 2025年2月11日
CHAID ノードは、最適な分割を識別するためにカイ 2 乗統計量を使用してディシジョン・ツリーを生成します。 C&R Tree および QUEST ノードと違って、CHAID は、非 2 分岐ツリーを生成できます。これは、ある分岐が 3 個以上のブランチを持つことを意味します。 対象フィールドおよび入力フィールドは、数値範囲 (連続型) またはカテゴリーとなります。 Exhaustive CHAID は CHAID の修正版で、可能性のある分割すべてを調べることで、よりよい結果を得られますが、計算時間も長くなります。
例
stream = modeler.script.stream() sourcenode = stream.findByID("id46WRP1285C") node = stream.createAt("chaid", "My node", 200, 100) stream.link(sourcenode, node) node.setPropertyValue("custom_fields", True) node.setPropertyValue("target", "Drug") node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"]) node.setPropertyValue("use_model_name", True) node.setPropertyValue("model_name", "CHAID") node.setPropertyValue("method", "Chaid") node.setPropertyValue("model_output_type", "InteractiveBuilder") node.setPropertyValue("use_tree_directives", True) node.setPropertyValue("tree_directives", "Test") node.setPropertyValue("split_alpha", 0.03) node.setPropertyValue("merge_alpha", 0.04) node.setPropertyValue("chi_square", "Pearson") node.setPropertyValue("use_percentage", False) node.setPropertyValue("min_parent_records_abs", 40) node.setPropertyValue("min_child_records_abs", 30) node.setPropertyValue("epsilon", 0.003) node.setPropertyValue("max_iterations", 75) node.setPropertyValue("split_merged_categories", True) node.setPropertyValue("bonferroni_adjustment", True)
プロパティー |
データ型または値 | プロパティーの説明 |
---|---|---|
|
フィールド | CHAID モデルは単一の対象フィールドおよび 1 つ以上の入力フィールドを使用します。 頻度を指定することもできます。 詳しくは、 一般的なモデル作成ノードのプロパティーを参照してください。 |
|
フラグ | |
|
|
は大規模なデータ・セットに使用され、サーバー接続を必要とします。 |
|
|
|
|
フラグ | |
|
string | |
|
|
|
|
|
|
|
整数 | 最大ツリー深さ (0 から 1000)。 の場合にのみ使用されます。 |
|
フラグ | |
|
数値 | |
|
数値 | |
|
数値 | |
|
数値 | |
|
フラグ | |
|
構造化 | 構造化プロパティー。 |
|
数値 | ブーストまたはバグのコンポーネント・モデル数。 |
|
|
カテゴリー型対象を結合するためのデフォルト・ルール。 |
|
|
連続型対象のデフォルト結合ルール。 |
|
フラグ | 大規模なデータ・セットにブースティングを適用します。 |
|
数値 | 分割の有意水準。 |
|
数値 | 結合の有意水準。 |
|
フラグ | Bonferroni 法を使用して有意確率値を調整します。 |
|
フラグ | マージしたカテゴリーの再分割を許可。 |
|
|
カイ 2 乗統計量の計算に使用する方法: Pearson または尤度比 |
|
数値 | 期待されるセル度数の最小変化量。 |
|
数値 | 収束のための最大反復回数。 |
|
整数 | |
|
数値 | |
|
フラグ | |
|
フラグ | |
|
フラグ | |
|
|
|
|
整数 | |
|
二重 | アルゴリズムは、内部でレコードをモデル構築セットとオーバーフィット防止セットに分割します。 オーバーフィット防止セットは、学習中にエラーを追跡するために使用されるデータ・レコードの独立したセットです。これにより、手法でデータの可能性の変動をモデル化することができなくなります。 レコードの割合を指定します。 デフォルトは です。 |
|
ブール値 | デフォルト値は です。 デシジョン・ツリーを分割するポイントとして特定のフィールドを指定する場合は、このプロパティーを に設定できます。 |
|
list | このプロパティーは、 が に設定されている場合にのみ使用されます。このプロパティーは、オブジェクトのリストです。 各オブジェクトには、以下の 2 つの属性があります。 SPSS Modeler フローが実行されると、CHAID アルゴリズムは、各層の
値に基づいて、分割するフィールドの候補リストを評価して返します。 カスタム・レイヤーの場合、レイヤーに指定した各フィールドが、フィールドの完全な候補リストと比較されます。 候補リストのフィールドと一致する最初のフィールドが分割に使用されます。 指定された残りのフィールドは無視されます。 どのフィールドも一致しない場合は、警告メッセージが表示され、ツリーは通常どおりに分割されます。 |
トピックは役に立ちましたか?
0/1000