영어 버전 문서로 돌아가기cartnode 특성
cartnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
분류 및 회귀(C&R) 트리 노드는 추가 관측값을 예측하거나 분류할 수 있게 하는 의사결정 트리를 생성합니다. 이 방법은 반복 파티셔닝을 사용하여 각 단계에서 불순도를 최소화하여 교육 레코드를 세그먼트로 분할합니다. 여기서 노드의 케이스 100% 가 대상 필드의 특정 범주에 속하는 경우 트리의 노드는 "순수"로 간주됩니다. 목표 및 입력 필드는 숫자 범위 또는 범주형(명목형, 순서형 또는 플래그)입니다. 모든 분할은 이분형입니다(오직 두 개의 부그룹).
예
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
cartnode 특성 |
값 | 특성 설명 |
---|---|---|
target |
필드 | C&R 트리 모델은 하나의 대상과 하나 이상의 입력 필드가 필요합니다. 빈도 필드도 지정할 수 있습니다. 자세한 정보는 공통 모델링 노드 특성 주제를 참조하십시오. |
continue_training_existing_model |
플래그 | |
objective |
Standard Boosting Bagging psm |
psm 은(는) 매우 큰 데이터 세트에 사용되며 서버 연결이 필요합니다. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
플래그 | |
tree_directives |
문자열 | 트리 성장을 위한 지시문을 지정하십시오. 줄 바꾸기 또는 인용부호 이스케이프를 피하기 위해 지시문을 삼중 인용부호로 묶을 수 있습니다. 지시문은 데이터 또는 모델링 옵션의 사소한 변화에 매우 민감할 수 있으며 다른 데이터 세트로 일반화하지 않을 수 있음을 참고하십시오. |
use_max_depth |
Default Custom |
|
max_depth |
정수 | 0부터 1000까지의
최대 트리 깊이입니다. use_max_depth
= Custom 인 경우에만 사용됩니다. |
prune_tree |
플래그 | 과적합을 방지하기 위해 트리를 가지치기합니다. |
use_std_err |
플래그 | (표준 오차에서) 위험의 최대 차이를 사용하십시오. |
std_err_multiplier |
Number | 최대 차이입니다. |
max_surrogates |
Number | 최대 서로게이트입니다. |
use_percentage |
플래그 | |
min_parent_records_pc |
Number | |
min_child_records_pc |
Number | |
min_parent_records_abs |
Number | |
min_child_records_abs |
Number | |
use_costs |
플래그 | |
costs |
구조화된 | 구조화 특성입니다. |
priors |
Data Equal Custom |
|
custom_priors |
구조화된 | 구조화 특성입니다. |
adjust_priors |
플래그 | |
trails |
Number | 부스팅 또는 배깅을 위한 구성요소 모델 수입니다. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
범주형 대상에 대한 기본 결합 규칙입니다. |
range_ensemble_method |
Mean Median |
연속형 대상에 대한 기본 결합 규칙입니다. |
large_boost |
플래그 | 매우 큰 데이터 세트에 부스팅을 적용합니다. |
min_impurity |
Number | |
impurity_measure |
Gini Twoing Ordered |
|
train_pct |
Number | 과적합 방지 세트입니다. |
set_random_seed |
플래그 | 결과 복제 옵션입니다. |
seed |
Number | |
calculate_variable_importance |
플래그 | |
calculate_raw_propensities |
플래그 | |
calculate_adjusted_propensities |
플래그 | |
adjusted_propensity_partition |
Test Validation |