영어 버전 문서로 돌아가기autoclassifiernode 특성
autoclassifiernode 특성
마지막 업데이트 날짜: 2024년 10월 07일
자동 분류자 노드는 이분형 결과(예 또는 아니오, 이탈 또는 이탈 안함 등)에 대해 다수의 여러 모델을 작성하고 비교하여 주어진 분석을 위한 최상의 접근 방식을 선택할 수 있게 합니다. 많은 모델링 알고리즘이 지원되어 사용할 방법, 각각에 대한 특정 옵션, 결과 비교 기준을 선택할 수 있습니다. 이 노드는 지정된 옵션을 기반으로 모델 세트를 생성하고 사용자가 지정하는 기준에 따라 최상의 후보를 순위화합니다.
예
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
autoclassifiernode 특성 |
값 | 특성 설명 |
---|---|---|
target |
필드 | 플래그 대상의 경우, 자동 분류자 노드는 하나의 대상과 하나 이상의 입력 필드가 필요합니다. 가중치 및 빈도 필드도 지정할 수 있습니다. 자세한 정보는 공통 모델링 노드 특성 을 참조하십시오. |
ranking_measure |
Accuracy Area_under_curve Profit Lift Num_variables |
|
ranking_dataset |
Training Test |
|
number_of_models |
정수 | 모델 너깃에 포함할 모델 수입니다. 1과 100 사이의 정수를 지정하십시오. |
calculate_variable_importance |
플래그 | |
enable_accuracy_limit |
플래그 | |
accuracy_limit |
정수 | 0과 100 사이의 정수입니다. |
enable_area_under_curve_limit |
플래그 | |
area_under_curve_limit |
Number | 0.0과 1.0 사이의 실수입니다. |
enable_profit_limit |
플래그 | |
profit_limit |
Number | 0보다 큰 정수입니다. |
enable_lift_limit |
플래그 | |
lift_limit |
Number | 1.0보다 큰 실수입니다. |
enable_number_of_variables_limit |
플래그 | |
number_of_variables_limit |
Number | 0보다 큰 정수입니다. |
use_fixed_cost |
플래그 | |
fixed_cost |
Number | 0.0보다 큰 실수입니다. |
variable_cost |
필드 | |
use_fixed_revenue |
플래그 | |
fixed_revenue |
Number | 0.0보다 큰 실수입니다. |
variable_revenue |
필드 | |
use_fixed_weight |
플래그 | |
fixed_weight |
Number | 0.0보다 큰 실수입니다. |
variable_weight |
필드 | |
lift_percentile |
Number | 0과 100 사이의 정수입니다. |
enable_model_build_time_limit |
플래그 | |
model_build_time_limit |
Number | 각 개별 모델을 작성하는 데 걸리는 시간을 제한하기 위해 분 단위로 설정하는 정수입니다. |
enable_stop_after_time_limit |
플래그 | |
stop_after_time_limit |
Number | 자동 분류자 실행에 대한 전체 경과 시간을 제한하기 위해 시간 수로 설정되는 실수입니다. |
enable_stop_after_valid_model_produced |
플래그 | |
use_costs |
플래그 | |
<algorithm> |
플래그 | 특정 알고리즘의 사용을 사용 또는 사용 안합니다. |
<algorithm>.<property> |
문자열 | 특정 알고리즘의 특성 값을 설정합니다. 자세한 정보는 알고리즘 특성 설정 을 참조하십시오. |
use_cross_validation |
필드 | 이 목록에 추가되는 필드에 모델에서 생성되는 규칙의 예측 역할 또는 조건이 사용될 수 있습니다. 이는 규칙 기준에 의한 규칙이므로, 필드는 한 규칙의 조건이면서 다른 규칙의 예측이 될 수 있습니다. |
number_of_folds |
정수 | 교차 검증을 위한 N 중첩 모수이며, 범위는 3 - 10입니다. |
set_random_seed |
부울 | 난수 시드를 설정하면 분석을 복제할 수 있습니다. 정수를 지정하거나, 생성을 클릭하여 1과 2147483647 사이(1과 2147483647 포함)의 유사 난수 정수를 작성합니다. 기본적으로, 분석은 시드 229176228로 복제됩니다. |
random_seed |
정수 | 무작위 시드 |
stop_if_valid_model |
부울 | |
filter_individual_model_output |
부울 | 앙상블 노드에 반영되는 개별 모델이 생성한 모든 추가 필드의 출력에서 제거합니다. 모든 입력 모델의 결합된 점수에만 관심이 있는 경우 이 옵션을 선택하십시오. 예를 들어 분석 노드 또는 평가 노드를 사용하여 결합된 점수의 정확도를 각 개별 입력 모델의 정확도와 비교하려는 경우 이 옵션이 선택 취소되었는지 확인하십시오. |
set_ensemble_method |
"Voting" |
목표를 설정하기 위한 앙상블 메소드입니다. |
set_voting_tie_selection |
"Random" |
투표가 연결된 경우, 무작위로 값을 선택하거나 가장 높은 신뢰도를 사용하십시오. |
flag_ensemble_method |
"Voting" |
플래그 목표에 대한 앙상블 메소드. |
flag_voting_tie_selection |
"Random" |
투표가 연결된 경우 신뢰도가 가장 높거나 원시 성향이 있는 무작위로 값을 선택하십시오. |