영어 버전 문서로 돌아가기featureselectionnode 특성
featureselectionnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
필드선택 노드는 기준(예: 결측값의 퍼센트) 세트를 기반으로 제거용 입력 필드를 차단합니다. 그런 다음 지정된 대상에 상대적인 남아 있는 입력의 중요도에 대해 순위를 매깁니다. 예를 들어, 수백 개의 잠재 입력이 있는 데이터 세트가 있다면 환자 결과 모델링 시 어느 것이 가장 유용합니까?
예
node = stream.create("featureselection", "My node")
node.setPropertyValue("screen_single_category", True)
node.setPropertyValue("max_single_category", 95)
node.setPropertyValue("screen_missing_values", True)
node.setPropertyValue("max_missing_values", 80)
node.setPropertyValue("criteria", "Likelihood")
node.setPropertyValue("unimportant_below", 0.8)
node.setPropertyValue("important_above", 0.9)
node.setPropertyValue("important_label", "Check Me Out!")
node.setPropertyValue("selection_mode", "TopN")
node.setPropertyValue("top_n", 15)
featureselectionnode 특성 |
값 | 특성 설명 |
---|---|---|
target |
필드 | 필드선택 모델은 지정된 대상에 상대적으로 예측자 순위를 매깁니다. 가중치 및 빈도 필드는 사용하지 않습니다. 자세한 정보는 공통 모델링 노드 특성 을 참조하십시오. |
screen_single_category |
플래그 | True 인 경우 레코드 수가 너무 많은 필드가 총 레코드 수와 비교하여 동일한 범주에 속하게 됩니다. |
max_single_category |
Number | screen_single_category 이(가) True 일 때 사용되는 임계값을 지정합니다. |
screen_missing_values |
플래그 | True 인 경우 결측값이 너무 많은 필드가 총 레코드 수의 백분율로 표시됩니다. |
max_missing_values |
Number | |
screen_num_categories |
플래그 | True 인 경우, 레코드의 총 수와 비교하여 너무 많은 범주가 있는 필드를 화면에 표시합니다. |
max_num_categories |
Number | |
screen_std_dev |
플래그 | True 인 경우, 표준 편차가 지정된 최소값보다 작거나 같은 필드가 표시됩니다. |
min_std_dev |
Number | |
screen_coeff_of_var |
플래그 | True 인 경우 지정된 최소값보다 작거나 같은 분산 계수로 필드를 표시합니다. |
min_coeff_of_var |
Number | |
criteria |
Pearson Likelihood CramersV Lambda |
범주형 예측자를 범주형 대상에 대해 순위화할 때, 중요도 값이 기반이 되는 측도를 지정합니다. |
unimportant_below |
Number | 중요, 보통 또는 중요하지 않음으로 변수 순위를 지정하는 데 사용하는 임계값 p 값을 지정합니다. 0.0부터 1.0까지의 값을 승인합니다. |
important_above |
Number | 0.0부터 1.0까지의 값을 승인합니다. |
unimportant_label |
문자열 | 중요하지 않은 순위에 대한 레이블을 지정합니다. |
marginal_label |
문자열 | |
important_label |
문자열 | |
selection_mode |
ImportanceLevel ImportanceValue TopN |
|
select_important |
플래그 | selection_mode 이(가) ImportanceLevel (으)로 설정된 경우, 중요한 필드를 선택할지 여부를 지정합니다. |
select_marginal |
플래그 | selection_mode 이(가) ImportanceLevel (으)로 설정된 경우, 주변 필드를 선택할지 여부를 지정합니다. |
select_unimportant |
플래그 | selection_mode 이(가) ImportanceLevel (으)로 설정된 경우 중요하지 않은 필드를 선택할지 여부를 지정합니다. |
importance_value |
Number | selection_mode 이(가) ImportanceValue (으)로 설정된 경우 사용할 컷오프 값을 지정합니다. 0부터 100까지의 값을 승인합니다. |
top_n |
정수 | selection_mode 이(가) TopN (으)로 설정된 경우 사용할 컷오프 값을 지정합니다. 0에서부터 1000까지의 값을 승인합니다. |