영어 버전 문서로 돌아가기rfnode 특성
rfnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
랜덤 포리스트 노드는 트리 모델을 기본 모델로 사용하는 배깅 알고리즘의 고급 구현을 사용합니다. SPSS Modeler 의 이 랜덤 포리스트 모델링 노드는 Python 에서 구현되며 scikit-learn© Python 라이브러리가 필요합니다.
rfnode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
custom_fields |
부울 | 이 옵션에서는 업스트림 유형 노드에 지정된 항목 대신, 여기에 지정된 필드 정보를 사용하도록 노드에 지시합니다. 이 옵션을 선택한 후 필요에 따라 다음 필드를 지정하십시오. |
inputs |
필드 | 입력용 필드 이름 목록입니다. |
target |
필드 | 대상에 대한 하나의 필드 이름입니다. |
fast_build |
부울 | 여러 CPU 코어를 활용하여 모델 빌드를 개선합니다. |
role_use |
문자열 | 사전 정의된 역할을 사용하려면 predefined 을(를) 지정하고 사용자 정의 필드 지정을 사용하려면 custom 을(를) 지정하십시오. 기본값은 predefined입니다. |
splits |
필드 | 분할용 필드 이름 목록입니다. |
n_estimators |
정수 | 작성할 트리의 수입니다. 기본값은 10 입니다. |
specify_max_depth |
부울 | 사용자 정의 최대 깊이를 지정합니다. false 인 경우 모든 리프가 순수하거나 모든 리프가 min_samples_split 개 미만의 샘플을 포함할 때까지 노드가 확장됩니다. 기본값은 false 입니다. |
max_depth |
정수 | 트리의 최대 깊이입니다. 기본값은 10 입니다. |
min_samples_leaf |
정수 | 최소 리프 노드 크기입니다. 기본값은 1 입니다. |
max_features |
문자열 | 최상의 분할을 검색할 때 고려할 변수의 수입니다.
auto 입니다. |
bootstrap |
부울 | 트리 작성 시 붓스트랩 표본을 사용합니다. 기본값은 true 입니다. |
oob_score |
부울 | 일반화 정확도를 추정하기 위해 준비된 표본을 사용합니다. 기본값은 false 입니다. |
extreme |
부울 | 극단적으로 임의화된 트리를 사용합니다. 기본값은 false 입니다. |
use_random_seed |
부울 | 복제된 결과를 가져오려면 이를 지정합니다. 기본값은 false 입니다. |
random_seed |
정수 | 트리를 작성할 때 사용할 난수 시드입니다. 정수를 지정하십시오. |
cache_size |
부동 | 커널 캐시의 크기(MB)입니다. 기본값은 200 입니다. |
enable_random_seed |
부울 | random_seed 매개변수를 사용합니다. true 또는 false를 지정하십시오. 기본값은 false 입니다. |
enable_hpo |
부울 | HPO 옵션을 사용하거나 사용하지 않으려면 true 또는 false 을(를) 지정하십시오. true (으)로 설정하면 Rbfopt가 적용되어 자동으로 "최상의" 무작위 포리스트 모델을 판별합니다. 이 모델은 다음 target_objval 매개변수를 사용하여 사용자가 정의한 목표 목표 값에 도달합니다. |
target_objval |
부동 | 도달하고자 하는 목표 함수 값(표본에 대한 모델의 오차율)이며
예를 들어, 알 수 없는 최적 값이 있습니다. 최적(예: 0.01 )을 알 수 없는 경우 이 매개변수를 적절한 값으로 설정하십시오. |
max_iterations |
정수 | 모델을 시도하는 최대 반복 수입니다. 기본값은 1000 입니다. |
max_evaluations |
정수 | 모델을 시도하는 함수 평가의 최대 수입니다. 여기서,
초점은 속도에 대한 정확도입니다. 기본값은 300 입니다. |