영어 버전 문서로 돌아가기smotenode 특성
smotenode 특성
마지막 업데이트 날짜: 2024년 10월 07일
SMOTE(Synthetic Minority Over-sampling Technique) 노드는 불균형 데이터 세트를 처리하기 위해 초과 표본추출 알고리즘을 제공합니다. 또한 데이터 균형을 조정하기 위한 고급 방법을 제공합니다. SPSS Modeler 의 SMOTE 프로세스 노드는 Python 에서 구현되며 imbalanced-learn© Python 라이브러리가 필요합니다.
smotenode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
target |
필드 | 대상 필드입니다. |
sample_ratio |
문자열 | 사용자 정의 비율 값을 사용으로 설정합니다. 두 가지 옵션은 자동(sample_ratio_auto ) 또는 설정 비율(sample_ratio_manual )입니다. |
sample_ratio_value |
부동 | 비율은 다수 클래스의 표본 수 대비 소수 클래스의 표본 수입니다. 0 보다 크고 1 보다 작거나 같아야 합니다. 기본값은 auto 입니다. |
enable_random_seed |
부울 | true (으)로 설정하면 random_seed 특성이 사용 가능합니다. |
random_seed |
정수 | 난수 생성기에 사용되는 시드입니다. |
k_neighbours |
정수 | 합성 샘플을 구성하는 데 사용되는 가장 가까운 이웃 수입니다. 기본값은 5 입니다. |
m_neighbours |
정수 | 소수 샘플이 위험 상태에 있는지 여부를 판별하는 데 사용되는 가장 가까운 이웃 수입니다. 이 옵션은 SMOTE 알고리즘 유형 borderline1 및 borderline2 에서만 사용할 수 있습니다. 기본값은 10 입니다. |
algorithm |
문자열 | SMOTE 알고리즘의 유형: regular , borderline1 또는 borderline2 . |
use_partition |
부울 | true (으)로 설정하면 모델 작성에만 훈련 데이터가 사용됩니다. 기본값은 true 입니다. |