영어 버전 문서로 돌아가기xgboostasnode 특성
xgboostasnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
XGBoost는 기울기 부스팅 알고리즘의 고급 구현입니다. 부스팅 알고리즘은 약한 분류자를 반복적으로 학습한 다음 이를 강한 최종 분류자에 추가합니다. XGBoost는 매우 유연하며 대부분의 사용자에게 압도적일 수 있는 많은 매개변수를 제공하므로 SPSS Modeler의 XGBoost-AS 노드는 코어 기능 및 일반적으로 사용되는 매개변수를 표시합니다. XGBoost-AS 노드는 Spark로 구현됩니다.
xgboostasnode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
target_field |
필드 | 목표에 대한 필드 이름 목록입니다. |
input_fields |
필드 | 입력을 위한 필드 이름 목록입니다. |
nWorkers |
정수 | XGBoost 모델 교육에 사용되는 작업자 수입니다. 기본값은 1 입니다. |
numThreadPerTask |
정수 | 작업자당 사용되는 스레드 수입니다. 기본값은 1 입니다. |
useExternalMemory |
부울 | 외부 메모리를 캐시로 사용하는지 여부입니다. 기본값은 false입니다. |
boosterType |
문자열 | 사용할 증폭기 유형입니다. 사용 가능한 옵션은 gbtree , gblinear 또는 dart 입니다. 기본값은 gbtree 입니다. |
numBoostRound |
정수 | 부스팅 라운드 수입니다. 0 이상의 값을 지정하십시오. 기본값은 10 입니다. |
scalePosWeight |
이중 | 양수 및 음수 가중값의 균형을 제어합니다. 기본값은 1 입니다. |
randomseed |
정수 | 난수 생성기에 사용되는 시드입니다. 기본값은 0입니다. |
objectiveType |
문자열 | 학습 목표입니다. 가능한 값은 reg:linear , reg:logistic , reg:gamma , reg:tweedie , rank:pairwise , binary:logistic 또는 multi 입니다. 플래그 대상의 경우 binary:logistic 또는 multi 만 사용할 수 있습니다. multi 을(를) 사용하면 점수 결과에 multi:softmax 및 multi:softprob XGBoost 목표 유형이 표시됩니다. 기본값은 reg:linear 입니다. |
evalMetric |
문자열 | 검증 데이터에 대한 평가 메트릭입니다. 기본 메트릭은 목표에 따라 지정됩니다. 가능한 값은 rmse , mae , logloss , error , merror , mlogloss , auc , ndcg , map 또는 gamma-deviance 입니다. 기본값은 rmse 입니다. |
lambda |
이중 | 가중값에 대한 L2 정규화 항입니다. 이 값을 늘리면
더 보수적인 모델이 생성됩니다. 숫자 0 이상을 지정하십시오. 기본값은 1 입니다. |
alpha |
이중 | 가중치에 대한 L1 정규화 항입니다. 이 값을 늘리면
더 보수적인 모델이 생성됩니다. 숫자 0 이상을 지정하십시오. 기본값은 0 입니다. |
lambdaBias |
이중 | 편향에 대한 L2 정규화 항입니다. gblinear booster 유형이 사용되는 경우 이 람다 바이어스 선형 부스터 매개변수를 사용할 수 있습니다. 숫자 0 이상을 지정하십시오. 기본값은 0 입니다. |
treeMethod |
문자열 | gbtree 또는 dart booster 유형이 사용되는 경우, 트리 성장에 대한 이 트리 메소드 매개변수(및 뒤에 오는 다른 트리 매개변수)를 사용할 수 있습니다. 이는 사용할 XGBoost 트리 생성 알고리즘을 지정합니다. 사용 가능한 옵션은 auto , exact 또는 approx 입니다. 기본값은 auto 입니다. |
maxDepth |
정수 | 트리의 최대 깊이입니다. 2 이상의 값을 지정하십시오. 기본값은 6 입니다. |
minChildWeight |
이중 | 하위에 필요한 인스턴스 가중치(hessian)의 최소 합계입니다. 0 이상의 값을 지정하십시오. 기본값은 1 입니다. |
maxDeltaStep |
이중 | 각 트리의 가중추정에 허용할 최대 델타 단계입니다. 0 이상의 값을 지정하십시오. 기본값은 0 입니다. |
sampleSize |
이중 | 하위 표본은 학습 인스턴스의 비율을 대상으로 합니다. 0.1 에서 1.0 사이의 값을 지정하십시오. 기본값은 1.0 입니다. |
eta |
이중 | 과적합 방지를 위해 업데이트 단계 중에 사용되는 단계 크기 축소입니다. 0 에서 1 사이의 값을 지정하십시오. 기본값은 0.3 입니다. |
gamma |
이중 | 트리의 리프 노드에 추가 파티션을 만드는 데 필요한
최소 손실 감소입니다. 숫자 0 이상을 지정하십시오. 기본값은 6 입니다. |
colsSampleRatio |
이중 | 각 트리를 생성할 때 열의 하위 표본 비율입니다. 0.01 에서 1 사이의 값을 지정하십시오. 기본값은 1 입니다. |
colsSampleLevel |
이중 | 각 수준에서 각 분할에 대한 열의 하위 표본 비율입니다. 0.01 에서 1 사이의 값을 지정하십시오. 기본값은 1 입니다. |
normalizeType |
문자열 | 다트 증폭기 유형이 사용되는 경우, 이 다트 모수 및 다음 세 개의 다트 모수도 사용 가능합니다. 이 모수는 정규화 알고리즘을 설정합니다. tree 또는 forest 을(를) 지정하십시오. 기본값은 tree 입니다. |
sampleType |
문자열 | 표본추출 알고리즘 유형입니다. uniform 또는 weighted 을(를) 지정하십시오. 기본값은 uniform 입니다. |
rateDrop |
이중 | 드롭아웃 비율 다트 증폭기 모수입니다. 0.0 에서 1.0 사이의 값을 지정하십시오. 기본값은 0.0 입니다. |
skipDrop |
이중 | 드롭아웃 건너뛰기 확률에 대한 다트 증폭기 모수입니다. 0.0 에서 1.0 사이의 값을 지정하십시오. 기본값은 0.0 입니다. |