0 / 0
영어 버전 문서로 돌아가기
xgboostasnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
xgboostasnode 특성

XGBoost-AS 노드 아이콘XGBoost는 기울기 부스팅 알고리즘의 고급 구현입니다. 부스팅 알고리즘은 약한 분류자를 반복적으로 학습한 다음 이를 강한 최종 분류자에 추가합니다. XGBoost는 매우 유연하며 대부분의 사용자에게 압도적일 수 있는 많은 매개변수를 제공하므로 SPSS Modeler의 XGBoost-AS 노드는 코어 기능 및 일반적으로 사용되는 매개변수를 표시합니다. XGBoost-AS 노드는 Spark로 구현됩니다.

표 1. xgboostasnode 특성
xgboostasnode 특성 데이터 유형 특성 설명
target_field 필드 목표에 대한 필드 이름 목록입니다.
input_fields 필드 입력을 위한 필드 이름 목록입니다.
nWorkers 정수 XGBoost 모델 교육에 사용되는 작업자 수입니다. 기본값은 1입니다.
numThreadPerTask 정수 작업자당 사용되는 스레드 수입니다. 기본값은 1입니다.
useExternalMemory 부울 외부 메모리를 캐시로 사용하는지 여부입니다. 기본값은 false입니다.
boosterType 문자열 사용할 증폭기 유형입니다. 사용 가능한 옵션은 gbtree, gblinear 또는 dart입니다. 기본값은 gbtree입니다.
numBoostRound 정수 부스팅 라운드 수입니다. 0 이상의 값을 지정하십시오. 기본값은 10입니다.
scalePosWeight 이중 양수 및 음수 가중값의 균형을 제어합니다. 기본값은 1입니다.
randomseed 정수 난수 생성기에 사용되는 시드입니다. 기본값은 0입니다.
objectiveType 문자열 학습 목표입니다. 가능한 값은 reg:linear, reg:logistic, reg:gamma, reg:tweedie, rank:pairwise, binary:logistic 또는 multi입니다. 플래그 대상의 경우 binary:logistic 또는 multi만 사용할 수 있습니다. multi을(를) 사용하면 점수 결과에 multi:softmaxmulti:softprob XGBoost 목표 유형이 표시됩니다. 기본값은 reg:linear입니다.
evalMetric 문자열 검증 데이터에 대한 평가 메트릭입니다. 기본 메트릭은 목표에 따라 지정됩니다. 가능한 값은 rmse, mae, logloss, error, merror, mlogloss, auc, ndcg, map 또는 gamma-deviance입니다. 기본값은 rmse입니다.
lambda 이중 가중값에 대한 L2 정규화 항입니다. 이 값을 늘리면 더 보수적인 모델이 생성됩니다. 숫자 0 이상을 지정하십시오. 기본값은 1입니다.
alpha 이중 가중치에 대한 L1 정규화 항입니다. 이 값을 늘리면 더 보수적인 모델이 생성됩니다. 숫자 0 이상을 지정하십시오. 기본값은 0입니다.
lambdaBias 이중 편향에 대한 L2 정규화 항입니다. gblinear booster 유형이 사용되는 경우 이 람다 바이어스 선형 부스터 매개변수를 사용할 수 있습니다. 숫자 0 이상을 지정하십시오. 기본값은 0입니다.
treeMethod 문자열 gbtree 또는 dart booster 유형이 사용되는 경우, 트리 성장에 대한 이 트리 메소드 매개변수(및 뒤에 오는 다른 트리 매개변수)를 사용할 수 있습니다. 이는 사용할 XGBoost 트리 생성 알고리즘을 지정합니다. 사용 가능한 옵션은 auto, exact 또는 approx입니다. 기본값은 auto입니다.
maxDepth 정수 트리의 최대 깊이입니다. 2 이상의 값을 지정하십시오. 기본값은 6입니다.
minChildWeight 이중 하위에 필요한 인스턴스 가중치(hessian)의 최소 합계입니다. 0 이상의 값을 지정하십시오. 기본값은 1입니다.
maxDeltaStep 이중 각 트리의 가중추정에 허용할 최대 델타 단계입니다. 0 이상의 값을 지정하십시오. 기본값은 0입니다.
sampleSize 이중 하위 표본은 학습 인스턴스의 비율을 대상으로 합니다. 0.1에서 1.0 사이의 값을 지정하십시오. 기본값은 1.0입니다.
eta 이중 과적합 방지를 위해 업데이트 단계 중에 사용되는 단계 크기 축소입니다. 0에서 1 사이의 값을 지정하십시오. 기본값은 0.3입니다.
gamma 이중 트리의 리프 노드에 추가 파티션을 만드는 데 필요한 최소 손실 감소입니다. 숫자 0 이상을 지정하십시오. 기본값은 6입니다.
colsSampleRatio 이중 각 트리를 생성할 때 열의 하위 표본 비율입니다. 0.01에서 1 사이의 값을 지정하십시오. 기본값은 1입니다.
colsSampleLevel 이중 각 수준에서 각 분할에 대한 열의 하위 표본 비율입니다. 0.01에서 1 사이의 값을 지정하십시오. 기본값은 1입니다.
normalizeType 문자열 다트 증폭기 유형이 사용되는 경우, 이 다트 모수 및 다음 세 개의 다트 모수도 사용 가능합니다. 이 모수는 정규화 알고리즘을 설정합니다. tree 또는 forest을(를) 지정하십시오. 기본값은 tree입니다.
sampleType 문자열 표본추출 알고리즘 유형입니다. uniform 또는 weighted을(를) 지정하십시오. 기본값은 uniform입니다.
rateDrop 이중 드롭아웃 비율 다트 증폭기 모수입니다. 0.0에서 1.0 사이의 값을 지정하십시오. 기본값은 0.0입니다.
skipDrop 이중 드롭아웃 건너뛰기 확률에 대한 다트 증폭기 모수입니다. 0.0에서 1.0 사이의 값을 지정하십시오. 기본값은 0.0입니다.
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기