영어 버전 문서로 돌아가기랜덤 포리스트 노드
랜덤 포리스트 노드(SPSS Modeler)
마지막 업데이트 날짜: 2024년 11월 21일
랜덤 포리스트©는 트리 모델을 기본 모델로 사용하는 배깅 알고리즘의 고급 구현을 사용합니다.
랜덤 포리스트에서 앙상블 내의 각 트리는 훈련 세트의 대체(예: 붓스트랩 표본)로 그려진 표본에서 작성됩니다. 트리 생성 동안 노드를 분할하는 경우, 선택된 분할이 더 이상 모든 변수 간의 최상의 분할이 아닙니다. 대신, 선택된 분할이 변수의 임의 서브세트 간의 최상의 분할이 됩니다. 이 임의성으로 인해 일반적으로 포리스트의 편향이 (단일 비임의 트리의 편향에 비해) 약간 상승하나 평균화로 인해 일반적으로 편향의 증가에 대한 보상 이상으로 분산도 감소하므로 전체적으로 더 나은 모델을 생성합니다.1
watsonx.ai 의 랜덤 포리스트 노드는 Python에서 구현됩니다. 노드 팔레트는 이 노드와 다른 Python 노드로 구성됩니다.
랜덤 포리스트 알고리즘에 대한 자세한 정보는 랜덤화된 트리의 포리스트를 참조하십시오.
1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.