영어 버전 문서로 돌아가기partitionnode 특성
partitionnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
파티션 노드는 파티션 필드를 생성하는데, 이 필드는 모델 작성의 학습, 검정, 검증 단계를 위한 별개의 서브세트로 데이터를 분할합니다.
예
node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")
partitionnode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
new_name |
문자열 | 노드가 생성하는 파티션 필드의 이름 |
create_validation |
플래그 | 검증 파티션이 작성되는지 여부를 지정합니다. |
training_size |
정수 | 훈련 파티션에 할당될 레코드의 퍼센트(0–100) |
testing_size |
정수 | 검정 파티션에 할당될 레코드의 퍼센트(0–100) |
validation_size |
정수 | 검증 파티션에 할당될 레코드의 퍼센트(0–100)입니다. 검증 파티션이 작성되지 않으면 무시됩니다. |
training_label |
문자열 | 훈련 파티션의 레이블 |
testing_label |
문자열 | 검정 파티션의 레이블. |
validation_label |
문자열 | 검증 파티션의 레이블입니다. 검증 파티션이 작성되지 않으면 무시됩니다. |
value_mode |
System SystemAndLabel Label |
데이터에서 각 파티션을 나타내기 위해 사용하는 값을
지정합니다. 예를 들어, 훈련 표본은 시스템 정수 1 , 레이블 Training 또는 두 개의 1_Training 조합으로 표시할 수 있습니다. |
set_random_seed |
부울 | 사용자 지정 난수 시드 사용 여부를 지정합니다. |
random_seed |
정수 | 사용자 지정 난수 시드 값입니다. 이 값을 사용하려면 set_random_seed 을(를) True (으)로 설정해야 합니다. |
enable_sql_generation |
부울 | SQL 푸시백을 사용하여 레코드를 파티션에 지정하는지 여부를 지정합니다. |
unique_field |
레코드가 무작위이지만 반복 가능한 방식으로 파티션에 지정되도록
보장하기 위해 사용하는 입력 필드를 지정합니다. 이 값을 사용하려면 enable_sql_generation 을(를) True (으)로 설정해야 합니다. |