값 옵션 설정
유형 노드 설정 아래에 있는 값 모드 열에는 사전 정의된 값의 드롭 다운 목록이 표시됩니다. 이 목록에서 지정 옵션을 선택한 후 톱니 바퀴 아이콘을 클릭하면 선택한 필드에 대한 값을 읽고 지정하고 레이블 지정하고 처리하기 위한 옵션을 설정할 수 있는 새 화면이 열립니다.
다수의 제어는 모든 유형의 데이터에 대해 공통입니다. 이 공통 제어에 대해 여기서 설명합니다.
측도. 현재 선택된 측정 수준을 표시합니다. 데이터를 사용할 방식을 반영하도록 설정을 변경할 수 있습니다. 예를 들어, day_of_week
라는 필드에 개별 날짜를 나타내는 숫자가 포함되어 있는 경우에는 각각의 범주를 개별적으로 조사하는 분포 노드를 작성하기 위해 이를 명목 데이터로 변경할 수 있습니다.
역할. 기계 학습 프로세스에 대한 입력 필드(예측변수 필드) 또는 대상 필드(예측 필드)인지 여부를 모델링 노드에 알리는 데 사용됩니다. 모두, 없음, 파티션, 분할, 빈도, 레코드 ID 등의 다른 역할도 사용할 수 있습니다.
- 읽기. 노드 실행 시 값을 읽으려면 선택하십시오.
- 패스. 현재 필드에 대한 데이터를 읽지 않으려면 선택하십시오.
- 지정. 여기의 옵션은 선택한 필드에 대한 값과 레이블을 지정하는 데 사용됩니다. 값 확인과 함께 사용하여 이 옵션을 통해 현재 필드에 대한 사용자의 지식을 기반으로 하는 값을 지정하십시오. 이 옵션은 각 유형의 필드에 대한 고유 제어를 활성화합니다. 측정 수준이 유형 없음인 필드에 대해서는 값 또는 레이블을 지정할 수 없습니다.
- 확장. 여기에 입력한 값이 포함된 현재 데이터를 붙여쓰려면 선택하십시오. 예를 들어,field_1
(0,10)
의 범위가 있고(8,16)
의 값 범위를 입력하면 원래 최소값을 제거하지 않고16
를 추가하여 범위가 확장됩니다. 새 범위는(0,16)
입니다. - 현재. 현재 데이터 값을 유지하려면 선택하십시오.
값 레이블(레이블 추가/편집). 이 섹션에서는 선택한 필드의 값 각각에 대해 사용자 정의 레이블을 입력할 수 있습니다.
최대 목록 길이. 측정 수준이 지리 공간 또는 콜렉션인 데이터에만 사용할 수 있습니다. 목록이 포함할 수 있는 요소 수를 지정하여 목록의 최대 길이를 설정하십시오.
최대 문자열 길이. 유형이 없는 데이터에만 사용할 수 있습니다. 테이블 작성을 위해 SQL을 생성하는 경우 이 필드를 사용하십시오. 데이터에서 가장 큰 문자열 값을 입력하십시오. 그러면 문자열을 포함하기에 충분히 열이 테이블에 생성됩니다. 문자열 길이 값을 사용할 수 없으면 데이터에 적합하지 않은 기본 문자열 값이 사용됩니다. 예를 들어, 값이 너무 작으면 테이블에 데이터를 쓸 때 오류가 발생할 수 있으며, 값이 너무 크면 성능에 불리한 영향을 미칠 수 있습니다.
확인. 지정된 연속형, 플래그 또는 명목 값을 준수하도록 값을 강제하는 방법을 선택하십시오. 이 옵션은 기본 유형 노드 설정의 검사 열에 해당하며 여기서 선택한 사항이 기본 설정의 값을 대체합니다. 값과 레이블을 지정하는 옵션과 함께 사용하면 값 검사를 통해 예측값을 가진 데이터의 값을 준수할 수 있습니다. 예를 들어, 값을 1,
0
로 지정한 후 버리기 를 사용하십시오. 여기서는 1
또는 0
이외의 값이 있는 모든 레코드를 삭제할 수 있습니다.
- 결측값. 특정 값(예:
99
또는0
)을 공백으로 정의하려면 이 필드를 사용하십시오. 값은 필드의 저장 유형에 대해 적합해야 합니다. - 범위. 결측값의 범위(예: 연령
1–17
또는65
초과)를 지정하는 데 사용됩니다. 바운드 값이 공백이면 범위가 무제한입니다. 예를 들어, 상한 없이 하한으로100
을 지정하면100
이상의 값은 모두 결측값으로 정의됩니다. 경계값도 포함됩니다. 예를 들어, 하한이5
이고 상한이10
인 범위의 범위 정의에는5
와10
이 포함됩니다. 결측값 범위는 날짜/시간 및 문자열(이 경우 값이 범위 내에 있는지 판별하기 위해 알파벳 정렬 순서가 사용됨)을 포함한 모든 저장 유형에 대해 정의할 수 있습니다. - 널/공백. 시스템 널(데이터에서
$null$
로 표시됨) 및 공백(표시되는 문자가 없는 문자열 값)을 공백으로 지정할 수도 있습니다. 유형 노드에서는 분석을 위해 빈 문자열도 공백으로 처리하지만 빈 문자열은 내부적으로 다르게 저장되며 특정 경우에 다르게 처리될 수 있습니다.
$null$
로 코딩하려면 채움 노드를 사용하십시오.