현재 플로우에 적용할 특성을 지정할 수 있습니다.
플로우 특성을 설정하려면 플로우 특성 아이콘 을 클릭하십시오.
다음 특성을 구성할 수 있습니다.
옵션
- 일반
- 데이터 미리보기에 표시할 행의 최대 수(M)
- 노드에 대한 데이터를 미리 볼 때 표시할 행 수를 지정할 수 있습니다.
- 명목 필드에 대한 멤버 제한
- 멤버 수가 최대 멤버 수에서 설정한 최대 멤버 수를 초과하면 명목 (세트) 필드의 데이터 유형이 유형 없음 이 됩니다. 이 옵션은 큰 명목 필드에 대해 작업할 때 유용합니다. 필드의 측정 수준이 유형 없음으로 설정되면 해당 역할이 자동으로 없음으로 설정됩니다. 없음 으로 설정된 필드는 모델링에 사용할 수 없습니다.
- 날짜/시간
- 날짜/시간/시간소인 가져오기
- 날짜 및 시간 필드에 데이터를 저장하는 데 날짜 및 시간 형식을 사용할지 또는 문자열 변수로 가져올지 여부를 선택하십시오.
- 시간소인 필드에 마이크로초 사용
- 마이크로초 단위로 측정되는 시간소인 데이터가 있는 경우 이 옵션을 사용하여 플로우에서 더 정확한 데이터를 사용할 수 있습니다. 이 옵션을 사용하려면 이 선택란을 선택하고 다음으로 날짜/시간/시간소인 가져오기 설정에 대해 문자열 을 선택하십시오.주: 이 옵션은 SQL 푸시백을 지원하는 커넥터에서만 작동합니다.
- 날짜 형식
- 날짜 저장 공간 필드에 사용하거나 문자열이 CLEM 날짜 함수에 의해 날짜로 해석될 때 사용할 날짜 형식을 선택하십시오.
- 시간 형식
- 시간 저장 공간 필드에 사용하거나 문자열이 CLEM 시간 함수에 의해 시간으로 해석될 때 사용할 시간 형식을 선택하십시오.
- 롤오버 일/분
- 시간 형식의 경우 음의 시차가 이전 일자나 시간을 참조하는 것으로 해석되는지 여부를 선택하십시오.
- 날짜 기준선(1월 1일)
- 단일 날짜를 처리하는 CLEM 날짜 함수에 사용할 기준선 연도(항상 1월 1일)를 선택하십시오.
- 두 자리 시작 날짜
- 두 자릿수로 표시되는 연도에 세기 자릿수를 추가하기 위한 구분 연도를 지정하십시오. 예를 들어, 1930을 분리점 연도로 지정하면 05/11/02는 2002년에 있다고 가정합니다. 이와 같은 설정은 30년 후의 날짜에도 20세기를 사용합니다. 따라서 05/11/73은 1973년으로 가정됩니다.
- 시간대
datetime_now
CLEM 표현식에 사용할 시간대를 선택하는 방법을 선택하십시오.- 서버를 선택하면 SPSS Modeler 런타임이 실행 중인 위치에서 시간대가 사용됩니다 (때때로 이 시간은 클라이언트 옵션과 동일함). 또는 플로우가 데이터베이스의 데이터를 사용하고 지원되는 데이터베이스가 SQL 푸시백을 사용하는 경우
datetime_now
표현식은 데이터베이스의 시간을 사용합니다. - 클라이언트를 선택하면 시간대는 SPSS Modeler가 설치된 시스템의 시간대가 사용됩니다.
- 또는 시간대에 대해 협정 세계시(UTC) 값을 선택할 수 있습니다.
- 서버를 선택하면 SPSS Modeler 런타임이 실행 중인 위치에서 시간대가 사용됩니다 (때때로 이 시간은 클라이언트 옵션과 동일함). 또는 플로우가 데이터베이스의 데이터를 사용하고 지원되는 데이터베이스가 SQL 푸시백을 사용하는 경우
- 숫자 형식
- SPSS Modeler 가 표준, 지수 또는 통화 표시 형식으로 실수를 표시할 때 사용할 소수점 이하 자릿수를 지정할 수 있습니다.
- 최적화
- 다음 설정을 사용하여 플로우 성능을 최적화할 수 있습니다.
- 플로우 재작성 사용
- 플로우 재작성은 플로우 시맨틱을 변경하지 않고 더 효율적인 작업을 위해 배경에서 플로우의 노드를 재정렬합니다.
- CLEM 표현식 최적화
- 이 옵션을 사용하면 최적화 프로그램이 처리 속도를 높이기 위해 플로우가 실행되기 전에 사전 처리할 수 있는 CLEM 표현식을 검색할 수 있습니다. 예를 들어,
log(salary)
와 같은 표현식이 있는 경우 옵티마이저는 실제 급여 값을 계산하여 처리를 위해 전달합니다. 이 옵션을 사용하여 SQL 푸시백 및 SPSS Modeler 성능을 모두 향상시킬 수 있습니다. - 구문 실행 최적화
- 이 플로우 재작성 방법은 SPSS Statistics 구문을 포함하는 둘 이상의 노드가 있는 작업의 효율성을 증가시킵니다. 구문 명령문을 각각 별도의 작업으로 실행하는 대신 단일 작업에 결합하여 최적화를 달성합니다.
- 다른 실행 최적화
- 이 플로우 재작성 방법은 데이터베이스에 위임할 수 없는 작업의 효율성을 높입니다. 플로우의 데이터 양을 가능한 조기에 줄이는 방식으로 최적화를 달성합니다. 데이터 무결성을 유지하면서 데이터 소스에 더 가까운 조작을 푸시하도록 플로우가 다시 작성됩니다. 이와 같이 변경하면 조인과 같은 비용이 많이 드는 조작의 데이터 다운스트림이 줄어듭니다.
- 병렬 처리 사용
- 여러 개의 프로세서가 있는 컴퓨터에서 실행하는 경우 이 옵션을 사용하면 시스템이 해당 프로세서 간에 로드 밸런스를 유지할 수 있으므로 성능이 더 빨라질 수 있습니다. 다중 노드를 사용하거나 다음 개별 노드를 사용하면 병렬 처리에서 이점을 얻을 수 있습니다. C5.0, 병합 (키 기준), 정렬, 구간 (순위 및 바둑판식 방법) 및 통합 (하나 이상의 키 필드 사용).
- SQL 생성
- 이 옵션은 SQL 처리를 다시 데이터베이스로 푸시합니다. 이 옵션을 켜거나 끄면 사용자가 작성하는 새 플로우에만 영향을 줍니다. 기존 플로우에 대한 설정을 전환할 수 없습니다. 플로우에서 이 옵션을 사용하는 방법에 대한 자세한 정보는 SQL 최적화를 참조하십시오.
- 데이터베이스 캐싱 (SQL 전용). 데이터베이스에서 실행될 SQL을 생성하는 플로우의 경우, 플로우 중간에 파일 시스템이 아닌 데이터베이스의 임시 테이블에 데이터를 캐싱할 수 있습니다. 이 옵션을 SQL 최적화와 결합하면 성능이 상당히 향상될 수 있습니다. 예를 들어, 다중 테이블을 병합하여 데이터 마이닝 보기를 작성하는 플로우의 출력을 캐싱하고 필요에 따라 재사용할 수 있습니다. 데이터베이스 캐싱이 사용 가능한 상태에서 플로우의 비터미널 노드 위로 마우스를 이동한 후 오버플로우 메뉴 를 클릭하고 을 선택하십시오. 이제 데이터가 이 노드에서 캐시되고 다음에 플로우가 실행될 때 캐시가 자동으로 데이터베이스에 직접 작성됩니다. 따라서 다운스트림 노드에 대해 SQL이 생성되며 성능이 추가로 향상됩니다. 또는 필요하면 이 옵션을 사용 안 함으로 설정할 수 있습니다(예: 정책 또는 권한으로 인해 데이터베이스에 데이터를 기록하지 못하는 경우). 데이터베이스 캐싱 또는 SQL 최적화가 사용으로 설정되지 않은 경우 대신 캐시가 파일 시스템에 기록됩니다.
- 저수준 변환 사용 (SQL 전용). 이 옵션을 사용하면 적절한 형식으로 저장된 경우 문자열에서 숫자로 또는 숫자에서 문자열로의 데이터 변환이 가능합니다. 예를 들어, 데이터가 데이터베이스에 문자열로 유지되지만 실제로는 의미있는 숫자를 포함하는 경우 푸시백이 발생할 때 사용하도록 데이터를 변환할 수 있습니다.
- 이 옵션은 SQL 처리를 다시 데이터베이스로 푸시합니다. 이 옵션을 켜거나 끄면 사용자가 작성하는 새 플로우에만 영향을 줍니다. 기존 플로우에 대한 설정을 전환할 수 없습니다. 플로우에서 이 옵션을 사용하는 방법에 대한 자세한 정보는 SQL 최적화를 참조하십시오.
- 로깅
- 런타임 시 메시지 로그에 SQL 표시
- 플로우 실행 중에 생성된 SQL을 메시지 로그에 전달할지 여부를 지정합니다.
- 준비 중에 메시지 로그에 SQL 생성 표시
- 플로우 미리보기 중에 생성된 SQL의 미리보기를 메시지 로그에 전달할지 여부를 지정합니다.
- SQL 형식
- 로그에 표시되는 모든 SQL이 SPSS Modeler에 의해 생성된 대로
{fn FUNC(…)}
양식의 기본 SQL 함수 또는 표준 ODBC 함수를 포함해야 하는지 여부를 지정합니다. 전자는 구현되지 않을 수도 있는 ODBC 드라이버 기능에 의존합니다. - 판독성 향상을 위해 SQL 형식 변경(F)
- 로그에 표시된 SQL이 가독성을 위해 형식화되어야 하는지 여부를 지정합니다.
- 레코드 상태 표시
- 레코드가 터미널 노드에 도착할 때 언제 레코드를 보고해야 하는지를 지정합니다. N 개의 레코드마다 상태를 업데이트하는 데 사용할 숫자를 지정하십시오.
매개변수
매개변수는 현재 플로우 또는 SuperNode로 저장되고 지속되는 사용자 정의 변수입니다. 매개변수는 종종 스크립트에서 스크립트의 동작을 제어하는 데 사용되며 사용자 인터페이스에서도 액세스할 수 있습니다.CLEM 표현식과 스크립팅에 사용할 매개변수를 정의할 수 있습니다. 플로우 특성에 정의된 매개변수는 플로우의 모든 노드에서 사용할 수 있습니다. SuperNode 에 대한 모수 세트는 SuperNode외부에서 사용할 수 없습니다. 플로우를 저장하면 해당 플로우에 대해 설정된 모든 매개변수도 저장됩니다.
모수에 대한 자세한 정보는 플로우 및 SuperNode 모수를 참조하십시오.
값 추가 를 클릭하고 새 매개변수에 대해 다음 정보를 입력하십시오.
- 이름
- 이 이름은 표현식에서 매개변수가 참조되는 방식입니다. 예를 들어, 최소 온도에 대한 매개변수를 작성하려면 minvalue를 입력할 수 있습니다.
CLEM 표현식에서 매개변수를 사용하는 경우 작은따옴표 안에 배치됩니다 (예:
'$P-minvalue'
).$P-
접두부를 입력하지 마십시오. CLEM 표현식에서 매개변수를 표시합니다. - 레이블
- 작성된 각 매개변수에 대한 설명 이름을 나열합니다.
- 스토리지
- 저장 공간은 모수에 데이터 값이 저장되는 방법을 표시합니다. 예를 들어, 값에 보존할 선행 0이 있는 경우 (예:
008
) 스토리지 유형으로 문자열 을 선택하십시오. 그렇지 않으면 값에서 0이 제거됩니다. - 값
- 필요에 따라 변경할 수 있는 각 매개변수의 현재 값을 나열합니다. 날짜 매개변수의 값은 ISO 표준 표기법 (YYYY-MM-DD) 으로 지정해야 합니다.
- 측도
- 매개변수의 특성을 설명하는 데 사용되는 측정 수준을 선택하십시오. 매개변수를 사용하려는 방법을 반영하도록 이 값을 변경할 수 있습니다. 예를 들어, 유형 없음 은 매개변수가 스토리지와 호환 가능한 모든 값을 가질 수 있음을 표시합니다.
- 프롬프트 여부
- 사용자가 런타임을 시작할 때 이 매개변수의 값을 입력하도록 프롬프트를 표시하려면 이 옵션을 선택하십시오. 다른 경우에 동일한 매개변수에 대해 다른 값을 입력해야 하는 경우 이 옵션을 사용할 수 있습니다.
전역값
플로우 특성의 글로벌 탭에서 현재 플로우에 대해 설정된 글로벌 값을 볼 수 있습니다. 글로벌 값은 선택된 필드의 평균, 합계 또는 표준 편차와 같은 통계를 판별하기 위해 전역값 설정 노드를 사용하여 작성됩니다.
전역값 설정 노드가 실행된 후 이러한 값은 플로우 조작에서 다양한 용도로 사용할 수 있게 됩니다.
플로우 특성의 테이블에서 글로벌 값을 편집할 수 없지만 플로우의 모든 글로벌 값을 지울 수 있습니다.
어노테이션
조직의 다른 사용자에게 플로우를 설명해야 하는 경우 플로우, 노드 및 모델 너깃에 설명 주석을 첨부할 수 있습니다. 그런 다음 다른 사용자가 화면에서 이러한 주석을 보거나 사용자의 주석을 포함하는 플로우의 이미지를 인쇄할 수도 있습니다.
플로우 특성의 어노테이션 탭을 사용하여 플로우에 텍스트 어노테이션을 추가하십시오. 이러한 메모는 플로우 어노테이션이 화면 주석으로도 표시될 수 있다는 점을 제외하고 어노테이션 탭이 열려 있는 경우에만 표시됩니다.