멤버 수가 최대 멤버 수에서 설정한 최대 멤버 수를 초과하면 명목 (세트) 필드의 데이터 유형이 유형 없음 이 됩니다. 이 옵션은 큰 명목 필드에 대해 작업할 때 유용합니다. 필드의 측정 수준이 유형 없음으로 설정되면 해당 역할이 자동으로 없음으로 설정됩니다. 없음 으로 설정된 필드는 모델링에 사용할 수 없습니다.
날짜/시간
날짜/시간/시간소인 가져오기
날짜 및 시간 필드에 데이터를 저장하는 데 날짜 및 시간 형식을 사용할지 또는 문자열 변수로 가져올지 여부를 선택하십시오.
시간소인 필드에 마이크로초 사용
마이크로초 단위로 측정되는 시간소인 데이터가 있는 경우 이 옵션을 사용하여 플로우에서 더 정확한 데이터를 사용할 수 있습니다. 이 옵션을 사용하려면 이 선택란을 선택하고 다음으로 날짜/시간/시간소인 가져오기 설정에 대해 문자열 을 선택하십시오.
주: 이 옵션은 SQL 푸시백을 지원하는 커넥터에서만 작동합니다.
날짜 형식
날짜 저장 공간 필드에 사용하거나 문자열이 CLEM 날짜 함수에 의해 날짜로 해석될 때 사용할 날짜 형식을 선택하십시오.
시간 형식
시간 저장 공간 필드에 사용하거나 문자열이 CLEM 시간 함수에 의해 시간으로 해석될 때 사용할 시간 형식을 선택하십시오.
롤오버 일/분
시간 형식의 경우 음의 시차가 이전 일자나 시간을 참조하는 것으로 해석되는지 여부를 선택하십시오.
날짜 기준선(1월 1일)
단일 날짜를 처리하는 CLEM 날짜 함수에 사용할 기준선 연도(항상 1월 1일)를 선택하십시오.
두 자리 시작 날짜
두 자릿수로 표시되는 연도에 세기 자릿수를 추가하기 위한 구분 연도를 지정하십시오. 예를 들어, 1930을 분리점 연도로 지정하면 05/11/02는 2002년에 있다고 가정합니다. 이와 같은 설정은 30년 후의 날짜에도 20세기를 사용합니다. 따라서 05/11/73은 1973년으로 가정됩니다.
시간대
datetime_now CLEM 표현식에 사용할 시간대를 선택하는 방법을 선택하십시오.
서버를 선택하면 SPSS Modeler 런타임이 실행 중인 위치에서 시간대가 사용됩니다 (때때로 이 시간은 클라이언트 옵션과 동일함). 또는 플로우가 데이터베이스의 데이터를 사용하고 지원되는 데이터베이스가 SQL 푸시백을 사용하는 경우 datetime_now 표현식은 데이터베이스의 시간을 사용합니다.
클라이언트를 선택하면 시간대는 SPSS Modeler가 설치된 시스템의 시간대가 사용됩니다.
또는 시간대에 대해 협정 세계시(UTC) 값을 선택할 수 있습니다.
숫자 형식
SPSS Modeler 가 표준, 지수 또는 통화 표시 형식으로 실수를 표시할 때 사용할 소수점 이하 자릿수를 지정할 수 있습니다.
최적화
다음 설정을 사용하여 플로우 성능을 최적화할 수 있습니다.
플로우 재작성 사용
플로우 재작성은 플로우 시맨틱을 변경하지 않고 더 효율적인 작업을 위해 배경에서 플로우의 노드를 재정렬합니다.
CLEM 표현식 최적화
이 옵션을 사용하면 최적화 프로그램이 처리 속도를 높이기 위해 플로우가 실행되기 전에 사전 처리할 수 있는 CLEM 표현식을 검색할 수 있습니다. 예를 들어, log(salary)와 같은 표현식이 있는 경우 옵티마이저는 실제 급여 값을 계산하여 처리를 위해 전달합니다. 이 옵션을 사용하여 SQL 푸시백 및 SPSS Modeler 성능을 모두 향상시킬 수 있습니다.
구문 실행 최적화
이 플로우 재작성 방법은 SPSS Statistics 구문을 포함하는 둘 이상의 노드가 있는 작업의 효율성을 증가시킵니다. 구문 명령문을 각각 별도의 작업으로 실행하는 대신 단일 작업에 결합하여 최적화를 달성합니다.
다른 실행 최적화
이 플로우 재작성 방법은 데이터베이스에 위임할 수 없는 작업의 효율성을 높입니다. 플로우의 데이터 양을 가능한 조기에 줄이는 방식으로 최적화를 달성합니다. 데이터 무결성을 유지하면서 데이터 소스에 더 가까운 조작을 푸시하도록 플로우가 다시 작성됩니다. 이와 같이 변경하면 조인과 같은 비용이 많이 드는 조작의 데이터 다운스트림이 줄어듭니다.
병렬 처리 사용
여러 개의 프로세서가 있는 컴퓨터에서 실행하는 경우 이 옵션을 사용하면 시스템이 해당 프로세서 간에 로드 밸런스를 유지할 수 있으므로 성능이 더 빨라질 수 있습니다. 다중 노드를 사용하거나 다음 개별 노드를 사용하면 병렬 처리에서 이점을 얻을 수 있습니다. C5.0, 병합 (키 기준), 정렬, 구간 (순위 및 바둑판식 방법) 및 통합 (하나 이상의 키 필드 사용).
SQL 생성
이 옵션은 SQL 처리를 다시 데이터베이스로 푸시합니다. 이 옵션을 켜거나 끄면 사용자가 작성하는 새 플로우에만 영향을 줍니다. 기존 플로우에 대한 설정을 전환할 수 없습니다. 플로우에서 이 옵션을 사용하는 방법에 대한 자세한 정보는 SQL 최적화를 참조하십시오.
데이터베이스 캐싱 (SQL 전용). 데이터베이스에서 실행될 SQL을 생성하는 플로우의 경우, 플로우 중간에 파일 시스템이 아닌 데이터베이스의 임시 테이블에 데이터를 캐싱할 수 있습니다. 이 옵션을 SQL 최적화와 결합하면 성능이 상당히 향상될 수 있습니다. 예를 들어, 다중 테이블을 병합하여 데이터 마이닝 보기를 작성하는 플로우의 출력을 캐싱하고 필요에 따라 재사용할 수 있습니다. 데이터베이스 캐싱이 사용 가능한 상태에서 플로우의 비터미널 노드 위로 마우스를 이동한 후 오버플로우 메뉴 를 클릭하고 캐시 > 사용을 선택하십시오. 이제 데이터가 이 노드에서 캐시되고 다음에 플로우가 실행될 때 캐시가 자동으로 데이터베이스에 직접 작성됩니다. 따라서 다운스트림 노드에 대해 SQL이 생성되며 성능이 추가로 향상됩니다. 또는 필요하면 이 옵션을 사용 안 함으로 설정할 수 있습니다(예: 정책 또는 권한으로 인해 데이터베이스에 데이터를 기록하지 못하는 경우). 데이터베이스 캐싱 또는 SQL 최적화가 사용으로 설정되지 않은 경우 대신 캐시가 파일 시스템에 기록됩니다.
저수준 변환 사용 (SQL 전용). 이 옵션을 사용하면 적절한 형식으로 저장된 경우 문자열에서 숫자로 또는 숫자에서 문자열로의 데이터 변환이 가능합니다. 예를 들어, 데이터가 데이터베이스에 문자열로 유지되지만 실제로는 의미있는 숫자를 포함하는 경우 푸시백이 발생할 때 사용하도록 데이터를 변환할 수 있습니다.
로깅
런타임 시 메시지 로그에 SQL 표시
플로우 실행 중에 생성된 SQL을 메시지 로그에 전달할지 여부를 지정합니다.
준비 중에 메시지 로그에 SQL 생성 표시
플로우 미리보기 중에 생성된 SQL의 미리보기를 메시지 로그에 전달할지 여부를 지정합니다.
SQL 형식
로그에 표시되는 모든 SQL이 SPSS Modeler에 의해 생성된 대로 {fn FUNC(…)}양식의 기본 SQL 함수 또는 표준 ODBC 함수를 포함해야 하는지 여부를 지정합니다. 전자는 구현되지 않을 수도 있는 ODBC 드라이버 기능에 의존합니다.
판독성 향상을 위해 SQL 형식 변경(F)
로그에 표시된 SQL이 가독성을 위해 형식화되어야 하는지 여부를 지정합니다.
레코드 상태 표시
레코드가 터미널 노드에 도착할 때 언제 레코드를 보고해야 하는지를 지정합니다. N 개의 레코드마다 상태를 업데이트하는 데 사용할 숫자를 지정하십시오.
매개변수
Copy link to section
매개변수는 현재 플로우 또는 SuperNode로 저장되고 지속되는 사용자 정의 변수입니다. 매개변수는 종종 스크립트에서 스크립트의 동작을 제어하는 데 사용되며 사용자 인터페이스에서도 액세스할 수 있습니다.
CLEM 표현식과 스크립팅에 사용할 매개변수를 정의할 수 있습니다. 플로우 특성에 정의된 매개변수는 플로우의 모든 노드에서 사용할 수 있습니다. SuperNode 에 대한 모수 세트는 SuperNode외부에서 사용할 수 없습니다.플로우를 저장하면 해당 플로우에 대해 설정된 모든 매개변수도 저장됩니다.