0 / 0
영어 버전 문서로 돌아가기
플로우 특성 설정
마지막 업데이트 날짜: 2024년 12월 20일
SPSS Modeler 플로우의 특성 설정

현재 플로우에 적용할 특성을 지정할 수 있습니다.

플로우 특성을 설정하려면 플로우 특성 아이콘 을 클릭하십시오.

다음 특성을 구성할 수 있습니다.

옵션

일반
데이터 미리보기에 표시할 행의 최대 수(M)
노드에 대한 데이터를 미리 볼 때 표시할 행 수를 지정할 수 있습니다.
명목 필드에 대한 멤버 제한
멤버 수가 최대 멤버 수에서 설정한 최대 멤버 수를 초과하면 명목 (세트) 필드의 데이터 유형이 유형 없음 이 됩니다. 이 옵션은 큰 명목 필드에 대해 작업할 때 유용합니다. 필드의 측정 수준이 유형 없음으로 설정되면 해당 역할이 자동으로 없음으로 설정됩니다. 없음 으로 설정된 필드는 모델링에 사용할 수 없습니다.
날짜/시간
날짜/시간/시간소인 가져오기
날짜 및 시간 필드에 데이터를 저장하는 데 날짜 및 시간 형식을 사용할지 또는 문자열 변수로 가져올지 여부를 선택하십시오.
시간소인 필드에 마이크로초 사용
마이크로초 단위로 측정되는 시간소인 데이터가 있는 경우 이 옵션을 사용하여 플로우에서 더 정확한 데이터를 사용할 수 있습니다. 이 옵션을 사용하려면 이 선택란을 선택하고 다음으로 날짜/시간/시간소인 가져오기 설정에 대해 문자열 을 선택하십시오.
주: 이 옵션은 SQL 푸시백을 지원하는 커넥터에서만 작동합니다.
날짜 형식
날짜 저장 공간 필드에 사용하거나 문자열이 CLEM 날짜 함수에 의해 날짜로 해석될 때 사용할 날짜 형식을 선택하십시오.
시간 형식
시간 저장 공간 필드에 사용하거나 문자열이 CLEM 시간 함수에 의해 시간으로 해석될 때 사용할 시간 형식을 선택하십시오.
롤오버 일/분
시간 형식의 경우 음의 시차가 이전 일자나 시간을 참조하는 것으로 해석되는지 여부를 선택하십시오.
날짜 기준선(1월 1일)
단일 날짜를 처리하는 CLEM 날짜 함수에 사용할 기준선 연도(항상 1월 1일)를 선택하십시오.
두 자리 시작 날짜
두 자릿수로 표시되는 연도에 세기 자릿수를 추가하기 위한 구분 연도를 지정하십시오. 예를 들어, 1930을 분리점 연도로 지정하면 05/11/02는 2002년에 있다고 가정합니다. 이와 같은 설정은 30년 후의 날짜에도 20세기를 사용합니다. 따라서 05/11/73은 1973년으로 가정됩니다.
시간대
datetime_now CLEM 표현식에 사용할 시간대를 선택하는 방법을 선택하십시오.
  • 서버를 선택하면 SPSS Modeler 런타임이 실행 중인 위치에서 시간대가 사용됩니다 (때때로 이 시간은 클라이언트 옵션과 동일함). 또는 플로우가 데이터베이스의 데이터를 사용하고 지원되는 데이터베이스가 SQL 푸시백을 사용하는 경우 datetime_now 표현식은 데이터베이스의 시간을 사용합니다.
  • 클라이언트를 선택하면 시간대는 SPSS Modeler가 설치된 시스템의 시간대가 사용됩니다.
  • 또는 시간대에 대해 협정 세계시(UTC) 값을 선택할 수 있습니다.
숫자 형식
SPSS Modeler 가 표준, 지수 또는 통화 표시 형식으로 실수를 표시할 때 사용할 소수점 이하 자릿수를 지정할 수 있습니다.
최적화
다음 설정을 사용하여 플로우 성능을 최적화할 수 있습니다.
플로우 재작성 사용
플로우 재작성은 플로우 시맨틱을 변경하지 않고 더 효율적인 작업을 위해 배경에서 플로우의 노드를 재정렬합니다.
CLEM 표현식 최적화
이 옵션을 사용하면 최적화 프로그램이 처리 속도를 높이기 위해 플로우가 실행되기 전에 사전 처리할 수 있는 CLEM 표현식을 검색할 수 있습니다. 예를 들어, log(salary)와 같은 표현식이 있는 경우 옵티마이저는 실제 급여 값을 계산하여 처리를 위해 전달합니다. 이 옵션을 사용하여 SQL 푸시백 및 SPSS Modeler 성능을 모두 향상시킬 수 있습니다.
구문 실행 최적화
이 플로우 재작성 방법은 SPSS Statistics 구문을 포함하는 둘 이상의 노드가 있는 작업의 효율성을 증가시킵니다. 구문 명령문을 각각 별도의 작업으로 실행하는 대신 단일 작업에 결합하여 최적화를 달성합니다.
다른 실행 최적화
이 플로우 재작성 방법은 데이터베이스에 위임할 수 없는 작업의 효율성을 높입니다. 플로우의 데이터 양을 가능한 조기에 줄이는 방식으로 최적화를 달성합니다. 데이터 무결성을 유지하면서 데이터 소스에 더 가까운 조작을 푸시하도록 플로우가 다시 작성됩니다. 이와 같이 변경하면 조인과 같은 비용이 많이 드는 조작의 데이터 다운스트림이 줄어듭니다.
병렬 처리 사용
여러 개의 프로세서가 있는 컴퓨터에서 실행하는 경우 이 옵션을 사용하면 시스템이 해당 프로세서 간에 로드 밸런스를 유지할 수 있으므로 성능이 더 빨라질 수 있습니다. 다중 노드를 사용하거나 다음 개별 노드를 사용하면 병렬 처리에서 이점을 얻을 수 있습니다. C5.0, 병합 (키 기준), 정렬, 구간 (순위 및 바둑판식 방법) 및 통합 (하나 이상의 키 필드 사용).
SQL 생성
  • 이 옵션은 SQL 처리를 다시 데이터베이스로 푸시합니다. 이 옵션을 켜거나 끄면 사용자가 작성하는 새 플로우에만 영향을 줍니다. 기존 플로우에 대한 설정을 전환할 수 없습니다. 플로우에서 이 옵션을 사용하는 방법에 대한 자세한 정보는 SQL 최적화를 참조하십시오.
    • 데이터베이스 캐싱 (SQL 전용). 데이터베이스에서 실행될 SQL을 생성하는 플로우의 경우, 플로우 중간에 파일 시스템이 아닌 데이터베이스의 임시 테이블에 데이터를 캐싱할 수 있습니다. 이 옵션을 SQL 최적화와 결합하면 성능이 상당히 향상될 수 있습니다. 예를 들어, 다중 테이블을 병합하여 데이터 마이닝 보기를 작성하는 플로우의 출력을 캐싱하고 필요에 따라 재사용할 수 있습니다. 데이터베이스 캐싱이 사용 가능한 상태에서 플로우의 비터미널 노드 위로 마우스를 이동한 후 오버플로우 메뉴 를 클릭하고 캐시 > 사용을 선택하십시오. 이제 데이터가 이 노드에서 캐시되고 다음에 플로우가 실행될 때 캐시가 자동으로 데이터베이스에 직접 작성됩니다. 따라서 다운스트림 노드에 대해 SQL이 생성되며 성능이 추가로 향상됩니다. 또는 필요하면 이 옵션을 사용 안 함으로 설정할 수 있습니다(예: 정책 또는 권한으로 인해 데이터베이스에 데이터를 기록하지 못하는 경우). 데이터베이스 캐싱 또는 SQL 최적화가 사용으로 설정되지 않은 경우 대신 캐시가 파일 시스템에 기록됩니다.
    • 저수준 변환 사용 (SQL 전용). 이 옵션을 사용하면 적절한 형식으로 저장된 경우 문자열에서 숫자로 또는 숫자에서 문자열로의 데이터 변환이 가능합니다. 예를 들어, 데이터가 데이터베이스에 문자열로 유지되지만 실제로는 의미있는 숫자를 포함하는 경우 푸시백이 발생할 때 사용하도록 데이터를 변환할 수 있습니다.
로깅
런타임 시 메시지 로그에 SQL 표시
플로우 실행 중에 생성된 SQL을 메시지 로그에 전달할지 여부를 지정합니다.
준비 중에 메시지 로그에 SQL 생성 표시
플로우 미리보기 중에 생성된 SQL의 미리보기를 메시지 로그에 전달할지 여부를 지정합니다.
SQL 형식
로그에 표시되는 모든 SQL이 SPSS Modeler에 의해 생성된 대로 {fn FUNC(…)}양식의 기본 SQL 함수 또는 표준 ODBC 함수를 포함해야 하는지 여부를 지정합니다. 전자는 구현되지 않을 수도 있는 ODBC 드라이버 기능에 의존합니다.
판독성 향상을 위해 SQL 형식 변경(F)
로그에 표시된 SQL이 가독성을 위해 형식화되어야 하는지 여부를 지정합니다.
레코드 상태 표시
레코드가 터미널 노드에 도착할 때 언제 레코드를 보고해야 하는지를 지정합니다. N 개의 레코드마다 상태를 업데이트하는 데 사용할 숫자를 지정하십시오.

매개변수

매개변수는 현재 플로우 또는 SuperNode로 저장되고 지속되는 사용자 정의 변수입니다. 매개변수는 종종 스크립트에서 스크립트의 동작을 제어하는 데 사용되며 사용자 인터페이스에서도 액세스할 수 있습니다.

CLEM 표현식과 스크립팅에 사용할 매개변수를 정의할 수 있습니다. 플로우 특성에 정의된 매개변수는 플로우의 모든 노드에서 사용할 수 있습니다. SuperNode 에 대한 모수 세트는 SuperNode외부에서 사용할 수 없습니다. 플로우를 저장하면 해당 플로우에 대해 설정된 모든 매개변수도 저장됩니다.

모수에 대한 자세한 정보는 플로우 및 SuperNode 모수를 참조하십시오.

값 추가 를 클릭하고 새 매개변수에 대해 다음 정보를 입력하십시오.

이름
이 이름은 표현식에서 매개변수가 참조되는 방식입니다. 예를 들어, 최소 온도에 대한 매개변수를 작성하려면 minvalue를 입력할 수 있습니다.

CLEM 표현식에서 매개변수를 사용하는 경우 작은따옴표 안에 배치됩니다 (예: '$P-minvalue'). $P- 접두부를 입력하지 마십시오. CLEM 표현식에서 매개변수를 표시합니다.

레이블
작성된 각 매개변수에 대한 설명 이름을 나열합니다.
스토리지
저장 공간은 모수에 데이터 값이 저장되는 방법을 표시합니다. 예를 들어, 값에 보존할 선행 0이 있는 경우 (예: 008) 스토리지 유형으로 문자열 을 선택하십시오. 그렇지 않으면 값에서 0이 제거됩니다.
필요에 따라 변경할 수 있는 각 매개변수의 현재 값을 나열합니다. 날짜 매개변수의 값은 ISO 표준 표기법 (YYYY-MM-DD) 으로 지정해야 합니다.
측도
매개변수의 특성을 설명하는 데 사용되는 측정 수준을 선택하십시오. 매개변수를 사용하려는 방법을 반영하도록 이 값을 변경할 수 있습니다. 예를 들어, 유형 없음 은 매개변수가 스토리지와 호환 가능한 모든 값을 가질 수 있음을 표시합니다.
프롬프트 여부
사용자가 런타임을 시작할 때 이 매개변수의 값을 입력하도록 프롬프트를 표시하려면 이 옵션을 선택하십시오. 다른 경우에 동일한 매개변수에 대해 다른 값을 입력해야 하는 경우 이 옵션을 사용할 수 있습니다.

전역값

플로우 특성의 글로벌 탭에서 현재 플로우에 대해 설정된 글로벌 값을 볼 수 있습니다. 글로벌 값은 선택된 필드의 평균, 합계 또는 표준 편차와 같은 통계를 판별하기 위해 전역값 설정 노드를 사용하여 작성됩니다.

전역값 설정 노드가 실행된 후 이러한 값은 플로우 조작에서 다양한 용도로 사용할 수 있게 됩니다.

플로우 특성의 테이블에서 글로벌 값을 편집할 수 없지만 플로우의 모든 글로벌 값을 지울 수 있습니다.

어노테이션

조직의 다른 사용자에게 플로우를 설명해야 하는 경우 플로우, 노드 및 모델 너깃에 설명 주석을 첨부할 수 있습니다. 그런 다음 다른 사용자가 화면에서 이러한 주석을 보거나 사용자의 주석을 포함하는 플로우의 이미지를 인쇄할 수도 있습니다.

플로우 특성의 어노테이션 탭을 사용하여 플로우에 텍스트 어노테이션을 추가하십시오. 이러한 메모는 플로우 어노테이션이 화면 주석으로도 표시될 수 있다는 점을 제외하고 어노테이션 탭이 열려 있는 경우에만 표시됩니다.

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기