영어 버전 문서로 돌아가기SQL 푸시백을 지원하는 노드
SQL 최적화(SPSS Modeler)
마지막 업데이트 날짜: 2024년 10월 07일
이 절의 표는 SQL 푸시백을 지원하는 데이터 마이닝 작업을 나타내는 노드를 보여줍니다. 이 표에 나타나지 않은 노드는 SQL 푸시백을 지원하지 않습니다.
SQL 생성을 지원하는 노드 | 참고: |
---|---|
선택 | 선택 표현식 자체에 대한 SQL 생성이 지원되는 경우에만 생성을 지원합니다. 필드에 널이 있는 경우 SQL 생성은 원시 SPSS Modeler에서 제공되는 것과 동일한 결과를 버리기 위해 제공하지 않습니다. |
샘플 | 단순 표본추출은 데이터베이스에 따라 다양한 정도로 SQL 생성을 지원합니다. |
통합 | 통합에 대한 SQL 생성 지원은 데이터 저장 공간에 따라 다릅니다. |
RFM 통합 | 두 번째 또는 세 번째 최근 트랜잭션의 데이터를 저장하거나 최근 트랜잭션만 포함하는 경우 외에 생성을 지원합니다. 단, datetime_date(YEAR,MONTH,DAY) 함수가 푸시백되는 경우에는 최근 트랜잭션 포함이 작동합니다. |
정렬 | |
Merge | 순서 기준으로 합치기에 대해서는 SQL이 생성되지 않습니다. 전체 또는 부분 외부 결합을 사용하여 키 기준으로 합치는 것은 데이터베이스/드라이버가 이를 지원하는 경우에만 지원됩니다. 일치하지 않는 입력 필드는 필터 노드 또는 가져오기 노드의 필터 설정을 사용하여 이름을 변경할 수 있습니다. 조건 기준으로 합치기에 대해 SQL 생성을 지원합니다. 입력이 다른 데이터베이스에서 유래한 경우, 모든 유형의 합치기에 대해 |
붙여쓰기 | 입력이 정렬되지 않은 경우 생성을 지원합니다. 입력이 동일한 수의 열을 가진 경우에만 SQL 최적화가 가능합니다. |
구분 | 각 그룹에 대해 복합 레코드 작성 모드(기본값)가 선택된 고유 노드는 SQL 최적화를 지원하지 않습니다. |
모드 | 샘플 | 최대 크기 | 시드 | Db2 for z/OS | OS/400용 Db2 | Win/UNIX용 Db2 | Oracle | SQL Server | Teradata |
---|---|---|---|---|---|---|---|---|---|
포함 | 첫 번째 | 해당사항 없음 | Y | Y | Y | Y | Y | Y | |
n중1 | 꺼짐 | Y | Y | Y | Y | Y | |||
최대 | Y | Y | Y | Y | Y | ||||
무작위 % | 꺼짐 | 꺼짐 | Y | Y | Y | Y | |||
켜짐 | Y | Y | Y | ||||||
최대 | 꺼짐 | Y | Y | Y | Y | ||||
켜짐 | Y | Y | Y | ||||||
삭제 | 첫 번째 | 꺼짐 | Y | ||||||
최대 | Y | ||||||||
n중1 | 꺼짐 | Y | Y | Y | Y | Y | |||
최대 | Y | Y | Y | Y | Y | ||||
무작위 % | 꺼짐 | 꺼짐 | Y | Y | Y | Y | |||
켜짐 | Y | Y | Y | ||||||
최대 | 꺼짐 | Y | Y | Y | Y | ||||
켜짐 | Y | Y | Y |
스토리지 | 합계 | 평균 | 최소 | 최대 | 표준 편차 | 중앙값 | 개수 | 분산 | 백분위수 |
---|---|---|---|---|---|---|---|---|---|
정수 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
실수 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
날짜 | Y | Y | Y* | Y | Y* | ||||
시간 | Y | Y | Y* | Y | Y* | ||||
시간소인 | Y | Y | Y* | Y | Y* | ||||
문자열 | Y | Y | Y* | Y | Y* |
* 중위수 및 백분위수가 Oracle에서 지원됩니다.
SQL 생성을 지원하는 노드 | 참고: |
---|---|
유형 | 유형 노드가 인스턴스화되고 ABORT 또는 WARN 유형 선택이 지정되지 않은 경우에 SQL 생성을 지원합니다. |
필터 | |
파생 | 파생 표현식에 대해 생성된 SQL이 지원되는 경우 SQL 생성을 지원합니다 (이 페이지의 뒷부분에 있는 표현식 참조). |
앙상블 | 연속형 대상에 대한 SQL 생성을 지원합니다. 다른 대상의 경우, 가장 높은 신뢰도 사용 앙상블 방법을 사용하는 경우에만 생성을 지원합니다. |
채움 | 파생 표현식에 대해 생성된 SQL이 지원되는 경우 SQL 생성을 지원합니다. |
값 익명화 | 연속형 대상에 대한 SQL 생성 및 명목형 및 플래그 대상에 대한 부분적인 SQL 생성을 지원합니다. |
재분류 | |
구간화 | 분위수(동일 빈도) 구간화 방법을 사용하고 사용 가능한 경우 구간 값 탭에서 읽기 옵션을 선택한 경우에 SQL 생성을 지원합니다. 구간 경계가 계산되는 방법의 차이(구간 필드 내의 데이터 분포의 특성 때문에 발생)로 인해 정규 플로우 실행 결과 및 SQL 푸시백 결과를 비교할 때 구간화 출력에 차이가 있을 수 있습니다. 이를 방지하려면 레코드 개수 분위수 방법을 사용하고 다음에 추가 또는 현재로 유지 분위수 중 하나를 사용하여 두 가지 방법의 플로우 실행 사이에서 가장 근접한 일치를 확보하십시오. |
RFM 분석 | 사용 가능한 경우 구간 값 탭에서 읽기 옵션을 선택한 경우 SQL 생성을 지원하지만, 다운스트림 노드에서 지원하지 않습니다. |
파티션 | 레코드를 파티션에 지정하기 위해 SQL 생성을 지원합니다. |
플래그로 설정 | |
구조변환 |
SQL 생성을 지원하는 노드 | 참고: |
---|---|
분포 | |
웹 | |
평가 |
일부 모델의 경우, 모델 스코어링 단계를 데이터베이스로 푸시백하면서 모델 너깃에 대한 SQL이 생성될 수 있습니다. 이 기능의 주된 목적은 성능을 개선하는 것이 아니라 해당 너깃이 포함된 플로우의 전체 SQL을 푸시백할 수 있도록 허용하는 것입니다. 자세한 정보는 모델 너깃에서 SQL 생성 을 참조하십시오.
SQL 생성을 지원하는 모델 너깃 | 참고: |
---|---|
C&R 트리 | 단일 트리 옵션에 대해서는 SQL 생성을 지원하지만, 부스팅, 배깅 또는 큰 데이터 세트 옵션에 대해서는 지원하지 않습니다. |
QUEST | |
CHAID | |
C5.0 | |
의사결정 목록 | |
선형 | 표준 모델 옵션에 대해서는 SQL 생성을 지원하지만, 부스팅, 배깅 또는 큰 데이터 세트 옵션에 대해서는 지원하지 않습니다. |
신경망 | 표준 모델 옵션(다중 레이어 퍼셉트론만 해당됨)에 대해서는 SQL 생성을 지원하지만, 부스팅, 배깅 또는 큰 데이터 세트 옵션에 대해서는 지원하지 않습니다. |
PCA/요인 | |
로지스틱 | 다항분포 프로시저에 대해서는 SQL 생성을 지원하나 이항분포에 대해서는 지원하지 않습니다. 다항분포의 경우 대상 유형이 플래그가 아닌 한, 신뢰도를 선택하면 생성이 지원되지 않습니다. |
생성된 규칙 세트 | |
자동 분류자 | 사용자 정의 함수(UDF) 스코어링 어댑터를 사용할 수 있으면 해당 너깃이 SQL 푸시백을 지원합니다. 또한 연속형 대상에 대한 SQL 생성 또는 가장 높은 신뢰도 사용 앙상블 방법을 사용하는 경우, 이러한 너깃이 추가 푸시백 다운스트림을 지원합니다. |
자동 숫자 |
SQL 생성을 지원하는 노드 | 참고: |
---|---|
테이블 | 강조표시 표현식에 대해 SQL 생성이 지원되는 경우 생성을 지원합니다. |
교차표 | 필드 옵션에 대해 모든 숫자를 선택한 경우를 제외하고 생성을 지원합니다. |
분석 | 선택된 옵션에 따라 생성을 지원합니다. |
변환 | |
통계 | 상관분석 옵션을 사용하지 않는 경우 생성을 지원합니다. |
보고서 | |
글로벌 설정 |