데이터 자산 노드를 사용하여 연결을 사용하는 원격 데이터 소스 또는 로컬 컴퓨터에서 데이터를 가져올 수 있습니다. 먼저 연결을 작성해야 합니다.
Planning Analytics 데이터베이스에 연결하려면 큐브가 아닌 보기를 선택해야 합니다.
로컬 데이터 파일(.csv, .txt, .json, .xls, .xlsx, .sav 및 .sas)에서 데이터를 가져올 수도 있습니다. 스프레드시트에서 첫 번째 시트만 가져옵니다. 노드 특성의 데이터 아래에서 업로드할 파일을 한 개 이상 선택하십시오. 로컬 파일 시스템에서 캔버스로 데이터 파일을 끌어서 놓을 수도 있습니다.
참고:SPSS Modeler Subscription 또는 SPSS Modeler 클라이언트에서 작성된 watsonx.ai 로 스트림 (.str) 을 가져올 수 있습니다. 가져온 스트림에 하나 이상의 가져오기 또는 내보내기 노드가 포함된 경우 노드를 변환하도록 프롬프트가 표시됩니다. SPSS Modeler 스트림 가져오기를 참조하십시오.
데이터 형식 옵션 설정
Copy link to section
국가마다 숫자의 정수 부분과 분수 부분을 구분하기 위해 다른 기호를 사용합니다. 예를 들어 일부 국가에서는 마침표 대신 쉼표(4,5)를 사용합니다(4.5). 또한 국가별로 데이터의 필드를 구분하기 위해 서로 다른 기호를 사용하는 경우도 있습니다. 예를 들어 쉼표 대신 콜론이나 탭을 사용하여 필드를 구분할 수 있습니다. 이러한 기호 중 어떤 기호를 사용할지 지정할 수 있습니다. 노드를 두 번 클릭하여 해당 특성을 열고 데이터 형식을 지정하십시오.그림 1. 필드 구분 기호 및 소수점 기호 옵션
데이터 구조 추론
Copy link to section
SPSS Modeler 는 데이터의 레코드 샘플을 처리하여 데이터의 구조 및 데이터 유형을 추론합니다. 처음 1000개의 레코드가 보유한 레코드 수에 대해 좋은 샘플이 아닌 경우 레코드 개수 추론 의 수를 조정하십시오. 때때로 SPSS Modeler 는 데이터 구조에 대해 잘못된 추론을 할 수 있습니다. 자세한 정보는 SPSS Modeler문제점 해결을 참조하십시오.
SPSS Statistics 파일에서 데이터 가져오기
Copy link to section
SPSS Statistics 파일(.sav)에서 데이터를 가져오는 경우 다음 옵션을 사용할 수 있습니다.
변수 이름. SPSS Statistics .sav 파일에서 가져올 때 변수 이름 및 레이블을 처리하는 메소드를 선택하십시오. 여기에 포함하도록 선택한 메타데이터는SPSS Modeler 의 작업 전체에서 지속되며 IBM SPSS Statistics에서 사용하기 위해 다시 내보낼 수 있습니다.
이름 및 레이블을 읽으십시오. 변수 이름과 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용 가능하며 변수 이름이 유형 노드에 표시됩니다. 레이블은 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다. 기본적으로 출력의 레이블 표시는 사용 중지되어 있습니다.
레이블을 이름으로 읽기. SPSS Statistics .sav 파일에서 짧은 필드 이름이 아닌 변수 설명 레이블을 읽고 SPSS Modeler에서 이러한 레이블을 변수 이름으로 사용하려면 선택합니다.
값입니다. SPSS Statistics .sav 파일에서 가져올 때 값 및 레이블을 처리하는 메소드를 선택하십시오. 여기에 포함하도록 선택하는 메타데이터는 SPSS Modeler 의 작업 전체에서 지속되며 SPSS Statistics에서 사용하기 위해 다시 내보낼 수 있습니다.
데이터 및 레이블 읽기. 실제 값과 값 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용으로 설정되며 값 자체가 유형 노드에 표시됩니다. 값 레이블은 표현식 작성기, 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다.
레이블을 데이터로 읽습니다. 값을 표시하는 데 사용되는 숫자 또는 기호 코드가 아닌 .sav 파일의 값 레이블을 사용하려면 선택하십시오. 예를 들어, 1 및 2 값이 남성 및 여성을 나타내는 성별 필드가 있는 데이터에 대해 이 옵션을 선택하면 필드를 문자열로 변환하고 male 및 female 를 실제 값으로 가져옵니다.
이 옵션을 선택하기 전에 SPSS Statistics 데이터에서 결측값을 고려하는 것이 중요합니다. 예를 들어, 숫자 필드가 결측값에 대해서만 레이블을 사용하는 경우 (0 = 응답 없음, –99 = 알 수 없음) 데이터로 레이블 읽기 옵션을 선택하면 값 레이블 응답 없음 및 알 수 없음 만 가져오고 필드를 문자열로 변환합니다. 이러한 경우 값 자체를 가져와서 유형 노드에서 결측값을 설정해야 합니다.
필드 형식 정보를 사용하여 저장 공간 판별. 이 옵션을 선택 취소하면 .sav 파일에서 정수로 형식화된 필드 값 (예: IBM SPSS Statistics의 변수 보기에서 Fn.0으로 지정된 필드) 을 정수 저장 공간을 사용하여 가져옵니다. 문자열을 제외한 다른 모든 필드 값은 실수로 가져옵니다.
이 옵션(기본값)을 선택하는 경우, 문자열을 제외한 모든 필드 값은 .sav 파일에서 정수로 형식화되었는지 여부에 상관없이 실수로 가져옵니다.
시간소인을 날짜로 읽기. 기본적으로 모든 시간소인 값은 날짜로 표시됩니다. 이 작동을 대체하려면 이 옵션을 선택 취소하십시오.
SQL을 사용하여 데이터 가져오기
Copy link to section
사용자 정의 SQL을 사용하여 데이터베이스에서 데이터를 가져오려는 경우 데이터 자산 가져오기 노드 특성의 모드 아래에서 SQL 쿼리를 선택하십시오. SQL SELECT 문을 사용하여 데이터베이스에서 데이터의 행 또는 열을 가져옵니다. SQL Query 모드를 사용하는 경우에는 소스 경로 필드가 적용되지 않습니다.그림 2. 사용자 정의 SQL 쿼리
다음 예제는 데이터베이스 테이블에서 데이터의 특정 행을 가져옵니다.
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
Copy to clipboard클립보드에 복사됨
다음 예제는 데이터베이스 테이블에서 데이터의 특정 열을 가져옵니다.
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
Copy to clipboard클립보드에 복사됨
사용하는 SQL 구문은 데이터베이스 플랫폼에 따라 다를 수 있습니다. 예를 들어, Informix 데이터베이스에서 데이터를 가져오는 경우 Informix 에서는 필드 이름을 큰따옴표로 묶어야 합니다. 예를 들어,
select "Age", "Sex" from testuser.canvas_drug
Copy to clipboard클립보드에 복사됨
이 SQL 기능은 데이터를 가져오는 데만 사용해야 합니다. 데이터베이스에서 데이터를 조작하지 않도록 주의하십시오.
본 사이트의 쿠키 정보웹 사이트가 제대로 작동하려면 일부 쿠키가 필요합니다(필수사항). 또한 다른 쿠키는 사이트 사용을 분석하고 사용자 경험을 개선하며 광고를 목적으로 귀하의 동의에 따라 사용될 수 있습니다.자세한 정보는 쿠키 환경 설정 옵션을 확인해 주시기 바랍니다. IBM 웹사이트를 방문함으로써 귀하는 IBM의개인정보처리방침에 따라 당사가 정보를 처리하는 것에 동의합니다.원활한 탐색을 제공하기 위해 귀하의 쿠키 환경 설정은 여기에 나열된 IBM 웹 도메인 전체에서 공유됩니다.