데이터 자산 노드를 사용하여 연결을 사용하는 원격 데이터 소스 또는 로컬 컴퓨터에서 데이터를 가져올 수 있습니다. 먼저, 연결을 작성해야 합니다.
Planning Analytics 데이터베이스에 연결하려면 큐브가 아닌 보기를 선택해야 합니다.
로컬 데이터 파일(.csv, .txt, .json, .xls, .xlsx, .sav 및 .sas)에서 데이터를 가져올 수도 있습니다. 스프레드시트에서 첫 번째 시트만 가져옵니다. 노드 특성의 데이터 아래에서 업로드할 파일을 한 개 이상 선택하십시오. 로컬 파일 시스템에서 캔버스로 데이터 파일을 끌어서 놓을 수도 있습니다.
데이터 형식 옵션 설정
데이터 구조 추론
SPSS Modeler 는 데이터의 레코드 샘플을 처리하여 데이터의 구조 및 데이터 유형을 추론합니다. 처음 1000개의 레코드가 보유한 레코드 수에 대해 좋은 샘플이 아닌 경우 레코드 개수 추론 의 수를 조정하십시오. 때때로 SPSS Modeler 는 데이터 구조에 대해 잘못된 추론을 할 수 있습니다. 자세한 정보는 SPSS Modeler문제점 해결을 참조하십시오.
SPSS Statistics 파일에서 데이터 가져오기
SPSS Statistics 파일(.sav)에서 데이터를 가져오는 경우 다음 옵션을 사용할 수 있습니다.
- 이름 및 레이블을 읽으십시오. 변수 이름과 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용 가능하며 변수 이름이 유형 노드에 표시됩니다. 레이블은 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다. 기본적으로 출력에 레이블 표시는 사용되지 않습니다.
- 레이블을 이름으로 읽기. SPSS Statistics .sav 파일에서 짧은 필드 이름이 아닌 변수 설명 레이블을 읽고 SPSS Modeler에서 이러한 레이블을 변수 이름으로 사용하려면 선택합니다.
- 데이터 및 레이블 읽기. 실제 값과 값 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용으로 설정되며 값 자체가 유형 노드에 표시됩니다. 값 레이블은 표현식 작성기, 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다.
- 레이블을 데이터로 읽습니다. 값을 표시하는 데 사용되는 숫자 또는 기호 코드가 아닌 .sav 파일의 값 레이블을 사용하려면 선택하십시오. 예를 들어,
1
및2
값이 남성 및 여성을 나타내는 성별 필드가 있는 데이터에 대해 이 옵션을 선택하면 필드를 문자열로 변환하고male
및female
를 실제 값으로 가져옵니다.이 옵션을 선택하기 전에 SPSS Statistics 데이터에서 결측값을 고려하는 것이 중요합니다. 예를 들어, 숫자 필드가 결측값에 대해서만 레이블을 사용하는 경우 (
0
= 응답 없음,–99
= 알 수 없음) 데이터로 레이블 읽기 옵션을 선택하면 값 레이블 응답 없음 및 알 수 없음 만 가져오고 필드를 문자열로 변환합니다. 이 경우, 값 자체를 가져오고 유형 노드에서 결측값을 설정해야 합니다.
필드 형식 정보를 사용하여 저장 공간 판별. 이 옵션을 선택 취소하면 .sav 파일에서 정수로 형식화된 필드 값 (예: IBM SPSS Statistics의 변수 보기에서 Fn.0으로 지정된 필드) 을 정수 저장 공간을 사용하여 가져옵니다. 문자열을 제외한 모든 기타 필드 값은 실제 수로 가져옵니다.
이 옵션(기본값)을 선택하는 경우, 문자열을 제외한 모든 필드 값은 .sav 파일에서 정수로 형식화되었는지 여부에 상관없이 실수로 가져옵니다.
시간소인을 날짜로 읽기. 기본적으로 모든 시간소인 값은 날짜로 표시됩니다. 이 작동을 대체하려면 이 옵션을 선택 취소하십시오.
SQL을 사용하여 데이터 가져오기
SELECT
문을 사용하여 데이터베이스에서 데이터의 행 또는 열을 가져옵니다. SQL Query 모드를 사용하는 경우에는 소스 경로 필드가 적용되지 않습니다.
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
select "Age", "Sex" from testuser.canvas_drug
이 SQL 기능은 데이터를 가져오는 데만 사용해야 합니다. 데이터베이스에서 데이터를 조작하지 않도록 주의하십시오.
- Amazon Redshift
- Apache Hive
- Apache Impala
- Compose for PostgreSQL
- Db2 on Cloud
- Db2 Warehouse
- Google BigQuery
- Informix
- Microsoft SQL Server
- MySQL
- Netezza
- Oracle
- Pivotal Greenplum
- Salesforce.com
- Snowflake
- SAP ASE
- SAP IQ
- Teradata