0 / 0
영어 버전 문서로 돌아가기
데이터 자산 노드
마지막 업데이트 날짜: 2024년 11월 22일
데이터 자산 노드(SPSS Modeler)

데이터 자산 노드를 사용하여 연결을 사용하는 원격 데이터 소스 또는 로컬 컴퓨터에서 데이터를 가져올 수 있습니다. 먼저, 연결을 작성해야 합니다.

Planning Analytics 데이터베이스에 연결하려면 큐브가 아닌 보기를 선택해야 합니다.

로컬 데이터 파일(.csv, .txt, .json, .xls, .xlsx, .sav.sas)에서 데이터를 가져올 수도 있습니다. 스프레드시트에서 첫 번째 시트만 가져옵니다. 노드 특성의 데이터 아래에서 업로드할 파일을 한 개 이상 선택하십시오. 로컬 파일 시스템에서 캔버스로 데이터 파일을 끌어서 놓을 수도 있습니다.

참고: SPSS Modeler Subscription 또는 SPSS Modeler 클라이언트에서 생성한 스트림(.str)을 ' watsonx.ai Studio '로 가져올 수 있습니다. 가져온 스트림에 하나 이상의 가져오기 또는 내보내기 노드가 포함된 경우 노드를 변환하도록 프롬프트가 표시됩니다. SPSS Modeler 스트림 가져오기를 참조하십시오.

데이터 형식 옵션 설정

국가마다 숫자의 정수 부분과 분수 부분을 구분하기 위해 다른 기호를 사용합니다. 예를 들어 일부 국가에서는 마침표 대신 쉼표(4,5)를 사용합니다(4.5). 또한 국가별로 데이터의 필드를 구분하기 위해 서로 다른 기호를 사용하는 경우도 있습니다. 예를 들어 쉼표 대신 콜론이나 탭을 사용하여 필드를 구분할 수 있습니다. 이러한 기호 중 어떤 기호를 사용할지 지정할 수 있습니다. 노드를 두 번 클릭하여 해당 특성을 열고 데이터 형식을 지정하십시오.
그림 1. 필드 구분자 및 소수점 기호 옵션
필드 구분자 및 소수점 기호 옵션

데이터 구조 추론

SPSS Modeler 는 데이터의 레코드 샘플을 처리하여 데이터의 구조 및 데이터 유형을 추론합니다. 처음 1000개의 레코드가 보유한 레코드 수에 대해 좋은 샘플이 아닌 경우 레코드 개수 추론 의 수를 조정하십시오. 때때로 SPSS Modeler 는 데이터 구조에 대해 잘못된 추론을 할 수 있습니다. 자세한 정보는 SPSS Modeler문제점 해결을 참조하십시오.

SPSS Statistics 파일에서 데이터 가져오기

SPSS Statistics 파일(.sav)에서 데이터를 가져오는 경우 다음 옵션을 사용할 수 있습니다.

변수 이름. SPSS Statistics .sav 파일에서 가져올 때 변수 이름 및 레이블을 처리하는 메소드를 선택하십시오. 여기에 포함하도록 선택한 메타데이터는SPSS Modeler 의 작업 전체에서 지속되며 IBM SPSS Statistics에서 사용하기 위해 다시 내보낼 수 있습니다.
  • 이름 및 레이블을 읽으십시오. 변수 이름과 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용 가능하며 변수 이름이 유형 노드에 표시됩니다. 레이블은 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다. 기본적으로 출력에 레이블 표시는 사용되지 않습니다.
  • 레이블을 이름으로 읽기. SPSS Statistics .sav 파일에서 짧은 필드 이름이 아닌 변수 설명 레이블을 읽고 SPSS Modeler에서 이러한 레이블을 변수 이름으로 사용하려면 선택합니다.
값입니다. SPSS Statistics .sav 파일에서 가져올 때 값 및 레이블을 처리하는 메소드를 선택하십시오. 여기에 포함하도록 선택하는 메타데이터는 SPSS Modeler 의 작업 전체에서 지속되며 SPSS Statistics에서 사용하기 위해 다시 내보낼 수 있습니다.
  • 데이터 및 레이블 읽기. 실제 값과 값 레이블을 모두 SPSS Modeler로 읽어 들이려면 선택하십시오. 이 옵션은 기본적으로 사용으로 설정되며 값 자체가 유형 노드에 표시됩니다. 값 레이블은 표현식 작성기, 차트, 모델 브라우저 및 기타 유형의 출력에 표시됩니다.
  • 레이블을 데이터로 읽습니다. 값을 표시하는 데 사용되는 숫자 또는 기호 코드가 아닌 .sav 파일의 값 레이블을 사용하려면 선택하십시오. 예를 들어, 12 값이 남성여성을 나타내는 성별 필드가 있는 데이터에 대해 이 옵션을 선택하면 필드를 문자열로 변환하고 malefemale 를 실제 값으로 가져옵니다.

    이 옵션을 선택하기 전에 SPSS Statistics 데이터에서 결측값을 고려하는 것이 중요합니다. 예를 들어, 숫자 필드가 결측값에 대해서만 레이블을 사용하는 경우 (0 = 응답 없음, –99 = 알 수 없음) 데이터로 레이블 읽기 옵션을 선택하면 값 레이블 응답 없음알 수 없음 만 가져오고 필드를 문자열로 변환합니다. 이 경우, 값 자체를 가져오고 유형 노드에서 결측값을 설정해야 합니다.

필드 형식 정보를 사용하여 저장 공간 판별. 이 옵션을 선택 취소하면 .sav 파일에서 정수로 형식화된 필드 값 (예: IBM SPSS Statistics의 변수 보기에서 Fn.0으로 지정된 필드) 을 정수 저장 공간을 사용하여 가져옵니다. 문자열을 제외한 모든 기타 필드 값은 실제 수로 가져옵니다.

이 옵션(기본값)을 선택하는 경우, 문자열을 제외한 모든 필드 값은 .sav 파일에서 정수로 형식화되었는지 여부에 상관없이 실수로 가져옵니다.

시간소인을 날짜로 읽기. 기본적으로 모든 시간소인 값은 날짜로 표시됩니다. 이 작동을 대체하려면 이 옵션을 선택 취소하십시오.

SQL을 사용하여 데이터 가져오기

사용자 정의 SQL을 사용하여 데이터베이스에서 데이터를 가져오려는 경우 데이터 자산 가져오기 노드 특성의 모드 아래에서 SQL 쿼리를 선택하십시오. SQL SELECT 문을 사용하여 데이터베이스에서 데이터의 행 또는 열을 가져옵니다. SQL Query 모드를 사용하는 경우에는 소스 경로 필드가 적용되지 않습니다.
그림 2. 사용자 정의 SQL 쿼리
사용자 정의 SQL 쿼리
다음 예제는 데이터베이스 테이블에서 데이터의 특정 행을 가져옵니다.
select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4
다음 예제는 데이터베이스 테이블에서 데이터의 특정 열을 가져옵니다.
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
사용하는 SQL 구문은 데이터베이스 플랫폼에 따라 다를 수 있습니다. 예를 들어, Informix 데이터베이스에서 데이터를 가져오는 경우 Informix 에서는 필드 이름을 큰따옴표로 묶어야 합니다. 예를 들어,
select "Age", "Sex" from testuser.canvas_drug

이 SQL 기능은 데이터를 가져오는 데만 사용해야 합니다. 데이터베이스에서 데이터를 조작하지 않도록 주의하십시오.

현재 이 사용자 정의 SQL 기능을 지원하는 데이터베이스는 다음과 같습니다.
  • Amazon Redshift
  • Apache Hive
  • Apache Impala
  • Compose for PostgreSQL
  • Db2 on Cloud
  • Db2 Warehouse
  • Google BigQuery
  • Informix
  • Microsoft SQL Server
  • MySQL
  • Netezza
  • Oracle
  • Pivotal Greenplum
  • Salesforce.com
  • Snowflake
  • SAP ASE
  • SAP IQ
  • Teradata
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기