데이터 통합 자산에 대한 메타데이터 가져오기 구성하기
데이터 통합은 기술 및 비즈니스 프로세스를 사용하여 다양한 소스의 데이터를 결합하고 기업에 의미 있고 가치 있는 정보를 생성합니다. 데이터 통합 도구는 추출, 변환, 로드(ETL) 패턴을 사용하여 비즈니스 요구 사항에 따라 데이터를 변환하고 정리할 수 있습니다. 이러한 ETL 작업은 소스 시스템에서 대상 시스템으로 데이터를 이동합니다.
InfoSphere DataStage 계보 메타데이터를 가져올 수 있습니다. 이 소스에서는 에셋을 가져올 수 없습니다.
InfoSphere DataStage
InfoSphere DataStage 대한 계보 메타데이터 가져오기를 생성할 때 이 데이터 소스에 특정한 옵션을 설정하고 계보가 생성되는 데이터의 범위를 정의할 수 있습니다. 메타데이터 가져오기에 대한 자세한 내용은 메타데이터 가져오기 디자인을 참조하세요.
외부 입력
작업, 스테이지 또는 운영 메타데이터 파일과 같은 InfoSphere DataStage 자산을 .zip 파일의 외부 입력으로 제공할 수 있습니다. 폴더의 구조는 다음과 같아야 합니다:
<job_name.xml>
' - 분석하려는 병렬 DataStage 작업과 해당 작업에서 사용하는 매개변수 집합을 디자이너 클라이언트에서 하나의 XML 파일로 내보낸 것입니다.omd_files
' - 운영 메타데이터(OMD) 파일을 위한 폴더입니다.<omd_file_name>
' - 작업 실행 중에 작업의 모든 유형의 매개변수를 확인하기 위해 수집되는 작업 메타데이터 파일입니다.
sql_files
' - 모든 SQL 파일이 들어 있는 폴더입니다.<sql_file_name>
' - SQL 쿼리가 포함된 파일입니다.
DSParams
' - 해당되는 경우 프로젝트 또는 환경 수준 매개변수가 포함된 파일입니다. 이 파일은 프로젝트 디렉터리에서 가져올 수 있습니다.datastageParameterOverride.txt
' - 작업에서 매개변수 집합을 사용하는 경우 매개변수 집합 오버라이드가 있는 파일입니다.connection_definition/odbcConnectionDefinition.ini
' - ODBC 연결에 대한 연결 정의가 포함된 파일입니다. ODBC 연결의 정의는 DataStage XML 내보내기에 포함되지 않으므로 별도로 지정해야 합니다.datastageComponentOverrides.csv
' - 컴포넌트 계보 오버라이드가 있는 파일입니다.
' datastageParameterOverride.txt
파일 형식
' datastageParameterOverride.txt
' 파일에는 다음과 같은 내용이 있습니다:
[ENVIRONMENT]
PARAM1_NAME = "param1_value"
PARAM2_NAME = "param2_value"
PARAM3_NAME = "param3_value"
[PARAMETER_SET/parameter_set_name]
param4_name = "default_param4_value"
param5_name = "default_param5_value"
$PARAM3_NAME = "$PROJDEF"
[VALUE_FILE/parameter_set_name/value_file1_name]
param4_name = "some_param4_value"
param5_name = "some_param5_value"
$PARAM3_NAME = "some_param3_value"
[VALUE_FILE/parameter_set_name/value_file2_name]
param4_name = "other_param4_value"
param5_name = "other_param5_value"
$PARAM3_NAME = "other_param3_value"
[JOB/job1_name]
param6_name = "param6_value"
param7_name = "param7_value"
[JOB/job2_name]
param7_name = "param8_value"
' connection_definition/odbcConnectionDefinition.ini
파일 형식
' connection_definition/odbcConnectionDefinition.ini
' 파일에는 다음과 같은 내용이 있습니다. 각 연결에 대해 별도의 ' [Shortcut_Name]
섹션을 만듭니다.
[<Shortcut_Name>]
Type=<connection_type>
Connection_String=<connection_string>
Server_Name=<server_name>
Database_Name=<database_name>
Schema_Name=<schema_name>
User_Name=<user_name>
- 바로가기_이름: 데이터 통합 도구에서 사용하는 연결 또는 데이터 서버의 이름입니다.
- 연결 유형: 데이터 소스 유형입니다.
- connection_string: JDBC 연결 문자열 또는 시스템 ID(SID) 또는 호스트 이름과 같은 데이터베이스의 식별자입니다.
- 서버_이름: 데이터 소스 유형에 따라 값이 달라집니다:
- Db2, Microsoft SQL Server, Netezza Performance Server, SAP ASE (이전 Sybase) 또는 Teradata: 서버 이름입니다.
- FTP: 호스트 이름입니다.
- Oracle 및 기타 데이터베이스: 값이 무시됩니다.
- 데이터베이스_이름: 데이터 소스 유형에 따라 값이 달라집니다:
- Oracle: 글로벌 데이터베이스 이름입니다.
- Db2, Microsoft SQL Server, Netezza Performance Server, SAP ASE (이전 Sybase), Teradata 및 기타 데이터베이스입니다: 기본 데이터베이스의 이름입니다.
- user_name: 데이터베이스에 로그인하는 사용자의 이름입니다.
각 섹션의 매개변수 끝에 새 줄을 추가합니다.
' datastageComponentOverrides.csv
파일 형식
' datastageComponentOverrides.csv
' 파일에는 다음과 같은 내용이 있습니다:
"Full path to Stage";"Input Link name";"Input Column name";"Output Link name";"Output Column name";"Edge Type (DIRECT | FILTER)";"Description (optional)"
"manual_mapping_job/Generic_3";"DSLink2";"a";"DSLink5";"b";"DIRECT";""
스테이지 경로는 ' Job/[Shared and Local containers optional]/Stage
형식입니다.
고급 가져오기 옵션
- Oracle 프록시 사용자 인증
- Oracle 프록시 사용자 인증을 사용할 수 있습니다. 값을 '
true
'로 설정하여 '\"USERNAME[SCHEMA_OWNER]\"
형식의 Oracle 사용자 이름을 '\"SCHEMA_OWNER\"
' 형식으로 변경합니다. 다른 경우에는 값을 'false
으로 설정합니다. - 값 파일
- 파라미터 세트에서 사용할 값 파일의 이름을 우선순위에 따라 지정합니다. 예를 들어,
DEV1,TEST,PROD
입니다.
자세한 정보
상위 주제: 메타데이터 가져오기 디자인하기