DataStage 흐름 설계
DataStage® 플로우는 데이터 통합 로직을 포함하는 디자인 타임 자산입니다.
비어 있는 DataStage 플로우를 작성하고 여기에 커넥터 및 스테이지를 추가하거나 ISX 또는 ZIP 파일에서 기존 DataStage 플로우를 가져올 수 있습니다.
- 데이터를 읽는 데이터 소스
- 데이터를 변환하는 스테이지
- 데이터를 기록하는 데이터 대상
- 소스, 스테이지 및 대상을 연결하는 링크
DataStage 플로우 및 연관된 오브젝트는 프로젝트에서 구성됩니다. 시작하려면 기존 프로젝트를 열거나 프로젝트를 새로 작성하십시오.
DataStage 플로우 작성
DataStage 플로우를 작성하려면 다음 단계를 완료하십시오.
- 기존 프로젝트를 열거나 프로젝트를 작성하십시오.
- 자산 탭에서 을 클릭합니다.
- DataStage 플로우 작성 페이지에서 다음 두 가지 방법 중 하나를 사용하여 DataStage 플로우를 작성하십시오.
- 새로 작성 탭을 클릭하고 DataStage 플로우에 필요한 세부사항을 추가한 후 작성을 클릭하십시오. 새 DataStage 플로우가 DataStage 디자이너 캔버스에서 오브젝트 없이 열립니다.
- 로컬 파일 탭을 클릭한 후 로컬 컴퓨터에서 ISX 또는 ZIP 파일을 업로드하십시오. 그런 다음 작성을 클릭하십시오. 가져오기 프로세스가 완료되면 가져오기 보고서 페이지를 닫은 후 프로젝트의 자산 탭에서 가져온 DataStage 플로우를 여십시오.
- 커넥터 또는 스테이지를 팔레트에서 DataStage 디자인 캔버스로 노드로 끌어 놓고 원하는 대로 배열하십시오. 노드 위에 포인터를 올려놓고 노드에서 화살표가 나타나도록 한 후 화살표 아이콘을 클릭하고 연결할 노드로 이를 끌어와서 캔버스에서 해당 노드를 연결하십시오.
이 조치는 노드 간에 링크를 작성합니다.
원격 데이터에 연결하려면 DataStage에서 데이터 원본에 연결하기을 참조하세요.
- 노드를 두 번 클릭하여 노드의 구성 및 설정을 지정할 수 있는 특성 패널을 여십시오.
- 플로우 설정이 완료되면 실행을 클릭하십시오.
플로우가 자동으로 저장되고 컴파일된 후 실행됩니다. 컴파일 및 작업 실행 모두에 대한 로그를 볼 수 있습니다.
DataStage 플로우 편집
다음 조치를 사용하여 DataStage 플로우를 편집할 수 있습니다.
- 스테이지 또는 커넥터를 끌어 DataStage 디자인 캔버스에 이미 있는 두 노드 사이의 링크에 놓으십시오. 새 노드에 대한 링크가 자동으로 추가되고 컬럼이 자동으로 전파됩니다. 결과를 보려면 실행 을 다시 클릭하십시오.
- DataStage 캔버스의 노드 위로 포인터를 이동하고 링크의 끝점을 클릭하여 노드에서 링크를 수동으로 분리하고 다시 연결하십시오.
- 스테이지 또는 커넥터를 팔레트에서 끌어서 이미 캔버스에 있는 링크에 놓습니다. 스테이지 또는 커넥터는 양쪽에 있는 노드에 자동으로 링크되며 DataStage 플로우의 열은 자동으로 전파됩니다.
- 바꾸기 아이콘
을 클릭하고 다른 플로우를 선택하여 플로우를 교체합니다. 이 작업은 빌드, 사용자 지정 및 래핑된 단계뿐만 아니라 하위 흐름 및 Java 라이브러리에서도 사용할 수 있습니다.
데이터 미리 보기
DataStage 흐름에서 데이터를 편집하고 미리 볼 수 있습니다. 캔버스에서 연결을 마우스 오른쪽 버튼으로 클릭하고 데이터 미리 보기를 선택합니다. 모든 연결 및 파일 커넥터로 데이터를 미리 볼 수 있습니다. 파일 커넥터에 대한 자세한 내용은 DataStage 파일 커넥터를 참조하세요.
예를 들어 시간대와 함께 시간 및 마이크로초 시간을 미리 볼 수 있습니다. ' time
' 및 ' microseconds time
' 데이터 유형은 모두 표준 형식으로 표시됩니다: 시간은 HH:mm:ss
, 마이크로초 시간은 ' HH:mm:ss.SSSSSS
'입니다.
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
여기서 시간대는 표준 시간 형식으로 ' 10:00:01
'로 변환되어 표시됩니다.고려사항
- 민감한 정보 및 암호화된 특성 값
- DataStage 플로우에서 비밀번호와 같은 암호화된 특성 값을 지정하는 것은 권장되지 않습니다. 대신 이름 지정된 매개변수를 사용하여 암호화됨 유형의 매개변수 세트를 작성하고 매개변수의 기본값을 지정하지 마십시오. 플로우에서 암호화된 매개변수 세트를 참조하고 특성 값에 대해 이름 지정된 매개변수를 지정하십시오 (예:
#<parameter set>.<parameter name>#
). 플로우를 실행하는 작업에서#parameter set.parameter name#
매개변수의 암호화된 값을 지정하십시오. - 데이터 손상을 방지하기 위해 소스 및 대상에서 파일 이름 지정
- 대부분의 경우 소스 및 대상이 동일한 데이터베이스 또는 스토리지 시스템을 가리키는 경우 대상에서와 동일한 파일 이름을 소스에서 사용하지 마십시오. 이 규칙은 파일 및 데이터베이스 테이블에 적용됩니다. 이름이 동일하면 데이터가 손상될 수 있습니다.
- 열 메타데이터 변경 사용
- 열의 메타데이터를 변경하면 변경사항이 자동으로 다운스트림으로 전파됩니다. 업스트림의 변경사항은 해당 메타데이터를 수정한 후에는 열에 적용되지 않습니다. 열을 삭제하면 이후 스테이지에서 열을 수정해도 열이 다시 추가되지 않습니다.
- 런타임 컬럼 사용
- RCP가 설정된 경우, 작업이 실행될 때 메타데이터에 정의되지 않은 추가 열을 발견하면 이러한 추가 열을 채택하고 나머지 작업을 통해 전파합니다. 이렇게 하면 맵핑 누락으로 인한 오류를 방지할 수 있습니다.
- 매개변수 추가
- 매개변수 추가를 참조하십시오.
자세한 정보
예
- DataStage 플로우 작성
단순 DataStage 플로우를 작성하는 방법에 대한 예제를 보려면 다음 비디오를 보십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
- DataStage 플로우를 프로젝트로 가져오기
DataStage 플로우를 프로젝트로 가져오는 방법에 대한 예제를 보려면 다음 비디오를 보십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.