IBM® DataStage® 는 프로젝트에서 데이터를 변환하고 통합하는 데 사용할 수 있는 ETL 도구입니다.
DataStage 는 사용하기 쉽도록 설계되었으며 Cloud Pak for Data에 완전히 통합되어 있습니다. ISX 파일을 사용하여 기존 레거시 병렬 작업을 DataStage 로 가져오고, DataStage 디자인 캔버스를 사용하여 플로우를 작성, 편집 및 테스트하고, 플로우에서 생성된 작업을 실행할 수 있습니다. DataStage 서비스는 데이터 패브릭의 일부입니다.
DataStage 는 운영, 트랜잭션 및 분석 대상 시스템 간에 데이터를 이동하고 변환하는 데이터 통합 도구입니다. 데이터 통합 전문가는 DataStage 를 사용하여 데이터를 처리하고 변환하는 플로우를 개발합니다. 수백 개의 사전 빌드된 변환 기능, 병렬 처리 기능 및 플랫폼 연결을 사용하여 엔터프라이즈 애플리케이션, 클라우드 데이터 소스, 관계형 및 NoSQL 시스템, REST 엔드포인트 등에 직접 연결할 수 있습니다. 이러한 플로우를 관리, 관리, 배치 및 재사용하여 조직 전체의 여러 시스템에서 데이터를 통합할 수 있습니다.
- 데이터 형식
- 표 형식: Avro, CSV, JSON, Parquet, TSV(읽기 전용) 또는 구분된 텍스트 파일
- 데이터 크기
- 모두
- 필수 서비스
- DataStage
- 커넥터
- 예제 커넥터에는 Db2®, Netezza® Performance Server, Microsoft SQL Server, Oracle,Teradata, Snowflake, Microsoft Azure File Storage, Amazon Web Services 및 Google Cloud Platform 서비스 및 Amazon S3가 포함됩니다.
DataStage 가 지원하는 커넥터 목록은 DataStage 커넥터 를 참조하십시오.
- 스테이지
- 이 서비스는 데이터베이스 액세스 또는 데이터 변환과 같은 특정 프로세스를 설명하는 단계를 제공합니다. DataStage 스테이지는 데이터 이동 및 변환을 위한 공통 기능을 제공합니다. QualityStage 스테이지는 중복되거나 더 이상 사용되지 않거나 부정확한 데이터를 제거하고 데이터를 표준화하고 주소 데이터를 확인하는 데 중요하지만 이에 제한되지는 않습니다.
DataStage 스테이지 및 DataStage의 품질 단계이 지원하는 단계에 대한 자세한 내용은 DataStage를 참조하세요.
자세한 내용은 품질 단계의 DataStage를 참조하세요.
자세한 정보
DataStage에 대한 빠른 시작 자습서를 검토하려면 빠른 시작을 참조하세요: 데이터 변환를 참조하세요.
데이터 패브릭 컨텍스트에서 DataStage 에 대한 학습서를 검토하려면 Multicloud data integration 학습서: 데이터 통합을 참조하십시오.
DataStage 사용에 대한 자세한 내용은 다음 항목을 참조하세요: