Translation not up to date
IBM® DataStage® jest narzędziem ETL, którego można używać do transformowania i integrowania danych w projektach.
Program DataStage został zaprojektowany z myślą o łatwości obsługi i jest w pełni zintegrowany z produktem Cloud Pak for Data. Istniejące wcześniejsze zadania równoległe można zaimportować do programu DataStage za pomocą plików ISX, kanwy projektu DataStage można użyć do tworzenia, edytowania i testowania przepływów oraz uruchamiania zadań wygenerowanych na podstawie przepływów. Usługa DataStage jest częścią sieci Fabric danych.
DataStage jest narzędziem integracji danych, które przenosi i transformuje dane między operacyjnymi, transakcyjnymi i analitycznymi systemami docelowymi. Specjaliści ds. integracji danych używają narzędzia DataStage do tworzenia przepływów, które przetwarzają i transformują dane. Dostępne są setki gotowych funkcji transformacji, możliwości przetwarzania równoległego i łączności platformy, które umożliwiają bezpośrednie połączenie z aplikacjami korporacyjnymi, źródłami danych w chmurze, systemami relacyjnymi i systemami NoSQL , punktami końcowymi REST i innymi. Istnieje możliwość administrowania, wdrażania i ponownego wykorzystywania tych przepływów oraz zarządzania nimi w celu zintegrowania danych z wielu systemów w całej organizacji.
- Format danych
- Tabelaryczne: Avro, CSV, JSON, Parquet, TSV (tylko do odczytu) lub pliki tekstowe z ogranicznikami
- Wielkość danych
- Dowolne
- Wymagane usługi
- DataStage
- Konektory
- Przykładowe konektory to: Db2®, Netezza® Performance Server, Microsoft SQL Server, Oracle,Teradata, Snowflake, Microsoft Azure File Storage, Amazon Web Services i Google Cloud Platform oraz Amazon S3.
Lista konektorów obsługiwanych przez program DataStage znajduje się w sekcji DataStage .
- Etapy
- Ta usługa udostępnia etapy opisujące konkretny proces, taki jak uzyskiwanie dostępu do bazy danych lub transformowanie danych w pewien sposób. Etapy DataStage udostępniają wspólne funkcje przenoszenia i transformowania danych. Etapy QualityStage są ważne dla, ale nie tylko, eliminowania nadmiarowych, przestarzałych lub niedokładnych danych, standaryzowania danych i weryfikowania danych adresowych.
Informacje na temat etapów obsługiwanych przez program DataStage można znaleźć w sekcji DataStage stage i QualityStage stage .
Więcej informacji na ten temat zawiera sekcja EtapyQualityStage.
Więcej inform.
Aby przejrzeć kurs szybkiego startu dla narzędzia DataStage, należy zapoznać się z sekcją Szybki start: transformowanie danych.
Aby zapoznać się z kursem DataStage w kontekście struktury danych, należy zapoznać się z sekcją Multicloud data integration : integrowanie danych.
Więcej informacji na temat korzystania z narzędzia DataStagezawierają następujące tematy: