0 / 0
Retourner à la version anglaise de la documentation
DataStage
Dernière mise à jour : 09 déc. 2024
DataStage

IBM® DataStage® est un outil ETL que vous pouvez utiliser pour transformer et intégrer des données dans des projets.

 

DataStage est conçu pour faciliter l'utilisation et est entièrement intégré à Cloud Pak for Data. Vous pouvez importer vos travaux parallèles existants dans DataStage à l'aide de fichiers ISX, utiliser la grille de conception DataStage pour créer, éditer et tester des flux et exécuter des travaux générés à partir des flux. Le service DataStage fait partie de la matrice de données.

DataStage est un outil d'intégration de données qui déplace et transforme des données entre des systèmes cible opérationnels, transactionnels et analytiques. Les spécialistes de l'intégration des données utilisent DataStage pour développer des flux qui traitent et transforment les données. Des centaines de fonctions de transformation préconfigurées, de capacités de traitement parallèle et de connectivité de plateforme sont disponibles pour se connecter directement aux applications d'entreprise, aux sources de données cloud, aux systèmes relationnels et NoSQL , aux noeuds finaux REST, etc. Vous pouvez administrer, gérer, déployer et réutiliser ces flux pour intégrer des données dans de nombreux systèmes de votre organisation.

Format de données
Tabulaire : Avro, CSV, JSON, Parquet, TSV (en lecture seule) ou fichiers texte délimité
Taille des données
Tous
Services requis
DataStage
Connecteurs
Exemples de connecteurs: Db2®, Netezza® Performance Server, Microsoft SQL Server, Oracle,Teradata, Snowflake, Microsoft Azure File Storage, Amazon Web Services et Google Cloud Platform services, et Amazon S3.

Voir ConnecteursDataStage pour la liste des connecteurs pris en charge par DataStage .

Etapes
Ce service fournit des étapes qui décrivent un processus particulier, tel que l'accès à une base de données ou la transformation de données d'une manière ou d'une autre. Les étapes DataStage fournissent des fonctions communes pour le déplacement et la transformation des données. Les étapes QualityStage sont importantes pour l'élimination des données redondantes, obsolètes ou inexactes, la normalisation des données et la vérification des données d'adresse.

Voir DataStage étapes et Étapes de qualité dans DataStage pour des informations sur les étapes que DataStage prend en charge.

Pour plus d'informations, voir Les étapes de qualité dans DataStage.

En savoir plus

Pour consulter un tutoriel de démarrage rapide pour DataStage, voir Démarrage rapide : Transformer les données.

Pour passer en revue un tutoriel relatif à DataStage dans le contexte de matrice de données, voir Multicloud data integration : Intégrer des données.

Pour plus d'informations sur l'utilisation de DataStage, voir les rubriques suivantes :