DataStage sur Cloud Pak for Data as a Service

 

Description

IBM DataStage est un outil d'intégration de données pour la conception, le développement et l'exécution de travaux qui déplacent et transforment des données.

DataStage est l'un des composants d'intégration de données d' Cloud Pak for Data. Le service DataStage est entièrement intégré dans Cloud Pak for Data as a Service dans le cadre du data fabric. Il fournit une infrastructure graphique permettant de développer les travaux qui déplacent les données de systèmes source vers des systèmes cible. Les données transformées peuvent être transmises à des entrepôts de données, des magasins de données et des magasins de données opérationnelles, des services Web en temps réel et des systèmes de messagerie, ainsi qu'à d'autres applications d'entreprise. DataStage prend en charge des modèles d'extraction, de transformation et de chargement (ETL) et d'extraction, de chargement et de transformation (ELT). Il utilise le traitement parallèle et la connectivité d'entreprise pour fournir une plateforme réellement évolutive.

DataStage fait partie de Cloud Pak for Data as a Service et fournit les fonctions d'intégration de données de l'architecture de matrice de données.

Diagramme illustrant comment DataStage s'intègre à l'architecture de service pour Cloud Pak for Data as a Service.

Avec le moteur parallèle DataStage (PX) d'exécution à distance en tant que service, vous pouvez exécuter des travaux dans IBM Cloud et sur des emplacements distants préconfigurés gérés par IBM. En utilisant un emplacement distant comme environnement, vous pouvez éliminer totalement ou partiellement la nécessité de déplacer ou de copier des données à partir d'autres clouds publics. En amenant vos charges de travail sur le lieu où sont stockées vos données, vous bénéficiez de meilleures performances, respectez les conditions de résidence des données et réduisez les coûts de transfert des données.

Avec DataStage, votre entreprise peut atteindre les objectifs suivants :

  • Concevoir des flux de données qui extraient des informations de plusieurs systèmes source, transforment les données en fonction des besoins et transmettent les données aux bases de données ou applications cible.
  • Se connecter directement aux applications d'entreprise en tant que sources ou cibles pour vous assurer que les données sont pertinentes, complètes et exactes.
  • Réduire le temps de développement et améliorer la cohérence de la conception et du déploiement en utilisant des fonctions préintégrées.
  • Réduire le cycle de distribution du projet en utilisant un ensemble d'outils commun dans Watson Studio.

Ce service ajoute un outil dans les projets.

Liens rapides

Services intégrés

Tableau 1. Services connexes. Les services connexes suivants sont souvent utilisés avec ce service et fournissent des fonctions complémentaires, mais ils ne sont pas requis.
Service Fonctionnalité
Watson™ Knowledge Catalog Créez des catalogues d'actifs sélectionnés avec cette plateforme de gestion de catalogue d'entreprise sécurisée qui est prise en charge par une infrastructure de gouvernance des données.
Watson Studio Préparez, analysez et modélisez des données dans un environnement collaboratif avec des outils destinés aux scientifiques des données, aux développeurs et aux experts du domaine.