DataStage en Cloud Pak for Data as a Service

 

Descripción

IBM DataStage es una herramienta de integración de datos para diseñar, desarrollar y ejecutar trabajos que mueven y transforman datos.

DataStage es uno de los componentes de integración de datos de Cloud Pak for Data. El servicio de DataStage está totalmente integrado en Cloud Pak for Data as a Service como parte del entramado de datos. Proporciona una infraestructura gráfica para desarrollar los trabajos que mueven datos desde los sistemas de origen a los sistemas de destino. Los datos transformados se pueden entregar a depósitos de datos, despensas de datos y almacenes de datos operativos, servicios web y sistemas de mensajería en tiempo real, y otras aplicaciones empresariales. DataStage da soporte a los patrones ETL (extraer, transformar y cargar) y ELT (extraer, cargar y transformar). DataStage utiliza el proceso paralelo y la conectividad empresarial para proporcionar una plataforma realmente escalable.

DataStage forma parte de Cloud Pak for Data as a Service y proporciona las prestaciones de integración de datos de la arquitectura de entramado de datos.

Un diagrama que muestra cómo se ajusta DataStage en la arquitectura de servicio para Cloud Pak for Data as a Service.

Con el tiempo de ejecución remoto como servicio del motor paralelo (PX) de DataStage , puede ejecutar trabajos en IBM Cloud y en ubicaciones remotas precompiladas gestionadas por IBM. Al utilizar una ubicación remota como entorno, puede eliminar total o parcialmente la necesidad de mover o copiar datos de otras nubes públicas. Si incorpora cargas de trabajo a la ubicación de los datos, mejorará el rendimiento, cumplirá los requisitos de residencia de datos e incurrirá en costes de transferencia de datos más bajos.

Con IBM DataStage, su empresa puede alcanzar estos objetivos:

  • Diseñar flujos de datos que extraen información de varios sistemas de origen, transformar los datos según convenga, y entregar los datos a bases de datos o aplicaciones de destino.
  • Conectar directamente a aplicaciones empresariales como orígenes o destinos para garantizar que los datos sean relevantes, completos y precisos.
  • Reducir el tiempo de desarrollo y mejorar la coherencia del diseño y el despliegue, utilizando las funciones creadas previamente.
  • Minimizar el ciclo de entrega del proyecto trabajando con un conjunto común de herramientas en Watson Studio.

Este servicio añade una herramienta en los proyectos.

Enlaces rápidos

Servicios integrados

Tabla 1. Servicios relacionados. Los siguientes servicios relacionados se utilizan a menudo con este servicio y proporcionan características complementarias, pero no son necesarios.
Servicio Prestación
Watson™ Knowledge Catalog Cree catálogos de activos organizados con esta plataforma segura de gestión de catálogos de empresa que está soportada por la infraestructura de gobernabilidad de datos.
Watson Studio Prepare, analice y modele datos en un entorno de colaboración con herramientas para científicos de datos, desarrolladores y expertos del dominio.