0 / 0
Volver a la versión inglesa de la documentación
Entornos deDataStage
Última actualización: 09 dic 2024
Entornos de DataStage

Controle cómo se ejecutan los trabajos de DataStage en el motor de ejecución configurando entornos. Puede ejecutar trabajos de DataStage en entornos en IBM Cloud o puede ejecutar trabajos localmente configurando entornos con sus propios motores de tiempo de ejecución remotos de DataStage .

DataStage en IBM Cloud

IBM® DataStage® ofrece tres entornos PX que puede utilizar para ejecutar los trabajos. Un trabajo utiliza Default DataStage PX S runtime de forma predeterminada. Sin embargo, antes de ejecutar el flujo como un trabajo, puede actualizar el entorno a cualquiera de los tres entornos disponibles.

Los tres tiempos de ejecución de IBM Cloud consumen horas de unidad de capacidad (CUH) de las que se realiza un seguimiento. Solo se realiza un seguimiento del tiempo que se tarda en ejecutar trabajos. La creación, configuración y actualización de flujos en el lienzo de DataStage no utiliza ninguna CUH.

Al crear un trabajo en el que ejecutar un flujo de DataStage , puede seleccionar uno de los siguientes entornos preestablecidos:

Nombre Configuración de hardware
Default DataStage PX S 1 conductor: 2 vCPU y 8 GB de RAM
Default DataStage PX M 1 conductor: 4 vCPU y 16 GB de RAM
Default DataStage PX L 1 conductor: 8 vCPU y 32 GB de RAM

El tiempo de ejecución predeterminado de DataStage PX S se utiliza cuando se ejecuta un trabajo para extraer, transformar y cargar datos en DataStage, a menos que se seleccione un entorno diferente. Para trabajos complejos con conjuntos de datos grandes, seleccione planes con más vCPU y memoria para aumentar la capacidad. Los entornos predeterminados utilizan 2 particiones.

Para actualizar el entorno que desea utilizar:

  • En el lienzo de DataStage , seleccione el icono de valores de ejecución y seleccione el entorno que desea utilizar.
  • Seleccione un trabajo, edite la configuración del trabajo y, en el separador de valores de ejecución, cambie el entorno.

Los administradores pueden crear nuevos entornos para IBM Cloud para especificar variables de entorno y cambiar el número de particiones.

Entornos de DataStage en motores de tiempo de ejecución remotos

Puede ejecutar trabajos en un entorno que no esté gestionado por IBM utilizando un motor de tiempo de ejecución remoto. Con un motor de tiempo de ejecución remoto de DataStage , puede utilizar aplicaciones y bases de datos locales y ejecutar trabajos localmente. Un administrador puede configurar motores de tiempo de ejecución remotos de DataStage a nivel de proyecto. Los desarrolladores con acceso de editor o administrador a un proyecto con un motor de tiempo de ejecución remoto de DataStage pueden ejecutar trabajos en ese entorno.

Una vez que haya seleccionado un entorno remoto como entorno predeterminado de proyecto, sólo podrá utilizar entornos remotos en dicho proyecto. No puede volver a utilizar entornos de IBM Cloud para los trabajos de DataStage de ese proyecto.

Los entornos remotos proporcionan las ventajas siguientes:
  • Ejecutar cargas de trabajo y datos de proceso localmente
  • Evite costes de transferencia de datos
  • Aumentar la seguridad manteniendo los datos locales en su entorno cloud
  • Utilice las características de DataStage de Cloud Pak for Data como, por ejemplo, las etapas definidas por el usuario, la etapa Java Integration, las rutinas de trabajo Antes/Después, etc., sin mantener una instalación completa de Cloud Pak for Data

Los entornos remotos no dan soporte a conectores que necesitan una carga de controlador, cajas fuertes y el conector de servicio de datos. Sólo se admiten varios conectores a través de una conexión de flujo.

Para más información, consulte DataStage Anywhere.

Ejecución de un flujo

Puede crear un trabajo en el que ejecutar el flujo de DataStage :

  • Directamente en el lienzo de DataStage pulsando el icono de ejecución en la barra de herramientas de DataStage (el nombre predeterminado de un trabajo que ejecuta un flujo es el nombre del flujo añadido con .DataStage job
  • En la página Flujos deDataStage del proyecto, seleccione el flujo de DataStage y pulse el menú Acción y seleccione Nuevo trabajo.

Cuando ejecutas un trabajo para extraer, transformar o cargar datos en DataStage, se inicia automáticamente un ' Default DataStage XS runtime ' y aparece como tiempo de ejecución activo en la página Entornos de tu proyecto. Puede actualizar el entorno que desea utilizar seleccionando el icono de valores de ejecución en el lienzo de DataStage o seleccionando un trabajo en el separador Trabajos y cambiando los valores allí.

Supervisión de la facturación mensual

Debe ser el propietario o el administrador de la cuenta de IBM Cloud para ver la información sobre uso de recursos.

Para ver los cargos mensuales, la cantidad de CUH utilizada, el número de VPC utilizadas y el número de usuarios para la instancia de servicio, vaya al panel de control de uso de la nube. Para cada instancia, pulse Gestionar > Facturación y uso > Uso, pulse Ver instancias junto al nombre de servicio y, a continuación, pulse Instancia de vista junto al nombre de instancia.

Registros de tiempo de ejecución para trabajos

Para ver los registros acumulados para un trabajo de DataStage :

  1. En la página Trabajos del proyecto, pulse el trabajo DataStage para el que desea ver los registros.
  2. Pulse la ejecución del trabajo. Puede ver el registro de trabajo, copiar el registro en el portapapeles o descargar el registro.