Opciones de cálculo de recursos para Data Refinery en proyectos

Para ejecutar trabajos de DataStage, debe seleccionar una plantilla de entorno para el motor de DataStage paralelo (PX). La plantilla de entorno especifica la configuración, el número de núcleos virtuales (vCPU) y la memoria para ejecutar el trabajo. Puede seleccionar distintas plantillas de entorno para cualquier trabajo en particular.

Tipos y ubicaciones de entorno

DataStage tiene un entorno de ejecución, el motor de DataStage PX. El motor de DataStage PX se puede ejecutar en un tipo de entorno SMP o MPP. Ambos tipos de entorno tienen configuraciones S (Small), M (Medium) y L (Large).

Puede utilizar estos tipos de entornos con DataStage:

  • Entorno SMP (un conductor)
  • Configuraciones de entorno MPP (un nodo conductor y uno o varios nodos de cálculo)

Plantillas de entorno predeterminadas

Para que pueda empezar rápidamente, el proyecto tiene plantillas de entorno precargadas para el entorno de ejecución del motor de DataStage PX. Puede seleccionar una de estas plantillas de entorno para ejecutar el trabajo en IBM Cloud.

El uso de cálculo se realiza por horas de unidad de capacidad (CUH) y diferentes entornos utilizan diferentes velocidades de unidades de capacidad por hora.

Nombre Configuración de hardware Unidades de capacidad por hora (CUH)
DataStage PX S predeterminado 1 conductor: 2 vCPU y 8 GB de RAM 1
DataStage PX M predeterminado 1 conductor: 4 vCPU y 16 GB de RAM 2
DataStage PX L predeterminado 1 conductor: 8 vCPU y 32 GB de RAM 4
DataStage PX (MPP) S predeterminado 1 conductor: 1 vCPU y 4 GB de RAM; 2 cálculos: 4 vCPU y 16 GB de RAM 9
DataStage PX (MPP) M predeterminado 1 conductor: 1 vCPU y 4 GB de RAM; 4 cálculos: 4 vCPU y 16 GB de RAM 17
DataStage PX (MPP) L predeterminado 1 conductor: 1 vCPU y 4 GB de RAM; 8 cálculos: 4 vCPU y 16 GB de RAM 33

El número de horas de unidad de capacidad que se utilizan para un trabajo de DataStage se basa en la calificación de unidad de capacidad del entorno y en el número de segundos que el tiempo de ejecución ha estado activo.

Los tiempos de ejecución de DataStage se detienen automáticamente cuando se completa el proceso.

Uso de cálculo en proyectos

Puede supervisar la cantidad total mensual de consumo de CUH para el servicio DataStage en la página Entornos.

Ámbito de tiempo de ejecución

La plantilla de entorno de ejecución que seleccione es específica del trabajo que ha seleccionado y los recursos de cálculo de dicho entorno no se comparten con otros trabajos de DataStage. También tiene la flexibilidad de ejecutar el mismo trabajo en diferentes configuraciones de entorno actualizando el entorno que desea para dicho trabajo.

Para actualizar el entorno que desea utilizar:

  • En el lienzo del flujo, seleccione el icono de valores de ejecución y seleccione el entorno que desea utilizar.
  • Seleccione un trabajo, edite la configuración del trabajo y, en el separador de valores de ejecución, cambie el entorno.

Cambio del tiempo de ejecución

Puede cambiar el tiempo de ejecución de un trabajo de DataStage editando la definición de trabajo. Consulte Creación de trabajos en DataStage.

Más información

Tema principal: Elección de recursos de cálculo para herramientas