Opciones de cálculo de recursos para Data Refinery en proyectos
Para ejecutar trabajos de DataStage, debe seleccionar una plantilla de entorno para el motor de DataStage paralelo (PX). La plantilla de entorno especifica la configuración, el número de núcleos virtuales (vCPU) y la memoria para ejecutar el trabajo. Puede seleccionar distintas plantillas de entorno para cualquier trabajo en particular.
- Tipos y ubicaciones de entorno
- Plantillas de entorno predeterminadas
- Uso de cálculo
- Ámbito de tiempo de ejecución
- Modificación del tiempo de ejecución
Tipos y ubicaciones de entorno
DataStage tiene un entorno de ejecución, el motor de DataStage PX. El motor de DataStage PX se puede ejecutar en un tipo de entorno SMP o MPP. Ambos tipos de entorno tienen configuraciones S (Small), M (Medium) y L (Large).
Puede utilizar estos tipos de entornos con DataStage:
- Entorno SMP (un conductor)
- Configuraciones de entorno MPP (un nodo conductor y uno o varios nodos de cálculo)
Plantillas de entorno predeterminadas
Para que pueda empezar rápidamente, el proyecto tiene plantillas de entorno precargadas para el entorno de ejecución del motor de DataStage PX. Puede seleccionar una de estas plantillas de entorno para ejecutar el trabajo en IBM Cloud.
El uso de cálculo se realiza por horas de unidad de capacidad (CUH) y diferentes entornos utilizan diferentes velocidades de unidades de capacidad por hora.
Nombre | Configuración de hardware | Unidades de capacidad por hora (CUH) |
---|---|---|
DataStage PX S predeterminado | 1 conductor: 2 vCPU y 8 GB de RAM | 2 |
DataStage PX M predeterminado | 1 conductor: 4 vCPU y 16 GB de RAM | 4 |
DataStage PX L predeterminado | 1 conductor: 8 vCPU y 32 GB de RAM | 8 |
El número de horas de unidad de capacidad que se utilizan para un trabajo de DataStage se basa en la calificación de unidad de capacidad del entorno y en el número de segundos que el tiempo de ejecución ha estado activo.
Los tiempos de ejecución de DataStage se detienen automáticamente cuando se completa el proceso.
Uso de cálculo en proyectos
Puede supervisar la cantidad total mensual de consumo de CUH para el servicio DataStage en la página Uso de recursos en el separador Gestionar del proyecto.
Las reglas de calidad de datos se ejecutan como flujos de DataStage y consumen CUH. Consulte Reglas de calidad de datos.
Ámbito de tiempo de ejecución
La plantilla de entorno de ejecución que seleccione es específica del trabajo que ha seleccionado y los recursos de cálculo de dicho entorno no se comparten con otros trabajos de DataStage. También tiene la flexibilidad de ejecutar el mismo trabajo en diferentes configuraciones de entorno actualizando el entorno que desea para dicho trabajo.
Para actualizar el entorno que desea utilizar:
- En el lienzo del flujo, seleccione el icono de valores de ejecución y seleccione el entorno que desea utilizar.
- Seleccione un trabajo, edite la configuración del trabajo y, en el separador de valores de ejecución, cambie el entorno.
Cambio del tiempo de ejecución
Puede cambiar el tiempo de ejecución de un trabajo de DataStage editando la definición de trabajo. Consulte Creación de trabajos en DataStage.
Más información
- DataStage
- Trabajos
- Planes de ofertas de DataStage
- Supervisión del uso de recursos de la cuenta
- Herramientas de línea de mandatos de DataStage
Tema principal: Elección de recursos de cálculo para herramientas