Opciones de cálculo de recursos para Data Refinery en proyectos
Cuando crea o edita un flujo de Data Refinery en un proyecto, se utiliza el entorno de ejecución de Default Data Refinery XS
. Sin embargo, cuando ejecuta un flujo de Data Refinery en un trabajo, elige una plantilla de entorno para el entorno de ejecución. La plantilla de entorno especifica el tipo, tamaño y alimentación de la configuración de hardware, además de la plantilla de software.
- Tipos de entornos
- Plantillas de entorno predeterminadas
- Uso de cálculo
- Modificación del tiempo de ejecución
- Registros de tiempo de ejecución para trabajos
Tipos de entornos
Puede utilizar estos tipos de entornos con Data Refinery:
- Entorno de ejecución de
Default Data Refinery XS
para ejecutar trabajos en conjuntos de datos pequeños. - Entornos de Spark para ejecutar trabajos en conjuntos de datos más grandes. Los entornos Spark tienen plantillas de entorno predeterminadas para que pueda empezar rápidamente. De lo contrario, puede crear plantillas de entorno personalizadas para entornos Spark. Debe utilizar un entorno Spark & R sólo si está trabajando en un conjunto de datos grande. Si el conjunto de datos es pequeño, debe seleccionar el tiempo de ejecución de
Default Data Refinery XS
. La razón es que, aunque el clúster de SparkR en un entorno de Spark & R es rápido y potente, requiere tiempo para crear, lo que se nota cuando se ejecuta un trabajo de Data Refinery en un conjunto de datos pequeño.
Plantillas de entorno predeterminadas
Cuando trabaja en Data Refinery, el tiempo de ejecución del entorno Default Data Refinery XS
se inicia y aparece como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. Este tiempo de ejecución después de una hora de inactividad en la interfaz de Data Refinery. Sin embargo, puede detenerlo manualmente en Tiempos de ejecución de la herramienta en la página Entornos .
Cuando crea un trabajo para ejecutar un flujo de Data Refinery en un proyecto, selecciona una plantilla de entorno. Después de iniciar un tiempo de ejecución para un trabajo, se lista como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. El tiempo de ejecución se detiene cuando se detiene la ejecución del trabajo de Data Refinery.
El seguimiento del uso de cálculo se realiza en horas de unidad de capacidad (CUH).
Nombre | Configuración de hardware | Unidades de capacidad por hora (CUH) |
---|---|---|
Data Refinery XS predeterminada | 3 vCPU y 12 GB de RAM | 1.5 |
Spark predeterminado 3.4 & R 4.2 | 2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM; Controlador: 1 vCPU y 4 GB de RAM |
1.5 |
Spark predeterminado 3.3 & R 4.2 En desuso |
2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM; Controlador: 1 vCPU y 4 GB de RAM |
1.5 |
Todas las plantillas de entorno predeterminadas para Data refinery están preparadas para HIPAA.
Las plantillas de entorno predeterminadas de Spark se listan en Plantillas en la página Entornos en el separador Gestionar del proyecto.
Uso de cálculo en proyectos
Puede supervisar el consumo de CUH de Watson Studio en la página Uso de recursos en el separador Gestionar del proyecto.
Cambio del tiempo de ejecución
No puede cambiar el tiempo de ejecución para trabajar en Data Refinery.
Puede cambiar el tiempo de ejecución para un trabajo de flujo de Data Refinery editando la plantilla de trabajo. Consulte Creación de trabajos en Data Refinery.
Registros de tiempo de ejecución para trabajos
Para ver los registros acumulados de un trabajo de Data Refinery:
- En la página Trabajos del proyecto, pulse el trabajo que ha ejecutado el flujo de Data Refinery cuyos registros desea ver.
- Pulse la ejecución del trabajo. Puede ver la cola del registro o descargar el archivo de registro completo.
Próximos pasos
Más información
Tema principal: Elección de recursos de cálculo para herramientas