0 / 0
Volver a la versión inglesa de la documentación
Opciones de cálculo de recursos para Data Refinery en proyectos

Opciones de cálculo de recursos para Data Refinery en proyectos

Cuando crea o edita un flujo de Data Refinery en un proyecto, se utiliza el entorno de ejecución de Default Data Refinery XS. Sin embargo, cuando ejecuta un flujo de Data Refinery en un trabajo, elige una plantilla de entorno para el entorno de ejecución. La plantilla de entorno especifica el tipo, tamaño y alimentación de la configuración de hardware, además de la plantilla de software.

Tipos de entornos

Puede utilizar estos tipos de entornos con Data Refinery:

  • Entorno de ejecución de Default Data Refinery XS para ejecutar trabajos en conjuntos de datos pequeños.
  • Entornos de Spark para ejecutar trabajos en conjuntos de datos más grandes. Los entornos Spark tienen plantillas de entorno predeterminadas para que pueda empezar rápidamente. De lo contrario, puede crear plantillas de entorno personalizadas para entornos Spark. Debe utilizar un entorno Spark & R sólo si está trabajando en un conjunto de datos grande. Si el conjunto de datos es pequeño, debe seleccionar el tiempo de ejecución de Default Data Refinery XS. La razón es que, aunque el clúster de SparkR en un entorno de Spark & R es rápido y potente, requiere tiempo para crear, lo que se nota cuando se ejecuta un trabajo de Data Refinery en un conjunto de datos pequeño.

Plantillas de entorno predeterminadas

Cuando trabaja en Data Refinery, el tiempo de ejecución del entorno Default Data Refinery XS se inicia y aparece como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. Este tiempo de ejecución después de una hora de inactividad en la interfaz de Data Refinery. Sin embargo, puede detenerlo manualmente en Tiempos de ejecución de la herramienta en la página Entornos .

Cuando crea un trabajo para ejecutar un flujo de Data Refinery en un proyecto, selecciona una plantilla de entorno. Después de iniciar un tiempo de ejecución para un trabajo, se lista como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. El tiempo de ejecución se detiene cuando se detiene la ejecución del trabajo de Data Refinery.

El seguimiento del uso de cálculo se realiza en horas de unidad de capacidad (CUH).

Plantillas de entorno preestablecidas disponibles en proyectos para Data Refinery
Nombre Configuración de hardware Unidades de capacidad por hora (CUH)
Data Refinery XS predeterminada 3 vCPU y 12 GB de RAM 1.5
Spark predeterminado 3.4 & R 4.2 2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM;
Controlador: 1 vCPU y 4 GB de RAM
1.5
Spark predeterminado 3.3 & R 4.2
En desuso
2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM;
Controlador: 1 vCPU y 4 GB de RAM
1.5
Nota: Spark 3.3 en Notebooks y JupyterLab está obsoleto. Aunque puede seguir utilizando Spark 3.3 para ejecutar sus cuadernos y scripts, considere pasar a Spark 3.4.

Todas las plantillas de entorno predeterminadas para Data refinery están preparadas para HIPAA.

Las plantillas de entorno predeterminadas de Spark se listan en Plantillas en la página Entornos en el separador Gestionar del proyecto.

Uso de cálculo en proyectos

Puede supervisar el consumo de CUH de Watson Studio en la página Uso de recursos en el separador Gestionar del proyecto.

Cambio del tiempo de ejecución

No puede cambiar el tiempo de ejecución para trabajar en Data Refinery.

Puede cambiar el tiempo de ejecución para un trabajo de flujo de Data Refinery editando la plantilla de trabajo. Consulte Creación de trabajos en Data Refinery.

Registros de tiempo de ejecución para trabajos

Para ver los registros acumulados de un trabajo de Data Refinery:

  1. En la página Trabajos del proyecto, pulse el trabajo que ha ejecutado el flujo de Data Refinery cuyos registros desea ver.
  2. Pulse la ejecución del trabajo. Puede ver la cola del registro o descargar el archivo de registro completo.

Próximos pasos

Más información

Tema principal: Elección de recursos de cálculo para herramientas

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información