Opciones de cálculo de recursos para Data Refinery en proyectos

Volver a la versión inglesa de la documentación

Cuando crea o edita un flujo de Data Refinery en un proyecto, se utiliza el entorno de ejecución de Default Data Refinery XS. Sin embargo, cuando ejecuta un flujo de Data Refinery en un trabajo, elige una plantilla de entorno para el entorno de ejecución. La plantilla de entorno especifica el tipo, tamaño y alimentación de la configuración de hardware, además de la plantilla de software.

Tipos de entornos
Plantillas de entorno predeterminadas
Uso de cálculo
Modificación del tiempo de ejecución
Registros de tiempo de ejecución para trabajos

Tipos de entornos

Puede utilizar estos tipos de entornos con Data Refinery:

Entorno de ejecución de Default Data Refinery XS para ejecutar trabajos en conjuntos de datos pequeños.
Entornos de Spark para ejecutar trabajos en conjuntos de datos más grandes. Los entornos Spark tienen plantillas de entorno predeterminadas para que pueda empezar rápidamente. De lo contrario, puede crear plantillas de entorno personalizadas para entornos Spark. Debe utilizar un entorno Spark & R sólo si está trabajando en un conjunto de datos grande. Si el conjunto de datos es pequeño, debe seleccionar el tiempo de ejecución de Default Data Refinery XS. La razón es que, aunque el clúster de SparkR en un entorno de Spark & R es rápido y potente, requiere tiempo para crear, lo que se nota cuando se ejecuta un trabajo de Data Refinery en un conjunto de datos pequeño.

Plantillas de entorno predeterminadas

Cuando trabaja en Data Refinery, el tiempo de ejecución del entorno Default Data Refinery XS se inicia y aparece como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. Este tiempo de ejecución después de una hora de inactividad en la interfaz de Data Refinery. Sin embargo, puede detenerlo manualmente en Tiempos de ejecución de la herramienta en la página Entornos .

Cuando crea un trabajo para ejecutar un flujo de Data Refinery en un proyecto, selecciona una plantilla de entorno. Después de iniciar un tiempo de ejecución para un trabajo, se lista como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. El tiempo de ejecución se detiene cuando se detiene la ejecución del trabajo de Data Refinery.

El seguimiento del uso de cálculo se realiza en horas de unidad de capacidad (CUH).

Plantillas de entorno preestablecidas disponibles en proyectos para Data Refinery
Nombre	Configuración de hardware	Unidades de capacidad por hora (CUH)
Data Refinery XS predeterminado	3 vCPU y 12 GB de RAM	1.5
Spark predeterminado 3.4 & R 4.2	2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM; Controlador: 1 vCPU y 4 GB de RAM	1.5
Spark predeterminado 3.3 & R 4.2 En desuso	2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM; Controlador: 1 vCPU y 4 GB de RAM	1.5

Todas las plantillas de entorno predeterminadas para Data refinery están preparadas para HIPAA.

Las plantillas de entorno predeterminadas de Spark se listan en Plantillas en la página Entornos en el separador Gestionar del proyecto.

Uso de cálculo en proyectos

Data Refinery se proporciona con Watson Studio e IBM Knowledge Catalog. No obstante, si dispone de ambos servicios, los recursos de cálculo que utiliza para trabajar en Data Refinery y para ejecutar trabajos para flujos de Data Refinery en proyectos no son acumulativos. Utilice el valor de CUH del plan con el nivel de prioridad más alto:

Enterprise o Professional
Standard
Lite

Por ejemplo, si tiene el plan Watson Studio Lite y el plan IBM Knowledge Catalog Professional, utilice IBM Knowledge Catalog CUH.

Si el nivel de plan de ambos servicios es el mismo, se utiliza CUH de Watson Knowledge Catalog. Por ejemplo, si tiene el plan Lite de Watson Studio y el plan Lite de IBM Knowledge Catalog , solo puede utilizar hasta el límite de Watson Studio CUH. No puede cambiar a utilizar IBM Knowledge Catalog CUH.

Puede supervisar el consumo de CUH de Watson Studio en la página Uso de recursos en el separador Gestionar del proyecto.

No puede supervisar el consumo de CUH de IBM Knowledge Catalog .

Cambio del tiempo de ejecución

No puede cambiar el tiempo de ejecución para trabajar en Data Refinery.

Puede cambiar el tiempo de ejecución para un trabajo de flujo de Data Refinery editando la plantilla de trabajo. Consulte Creación de trabajos en Data Refinery.

Registros de tiempo de ejecución para trabajos

Para ver los registros acumulados de un trabajo de Data Refinery:

En la página Trabajos del proyecto, pulse el trabajo que ha ejecutado el flujo de Data Refinery cuyos registros desea ver.
Pulse la ejecución del trabajo. Puede ver la cola del registro o descargar el archivo de registro completo.

Próximos pasos

Más información

Supervisión del uso de recursos de la cuenta

Tema principal: Elección de recursos de cálculo para herramientas