0 / 0
Volver a la versión inglesa de la documentación
Opciones de cálculo de recursos para Data Refinery en proyectos
Opciones de cálculo de recursos para Data Refinery en proyectos

Opciones de cálculo de recursos para Data Refinery en proyectos

Cuando crea o edita un flujo de Data Refinery en un proyecto, se utiliza el entorno de ejecución de Default Data Refinery XS. Sin embargo, cuando ejecuta un flujo de Data Refinery en un trabajo, elige una plantilla de entorno para el entorno de ejecución. La plantilla de entorno especifica el tipo, tamaño y alimentación de la configuración de hardware, además de la plantilla de software.

Tipos de entornos

Puede utilizar estos tipos de entornos con Data Refinery:

  • Entorno de ejecución de Default Data Refinery XS para ejecutar trabajos en conjuntos de datos pequeños.
  • Entornos de Spark para ejecutar trabajos en conjuntos de datos más grandes. Los entornos Spark tienen plantillas de entorno predeterminadas para que pueda empezar rápidamente. De lo contrario, puede crear plantillas de entorno personalizadas para entornos Spark. Solo debe utilizar un entorno de Spark & R 3.6 si trabaja en un conjunto de datos de gran tamaño. Si el conjunto de datos es pequeño, debe seleccionar el tiempo de ejecución de Default Data Refinery XS. Esto es debido a que, aunque el clúster SparkR de un entorno de Spark & R 3.6 es rápido y potente, requiere tiempo de creación, y esto se puede detectar cuando se ejecuta un trabajo de Data Refinery en conjuntos de datos pequeños.

Plantillas de entorno predeterminadas

Cuando trabaja en Data Refinery, el tiempo de ejecución del entorno Default Data Refinery XS se inicia y aparece como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. Este tiempo de ejecución después de una hora de inactividad en la interfaz de Data Refinery. Sin embargo, puede detenerlo manualmente en Tiempos de ejecución de la herramienta en la página Entornos .

Cuando crea un trabajo para ejecutar un flujo de Data Refinery en un proyecto, selecciona una plantilla de entorno. Después de iniciar un tiempo de ejecución para un trabajo, se lista como un tiempo de ejecución activo en Tiempos de ejecución de herramienta en la página Entornos en el separador Gestionar del proyecto. El tiempo de ejecución se detiene cuando se detiene la ejecución del trabajo de Data Refinery.

El seguimiento del uso de cálculo se realiza en horas de unidad de capacidad (CUH).

Plantillas de entorno preestablecidas disponibles en proyectos para Data Refinery
Nombre Configuración de hardware Unidades de capacidad por hora (CUH)
Spark 3.3 & R 3.6 predeterminado 2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM;
Controlador: 1 vCPU y 4 GB de RAM
1,5
Spark 3.2 & R 3.6
predeterminado (en desuso)
2 Ejecutores cada uno: 1 vCPU y 4 GB de RAM;
Controlador: 1 vCPU y 4 GB de RAM
1,5
Data Refinery XS predeterminado 3 vCPU y 12 GB de RAM 1,5

Todas las plantillas de entorno predeterminadas para Data refinery están preparadas para HIPAA.

Las plantillas de entorno predeterminadas de Spark se listan en Plantillas en la página Entornos en el separador Gestionar del proyecto.

Uso de cálculo en proyectos

Data Refinery se proporciona con Watson Studio y Watson Knowledge Catalog. No obstante, si dispone de ambos servicios, los recursos de cálculo que utiliza para trabajar en Data Refinery y para ejecutar trabajos para flujos de Data Refinery en proyectos no son acumulativos. Utilice el valor de CUH del plan con el nivel de prioridad más alto:

  1. Enterprise o Professional
  2. Standard
  3. Lite

Por ejemplo, si tiene el plan Lite de Watson Studio y el plan Professional de Watson Knowledge Catalog, se utiliza CUH de Watson Knowledge Catalog.

Si el nivel de plan de ambos servicios es el mismo, se utiliza CUH de Watson Knowledge Catalog. Por ejemplo, si tiene el plan Lite de Watson Studio y el plan Lite de Watson Knowledge Catalog, solo puede utilizar hasta el límite de CUH de Watson Knowledge Catalog. No puede pasar a utilizar CUH de Watson Knowledge Catalog.

Puede supervisar el consumo de CUH de Watson Studio en la página Uso de recursos en el separador Gestionar del proyecto.

No puede supervisar el consumo de CUH de Watson Knowledge Catalog.

Cambio del tiempo de ejecución

No puede cambiar el tiempo de ejecución para trabajar en Data Refinery.

Puede cambiar el tiempo de ejecución para un trabajo de flujo de Data Refinery editando la plantilla de trabajo. Consulte Creación de trabajos en Data Refinery.

Registros de tiempo de ejecución para trabajos

Para ver los registros acumulados de un trabajo de Data Refinery:

  1. En la página Trabajos del proyecto, pulse el trabajo que ha ejecutado el flujo de Data Refinery cuyos registros desea ver.
  2. Pulse la ejecución del trabajo. Puede ver la cola del registro o descargar el archivo de registro completo.

Próximos pasos

Más información

Tema principal: Elección de recursos de cálculo para herramientas