Un trabajo es una forma de ejecutar un despliegue por lotes, o un activo autónomo como un script, un cuaderno, un paquete de código o un flujo en watsonx.ai Runtime. Puede seleccionar la entrada y salida para el trabajo y elegir ejecutarlo manualmente o según una planificación. Desde un espacio de despliegue, puede crear, planificar, ejecutar y gestionar trabajos.
Antes de empezar
Para mejorar la seguridad de la ejecución de los trabajos de despliegue, se requieren credenciales de tarea para las solicitudes de trabajos de despliegue. Para saber cómo configurar tus credenciales de tarea y generar una clave API, consulta Añadir credenciales de tarea.
- Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
Creación de un trabajo de despliegue por lotes
Siga estos pasos al crear un trabajo de despliegue por lotes:
- En el separador Despliegues , seleccione el despliegue y pulse Nuevo trabajo. Se abre el recuadro de diálogo Crear un trabajo .
- En la sección Definir detalles , especifique el nombre del trabajo, una descripción opcional y pulse Siguiente.
- En la sección Configurar , seleccione una especificación de hardware. Puede seguir estos pasos para configurar opcionalmente variables de entorno y valores de retención de ejecución de trabajos:
- Opcional: si está desplegando un script Python , un script R o un cuaderno, puede especificar variables de entorno para pasar parámetros al trabajo. Pulse Variables de entorno para especificar el par clave - valor .
- Opcional: Para evitar finalizar los recursos reteniendo todos los metadatos de trabajo históricos, siga una de estas opciones:
- Pulse Por cantidad para establecer umbrales para guardar un número establecido de ejecuciones de trabajos y registros asociados.
- Pulse Por duración (días) para establecer umbrales para guardar artefactos para un número especificado de días.
- Opcional: En la sección Planificar , conmute el botón Planificar desactivado para planificar una ejecución. Puede establecer una fecha y hora para el inicio de la planificación y establecer una planificación para la repetición. Pulse Siguiente.
- Opcional: En la sección Notificar , active el botón Desactivar para activar las notificaciones asociadas con este trabajo. Pulse Siguiente.
- En la sección Elegir datos , proporcione datos en línea que se correspondan con el esquema de modelo. Puede proporcionar entrada en el formador JSON utilizando un formulario. Pulse Siguiente. Consulte Ejemplo de carga útil JSON para datos en línea.
- En la sección Revisar y crear , verifique los detalles del trabajo y pulse Crear y ejecutar.
Notas:
Los trabajos planificados se visualizan en la pestaña Trabajos del espacio de despliegue.
Los resultados de las ejecuciones de trabajo se graban en el archivo de salida especificado y se guardan como un activo de espacio.
Un activo de datos puede ser un archivo de origen de datos que ha promocionado al espacio, un origen de datos conectado o tablas de bases de datos y archivos de orígenes de datos basados en archivos.
Si excluye determinados días de la semana en la planificación de trabajos, es posible que el trabajo no se ejecute como esperaba. La razón se debe a una discrepancia entre el huso horario del usuario que crea la planificación y el huso horario del nodo principal donde se ejecuta el trabajo.
Cuando crea o modifica un trabajo planificado, se genera una clave de API. Las ejecuciones futuras utilizan esta clave de API generada.
Carga útil JSON de ejemplo para datos en línea
{
"deployment": {
"id": "<deployment id>"
},
"space_id": "<your space id>",
"name": "test_v4_inline",
"scoring": {
"input_data": [{
"fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K"],
"values": [[47, "M", "LOW", "HIGH", 0.739, 0.056], [47, "M", "LOW", "HIGH", 0.739, 0.056]]
}]
}
}
Colocación en cola y ejecuciones simultáneas de trabajos
El número máximo de trabajos simultáneos para cada despliegue es manejado internamente por el servicio de despliegue. Para el despliegue por lotes, de forma predeterminada, se pueden ejecutar dos trabajos simultáneamente. Cualquier solicitud de trabajo de despliegue para un despliegue por lotes que ya tenga dos trabajos en ejecución se coloca en una cola para su ejecución posterior. Cuando se completa alguno de los trabajos en ejecución, se ejecuta el siguiente trabajo de la cola. La cola no tiene límite de tamaño.
Limitación en el uso de cargas útiles en línea grandes para despliegues por lotes
Los trabajos de despliegue por lotes que utilizan una carga útil en línea grande pueden atascarse en el estado starting
o running
. Para obtener más información, consulte Problemas conocidos y limitaciones.
Retención de metadatos de trabajos de despliegue
Los metadatos relacionados con el trabajo se conservan y se puede acceder a ellos hasta que se supriman el trabajo y su despliegue.
Visualización de los detalles del trabajo de despliegue
Cuando crea o visualiza un trabajo por lotes, se visualizan el ID de despliegue y el ID de trabajo.
- El ID de despliegue representa la definición de despliegue, incluidas las configuraciones de hardware y software y los activos relacionados.
- El ID de trabajo representa los detalles de un trabajo, incluidos los datos de entrada y una ubicación de salida y una planificación para ejecutar el trabajo.
Utilice estos identificadores para referirse al trabajo en las peticiones de tiempo de ejecución ' watsonx.ai ' API de datos e inteligencia artificial o en los cuadernos que utilicen ' watsonx.ai ' ' biblioteca cliente Python .
Tema padre: Gestión de despliegues predictivos