Un lavoro è un modo per eseguire un'implementazione batch o una risorsa autonoma come uno script, un notebook, un pacchetto di codice o un flusso in watsonx.ai Runtime. È possibile selezionare l'input e l'output per il lavoro e scegliere di eseguirlo manualmente o in base a una pianificazione. Da uno spazio di distribuzione, è possibile creare, pianificare, eseguire e gestire lavori.
Prima di iniziare
Per migliorare la sicurezza dell'esecuzione dei lavori di distribuzione, sono necessarie le credenziali dell'attività per le richieste di lavoro di distribuzione. Per sapere come impostare le credenziali dell'attività e generare una chiave API, vedere Aggiungi le credenziali dell'attività.
- È necessario impostare le credenziali dell'attività generando una chiave API. Per ulteriori informazioni, vedere Gestione delle credenziali delle attività.
Creazione di un lavoro di distribuzione batch
Attenersi alla seguente procedura quando si crea un lavoro di distribuzione batch:
- Dalla scheda Distribuzioni , selezionare la distribuzione e fare clic su Nuovo lavoro. Viene visualizzata la finestra di dialogo Crea lavoro .
- Nella sezione Definisci dettagli , immettere il nome del lavoro, una descrizione facoltativa e fare clic su Avanti.
- Nella sezione Configura , selezionare una specifica hardware. È possibile seguire questi passi per configurare facoltativamente le variabili di ambiente e le impostazioni di conservazione dell'esecuzione del job:
- Facoltativo: se si sta distribuendo uno script Python , uno script R o un notebook, è possibile immettere le variabili di ambiente per passare i parametri al lavoro. Fai clic su Variabili di ambiente per immettere la coppia key - value .
- Facoltativo: per evitare di terminare le risorse conservando tutti i metadati del job cronologici, seguire una delle seguenti opzioni:
- Fare clic su Per quantità per impostare le soglie per salvare un numero impostato di esecuzioni di lavori e log associati.
- Fare clic su Per durata (giorni) per impostare le soglie per il salvataggio delle risorse utente per un determinato numero di giorni.
- Facoltativo: nella sezione Pianificazione , attivare o disattivare il pulsante Pianificazione per pianificare un'esecuzione. È possibile impostare una data e un'ora per l'avvio della pianificazione e impostare una pianificazione per la ripetizione. Fare clic su Avanti.
- Facoltativo: nella sezione Notifica , attivare il pulsante Disattiva per attivare le notifiche associate a questo lavoro. Fare clic su Avanti.
- Nella sezione Scegli dati , fornire i dati in linea che corrispondono allo schema del modello. Puoi fornire l'input nel programma di formattazione JSON utilizzando un modulo. Fare clic su Avanti. Vedi Esempio di payload JSON per i dati in linea.
- Nella sezione Revisiona e crea , verifica i dettagli del tuo lavoro e fai clic su Crea ed esegui.
Note:
I lavori pianificati vengono visualizzati sulla scheda Lavori dello spazio di distribuzione.
I risultati delle esecuzioni dei processi vengono scritti nel file di output specificato e salvati come asset di spazio.
Un asset di dati può essere un file di origine dati promosso allo spazio, un'origine dati connessa o tabelle da database e file da origini dati basate su file.
Se si escludono determinati giorni della settimana nella pianificazione del lavoro, il lavoro potrebbe non essere eseguito come ci si aspetterebbe. Il motivo è dovuto a una discrepanza tra il fuso orario dell'utente che crea la pianificazione e il fuso orario del nodo principale in cui viene eseguito il lavoro.
Quando si crea o si modifica un lavoro pianificato, viene generata una chiave API. Le esecuzioni future utilizzano questa chiave API generata.
Payload JSON di esempio per i dati in linea
{
"deployment": {
"id": "<deployment id>"
},
"space_id": "<your space id>",
"name": "test_v4_inline",
"scoring": {
"input_data": [{
"fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K"],
"values": [[47, "M", "LOW", "HIGH", 0.739, 0.056], [47, "M", "LOW", "HIGH", 0.739, 0.056]]
}]
}
}
Accodamento ed esecuzioni di lavori simultanei
Il numero massimo di lavori simultanei per ogni distribuzione viene gestito internamente dal servizio di distribuzione. Per la distribuzione batch, per impostazione predefinita, è possibile eseguire due lavori contemporaneamente. Qualsiasi richiesta di lavoro di distribuzione per una distribuzione batch che dispone già di due lavori in esecuzione viene inserita in una coda per l'esecuzione in un secondo momento. Quando uno dei lavori in esecuzione viene completato, viene eseguito il lavoro successivo nella coda. La coda non ha limiti di dimensione.
Limitazione sull'utilizzo di payload inline di grandi dimensioni per le implementazioni batch
I lavori di distribuzione batch che utilizzano payload inline di grandi dimensioni potrebbero rimanere bloccati nello stato starting
o running
. Per ulteriori informazioni, vedi Problemi e limitazioni noti.
Conservazione dei metadati del lavoro di distribuzione
I metadati relativi al lavoro vengono conservati e possono essere acceduti fino a quando il lavoro e la relativa distribuzione non vengono eliminati.
Visualizzazione dei dettagli del lavoro di distribuzione
Quando si crea o si visualizza un lavoro batch, vengono visualizzati l'ID distribuzione e l'ID lavoro.
- L'ID di distribuzione rappresenta la definizione di distribuzione, incluse le configurazioni hardware e software e gli asset correlati.
- L'ID lavoro rappresenta i dettagli di un lavoro, inclusi i dati di input e un'ubicazione di output e una pianificazione per l'esecuzione del lavoro.
Usare questi ID per fare riferimento al lavoro nelle richieste di watsonx.ai Runtime Data e AI Common Core API o nei notebook che utilizzano la libreria clientPython watsonx.ai.
Argomento principale: Gestione delle distribuzioni predittive