0 / 0
Torna alla versione inglese della documentazione
Creazione di lavori negli spazi di distribuzione
Ultimo aggiornamento: 21 nov 2024
Creazione di lavori negli spazi di distribuzione

Un lavoro è un modo per eseguire un'implementazione batch o una risorsa autonoma come uno script, un notebook, un pacchetto di codice o un flusso in watsonx.ai Runtime. È possibile selezionare l'input e l'output per il lavoro e scegliere di eseguirlo manualmente o in base a una pianificazione. Da uno spazio di distribuzione, è possibile creare, pianificare, eseguire e gestire lavori.

  1. È necessario impostare le credenziali dell'attività generando una chiave API. Per ulteriori informazioni, vedere Gestione delle credenziali delle attività.

Creazione di un lavoro di distribuzione batch

Attenersi alla seguente procedura quando si crea un lavoro di distribuzione batch:

Importante: è necessario disporre di una distribuzione batch esistente per creare un lavoro batch.
  1. Dalla scheda Distribuzioni , selezionare la distribuzione e fare clic su Nuovo lavoro. Viene visualizzata la finestra di dialogo Crea lavoro .
  2. Nella sezione Definisci dettagli , immettere il nome del lavoro, una descrizione facoltativa e fare clic su Avanti.
  3. Nella sezione Configura , selezionare una specifica hardware. È possibile seguire questi passi per configurare facoltativamente le variabili di ambiente e le impostazioni di conservazione dell'esecuzione del job:
    • Facoltativo: se si sta distribuendo uno script Python , uno script R o un notebook, è possibile immettere le variabili di ambiente per passare i parametri al lavoro. Fai clic su Variabili di ambiente per immettere la coppia key - value .
    • Facoltativo: per evitare di terminare le risorse conservando tutti i metadati del job cronologici, seguire una delle seguenti opzioni:
      • Fare clic su Per quantità per impostare le soglie per salvare un numero impostato di esecuzioni di lavori e log associati.
      • Fare clic su Per durata (giorni) per impostare le soglie per il salvataggio delle risorse utente per un determinato numero di giorni.
  4. Facoltativo: nella sezione Pianificazione , attivare o disattivare il pulsante Pianificazione per pianificare un'esecuzione. È possibile impostare una data e un'ora per l'avvio della pianificazione e impostare una pianificazione per la ripetizione. Fare clic su Avanti.
Nota: se non si specifica una pianificazione, il job viene eseguito immediatamente.
  1. Facoltativo: nella sezione Notifica , attivare il pulsante Disattiva per attivare le notifiche associate a questo lavoro. Fare clic su Avanti.
Nota: puoi ricevere notifiche per tre tipi di eventi: riuscito, avvertenza e non riuscito.
  1. Nella sezione Scegli dati , fornire i dati in linea che corrispondono allo schema del modello. È possibile fornire l'input in formato JSON. Fare clic su Avanti. Vedi Esempio di payload JSON per i dati in linea.
  2. Nella sezione Revisiona e crea , verifica i dettagli del tuo lavoro e fai clic su Crea ed esegui.

Note:

  • I lavori pianificati vengono visualizzati sulla scheda Lavori dello spazio di distribuzione.

  • I risultati delle esecuzioni dei processi vengono scritti nel file di output specificato e salvati come asset di spazio.

  • Un asset di dati può essere un file di origine dati promosso allo spazio, un'origine dati connessa o tabelle da database e file da origini dati basate su file.

  • Se si escludono determinati giorni della settimana nella pianificazione del lavoro, il lavoro potrebbe non essere eseguito come ci si aspetterebbe. Il motivo è dovuto a una discrepanza tra il fuso orario dell'utente che crea la pianificazione e il fuso orario del nodo principale in cui viene eseguito il lavoro.

  • Quando si crea o si modifica un lavoro pianificato, viene generata una chiave API. Le esecuzioni future utilizzano questa chiave API generata.

Payload JSON di esempio per i dati in linea

{
  "deployment": {
    "id": "<deployment id>"
  },
  "space_id": "<your space id>",
  "name": "test_v4_inline",
  "scoring": {
  "input_data": [{
    "fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K"],
    "values": [[47, "M", "LOW", "HIGH", 0.739, 0.056], [47, "M", "LOW", "HIGH", 0.739, 0.056]]
    }]
  }
}

Accodamento ed esecuzioni di lavori simultanei

Il numero massimo di lavori simultanei per ogni distribuzione viene gestito internamente dal servizio di distribuzione. Per la distribuzione batch, per impostazione predefinita, è possibile eseguire due lavori contemporaneamente. Qualsiasi richiesta di lavoro di distribuzione per una distribuzione batch che dispone già di due lavori in esecuzione viene inserita in una coda per l'esecuzione in un secondo momento. Quando uno dei lavori in esecuzione viene completato, viene eseguito il lavoro successivo nella coda. La coda non ha limiti di dimensione.

Limitazione sull'utilizzo di payload inline di grandi dimensioni per le implementazioni batch

I lavori di distribuzione batch che utilizzano payload inline di grandi dimensioni potrebbero rimanere bloccati nello stato starting o running . Per ulteriori informazioni, consultare

Suggerimento: se si forniscono payload di grandi dimensioni alle distribuzioni batch, utilizzare i riferimenti ai dati invece di quelli in linea.

Conservazione dei metadati del lavoro di distribuzione

I metadati relativi al lavoro vengono conservati e possono essere acceduti fino a quando il lavoro e la relativa distribuzione non vengono eliminati.

Visualizzazione dei dettagli del lavoro di distribuzione

Quando si crea o si visualizza un lavoro batch, vengono visualizzati l'ID distribuzione e l'ID lavoro.

ID lavoro

  • L'ID di distribuzione rappresenta la definizione di distribuzione, incluse le configurazioni hardware e software e gli asset correlati.
  • L'ID lavoro rappresenta i dettagli di un lavoro, inclusi i dati di input e un'ubicazione di output e una pianificazione per l'esecuzione del lavoro.

Usare questi ID per fare riferimento al lavoro nelle richieste di watsonx.ai Runtime Data e AI Common Core API o nei notebook che utilizzano la libreria clientPython watsonx.ai.

Argomento principale: Gestione delle distribuzioni predittive

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni