0 / 0
Torna alla versione inglese della documentazione
Creazione di un lavoro batch SPSS Modeler con più origini dati
Ultimo aggiornamento: 21 nov 2024
Creazione di un lavoro batch SPSS Modeler con più origini dati

In un flusso SPSS Modeler , è comune avere più nodi di importazione ed esportazione, in cui più nodi di importazione possono recuperare i dati da uno o più database relazionali. È possibile utilizzare watsonx.ai Runtime per creare un lavoro batch di SPSS Modeler che utilizza anche fonti di dati multiple da database relazionali.

Nota:

Gli esempi utilizzano IBM Db2 e IBM Db2 Warehouse, a cui si fa riferimento negli esempi come dashdb.

Connessione a più database relazionali come input a un lavoro batch

Il numero di nodi di importazione in un flusso SPSS Modeler può variare. È possibile utilizzare fino a 60 o 70. Tuttavia, il numero di connessioni distinte ai database in questi casi è solo di pochi, anche se i nomi tabella a cui si accede tramite le connessioni variano. Anziché specificare i dettagli per ogni connessione di tabella, l'approccio qui descritto si concentra sulle connessioni al database. I lavori batch accettano un elenco di connessioni ai dati o riferimenti per nome del nodo che sono mappati ai nomi delle connessioni nei nodi di importazione del flusso SPSS Modeler.

Il diagramma mostra come tre nodi di input per un flusso di modeler SPSS vengono combinati in un singolo nodo di output per esportare i dati in un altro connettore. Dopo aver salvato il modello o il flusso SPSS in uno spazio di distribuzione, si crea una distribuzione batch e si forniscono i dati di input per ciascuno dei tre nodi di input del flusso. Eseguire il lavoro per generare il singolo file di output per la distribuzione.

Flusso dalla creazione del modello alla creazione di posti di lavoro

Limitazione: il riferimento di connessione per un nodo in un flusso viene sovrascritto dal riferimento ricevuto dal lavoro batch. Tuttavia, il nome della tabella nel nodo di importazione o esportazione non viene sovrascritto.

Flusso SPSS Modeler con esempio

Il diagramma seguente mostra un tipico flusso SPSS Modeler. Il flusso utilizza più connettori come input in SPSS Modeler ed esporta i dati in un singolo connettore come output. In questo esempio, il modello viene configurato collegandosi a 3 connettori, inclusa una connessione a Db2 Warehouse (dashDB) e due connessioni ai database Db2 . I nodi di importazione leggono i dati da un totale di 40 tabelle, incluse 30 tabelle da Db2 Warehouse e 5 tabelle da due database Db2 . Il nodo di esportazione scrive i dati in una singola tabella di output, Tabella X, che può essere esportata come una singola connessione Db2 .

Flusso SPSS Modeler con più input

Esempio

Questa procedura illustra come creare le connessioni e identificare le tabelle.

  1. Creare una connessione nel progetto.

    Per eseguire il flusso SPSS Modeler, si parte dal progetto e si crea una connessione per ciascuno dei tre database a cui il flusso si collega.

    Per questo esempio, le connessioni database nel progetto sono denominate dashdb_conn, db2_conn1e db2_conn2.

  2. Configurare i nodi delle risorse di dati nel flusso SPSS Modeler per utilizzare le connessioni.

    Configurare ogni nodo del flusso in modo che faccia riferimento a una delle tre connessioni create (dashdb_conn, db2_conn1 e db2_conn2) e specificare una tabella per ogni nodo.

    Nota: è possibile modificare il nome della connessione al momento dell'esecuzione del lavoro. Ai nomi tabella selezionati nel flusso si fa riferimento quando viene eseguito il job. Non è possibile sovrascriverli o modificarli.
  3. Salvare il modello SPSS nel repository watsonx.ai Runtime.

    È utile fornire lo schema di input e output quando si salva un modello. Semplifica il processo di identificazione di ciascun input quando si crea il lavoro batch nell'interfaccia utente di watsonx.ai Studio. Le connessioni a cui si fa riferimento nei nodi Asset dati del flusso SPSS Modeler devono essere fornite nel campo nome nodo dello schema di input. Per individuare il nome nodo, fare doppio clic sul nodo di importazione Asset dati nel flusso per aprire le relative proprietà:

    Nome nodo di importazione asset di dati

    Nota:

    I modelli SPSS salvati senza schemi sono ancora supportati per i lavori, ma è necessario inserire manualmente i campi nome del nodo e fornire la risorsa dati quando si crea il lavoro.

    Questo esempio di codice mostra come salvare lo schema di input quando si salva un modello (Endpoint: POST /v4/models).

         {
               "name": "SPSS Drug Model",
               "label_column": "label",
               "type": "spss-modeler_18.1",
               "runtime": {
                       "href": "/v4/runtimes/spss-modeler_18.1"
                },
                "space": {
                       "href": "/v4/spaces/<space_id>"
                },
                "schemas": {
                          "input":  [ { "id": "dashdb_conn", "fields": [] },
                                            { "id": "db2_conn1 ", "fields": [] } ,
                                            { "id": "db2_conn2", "fields": [] } ],
                           "output": [{ "id": "db2_conn2 ","fields": [] }]
                 }
         }
    
    Nota: il numero di campi in ciascuna di queste connessioni non è importante. Non sono convalidati o utilizzati. Ciò che è importante è il numero di connessioni utilizzate.
  4. Creare la distribuzione batch per il modello SPSS .

    Per modelli SPSS , il processo di creazione del lavoro di distribuzione batch è lo stesso. È possibile creare l'installazione client con il modello creato nel passaggio precedente.

  5. Creare lavori batch SPSS.

    È possibile creare un lavoro batch dall'interfaccia utente di watsonx.ai Studio o utilizzando l'API REST. Se lo schema viene salvato con un modello, l'interfaccia utente di watsonx.ai Studio semplifica l'accettazione di input dalle connessioni specificate nello schema. Poiché sono già state create le connessioni dei dati, è possibile selezionare una risorsa di dati connessa per ogni campo del nome del nodo visualizzato nell'interfaccia utente di watsonx.ai Studio durante la definizione del lavoro.

    Il nome della connessione creata al momento dell'inoltro del lavoro può essere diverso da quello utilizzato al momento della creazione del modello. Tuttavia, deve essere assegnato al campo nome nodo .

Creare lavori per i modelli quando lo schema non è fornito

Se lo schema non viene fornito nei metadati del modello al momento del salvataggio del modello, è necessario immettere manualmente il nome nodo di importazione . Inoltre, è necessario selezionare la risorsa dati nell'interfaccia utente di watsonx.ai Studio per ogni connessione. Le connessioni a cui si fa riferimento nei nodi di importazione Asset dati del flusso SPSS Modeler devono essere fornite nel campo nome nodo dei riferimenti ai dati di importazione / esportazione.

Specifica delle connessioni per un lavoro con asset di dati

Questo esempio di codice mostra come specificare le connessioni per un lavoro creato utilizzando l'API REST (Endpoint: /v4/deployment_jobs).

         {
                     "deployment": {
                                    "href": "/v4/deployments/<deploymentID>"
                        },
                        "scoring": {
                                    "input_data_references": [
                                       {
                                          "id": "dashdb_conn",
                                          "name": "dashdb_conn",
                                          "type": "data_asset",
                                          "connection": {},
                                          "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn1 ",
                                             "name": "db2_conn1 ",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn2 ",
                                             "name": "db2_conn2",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }],
                                    "output_data_reference": {
                                             "id": "db2_conn2"
                                             "name": "db2_conn2",
                                             "type": "data_asset ",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }
         }

Argomento principale: Dettagli di input della distribuzione batch per framework

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni