0 / 0
Zurück zur englischen Version der Dokumentation
SPSS Modeler -Stapeljob mit mehreren Datenquellen erstellen
Letzte Aktualisierung: 21. Nov. 2024
SPSS Modeler -Stapeljob mit mehreren Datenquellen erstellen

In einem SPSS Modeler-Ablauf werden häufig mehrere Import- und Exportknoten verwendet, wobei mehrere Importknoten Daten aus einer oder mehreren relationalen Datenbanken abrufen können. Sie können watsonx.ai Runtime verwenden, um einen SPSS Modeler zu erstellen, der auch mehrere Datenquellen aus relationalen Datenbanken verwendet.

Hinweis:

In den Beispielen werden IBM Db2 und IBM Db2 Warehouseverwendet, die in Beispielen als dashdbbezeichnet werden.

Verbindung zu mehreren relationalen Datenbanken als Eingabe für einen Batch-Job herstellen

Die Anzahl der Importknoten in einem SPSS Modeler-Ablauf kann variieren. Sie können z. B. 60 oder 70 verwenden. Die Anzahl unterschiedlicher Verbindungen zu Datenbanken in diesen Fällen sind jedoch nur wenige, obwohl die Tabellennamen, auf die über die Verbindungen zugegriffen wird, variieren. Anstatt die Details für jede Tabellenverbindung anzugeben, konzentriert sich der hier beschriebene Ansatz auf die Datenbankverbindungen. Die Batch-Jobs akzeptieren eine Liste von Datenverbindungen oder Referenzen nach Knotennamen, die auf Verbindungsnamen in den Importknoten des SPSS Modeler-Flows abgebildet werden.

Das Diagramm zeigt, wie drei Eingabeknoten für einen SPSS Modeler-Ablauf zu einem einzigen Ausgabeknoten kombiniert werden, um die Daten in einen anderen Connector zu exportieren. Nachdem Sie das SPSS-Modell oder den Fluss in einem Bereitstellungsraum gespeichert haben, erstellen Sie eine Batch-Bereitstellung und stellen Eingabedaten für jeden der drei Eingabeknoten im Fluss bereit. Führen Sie den Job aus, um die einzelne Ausgabedatei für die Implementierung zu erstellen.

Fluss von der Modellbildung zur Schaffung von Arbeitsplätzen

Einschränkung : Die Verbindungsreferenz für einen Knoten in einem Flow wird durch die Referenz überschrieben, die vom Batch-Job empfangen wurde. Der Tabellenname im Import-oder Exportknoten wird jedoch nicht überschrieben.

Ablauf in SPSS Modeler mit Beispiel

Das folgende Diagramm zeigt einen typischen SPSS Modeler Ablauf. Der Fluss verwendet mehrere Konnektoren als Eingabe in SPSS Modeler und exportiert Daten in einen einzigen Konnektor als Ausgabe. In diesem Beispiel wird das Modell durch eine Verbindung zu drei Connectors konfiguriert, einschließlich einer Verbindung zu Db2 Warehouse (dashDB) und zwei Verbindungen zu Db2 -Datenbanken. Die Importknoten lesen Daten aus insgesamt 40 Tabellen, einschließlich 30 Tabellen aus Db2 Warehouse und 5 Tabellen aus zwei Db2 -Datenbanken. Der Exportknoten schreibt Daten in eine einzelne Ausgabetabelle (Tabelle X), die als einzelne Db2 -Verbindung exportiert werden kann.

SPSS Modeler -Ablauf mit mehreren Eingaben

Beispiel

Die folgenden Schritte veranschaulichen, wie die Verbindungen erstellt und die Tabellen angegeben werden.

  1. Erstellen Sie eine Verbindung in Ihrem Projekt.

    Um den SPSS Modeler Ablauf auszuführen, starten Sie in Ihrem Projekt und erstellen eine Verbindung für jede der drei Datenbanken, mit denen Ihr Ablauf verbunden ist.

    Für dieses Beispiel lauten die Datenbankverbindungen im Projekt dashdb_conn, db2_conn1und db2_conn2.

  2. Konfigurieren Sie die Data Asset-Knoten in Ihrem SPSS Modeler-Flow, um die Verbindungen zu verwenden.

    Konfigurieren Sie jeden Knoten in Ihrem Ablauf so, dass er auf eine der drei von Ihnen erstellten Verbindungen verweist (dashdb_conn, db2_conn1 und db2_conn2), und geben Sie dann eine Tabelle für jeden Knoten an.

    Anmerkung: Der Name der Verbindung kann zum Zeitpunkt der Jobausführung geändert werden. Die Tabellennamen, die Sie im Flow auswählen, werden referenziert, wenn der Job ausgeführt wird. Sie können sie nicht überschreiben oder ändern.
  3. Speichern Sie das SPSS im watsonx.ai Runtime Repository.

    Es ist hilfreich, das Eingabe- und Ausgabeschema anzugeben, wenn Sie ein Modell speichern. Es vereinfacht den Prozess der Identifizierung der einzelnen Eingaben, wenn Sie den Batch-Job in der watsonx.ai Studio-Benutzeroberfläche erstellen. Verbindungen, auf die in den Datenassetknoten des SPSS Modeler -Ablaufs verwiesen wird, müssen im Feld Knotenname des Eingabeschemas angegeben werden. Für die Suche nach dem Knotennamen klicken Sie doppelt auf den Datenassetimportknoten in Ihrem Ablauf, um die zugehörigen Eigenschaften zu öffnen:

    Name des Datenassetimportknotens

    Hinweis:

    SPSS-Modelle, die ohne Schemata gespeichert werden, werden weiterhin für Aufträge unterstützt, aber Sie müssen Knotennamen-Felder manuell eingeben und das Daten-Asset bereitstellen, wenn Sie den Auftrag erstellen.

    Dieses Codebeispiel zeigt, wie das Eingabeschema gespeichert wird, wenn Sie ein Modell speichern (Endpunkt: POST /v4/models).

         {
               "name": "SPSS Drug Model",
               "label_column": "label",
               "type": "spss-modeler_18.1",
               "runtime": {
                       "href": "/v4/runtimes/spss-modeler_18.1"
                },
                "space": {
                       "href": "/v4/spaces/<space_id>"
                },
                "schemas": {
                          "input":  [ { "id": "dashdb_conn", "fields": [] },
                                            { "id": "db2_conn1 ", "fields": [] } ,
                                            { "id": "db2_conn2", "fields": [] } ],
                           "output": [{ "id": "db2_conn2 ","fields": [] }]
                 }
         }
    
    Anmerkung: Die Anzahl der Felder in jeder dieser Verbindungen spielt keine Rolle. Sie werden nicht überprüft oder verwendet. Wichtig ist die Anzahl der verwendeten Verbindungen.
  4. Erstellen Sie die Batchbereitstellung für das SPSS-Modell.

    Bei SPSS -Modellen ist der Erstellungsprozess des Batchbereitstellungsjobs identisch. Sie können die Bereitstellung mit dem Modell erstellen, das im vorherigen Schritt erstellt wurde.

  5. Erstellen Sie SPSS Batchaufträge.

    Sie können einen Batch-Job über die Benutzeroberfläche watsonx.ai Studio oder über die REST-API erstellen. Wenn das Schema zusammen mit einem Modell gespeichert wird, erleichtert die Benutzeroberfläche von watsonx.ai Studio die Annahme von Eingaben über die im Schema angegebenen Verbindungen. Da Sie die Datenverbindungen bereits erstellt haben, können Sie ein verbundenes Daten-Asset für jedes Knotennamenfeld auswählen, das in der watsonx.ai Studio-Benutzeroberfläche angezeigt wird, während Sie den Auftrag definieren.

    Der Name der Verbindung, die bei der Jobübergabe erstellt wird, kann sich von dem Namen unterscheiden, der bei der Modellerstellung verwendet wurde. Sie muss jedoch dem Feld Knotenname zugeordnet sein.

Erstellen von Aufträgen für Modelle, wenn das Schema nicht bereitgestellt wird

Wenn das Schema zum Zeitpunkt der Speicherung des Modells nicht in den Modellmetadaten bereitgestellt wird, müssen Sie den Importknotennamen manuell eingeben. Zudem müssen Sie für jede Verbindung das Daten-Asset in der watsonx.ai Studio-Benutzeroberfläche auswählen. Verbindungen, auf die in den Data Asset-Importknoten des SPSS Modeler -Ablaufs verwiesen wird, müssen im Feld Knotenname der Import-/Exportdatenreferenzen angegeben werden.

Verbindungen für einen Job mit dem Datenasset angeben

Dieses Codebeispiel zeigt, wie die Verbindungen für einen Auftrag angegeben werden, der über die REST-API (Endpunkt: /v4/deployment_jobs) erstellt wird.

         {
                     "deployment": {
                                    "href": "/v4/deployments/<deploymentID>"
                        },
                        "scoring": {
                                    "input_data_references": [
                                       {
                                          "id": "dashdb_conn",
                                          "name": "dashdb_conn",
                                          "type": "data_asset",
                                          "connection": {},
                                          "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn1 ",
                                             "name": "db2_conn1 ",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn2 ",
                                             "name": "db2_conn2",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }],
                                    "output_data_reference": {
                                             "id": "db2_conn2"
                                             "name": "db2_conn2",
                                             "type": "data_asset ",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }
         }

Übergeordnetes Thema: Eingabedetails für Batchbereitstellung nach Framework

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen