0 / 0
Zurück zur englischen Version der Dokumentation
Eingabedetails zur Batchbereitstellung für SPSS-Modelle
Letzte Aktualisierung: 28. Nov. 2024
Eingabedetails zur Batchbereitstellung für SPSS-Modelle

Befolgen Sie diese Regeln, wenn Sie Eingabedetails für Batch-Bereitstellungen von SPSS angeben.

Übersichtstabelle für Datentypen:

Daten Beschreibung
Typ datenreferenzen, inline
Dateiformate CSV

Datenquellen

Referenzen für Eingangs- oder Ausgangsdaten:

Hinweise:

  • Für Verbindungen des Typs Cloud Object Storage oder Cloud Object Storage (infrastructure) müssen Sie Zugriffsschlüssel und geheime Schlüssel konfigurieren, die auch als HMAC-Berechtigungsnachweise bezeichnet werden.
  • Für SPSS sind diese Datenquellen nicht mit dem Federal Information Processing Standard (FIPS) konform:
    • Cloud Object Storage
    • Cloud Object Storage (infrastructure)
    • Speicherdatenträger
  • Tabellennamen, die in Ein- und Ausgabedatenreferenzen angegeben sind, werden ignoriert. Tabellennamen, auf die im SPSS verwiesen wird, werden während der Batch-Bereitstellung verwendet.
  • Verwenden Sie SQL PushBack, um SQL-Anweisungen für IBM SPSS Modeler zu generieren, die in die Datenbank "zurückgeschoben" oder dort ausgeführt werden können, um die Leistung zu verbessern. SQL Pushback wird nur unterstützt von:
    • Db2
    • SQL Server
    • Netezza Performance Server

Verwendung verbundener Daten für eine Batch-Bereitstellung

Ein SPSS Modeler kann eine Reihe von Import- und Exportknoten für Daten enthalten. Wenn die Knoten Datenbankverbindungen verwenden, müssen sie mit den Tabellennamen in den Datenquellen und Zielen konfiguriert werden. Diese Tabellennamen werden später für Batchaufträge verwendet. Verwenden Sie Daten-Asset-Knoten zum Importieren von Daten und Daten-Asset-Export-Knoten zum Exportieren von Daten. Wenn Sie die Knoten konfigurieren, wählen Sie den Tabellennamen aus Connections; wählen Sie kein Daten-Asset in Ihrem Projekt. Legen Sie die Knoten und Tabellennamen fest, bevor Sie das Modell speichern und an watsonx.ai Runtime übergeben.

Wenn Sie das Modell in einem Bereitstellungsbereich einsetzen, überprüfen Sie, ob die Knoten eine Verbindung zu einer unterstützten Datenbank im Bereitstellungsbereich herstellen. Bei einer Batch-Bereitstellung des Modells werden die Verbindungsdetails aus den Eingabe- und Ausgabedatenreferenzen ausgewählt, aber die Namen der Eingabe- und Ausgabetabellen werden aus dem SPSS Modeler ausgewählt. Die Namen der Ein- und Ausgabetabellen, die in den angeschlossenen Datenreferenzen angegeben sind, werden ignoriert.

Für die Batch-Bereitstellung eines SPSS, das eine Cloud Object Storage verwendet, stellen Sie sicher, dass das SPSS einen einzigen Eingangs- und Ausgangsdaten-Asset-Knoten hat.

Unterstützte Kombinationen von Eingabe- und Ausgabequellen

Sie müssen kompatible Datenquellen und Ziele für den Batchjob-Input und den Output angeben. Wenn Sie inkompatible Datenquellen und Ziele angeben, erhalten Sie eine Fehlermeldung, wenn Sie versuchen, den Batchauftrag auszuführen.

Die folgenden Kombinationen werden für Batch-Jobs unterstützt:

SPSS Eingabe/Ausgabe Eingabe für Batchbereitstellungsjobs Ausgabe des Batchbereitstellungsjobs 
Datei Lokaler, verwalteter oder referenzierter Datenbestand oder Verbindungsbestand (Datei) Ferne Datenasset-oder -verbindungsanlage (Datei) oder Name
Datenbank Ferne Datenasset-oder Verbindungsanlage (Datenbank) Ferne Datenasset-oder Verbindungsanlage (Datenbank)

Mehrere Eingaben angeben

Wenn Sie mehrere Eingaben für eine SPSS ohne Schema angeben, geben Sie eine ID für jedes Element in " input_data_references an.

Weitere Informationen finden Sie unter Verwendung mehrerer Datenquellen für einen SPSS.

In diesem Beispiel geben Sie bei der Erstellung des Auftrags drei Eingabeeinträge mit den IDs ' sample_db2_conn, ' sample_teradata_conn und ' sample_googlequery_conn an und wählen die gewünschten verbundenen Daten für jede Eingabe.

{
"deployment": {
    "href": "/v4/deployments/<deploymentID>"
  },
  "scoring": {
  	  "input_data_references": [{
               "id": "sample_db2_conn",
               "name": "DB2 connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           },
           {
               "id": "sample_teradata_conn",
               "name": "Teradata connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           },
           {
               "id": "sample_googlequery_conn",
               "name": "Google bigquery connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           }],
  	  "output_data_references": {
  	  	        "id": "sample_db2_conn",
                "type": "data_asset",
                "connection": {},
                "location": {
                    "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                },
          }
}
Hinweis: Der Parameter für die Umgebungsvariablen von Verteilungsaufträgen ist nicht anwendbar.

Programmatische Angabe von Datenreferenzen

Wenn Sie Eingangs- und Ausgangsdatenreferenzen programmatisch angeben:

  • Datenquellenreferenz type hängt vom Assettyp ab. Weitere Informationen finden Sie im Abschnitt Referenztypen für Datenquellen in Datenassets zu einem Bereitstellungsbereich hinzufügen.
  • SPSS-Jobs unterstützen mehrere Datenquelleneingaben und eine einzelne Ausgabe. Wenn das Schema beim Speichern des Modells nicht in den Metadaten enthalten war, müssen Sie " id manuell eingeben und für jede Verbindung ein Datenelement auswählen. Wenn das Schema in den Metadaten für das Modell angegeben ist, werden die " id -Namen automatisch durch die Verwendung von Metadaten gefüllt. Sie wählen in watsonx.ai Studio das Daten-Asset für den entsprechenden ' ids aus. Weitere Informationen finden Sie unter Verwendung mehrerer Datenquellen für einen SPSS.
  • Um ein lokales oder verwaltetes Asset als Ausgangsdatenreferenz zu erstellen, muss das Feld " name für " output_data_reference angegeben werden, damit ein Daten-Asset mit dem angegebenen Namen erstellt wird. Sie können keinen " href angeben, der sich auf ein bestehendes lokales Daten-Asset bezieht.
Hinweis:

Verbundene Datenbestände, die auf unterstützte Datenbanken verweisen, können nur dann im " output_data_references erstellt werden, wenn der " input_data_references ebenfalls auf eine dieser Quellen verweist.

  • Wenn Sie einen Auftrag unter Verwendung des Python erstellen, müssen Sie den Verbindungsnamen, auf den in den Datenknoten des SPSS verwiesen wird, im Feld " id und das Daten-Asset href in " location.href für die Eingabe-/Ausgabedatenreferenzen der Nutzlast des Bereitstellungsauftrags angeben. Sie können die Nutzlast des Auftrags zum Beispiel wie folgt zusammenstellen:

    job_payload_ref = {
        client.deployments.ScoringMetaNames.INPUT_DATA_REFERENCES: [{
            "id": "DB2Connection",
            "name": "drug_ref_input1",
            "type": "data_asset",
            "connection": {},
            "location": {
                "href": <input_asset_href1>
            }
        },{
            "id": "Db2 WarehouseConn",
            "name": "drug_ref_input2",
            "type": "data_asset",
            "connection": {},
            "location": {
                "href": <input_asset_href2>
            }
        }],
        client.deployments.ScoringMetaNames.OUTPUT_DATA_REFERENCE: {
                "type": "data_asset",
                "connection": {},
                "location": {
                    "href": <output_asset_href>
                }
            }
        }
    

Übergeordnetes Thema: Eingabedetails für Batchbereitstellung nach Framework

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen