Befolgen Sie diese Regeln, wenn Sie Eingabedetails für Batch-Bereitstellungen von SPSS angeben.
Übersichtstabelle für Datentypen:
Daten | Beschreibung |
---|---|
Typ | datenreferenzen, inline |
Dateiformate | CSV |
Datenquellen
Referenzen für Eingangs- oder Ausgangsdaten:
- Lokale oder verwaltete Vermögenswerte aus dem Weltraum
- Verbundene (ferne) Assets aus den folgenden Quellen:
Hinweise:
- Für Verbindungen des Typs Cloud Object Storage oder Cloud Object Storage (infrastructure) müssen Sie Zugriffsschlüssel und geheime Schlüssel konfigurieren, die auch als HMAC-Berechtigungsnachweise bezeichnet werden.
- Für SPSS sind diese Datenquellen nicht mit dem Federal Information Processing Standard (FIPS) konform:
- Cloud Object Storage
- Cloud Object Storage (infrastructure)
- Speicherdatenträger
- Tabellennamen, die in Ein- und Ausgabedatenreferenzen angegeben sind, werden ignoriert. Tabellennamen, auf die im SPSS verwiesen wird, werden während der Batch-Bereitstellung verwendet.
- Verwenden Sie SQL PushBack, um SQL-Anweisungen für IBM SPSS Modeler zu generieren, die in die Datenbank "zurückgeschoben" oder dort ausgeführt werden können, um die Leistung zu verbessern. SQL Pushback wird nur unterstützt von:
- Db2
- SQL Server
- Netezza Performance Server
Verwendung verbundener Daten für eine Batch-Bereitstellung
Ein SPSS Modeler kann eine Reihe von Import- und Exportknoten für Daten enthalten. Wenn die Knoten Datenbankverbindungen verwenden, müssen sie mit den Tabellennamen in den Datenquellen und Zielen konfiguriert werden. Diese Tabellennamen werden später für Batchaufträge verwendet. Verwenden Sie Daten-Asset-Knoten zum Importieren von Daten und Daten-Asset-Export-Knoten zum Exportieren von Daten. Wenn Sie die Knoten konfigurieren, wählen Sie den Tabellennamen aus Connections; wählen Sie kein Daten-Asset in Ihrem Projekt. Legen Sie die Knoten und Tabellennamen fest, bevor Sie das Modell speichern und an watsonx.ai Runtime übergeben.
Wenn Sie das Modell in einem Bereitstellungsbereich einsetzen, überprüfen Sie, ob die Knoten eine Verbindung zu einer unterstützten Datenbank im Bereitstellungsbereich herstellen. Bei einer Batch-Bereitstellung des Modells werden die Verbindungsdetails aus den Eingabe- und Ausgabedatenreferenzen ausgewählt, aber die Namen der Eingabe- und Ausgabetabellen werden aus dem SPSS Modeler ausgewählt. Die Namen der Ein- und Ausgabetabellen, die in den angeschlossenen Datenreferenzen angegeben sind, werden ignoriert.
Für die Batch-Bereitstellung eines SPSS, das eine Cloud Object Storage verwendet, stellen Sie sicher, dass das SPSS einen einzigen Eingangs- und Ausgangsdaten-Asset-Knoten hat.
Unterstützte Kombinationen von Eingabe- und Ausgabequellen
Sie müssen kompatible Datenquellen und Ziele für den Batchjob-Input und den Output angeben. Wenn Sie inkompatible Datenquellen und Ziele angeben, erhalten Sie eine Fehlermeldung, wenn Sie versuchen, den Batchauftrag auszuführen.
Die folgenden Kombinationen werden für Batch-Jobs unterstützt:
SPSS Eingabe/Ausgabe | Eingabe für Batchbereitstellungsjobs | Ausgabe des Batchbereitstellungsjobs |
---|---|---|
Datei | Lokaler, verwalteter oder referenzierter Datenbestand oder Verbindungsbestand (Datei) | Ferne Datenasset-oder -verbindungsanlage (Datei) oder Name |
Datenbank | Ferne Datenasset-oder Verbindungsanlage (Datenbank) | Ferne Datenasset-oder Verbindungsanlage (Datenbank) |
Mehrere Eingaben angeben
Wenn Sie mehrere Eingaben für eine SPSS ohne Schema angeben, geben Sie eine ID für jedes Element in " input_data_references
an.
Weitere Informationen finden Sie unter Verwendung mehrerer Datenquellen für einen SPSS.
In diesem Beispiel geben Sie bei der Erstellung des Auftrags drei Eingabeeinträge mit den IDs ' sample_db2_conn
, ' sample_teradata_conn
und ' sample_googlequery_conn
an und wählen die gewünschten verbundenen Daten für jede Eingabe.
{
"deployment": {
"href": "/v4/deployments/<deploymentID>"
},
"scoring": {
"input_data_references": [{
"id": "sample_db2_conn",
"name": "DB2 connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_teradata_conn",
"name": "Teradata connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_googlequery_conn",
"name": "Google bigquery connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}],
"output_data_references": {
"id": "sample_db2_conn",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}
}
Programmatische Angabe von Datenreferenzen
Wenn Sie Eingangs- und Ausgangsdatenreferenzen programmatisch angeben:
- Datenquellenreferenz
type
hängt vom Assettyp ab. Weitere Informationen finden Sie im Abschnitt Referenztypen für Datenquellen in Datenassets zu einem Bereitstellungsbereich hinzufügen. - SPSS-Jobs unterstützen mehrere Datenquelleneingaben und eine einzelne Ausgabe. Wenn das Schema beim Speichern des Modells nicht in den Metadaten enthalten war, müssen Sie "
id
manuell eingeben und für jede Verbindung ein Datenelement auswählen. Wenn das Schema in den Metadaten für das Modell angegeben ist, werden die "id
-Namen automatisch durch die Verwendung von Metadaten gefüllt. Sie wählen in watsonx.ai Studio das Daten-Asset für den entsprechenden 'id
s aus. Weitere Informationen finden Sie unter Verwendung mehrerer Datenquellen für einen SPSS. - Um ein lokales oder verwaltetes Asset als Ausgangsdatenreferenz zu erstellen, muss das Feld "
name
für "output_data_reference
angegeben werden, damit ein Daten-Asset mit dem angegebenen Namen erstellt wird. Sie können keinen "href
angeben, der sich auf ein bestehendes lokales Daten-Asset bezieht.
Verbundene Datenbestände, die auf unterstützte Datenbanken verweisen, können nur dann im " output_data_references
erstellt werden, wenn der " input_data_references
ebenfalls auf eine dieser Quellen verweist.
Wenn Sie einen Auftrag unter Verwendung des Python erstellen, müssen Sie den Verbindungsnamen, auf den in den Datenknoten des SPSS verwiesen wird, im Feld "
id
und das Daten-Asset href in "location.href
für die Eingabe-/Ausgabedatenreferenzen der Nutzlast des Bereitstellungsauftrags angeben. Sie können die Nutzlast des Auftrags zum Beispiel wie folgt zusammenstellen:job_payload_ref = { client.deployments.ScoringMetaNames.INPUT_DATA_REFERENCES: [{ "id": "DB2Connection", "name": "drug_ref_input1", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href1> } },{ "id": "Db2 WarehouseConn", "name": "drug_ref_input2", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href2> } }], client.deployments.ScoringMetaNames.OUTPUT_DATA_REFERENCE: { "type": "data_asset", "connection": {}, "location": { "href": <output_asset_href> } } }
Übergeordnetes Thema: Eingabedetails für Batchbereitstellung nach Framework