Translation not up to date
Při zadávání vstupních podrobností pro dávkové implementace modelů SPSS dodržujte tato pravidla.
Souhrnná tabulka datového typu:
Data | Popis |
---|---|
Typ | vložené, odkazy na data |
formáty souboru | CSV |
Zdroje dat
Odkazy na vstupní/výstupní data:
- Lokální/spravovaná aktiva z prostoru
- Připojená (vzdálená) aktiva z těchto zdrojů:
Poznámky:
- Pro připojení typu Cloud Object Storage nebo Cloud Object Storage (infrastructure)musíte nakonfigurovat Přístupový klíč a Tajný klíč, také známý jako HMAC pověření.
- Pro implementace produktu SPSS nejsou tyto zdroje dat kompatibilní se standardem FIPS (Federal Information Processing Standard):
- Cloud Object Storage
- Cloud Object Storage (infrastructure)
- svazky úložišť
Pokud určujete odkazy vstupních/výstupních dat programově:
Odkaz na zdroj dat
type
závisí na typu aktiva. Viz sekce Typy odkazů na zdroje dat v části Přidání datových aktiv do prostoru implementace.Úlohy SPSS podporují více vstupů zdrojů dat a jeden výstup. Pokud není schéma poskytnuto v metadatech modelu v době uložení modelu, musíte zadat
id
ručně a vybrat datové aktivum pro každé připojení. Je-li schéma poskytnuto v metadatech modelu, názvyid
se automaticky naplní daty pomocí metadat. Právě vyberete datové aktivum pro odpovídajícíid
v produktu Watson Studio. Podrobnosti naleznete v tématu Použití více zdrojů dat pro úlohu SPSS.Chcete-li vytvořit lokální nebo spravované aktivum jako odkaz na výstupní data, musí být pole
name
zadáno prooutput_data_reference
, aby bylo vytvořeno datové aktivum s uvedeným názvem. Uvedeníhref
, které odkazuje na existující lokální datové aktivum, není podporováno. Všimněte si, že připojená data aktiv, která odkazují na podporované databáze, mohou být vytvořena v produktuoutput_data_references
pouze tehdy, když seinput_data_references
také odkazuje na jeden z těchto zdrojů.Názvy tabulek, které jsou poskytovány ve vstupních a výstupních datech, jsou ignorovány. Během dávkové implementace se budou používat názvy tabulek, které jsou uvedeny v proudu modelu SPSS .
SQL PushBack vám umožňuje generovat příkazy SQL pro nativní operace IBM SPSS Modeler , které mohou být "odeslány zpět" do (které jsou prováděny v) databázi za účelem zlepšení výkonu. Příkaz SQL Pushback je podporován pouze s:
- Db2
- SQL Server
- Netezza Performance Server
Pokud vytváříte úlohu pomocí klienta Python , musíte poskytnout název připojení, který je uveden v datových uzlech proudu modelu SPSS v poli
id
, a odkaz datového aktiva href vlocation.href
pro vstupní/výstupní datové odkazy na informační obsah úlohy implementace. Například, můžete sestavit informační obsah úloh, jako je tento:job_payload_ref = { client.deployments.ScoringMetaNames.INPUT_DATA_REFERENCES: [{ "id": "DB2Connection", "name": "drug_ref_input1", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href1> } },{ "id": "Db2 WarehouseConn", "name": "drug_ref_input2", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href2> } }], client.deployments.ScoringMetaNames.OUTPUT_DATA_REFERENCE: { "type": "data_asset", "connection": {}, "location": { "href": <output_asset_href> } } }
Použití připojených dat pro úlohu toku produktu SPSS Modeler
Tok produktu SPSS Modeler může mít řadu vstupních a výstupních datových uzlů. Když se připojujete k podporované databázi jako vstupní a výstupní zdroj dat, všimněte si, že podrobnosti připojení jsou vybrány z odkazu na vstupní a výstupní data, ale názvy vstupních a výstupních tabulek jsou vybrány z proudového souboru modelu SPSS .
Chcete-li provést dávkovou implementaci modelu SPSS , který používá databázové připojení, ujistěte se, že uzly vstupu a výstupu modeláře jsou uzly datového aktiva. V produktu SPSS Modelermusí být uzly datového aktiva nakonfigurovány s názvy tabulek, které budou použity později pro předpovědi úloh. Před uložením modelu do produktu Watson Machine Learningnastavte názvy uzlů a tabulek. Když konfigurujete uzly datového aktiva, vyberte název tabulky z produktu Connections; volba datového aktiva, která je vytvořena ve vašem projektu, momentálně není podporována.
Když vytváříte úlohu implementace pro model SPSS , ujistěte se, že typ zdrojů dat je stejný pro vstup a výstup. Konfigurované názvy tabulek z proudu modelu budou předány dávkovému nasazení a názvy vstupní/výstupní tabulky, které jsou poskytnuty v připojených datech, budou ignorovány.
Chcete-li provést dávkovou implementaci modelu SPSS , který používá připojení COS ( Cloud Object Storage ), ujistěte se, že proud modelu SPSS má jeden vstupní a výstupní uzel datového aktiva.
Podporované kombinace vstupních a výstupních zdrojů
Musíte uvést kompatibilní zdroje pro vstup toku SPSS Modeler , vstup dávkových úloh a výstup. Určíte-li nekompatibilní kombinaci typů zdrojů dat, při pokusu o provedení dávkové úlohy se zobrazí chyba.
Tyto kombinace jsou podporovány pro dávkové úlohy:
Vstup/výstup proudu modelu SPSS | Vstup úlohy dávkové implementace | Výstup úlohy dávkové implementace |
---|---|---|
Soubor | Lokální/spravované nebo odkazované datové aktivum nebo aktivum připojení (soubor) | Vzdálené datové aktivum nebo spojovací aktivum (soubor) nebo název |
Databáze | Vzdálené aktivum datového aktiva nebo připojení (databáze) | Vzdálené aktivum datového aktiva nebo připojení (databáze) |
Určení více vstupů
Pokud určujete více vstupů pro implementaci proudu modelu SPSS bez schématu, zadejte ID pro každý prvek v produktu input_data_references
.
Podrobné informace naleznete v tématu Použití více zdrojů dat pro úlohu SPSS.
V tomto příkladu, když vytváříte úlohu, poskytněte tři vstupní záznamy s ID: sample_db2_conn
, sample_teradata_conn
a sample_googlequery_conn
a vyberte požadované připojené údaje pro každý vstup.
{
"deployment": {
"href": "/v4/deployments/<deploymentID>"
},
"scoring": {
"input_data_references": [{
"id": "sample_db2_conn",
"name": "DB2 connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_teradata_conn",
"name": "Teradata connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_googlequery_conn",
"name": "Google bigquery connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}],
"output_data_references": {
"id": "sample_db2_conn",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}
}
Nadřízené téma: Podrobnosti vstupní implementace dávky podle rámce