Translation not up to date
V toku SPSS Modeler je běžné mít více uzlů importu a exportu, kde více uzlů importu může načítat data z jedné nebo více relačních databází. Naučte se, jak používat produkt Watson Machine Learning k vytvoření dávkové úlohy SPSS Modeler s více zdroji dat z relačních databází.
Příklady v této sekci používají produkty IBM Db2 a IBM Db2 Warehouse, které jsou uvedeny v příkladech jako dashdb.
Připojení k více relačním databázím jako vstup pro dávkovou úlohu
Počet uzlů importu v toku SPSS Modeler se může lišit. Můžete jich využít až 60 nebo 70. Počet jedinečných připojení k databázím v těchto případech však bude obvykle jen málo, ačkoli názvy tabulek, k nimž se přistupuje prostřednictvím připojení, se budou lišit. Místo určení podrobností pro každé připojení k tabulce je zde popisovaný přístup zaměřen na databázová připojení. Dávkové úlohy proto budou přijímat seznam datových připojení nebo odkazů podle názvu uzlu , které jsou mapovány na názvy připojení v uzlech importu toku SPSS Modeler .
Předpokládejme například, že pokud má tok 30 uzlů, použijí se pouze tři jedinečná databázová připojení pro připojení k 30 různým tabulkám. V tomto případě odešlete do dávkové úlohy tři připojení (C1, C2a C3). C1, C2a C3 jsou názvy připojení v uzlu importu toku a název uzlu na vstupu dávkové úlohy.
Je-li spuštěna dávková úloha, je datový odkaz pro uzel poskytován mapováním uzlu name s názvem připojení v uzlu importu. Tento příklad ilustruje kroky pro vytvoření mapování.
Následující diagram ukazuje tok od vytvoření modelu k odeslání úlohy:
Omezení: Přestože odkaz na připojení pro uzel v toku bude přepsán odkazem obdrženým od dávkové úlohy, název tabulky v uzlu importu nebo exportu nebude přepsán.
Scénář implementace s příkladem
V tomto příkladu je sestaven model SPSS s použitím 40 uzlů importu a jednoho výstupu. Model má následující konfiguraci:
- Připojení ke třem databázím: 1 Db2 Warehouse (dashDB) a 2 Db2.
- Uzly importu se čtou z 40 tabulek (30 z Db2 Warehouse a 5 z databází Db2 ).
- Jedna výstupní tabulka je zapsána do databáze Db2 .
Příklad
Tento postup ukazuje, jak vytvořit připojení a identifikovat tabulky.
Vytvořte připojení ve svém projektu.
Chcete-li spustit tok SPSS Modeler , začněte ve svém projektu a vytvořte připojení pro každou ze tří databází, ke kterým se váš model připojuje. Poté můžete každý uzel importu v daném toku nakonfigurovat tak, aby ukazoval na tabulku v jedné z připojených databází.
Pro tento příklad jsou databázová připojení v projektu pojmenována
dashdb_conn
,db2_conn1
adb2_conn2
.Nakonfigurujte uzly importu datových aktiv ve svém toku SPSS Modeler s připojeními.
Konfigurujte každý uzel v toku tak, aby odkazoval na jedno ze tří připojení, která jste vytvořili (
dashdb_conn
,db2_conn1
adb2_conn2
), a poté zadejte tabulku pro každý uzel.Poznámka: Můžete změnit název připojení v době spuštění úlohy, ale názvy tabulek, které jste vybrali v toku, jsou odkazovány, když je úloha spuštěna; přepsat nebo změnit je nemůžete.Uložte model SPSS do úložiště produktu Watson Machine Learning .
Pro tento příklad je užitečné poskytnout vstupní a výstupní schéma při ukládání modelu, protože zjednodušuje proces identifikace každého vstupu při vytváření a odeslání dávkové úlohy v uživatelském rozhraní produktu Watson Studio . Všimněte si, že připojení, na která se odkazuje v uzlech datového aktiva v toku SPSS Modeler , musí být uvedena v poli název uzlu vstupního schématu. Chcete-li najít název uzlu, poklepejte na uzel importu datového aktiva ve svém toku a otevřete jeho vlastnosti:
Pozn.:Modely SPSS , které jsou uloženy bez schémat, jsou stále podporovány pro úlohy, ale musíte zadat pole název uzlu ručně a poskytnout datové aktivum, když odešlete úlohu.
Tato ukázka kódu ukazuje, jak uložit vstupní schéma při ukládání modelu (koncový bod: POST /v4/models).
{ "name": "SPSS Drug Model", "label_column": "label", "type": "spss-modeler_18.1", "runtime": { "href": "/v4/runtimes/spss-modeler_18.1" }, "space": { "href": "/v4/spaces/<space_id>" }, "schemas": { "input": [ { "id": "dashdb_conn", "fields": [] }, { "id": "db2_conn1 ", "fields": [] } , { "id": "db2_conn2", "fields": [] } ], "output": [{ "id": "db2_conn2 ","fields": [] }] } }
Poznámka: Počet polí v každém z těchto připojení nezáleží. Nejsou validovány nebo použity. Důležitý je počet použitých připojení.Vytvořte dávkovou implementaci pro model SPSS .
Pro modely SPSS je proces vytváření úlohy implementace dávky stejný. Požadavek na nasazení můžete odeslat s modelem, který byl vytvořen v předchozím kroku.
Odešlete dávkové úlohy SPSS .
Dávkovou úlohu můžete odeslat z uživatelského rozhraní produktu Watson Studio nebo pomocí rozhraní REST API. Je-li schéma uloženo s modelem, uživatelské rozhraní produktu Watson Studio usnadňuje přijetí vstupu z připojení uvedených ve schématu. Vzhledem k tomu, že jste již vytvořili datová připojení, můžete pro každé pole název uzlu , které se zobrazí v uživatelském rozhraní produktu Watson Studio při definování úlohy, vybrat připojené datové aktivum.
Název připojení vytvořeného při odeslání úlohy se může lišit od názvu použitého při vytvoření modelu, ale příslušný objekt musí být přiřazen k poli název uzlu .
Odeslání úlohy, není-li schéma poskytnuto
Pokud není schéma poskytnuto v metadatech modelu v době, kdy je model uložen, musíte zadat název uzlu importu ručně a vybrat datové aktivum v uživatelském rozhraní Watson Studio pro každé připojení. Připojení, která jsou odkazována v uzlech importu datového aktiva v toku SPSS Modeler , musí být poskytnuta v poli název uzlu v odkazech na import/export dat.
Uvedení připojení pro úlohu s datovým aktivem
Tato ukázka kódu demonstruje, jak určit připojení pro úlohu, která je zadána pomocí rozhraní REST API (koncový bod: /v4/deployment_jobs).
{
"deployment": {
"href": "/v4/deployments/<deploymentID>"
},
"scoring": {
"input_data_references": [
{
"id": "dashdb_conn",
"name": "dashdb_conn",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
},
{
"id": "db2_conn1 ",
"name": "db2_conn1 ",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
},
{
"id": "db2_conn2 ",
"name": "db2_conn2",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
}],
"output_data_reference": {
"id": "db2_conn2"
"name": "db2_conn2",
"type": "data_asset ",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
}
}
Nadřízené téma: Vytvoření dávkové implementace