Translation not up to date
W przepływie SPSS Modeler często używane jest wiele węzłów importu i eksportu, w których wiele węzłów importu może pobierać dane z jednej lub większej liczby relacyjnych baz danych. W tej sekcji opisano sposób korzystania z produktu Watson Machine Learning w celu utworzenia zadania wsadowego SPSS Modeler z wieloma źródłami danych z relacyjnych baz danych.
Przykłady w tej sekcji korzystają z produktów IBM Db2 i IBM Db2 Warehouse, o których mowa w przykładach jako dashdb.
Łączenie z wieloma relacyjnymi bazami danych jako danymi wejściowymi dla zadania wsadowego
Liczba węzłów importu w przepływie SPSS Modeler może być różna. Można użyć ich jako 60 lub 70. Jednak liczba unikalnych połączeń z bazami danych w tych przypadkach będzie zwykle tylko nielicznymi, choć nazwy tabel, do których dostęp jest uzyskiwany przez połączenia, będą się różnić. Zamiast określać szczegóły dla każdego połączenia z tabelą, opisane tutaj podejście koncentruje się na połączeniach z bazą danych. Dlatego zadania wsadowe akceptują listę połączeń z danymi lub odwołań przez nazwę węzła , które są odwzorowane na nazwy połączeń w węzłach importu SPSS Modeler .
Na przykład można założyć, że jeśli przepływ ma 30 węzłów, do połączenia z 30 różnymi tabelami używane są tylko trzy unikalne połączenia z bazą danych. W tym przypadku do zadania wsadowego należy wprowadzić trzy połączenia (C1, C2i C3). C1, C2i C3 to nazwy połączeń w węźle importu przepływu i nazwa węzła w danych wejściowych zadania wsadowego.
W przypadku uruchomienia zadania wsadowego odwołanie do danych dla węzła jest udostępniane przez odwzorowanie nazwy węzła z nazwą połączenia w węźle importu. W tym przykładzie przedstawiono kroki tworzenia odwzorowania.
Na poniższym diagramie przedstawiono przepływ z tworzenia modelu do przedłożenia zadania:
Ograniczenie: Mimo że odwołanie do połączenia dla węzła w przepływie zostanie przesłonięte przez odwołanie odebrane z zadania wsadowego, nazwa tabeli w węźle importu lub eksportu nie zostanie nadpisana.
Scenariusz wdrażania z przykładem
W tym przykładzie model SPSS jest tworzony przy użyciu 40 węzłów importu i pojedynczych danych wyjściowych. Model ma następującą konfigurację:
- Połączenia z trzema bazami danych: 1 Db2 Warehouse (dashDB) i 2 Db2.
- Węzły importu są odczytyowane z 40 tabel (30 z bazy danych Db2 Warehouse i 5 z baz danych Db2 ).
- Pojedyncza tabela wyjściowa jest zapisywana w bazie danych Db2 .
Przykład
W poniższych krokach przedstawiono sposób tworzenia połączeń i identyfikowania tabel.
Utwórz połączenie w projekcie.
Aby uruchomić przepływ programu SPSS Modeler , należy uruchomić projekt i utworzyć połączenie dla każdej z trzech baz danych, z którą łączy się model. Następnie należy skonfigurować każdy węzeł importu w przepływie w taki sposób, aby wskazywał na tabelę w jednej z połączonych baz danych.
W tym przykładzie połączenia z bazą danych w projekcie mają nazwy
dashdb_conn
,db2_conn1
idb2_conn2
.Skonfiguruj węzły importu zasobów danych w przepływie SPSS Modeler z połączeniami.
Skonfiguruj każdy węzeł w przepływie tak, aby odwoływał się do jednego z trzech utworzonych połączeń (
dashdb_conn
,db2_conn1
idb2_conn2
), a następnie określ tabelę dla każdego węzła.Uwaga: nazwę połączenia można zmienić w czasie wykonywania zadania, ale nazwy tabel wybrane w przepływie są przywoływane podczas wykonywania zadania. Nie można ich zastąpić lub zmienić.Zapisz model SPSS w repozytorium Watson Machine Learning .
W tym przykładzie pomocne jest podanie schematu wejściowego i wyjściowego podczas zapisywania modelu, ponieważ upraszcza to proces identyfikowania wszystkich danych wejściowych podczas tworzenia i wprowadzania zadania wsadowego w interfejsie użytkownika Watson Studio . Należy pamiętać, że połączenia, do których odwołuje się węzeł Zasób danych w przepływie SPSS Modeler , muszą być udostępnione w polu nazwa węzła schematu wejściowego. Aby znaleźć nazwę węzła, kliknij dwukrotnie węzeł importu zasobu danych w przepływie, aby otworzyć jego właściwości:
Uwaga:Modele SPSS , które są zapisywane bez schematów, są nadal obsługiwane dla zadań, ale pola nazwa węzła należy wprowadzić ręcznie i udostępnić zasób danych podczas wprowadzania zadania.
W tym przykładzie kodu pokazano, jak zapisać schemat wejściowy podczas zapisywania modelu (punkt końcowy: POST /v4/models).
{ "name": "SPSS Drug Model", "label_column": "label", "type": "spss-modeler_18.1", "runtime": { "href": "/v4/runtimes/spss-modeler_18.1" }, "space": { "href": "/v4/spaces/<space_id>" }, "schemas": { "input": [ { "id": "dashdb_conn", "fields": [] }, { "id": "db2_conn1 ", "fields": [] } , { "id": "db2_conn2", "fields": [] } ], "output": [{ "id": "db2_conn2 ","fields": [] }] } }
Uwaga: Liczba pól w każdym z tych połączeń nie ma znaczenia. Nie są one zwalidowane ani używane. Ważne jest to, ile połączeń jest używanych.Utwórz wdrożenie wsadowe dla modelu SPSS .
W przypadku modeli SPSS proces tworzenia zadania wdrożenia wsadowego jest taki sam. Żądanie wdrożenia można wysłać razem z modelem utworzonym w poprzednim kroku.
Wprowadź zadania wsadowe SPSS .
Zadanie wsadowe można wprowadzić z poziomu interfejsu użytkownika produktu Watson Studio lub za pomocą interfejsu REST API. Jeśli schemat jest zapisywany razem z modelem, interfejs użytkownika Watson Studio ułatwia akceptowanie danych wejściowych z połączeń określonych w schemacie. Ponieważ połączenia z danymi zostały już utworzone, można wybrać połączony zasób danych dla każdej zmiennej nazwa węzła , która jest wyświetlana w interfejsie użytkownika produktu Watson Studio podczas definiowania zadania.
Nazwa połączenia, która jest tworzona w momencie wprowadzania zadania, może być inna niż nazwa używana w momencie tworzenia modelu, ale odpowiednia wartość musi być przypisana do pola nazwa węzła .
Wprowadzanie zadania, gdy schemat nie jest udostępniany
Jeśli schemat nie jest udostępniany w metadanych modelu w momencie zapisywania modelu, należy ręcznie wprowadzić nazwę węzła importu i wybrać zasób danych w interfejsie użytkownika Watson Studio dla każdego połączenia. Połączenia, do których istnieją odwołania w węzłach importu zasobów danych w przepływie SPSS Modeler , muszą być udostępnione w polu nazwa węzła odwołań do danych importu/eksportu.
Określanie połączeń dla zadania z zasobem danych
Ten przykład kodu demonstruje sposób określania połączeń dla zadania wprowadzonego za pomocą interfejsu REST API (Endpoint: /v4/deployment_jobs).
{
"deployment": {
"href": "/v4/deployments/<deploymentID>"
},
"scoring": {
"input_data_references": [
{
"id": "dashdb_conn",
"name": "dashdb_conn",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
},
{
"id": "db2_conn1 ",
"name": "db2_conn1 ",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
},
{
"id": "db2_conn2 ",
"name": "db2_conn2",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
}],
"output_data_reference": {
"id": "db2_conn2"
"name": "db2_conn2",
"type": "data_asset ",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
"schema": {}
}
}
Temat nadrzędny: Tworzenie wdrożenia wsadowego