0 / 0
Go back to the English version of the documentation
Korzystanie z wielu źródeł danych dla zadania SPSS Modeler
Last updated: 18 sie 2023
Korzystanie z wielu źródeł danych dla zadania SPSS Modeler

W przepływie SPSS Modeler często używane jest wiele węzłów importu i eksportu, w których wiele węzłów importu może pobierać dane z jednej lub większej liczby relacyjnych baz danych. W tej sekcji opisano sposób korzystania z produktu Watson Machine Learning w celu utworzenia zadania wsadowego SPSS Modeler z wieloma źródłami danych z relacyjnych baz danych.

Uwaga:

Przykłady w tej sekcji korzystają z produktów IBM Db2 i IBM Db2 Warehouse, o których mowa w przykładach jako dashdb.

Łączenie z wieloma relacyjnymi bazami danych jako danymi wejściowymi dla zadania wsadowego

Liczba węzłów importu w przepływie SPSS Modeler może być różna. Można użyć ich jako 60 lub 70. Jednak liczba unikalnych połączeń z bazami danych w tych przypadkach będzie zwykle tylko nielicznymi, choć nazwy tabel, do których dostęp jest uzyskiwany przez połączenia, będą się różnić. Zamiast określać szczegóły dla każdego połączenia z tabelą, opisane tutaj podejście koncentruje się na połączeniach z bazą danych. Dlatego zadania wsadowe akceptują listę połączeń z danymi lub odwołań przez nazwę węzła , które są odwzorowane na nazwy połączeń w węzłach importu SPSS Modeler .

Na przykład można założyć, że jeśli przepływ ma 30 węzłów, do połączenia z 30 różnymi tabelami używane są tylko trzy unikalne połączenia z bazą danych. W tym przypadku do zadania wsadowego należy wprowadzić trzy połączenia (C1, C2i C3). C1, C2i C3 to nazwy połączeń w węźle importu przepływu i nazwa węzła w danych wejściowych zadania wsadowego.

W przypadku uruchomienia zadania wsadowego odwołanie do danych dla węzła jest udostępniane przez odwzorowanie nazwy węzła z nazwą połączenia w węźle importu. W tym przykładzie przedstawiono kroki tworzenia odwzorowania.

Na poniższym diagramie przedstawiono przepływ z tworzenia modelu do przedłożenia zadania:

Zadanie SPSS Modeler z wieloma wejściami

Ograniczenie: Mimo że odwołanie do połączenia dla węzła w przepływie zostanie przesłonięte przez odwołanie odebrane z zadania wsadowego, nazwa tabeli w węźle importu lub eksportu nie zostanie nadpisana.

Scenariusz wdrażania z przykładem

W tym przykładzie model SPSS jest tworzony przy użyciu 40 węzłów importu i pojedynczych danych wyjściowych. Model ma następującą konfigurację:

  • Połączenia z trzema bazami danych: 1 Db2 Warehouse (dashDB) i 2 Db2.
  • Węzły importu są odczytyowane z 40 tabel (30 z bazy danych Db2 Warehouse i 5 z baz danych Db2 ).
  • Pojedyncza tabela wyjściowa jest zapisywana w bazie danych Db2 .

Przepływ SPSS Modeler z wieloma danymi wejściowymi

Przykład

W poniższych krokach przedstawiono sposób tworzenia połączeń i identyfikowania tabel.

  1. Utwórz połączenie w projekcie.

    Aby uruchomić przepływ programu SPSS Modeler , należy uruchomić projekt i utworzyć połączenie dla każdej z trzech baz danych, z którą łączy się model. Następnie należy skonfigurować każdy węzeł importu w przepływie w taki sposób, aby wskazywał na tabelę w jednej z połączonych baz danych.

    W tym przykładzie połączenia z bazą danych w projekcie mają nazwy dashdb_conn, db2_conn1i db2_conn2.

  2. Skonfiguruj węzły importu zasobów danych w przepływie SPSS Modeler z połączeniami.

    Skonfiguruj każdy węzeł w przepływie tak, aby odwoływał się do jednego z trzech utworzonych połączeń (dashdb_conn, db2_conn1i db2_conn2), a następnie określ tabelę dla każdego węzła.

    Uwaga: nazwę połączenia można zmienić w czasie wykonywania zadania, ale nazwy tabel wybrane w przepływie są przywoływane podczas wykonywania zadania. Nie można ich zastąpić lub zmienić.
  3. Zapisz model SPSS w repozytorium Watson Machine Learning .

    W tym przykładzie pomocne jest podanie schematu wejściowego i wyjściowego podczas zapisywania modelu, ponieważ upraszcza to proces identyfikowania wszystkich danych wejściowych podczas tworzenia i wprowadzania zadania wsadowego w interfejsie użytkownika Watson Studio . Należy pamiętać, że połączenia, do których odwołuje się węzeł Zasób danych w przepływie SPSS Modeler , muszą być udostępnione w polu nazwa węzła schematu wejściowego. Aby znaleźć nazwę węzła, kliknij dwukrotnie węzeł importu zasobu danych w przepływie, aby otworzyć jego właściwości:

    Nazwa węzła importowania zasobu danych

    Uwaga:

    Modele SPSS , które są zapisywane bez schematów, są nadal obsługiwane dla zadań, ale pola nazwa węzła należy wprowadzić ręcznie i udostępnić zasób danych podczas wprowadzania zadania.

    W tym przykładzie kodu pokazano, jak zapisać schemat wejściowy podczas zapisywania modelu (punkt końcowy: POST /v4/models).

         {
               "name": "SPSS Drug Model",
               "label_column": "label",
               "type": "spss-modeler_18.1",
               "runtime": {
                       "href": "/v4/runtimes/spss-modeler_18.1"
                },
                "space": {
                       "href": "/v4/spaces/<space_id>"
                },
                "schemas": {
                          "input":  [ { "id": "dashdb_conn", "fields": [] },
                                            { "id": "db2_conn1 ", "fields": [] } ,
                                            { "id": "db2_conn2", "fields": [] } ],
                           "output": [{ "id": "db2_conn2 ","fields": [] }]
                 }
         }
    
    Uwaga: Liczba pól w każdym z tych połączeń nie ma znaczenia. Nie są one zwalidowane ani używane. Ważne jest to, ile połączeń jest używanych.
  4. Utwórz wdrożenie wsadowe dla modelu SPSS .

    W przypadku modeli SPSS proces tworzenia zadania wdrożenia wsadowego jest taki sam. Żądanie wdrożenia można wysłać razem z modelem utworzonym w poprzednim kroku.

  5. Wprowadź zadania wsadowe SPSS .

    Zadanie wsadowe można wprowadzić z poziomu interfejsu użytkownika produktu Watson Studio lub za pomocą interfejsu REST API. Jeśli schemat jest zapisywany razem z modelem, interfejs użytkownika Watson Studio ułatwia akceptowanie danych wejściowych z połączeń określonych w schemacie. Ponieważ połączenia z danymi zostały już utworzone, można wybrać połączony zasób danych dla każdej zmiennej nazwa węzła , która jest wyświetlana w interfejsie użytkownika produktu Watson Studio podczas definiowania zadania.

    Nazwa połączenia, która jest tworzona w momencie wprowadzania zadania, może być inna niż nazwa używana w momencie tworzenia modelu, ale odpowiednia wartość musi być przypisana do pola nazwa węzła .

Wprowadzanie zadania, gdy schemat nie jest udostępniany

Jeśli schemat nie jest udostępniany w metadanych modelu w momencie zapisywania modelu, należy ręcznie wprowadzić nazwę węzła importu i wybrać zasób danych w interfejsie użytkownika Watson Studio dla każdego połączenia. Połączenia, do których istnieją odwołania w węzłach importu zasobów danych w przepływie SPSS Modeler , muszą być udostępnione w polu nazwa węzła odwołań do danych importu/eksportu.

Określanie połączeń dla zadania z zasobem danych

Ten przykład kodu demonstruje sposób określania połączeń dla zadania wprowadzonego za pomocą interfejsu REST API (Endpoint: /v4/deployment_jobs).

         {
                     "deployment": {
                                    "href": "/v4/deployments/<deploymentID>"
                        },
                        "scoring": {
                                    "input_data_references": [
                                       {
                                          "id": "dashdb_conn",
                                          "name": "dashdb_conn",
                                          "type": "data_asset",
                                          "connection": {},
                                          "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn1 ",
                                             "name": "db2_conn1 ",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn2 ",
                                             "name": "db2_conn2",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }],
                                    "output_data_reference": {
                                             "id": "db2_conn2"
                                             "name": "db2_conn2",
                                             "type": "data_asset ",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }
         }

Temat nadrzędny: Tworzenie wdrożenia wsadowego

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more