0 / 0
Go back to the English version of the documentation
Vstupní podrobnosti dávkového nasazení pro modely SPSS
Last updated: 18. 8. 2023
Vstupní podrobnosti dávkového nasazení pro modely SPSS

Při zadávání vstupních podrobností pro dávkové implementace modelů SPSS dodržujte tato pravidla.

Souhrnná tabulka datového typu:

Data Popis
Typ vložené, odkazy na data
formáty souboru CSV

Zdroje dat

Odkazy na vstupní/výstupní data:

Poznámky:

  • Pro připojení typu Cloud Object Storage nebo Cloud Object Storage (infrastructure)musíte nakonfigurovat Přístupový klíč a Tajný klíč, také známý jako HMAC pověření.
  • Pro implementace produktu SPSS nejsou tyto zdroje dat kompatibilní se standardem FIPS (Federal Information Processing Standard):
    • Cloud Object Storage
    • Cloud Object Storage (infrastructure)
    • svazky úložišť

Pokud určujete odkazy vstupních/výstupních dat programově:

  • Odkaz na zdroj dat type závisí na typu aktiva. Viz sekce Typy odkazů na zdroje dat v části Přidání datových aktiv do prostoru implementace.

  • Úlohy SPSS podporují více vstupů zdrojů dat a jeden výstup. Pokud není schéma poskytnuto v metadatech modelu v době uložení modelu, musíte zadat id ručně a vybrat datové aktivum pro každé připojení. Je-li schéma poskytnuto v metadatech modelu, názvy id se automaticky naplní daty pomocí metadat. Právě vyberete datové aktivum pro odpovídající idv produktu Watson Studio. Podrobnosti naleznete v tématu Použití více zdrojů dat pro úlohu SPSS.

  • Chcete-li vytvořit lokální nebo spravované aktivum jako odkaz na výstupní data, musí být pole name zadáno pro output_data_reference , aby bylo vytvořeno datové aktivum s uvedeným názvem. Uvedení href , které odkazuje na existující lokální datové aktivum, není podporováno. Všimněte si, že připojená data aktiv, která odkazují na podporované databáze, mohou být vytvořena v produktu output_data_references pouze tehdy, když se input_data_references také odkazuje na jeden z těchto zdrojů.

  • Názvy tabulek, které jsou poskytovány ve vstupních a výstupních datech, jsou ignorovány. Během dávkové implementace se budou používat názvy tabulek, které jsou uvedeny v proudu modelu SPSS .

  • SQL PushBack vám umožňuje generovat příkazy SQL pro nativní operace IBM SPSS Modeler , které mohou být "odeslány zpět" do (které jsou prováděny v) databázi za účelem zlepšení výkonu. Příkaz SQL Pushback je podporován pouze s:

    • Db2
    • SQL Server
    • Netezza Performance Server
  • Pokud vytváříte úlohu pomocí klienta Python , musíte poskytnout název připojení, který je uveden v datových uzlech proudu modelu SPSS v poli id , a odkaz datového aktiva href v location.href pro vstupní/výstupní datové odkazy na informační obsah úlohy implementace. Například, můžete sestavit informační obsah úloh, jako je tento:

    job_payload_ref = {
        client.deployments.ScoringMetaNames.INPUT_DATA_REFERENCES: [{
            "id": "DB2Connection",
            "name": "drug_ref_input1",
            "type": "data_asset",
            "connection": {},
            "location": {
                "href": <input_asset_href1>
            }
        },{
            "id": "Db2 WarehouseConn",
            "name": "drug_ref_input2",
            "type": "data_asset",
            "connection": {},
            "location": {
                "href": <input_asset_href2>
            }
        }],
        client.deployments.ScoringMetaNames.OUTPUT_DATA_REFERENCE: {
                "type": "data_asset",
                "connection": {},
                "location": {
                    "href": <output_asset_href>
                }
            }
        }
    

Použití připojených dat pro úlohu toku produktu SPSS Modeler

Tok produktu SPSS Modeler může mít řadu vstupních a výstupních datových uzlů. Když se připojujete k podporované databázi jako vstupní a výstupní zdroj dat, všimněte si, že podrobnosti připojení jsou vybrány z odkazu na vstupní a výstupní data, ale názvy vstupních a výstupních tabulek jsou vybrány z proudového souboru modelu SPSS .

Chcete-li provést dávkovou implementaci modelu SPSS , který používá databázové připojení, ujistěte se, že uzly vstupu a výstupu modeláře jsou uzly datového aktiva. V produktu SPSS Modelermusí být uzly datového aktiva nakonfigurovány s názvy tabulek, které budou použity později pro předpovědi úloh. Před uložením modelu do produktu Watson Machine Learningnastavte názvy uzlů a tabulek. Když konfigurujete uzly datového aktiva, vyberte název tabulky z produktu Connections; volba datového aktiva, která je vytvořena ve vašem projektu, momentálně není podporována.

Když vytváříte úlohu implementace pro model SPSS , ujistěte se, že typ zdrojů dat je stejný pro vstup a výstup. Konfigurované názvy tabulek z proudu modelu budou předány dávkovému nasazení a názvy vstupní/výstupní tabulky, které jsou poskytnuty v připojených datech, budou ignorovány.

Chcete-li provést dávkovou implementaci modelu SPSS , který používá připojení COS ( Cloud Object Storage ), ujistěte se, že proud modelu SPSS má jeden vstupní a výstupní uzel datového aktiva.

Podporované kombinace vstupních a výstupních zdrojů

Musíte uvést kompatibilní zdroje pro vstup toku SPSS Modeler , vstup dávkových úloh a výstup. Určíte-li nekompatibilní kombinaci typů zdrojů dat, při pokusu o provedení dávkové úlohy se zobrazí chyba.

Tyto kombinace jsou podporovány pro dávkové úlohy:

Vstup/výstup proudu modelu SPSS Vstup úlohy dávkové implementace Výstup úlohy dávkové implementace
Soubor Lokální/spravované nebo odkazované datové aktivum nebo aktivum připojení (soubor) Vzdálené datové aktivum nebo spojovací aktivum (soubor) nebo název
Databáze Vzdálené aktivum datového aktiva nebo připojení (databáze) Vzdálené aktivum datového aktiva nebo připojení (databáze)

Určení více vstupů

Pokud určujete více vstupů pro implementaci proudu modelu SPSS bez schématu, zadejte ID pro každý prvek v produktu input_data_references.

Podrobné informace naleznete v tématu Použití více zdrojů dat pro úlohu SPSS.

V tomto příkladu, když vytváříte úlohu, poskytněte tři vstupní záznamy s ID: sample_db2_conn, sample_teradata_conna sample_googlequery_conn a vyberte požadované připojené údaje pro každý vstup.

{
"deployment": {
    "href": "/v4/deployments/<deploymentID>"
  },
  "scoring": {
  	  "input_data_references": [{
               "id": "sample_db2_conn",
               "name": "DB2 connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           },
           {
               "id": "sample_teradata_conn",
               "name": "Teradata connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           },
           {
               "id": "sample_googlequery_conn",
               "name": "Google bigquery connection",
               "type": "data_asset",
               "connection": {},
               "location": {
                     "href": "/v2/assets/<asset_id>?space_id=<space_id>"
               },
           }],
  	  "output_data_references": {
  	  	        "id": "sample_db2_conn",
                "type": "data_asset",
                "connection": {},
                "location": {
                    "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                },
          }
}
Poznámka: Parametry proměnných prostředí implementace úloh nejsou použitelné.

Nadřízené téma: Podrobnosti vstupní implementace dávky podle rámce

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more