0 / 0
영어 버전 문서로 돌아가기
여러 데이터 소스가 있는 SPSS Modeler 일괄처리 작업 작성
마지막 업데이트 날짜: 2024년 11월 21일
여러 데이터 소스가 있는 SPSS Modeler 일괄처리 작업 작성

SPSS Modeler 플로우에서 여러 가져오기 및 내보내기 노드가 있는 것이 일반적이며, 여기서 여러 개의 가져오기 노드가 하나 이상의 관계형 데이터베이스에서 데이터를 페치할 수 있습니다. watsonx.ai Runtime을 사용하여 관계형 데이터베이스의 여러 데이터 소스를 사용하는 SPSS Modeler 일괄 작업을 만들 수 있습니다.

참고:

예에서는 IBM Db2 및 IBM Db2 Warehouse(예에서는 dashdb라고 함) 를 사용합니다.

여러 관계형 데이터베이스를 입력으로 일괄처리 작업에 연결

SPSS Modeler 플로우에서 가져오기 노드의 수는 다양할 수 있습니다. 60개 또는 70개까지도 사용할 수 있습니다. 그러나 연결을 통해 액세스되는 테이블 이름은 다양하지만 이 경우 데이터베이스에 대한 구별 연결 수는 몇 개에 지나지 않습니다. 모든 테이블 연결에 대한 세부사항을 지정하는 대신 여기에서 설명하는 접근 방식은 데이터베이스 연결에 초점을 맞춥니다. 배치 작업은 노드 이름별 데이터 연결 또는 참조 목록을 SPSS Modeler 흐름의 가져오기 노드에 있는 연결 이름에 매핑합니다.

이 다이어그램은 SPSS 모델러 플로우에 대한 세 개의 입력 노드를 단일 출력 노드로 결합하여 데이터를 다른 커넥터로 내보내는 방법을 보여줍니다. 배포 공간에 모델 또는 플로우를 저장한 후 일괄 배포를 만들고 플로우의 세 입력 노드 각각에 대한 입력 데이터를 제공합니다. 작업을 실행하여 배치에 대한 단일 출력 파일을 생성하십시오.

모델 생성에서 일자리 창출까지의 흐름

제한사항: 플로우의 노드에 대한 연결 참조는 일괄처리 작업에서 수신되는 참조로 대체됩니다. 그러나 가져오기 또는 내보내기 노드의 테이블 이름은 대체되지 않습니다.

예제가 있는 SPSS Modeler 플로우

다음 다이어그램은 일반적인 SPSS Modeler 흐름을 보여줍니다. 이 흐름은 SPSS Modeler에서 여러 커넥터를 입력으로 사용하고 데이터를 출력으로 단일 커넥터로 내보냅니다. 이 예에서 모델은 Db2 Warehouse (dashDB) 에 대한 하나의 연결과 Db2 데이터베이스에 대한 두 개의 연결을 포함하여 세 개의 커넥터에 연결하여 구성됩니다. 가져오기 노드는 총 40개의 테이블에서 데이터를 읽습니다. 여기에는 Db2 Warehouse 의 30개테이블과 두 개의 Db2 데이터베이스의 5개테이블이 포함됩니다. 내보내기 노드는 단일 Db2 연결로 내보낼 수 있는 단일 출력 테이블인 테이블 X에 데이터를 씁니다.

다중 입력이 있는 SPSS Modeler 플로우

다음 단계는 연결을 작성하고 테이블을 식별하는 방법을 보여줍니다.

  1. 프로젝트에서 연결을 작성하십시오.

    SPSS Modeler 흐름을 실행하려면 프로젝트에서 시작하여 흐름이 연결되는 세 데이터베이스 각각에 대한 연결을 만듭니다.

    이 예제의 경우 프로젝트의 데이터베이스 연결 이름은 dashdb_conn, db2_conn1db2_conn2입니다.

  2. 연결을 사용하도록 SPSS Modeler 흐름에서 데이터 자산 노드를 구성합니다.

    흐름의 각 노드가 생성한 세 가지 연결 중 하나를 참조하도록 구성한 다음(dashdb_conn, db2_conn1db2_conn2) 각 노드에 대한 테이블을 지정합니다.

    주: 작업 실행 시 연결 이름을 변경할 수 있습니다. 플로우에서 선택하는 테이블 이름은 작업이 실행될 때 참조됩니다. 이를 겹쳐쓰거나 변경할 수 없습니다.
  3. SPSS 모델을 watsonx.ai 런타임 리포지토리에 저장합니다.

    모델을 저장할 때 입력 및 출력 스키마를 제공하면 도움이 됩니다. watsonx.ai Studio 사용자 인터페이스에서 배치 작업을 생성할 때 각 입력을 식별하는 프로세스를 간소화합니다. SPSS Modeler 플로우의 데이터 자산 노드에서 참조되는 연결은 입력 스키마의 노드 이름 필드에 제공되어야 합니다. 노드 이름을 찾으려면 플로우에서 데이터 자산 가져오기 노드를 두 번 클릭하여 해당 특성을 여십시오.

    데이터 자산 가져오기 노드 이름

    참고:

    스키마 없이 저장된 SPSS 모델은 여전히 작업에서 지원되지만, 작업 생성 시 노드 이름 필드를 수동으로 입력하고 데이터 자산을 제공해야 합니다.

    이 코드 샘플은 모델을 저장할 때 입력 스키마를 저장하는 방법을 보여줍니다(엔드포인트: POST /v4/models).

         {
               "name": "SPSS Drug Model",
               "label_column": "label",
               "type": "spss-modeler_18.1",
               "runtime": {
                       "href": "/v4/runtimes/spss-modeler_18.1"
                },
                "space": {
                       "href": "/v4/spaces/<space_id>"
                },
                "schemas": {
                          "input":  [ { "id": "dashdb_conn", "fields": [] },
                                            { "id": "db2_conn1 ", "fields": [] } ,
                                            { "id": "db2_conn2", "fields": [] } ],
                           "output": [{ "id": "db2_conn2 ","fields": [] }]
                 }
         }
    
    참고: 각 연결에 있는 필드 수는 중요하지 않습니다. 이들은 유효성 검증되거나 사용되지 않습니다. 중요한 것은 사용되는 연결의 수입니다.
  4. SPSS 모델에 대한 일괄처리 배치를 작성하십시오.

    SPSS 모델의 경우 일괄처리 배치 작업의 작성 프로세스는 동일합니다. 이전 단계에서 만든 모델을 사용하여 배포를 만들 수 있습니다.

  5. SPSS 배치 작업을 생성합니다.

    watsonx.ai Studio 사용자 인터페이스에서 또는 REST API를 사용하여 배치 작업을 생성할 수 있습니다. 스키마가 모델과 함께 저장된 경우, watsonx.ai Studio 사용자 인터페이스에서 스키마에 지정된 연결의 입력을 간단하게 수락할 수 있습니다. 데이터 연결을 이미 생성했으므로 작업을 정의할 때 watsonx.ai Studio 사용자 인터페이스에 표시되는 각 노드 이름 필드에 대해 연결된 데이터 자산을 선택할 수 있습니다.

    작업 제출 시 작성된 연결 이름은 모델 작성 시 사용된 연결 이름과 다를 수 있습니다. 그러나 노드 이름 필드에 지정되어야 합니다.

스키마가 제공되지 않은 경우 모델에 대한 작업 만들기

모델이 저장될 때 모델 메타데이터에 스키마가 제공되지 않으면 가져오기 노드 이름 을 수동으로 입력해야 합니다. 또한 각 연결에 대해 watsonx.ai Studio 사용자 인터페이스에서 데이터 자산을 선택해야 합니다. SPSS Modeler 플로우의 데이터 자산 가져오기 노드에서 참조되는 연결은 가져오기/내보내기 데이터 참조의 노드 이름 필드에 제공되어야 합니다.

데이터 자산이 있는 작업에 대한 연결 지정

이 코드 샘플은 REST API(엔드포인트: /v4/deployment_jobs)를 사용하여 만든 작업에 대한 연결을 지정하는 방법을 보여 줍니다.

         {
                     "deployment": {
                                    "href": "/v4/deployments/<deploymentID>"
                        },
                        "scoring": {
                                    "input_data_references": [
                                       {
                                          "id": "dashdb_conn",
                                          "name": "dashdb_conn",
                                          "type": "data_asset",
                                          "connection": {},
                                          "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn1 ",
                                             "name": "db2_conn1 ",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    },
                                    {
                                             "id": "db2_conn2 ",
                                             "name": "db2_conn2",
                                             "type": "data_asset",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }],
                                    "output_data_reference": {
                                             "id": "db2_conn2"
                                             "name": "db2_conn2",
                                             "type": "data_asset ",
                                             "connection": {},
                                             "location": {
                                                      "href": "/v2/assets/<asset_id>?space_id=<space_id>"
                                             },
                                             "schema": {}
                                    }
         }

상위 주제: 프레임워크별 일괄처리 배치 입력 세부사항

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기