0 / 0
영어 버전 문서로 돌아가기
확장 모델 너깃
마지막 업데이트 날짜: 2024년 10월 04일
확장 모델 너깃(SPSS Modeler)

확장 모델 너깃은 모델 작성 및 모델 스코어링을 정의하는 R 스크립트 또는 Python for Spark 스크립트를 포함하는 확장 모델 노드를 실행한 후 생성되어 플로우 캔버스에 배치됩니다.

기본적으로 확장 모델 너깃은 모델 스코어링에 사용되는 스크립트, 데이터 읽기에 대한 옵션, 그리고 R 콘솔 또는 Python for Spark의 출력을 포함합니다. 필요에 따라 확장 모델 너깃에 다양한 기타 형식의 모델 출력(그래프 및 텍스트 출력 등)이 포함될 수 있습니다. 확장 모델 너깃이 생성되어 플로우 캔버스에 추가되고 나면 여기에 출력 노드를 연결할 수 있습니다. 그 후에는 이 출력 노드를 플로우 내에서 데이터 및 모델에 대한 정보를 얻고, 다양한 형식으로 데이터를 내보내기 위해 일반적인 방식으로 사용할 수 있습니다.

명령문 탭

R 모델 스코어링 구문. R을 사용하고 있는 경우에는 모델 스코어링에 사용되는 R 스크립트가 이 필드에 표시됩니다. 기본적으로 이 필드는 사용 가능하도록 설정되나 편집할 수는 없습니다. Python 모델 스코어링 스크립트를 편집하려면 편집을 클릭하십시오.

Python 모델 스코어링 구문. Python for Spark를 사용하고 있는 경우에는 모델 스코어링에 사용되는 Python 스크립트가 이 필드에 표시됩니다. 기본적으로 이 필드는 사용 가능하도록 설정되나 편집할 수는 없습니다. Python 모델 스코어링 스크립트를 편집하려면 편집을 클릭하십시오.

편집을 클릭하여 스코어링 명령문 필드를 편집 가능한 상태로 설정하고 나면 스코어링 명령문 필드에 내용을 입력하여 모델 스코어링 스크립트를 편집할 수 있습니다. 예를 들어, 확장 모델 너깃을 생성하기 위해 확장 모델 노드를 실행하고 난 후 모델에 있는 오류를 식별한 경우에는 모델 스코어링 스크립트를 편집하려 할 수 있습니다. 확장 모델 너깃에 있는 모델 스코어링 스크립트에 대해 수행하는 모든 변경사항은 확장 모델 노드를 다시 실행하여 모델을 다시 생성하면 사라집니다.

모델 옵션 탭

데이터 읽기 옵션. 이러한 옵션은 Python for Spark이 아니라 R에만 적용됩니다. 이 옵션을 사용하면 날짜 또는 날짜/시간 형식의 결측값, 플래그 필드 및 변수를 처리하는 방법을 지정할 수 있습니다.

  • 일괄처리로 데이터 읽기. 크기가 큰 데이터(예를 들면, R 엔진의 메모리에 비해 너무 큰 경우)를 처리하는 경우에는 이 옵션을 사용하여 데이터를 개별적으로 전송하고 처리할 수 있는 배치로 나누십시오. 각 배치에 포함시킬 최대 데이터 레코드 수를 지정하십시오.

    확장 변환 노드 및 확장 모델 너깃의 경우 모두 데이터는 R 스크립트를 통해 배치로 전달됩니다. 이러한 이유로 Hadoop 또는 데이터베이스 환경에서 실행되는, 모델 스코어링을 위한 스크립트와 프로세스 노드는 정렬 또는 통합과 같이 데이터의 행을 병합하거나 결합하는 작업을 포함하지 않아야 합니다. 이 제한사항은 데이터가 Hadoop 환경 및 In-Database 마이닝 동안 분할될 수 있도록 하기 위해 적용됩니다. 확장 출력 및 확장 모델 노드에는 이 제한사항이 없습니다.

  • 플래그 필드 변환. 플래그 필드를 처리하는 방법을 지정합니다. 문자열에서 요인으로, 정수 및 실수에서 double로논리 값(True, False)이라는 두 가지 옵션이 있습니다. 논리 값(True, False)을 선택하면 플래그 필드의 원래 값이 손실됩니다. 예를 들어, 필드에 값 MaleFemale이 있는 경우 이들은 TrueFalse로 변경됩니다.
  • 결측값을 R '사용할 수 없음' 값(NA)으로 변환. 이 옵션을 선택하면 결측값이 R로 변환됩니다.NA값. 값NAR에서 결측값을 식별하는 데 사용됩니다. 사용하는 일부 R 함수에는 데이터가 포함될 때 함수가 작동하는 방식을 제어할 수 있는 인수가 있을 수 있습니다.NA. 예를 들어, 이 함수를 사용하면 다음을 포함하는 레코드를 자동으로 제외하도록 선택할 수 있습니다.NA. 이 옵션을 선택하지 않으면 누락된 값이 변경되지 않은 상태로 R에 전달되며 R 스크립트를 실행할 때 오류가 발생할 수 있습니다.
  • 날짜/시간 필드를 시간대의 특수 제어가 있는 R 클래스로 변환 이 옵션을 선택하면 날짜 또는 날짜/시간 형식의 변수가 R 날짜/시간 형식으로 변환됩니다. 다음 옵션 중 하나를 선택해야 합니다.
    • R POSIXct. 날짜 또는 날짜 시간 형식의 변수가 R로 변환됩니다.POSIXct오브젝트,
    • R POSIXlt (목록). 날짜 또는 날짜 시간 형식의 변수는 R로 변환됩니다.POSIXlt오브젝트,
    참고: POSIX 형식은 고급 옵션입니다. R 스크립트에서 날짜/시간 필드가 해당 형식이 필요한 방식으로 처리되도록 지정된 경우에만 이 옵션을 사용하십시오. POSIX 형식은 시간 형식의 변수에는 적용되지 않습니다.
플래그 필드 변환, 결측값을 R '사용할 수 없음' 값(NA)으로 변환날짜/시간 필드를 시간대에 대한 특수 제어가 있는 R 클래스로 변환에 대해 선택되는 옵션은 확장 모델 너깃이 데이터베이스에 대해 실행되는 경우에는 인식되지 않습니다. 노드가 데이터베이스에 대해 실행되는 경우에는 이러한 제어에 대한 기본값이 대신 사용됩니다.
  • 플래그 필드 변환문자열에서 요인으로, 정수 및 실수에서 double로로 설정됨
  • 결측값을 R '사용할 수 없음' 값(NA)으로 변환은 선택됨
  • 날짜/시간 필드를 시간대에 대한 특수 제어가 있는 R 클래스로 변환은 선택되지 않음

콘솔 출력 탭

콘솔 출력 탭은 명령문 탭에 있는 R 스크립트 또는 Python for Spark 스크립트가 실행될 때 수신되는 출력을 포함합니다(예를 들어, R 스크립트를 사용하는 경우 이 탭은 확장 모델 너깃의 명령문 탭에서 R 모델 스코어링 명령문 필드에 있는 R 스크립트가 실행될 때 R 콘솔로부터 수신되는 출력을 표시함). 이 출력은 R 또는 Python 스크립트가 실행될 때 생성되는 모든 R 또는 Python 오류 메시지나 경고, 그리고 R 콘솔의 텍스트 출력을 포함합니다. 출력은 주로 스크립트를 디버그할 때 사용할 수 있습니다.

모델 스코어링 스크립트가 실행될 때마다, 콘솔 출력 탭의 내용은 R 콘솔 또는 Python for Spark로부터 수신한 출력으로 덮어쓰여집니다. 콘솔 출력은 편집할 수 없습니다.

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기