언어학적 자원

마지막 업데이트 날짜: 2025년 2월 12일
텍스트 분석용 SPSS Modeler 사용되는 언어 리소스

SPSS Modeler 언어 리소스에 의존하는 추출 프로세스를 사용합니다. 이러한 언어 리소스는 텍스트 데이터를 처리하고 정보를 추출하여 개념, 유형, 때로는 패턴을 파악하는 방법의 기초가 됩니다.

언어 리소스는 여러 유형으로 나눌 수 있습니다:

범주 세트
카테고리는 채점 과정을 통해 텍스트 데이터에 할당되는 밀접하게 관련된 아이디어와 패턴의 그룹입니다.
라이브러리
라이브러리는 TAP과 템플리트 모두에 구성 요소로 사용됩니다. 각 라이브러리는 용어, 동의어, 제외 목록을 정의하고 관리하는 데 사용되는 여러 사전으로 구성되어 있습니다. 라이브러리는 개별적으로도 제공되지만 템플리트와 TAP에서는 함께 패키지됩니다.
템플리트
템플릿은 라이브러리 세트와 몇 가지 고급 언어 및 비언어적 리소스로 구성되어 있습니다. 이러한 리소스는 제품 의견과 같이 특정 도메인이나 상황에 맞게 조정된 전문화된 세트를 구성합니다.
텍스트 분석 패키지(TAP)
텍스트 분석 패키지는 하나 이상의 카테고리 세트와 함께 번들로 제공되는 미리 정의된 템플릿입니다. 탭은 이러한 리소스를 함께 묶어 카테고리와 카테고리를 생성하는 데 사용된 리소스를 함께 저장하고 재사용할 수 있도록 합니다. 그런 다음 TAP을 재사용하여 다른 흐름에 동일한 카테고리와 리소스를 적용할 수 있습니다.
참고: 추출하는 동안 일부 컴파일된 내부 언어 리소스도 사용됩니다. 이 컴파일된 리소스에는 코어 라이브러리의 유형을 보완하는 많은 정의가 포함되어 있습니다. 컴파일된 이러한 자원은 편집할 수 없습니다.

맞춤형 언어 리소스

SPSS Modeler 기본적으로 특수 언어 리소스 세트가 있습니다. 이러한 언어 리소스를 사용하여 특정 언어 및 특정 애플리케이션에 대한 연구 및 미세 조정의 이점을 누릴 수 있습니다. 그러나 이러한 언어 리소스는 사용자의 상황이나 데이터에 최적화되지 않을 수 있습니다. 이러한 언어 리소스에 대한 변경 사항을 편집하고 저장하여 흐름에 맞게 추출 프로세스를 최적화할 수 있습니다.

또한 조직의 데이터에 맞게 고유하게 미세 조정된 사용자 지정 언어 리소스를 만들고 가져올 수도 있습니다. 로컬 파일을 사용하여 사용자와 프로젝트 간에 이러한 언어 리소스를 공유할 수 있습니다. 로컬 파일에서 템플릿, 라이브러리 또는 TAP을 프로젝트 자산으로 추가할 수 있습니다.