텍스트 분석 워크벤치
마지막 업데이트 날짜: 2025년 2월 12일
텍스트 마이닝 노드에서 플로우가 실행될 때 Text Analytics Workbench 세션을 시작하도록 선택할 수 있습니다. Text Analytics Workbench는 추출 결과를 탐색하고 텍스트 마이닝 노드에 대한 구성을 미세 조정할 수 있는 대화식 세션입니다.
텍스트 마이닝 은 텍스트 데이터의 컨텍스트에 따라 추출 결과를 검토하고 새 결과를 생성하도록 미세 조정한 후 다시 평가하는 반복 프로세스입니다. 텍스트 마이닝 노드를 실행할 때 추출 엔진은 텍스트 데이터를 읽고 관련 개념을 식별하며 각각에 유형을 지정합니다.
텍스트 마이닝 노드 실행이 완료되면 텍스트 분석 워크벤치가 열리므로 추출 결과를 검토할 수 있습니다. Text Analytics Workbench는탭으로 구성됩니다. 각 탭에서 텍스트 마이닝 프로세스의 여러 영역에 초점을 맞출 수 있습니다.
- 개념
- 개념은 텍스트 데이터에서 식별되고 추출된 중요한 단어 및 구문입니다. 이를 추출 결과라고도 합니다. 이러한 개념은 유형으로 그룹화됩니다. 이러한 개념을 사용하여 데이터를 탐색하고 범주를 작성할 수 있습니다. 개념 탭에서 개념을 관리할 수 있습니다.
- 텍스트 링크
- 언어 자원에 텍스트 링크 분석 (TLA) 규칙이 있는 경우 텍스트 데이터에서 패턴을 추출할 수 있습니다. 예를 들어, 자원 템플리트에 이미 일부 TLA 규칙이 있습니다. 이러한 패턴을 사용하여 데이터에 있는 개념 간의 흥미로운 관계를 쉽게 알아낼 수 있습니다. 또한 이러한 패턴을 범주에서 디스크립터로 사용할 수 있습니다. 텍스트 링크 탭에서 이러한 패턴을 관리할 수 있습니다.
- 카테고리
- 디스크립터 (예: 추출 결과, 패턴 및 규칙) 를 정의로 사용하여 범주 세트를 수동 또는 자동으로 작성할 수 있습니다. 문서 및 레코드는 범주 정의의 일부를 포함하는지 여부에 따라 이러한 범주에 지정됩니다. 카테고리 탭에서 카테고리를 관리할 수 있습니다.
- 자원
- 추출 프로세스는 언어 자원의 매개변수 및 정의 세트에 의존하여 텍스트가 추출되고 처리되는 방법을 제어합니다. 이러한 언어 리소스(예: 템플릿 및 라이브러리)는 리소스 편집기 탭에서 조정할 수 있습니다.

워크벤치를 사용하여 다음과 같은 텍스트 마이닝 작업을 수행할 수 있습니다:
- 텍스트 데이터에서 주요 개념 추출
- 범주 빌드(B)
- 텍스트 링크 분석 (TLA) 에서 패턴 탐색
- 범주 모델 너깃 생성
- 추출 프로세스 중에 조정하거나 사용한 리소스를 텍스트 분석 패키지(TAP)로 저장합니다.
주제가 도움이 되었습니까?
0/1000