Desde un nodo Minería de textos, puede elegir iniciar la sesión de Text Analytics Workbench cuando se ejecute el flujo. Text Analytics Workbench es una sesión interactiva en la que puede explorar los resultados de la extracción y ajustar la configuración para el nodo Minería de textos.
La minería de texto es un proceso iterativo en el que los resultados de la extracción se revisan de acuerdo con el contexto de los datos de texto, se ajustan para producir nuevos resultados y, a continuación, se vuelven a evaluar. Cuando ejecuta el nodo Minería de textos, el motor de extracción lee los datos de texto, identifica los conceptos relevantes y asigna un tipo a cada uno.
Cuando el nodo Text Mining termina de ejecutarse, se abre Text Analytics Workbench para que pueda revisar los resultados de la extracción. Text Analytics Workbench se organiza en pestañas. En cada pestaña, puede centrarse en diferentes áreas del proceso de minería de textos.
- conceptos
- Los conceptos son palabras y frases importantes que se han identificado y extraído de los datos de texto. También se conocen como resultados de extracción. Estos conceptos se agrupan en tipos. Puede utilizar estos conceptos para explorar los datos y crear las categorías. Puede gestionar los conceptos en la pestaña Conceptos .
- Enlaces de texto
- Puede extraer patrones de los datos de texto si tiene reglas de análisis de enlace de texto (TLA) en los recursos lingüísticos. Por ejemplo, la plantilla de recursos ya tiene algunas reglas TLA. Estos patrones le pueden ayudar a descubrir relaciones interesantes entre conceptos en sus datos. También puede utilizar estos patrones como descriptores en las categorías. Puede gestionar estos patrones en la pestaña Enlaces de texto .
- Categorías
- Utilizando descriptores (como resultados de extracción, patrones y reglas) como definición, puede crear manual o automáticamente un conjunto de categorías. Los documentos y registros se asignan a estas categorías en función de si contienen una parte de la definición de categoría. Puede gestionar categorías en la pestaña Categorías .
- Recursos
- El proceso de extracción se basa en un conjunto de parámetros y definiciones de recursos lingüísticos para controlar cómo se extrae y se maneja el texto. Puede ajustar estos recursos lingüísticos (como plantillas y bibliotecas) en la pestaña Editor de recursos.
Puede utilizar el banco de trabajo para realizar las siguientes tareas de minería de textos:
- Extraer conceptos clave de los datos de texto
- Generar categorías
- Explorar patrones en el análisis de enlaces de texto (TLA)
- Generar nuggets de modelo de categoría
- Guarde los recursos que haya ajustado o utilizado durante el proceso de extracción como un paquete de análisis de texto (TAP).