En Text Analytics Workbench, puede utilizar la pestaña Conceptos para explorar conceptos y ajustar los resultados de extracción.
Cuando ejecuta el nodo Minería de textos, el motor de extracción lee los datos de texto, identifica los conceptos relevantes y asigna un tipo a cada uno. Puede ver qué conceptos y tipos se han extraído en la pestaña Conceptos . Los conceptos pueden darle una idea de los temas principales en los datos de texto y los temas más importantes.
En la pestaña Conceptos, puede ver los conceptos que se extrajeron de sus datos de texto y los términos y tipos relacionados. Estos términos técnicos se definen del siguiente modo.
- Conceptos
- Los conceptos son palabras y frases importantes que se han identificado y extraído de los datos de texto. También se conocen como resultados de extracción. Estos conceptos se agrupan en tipos. Puede utilizar estos conceptos para explorar los datos y crear las categorías.
- Términos
- Los términos son las palabras específicas que componen un concepto. Los términos son palabras únicas como
airport
olocation
y frases de palabras comoairport pick-up
. Se utilizan para identificar conceptos en el texto. Los términos pueden ser formas plurales o singulares de palabras, partes de palabras más grandes, sinónimos o variaciones ortográficas. - Tipos
- Los tipos son agrupaciones semánticas para conceptos. Cuando se extraen conceptos, se les asigna un tipo para contribuir a agrupar conceptos similares. Por ejemplo, algunos de los tipos predeterminados son
<Location>
,<Organization>
,<Person>
,<Positive>
y<Negative>
.
Puede refinar los resultados de la extracción modificando los recursos lingüísticos. Para simplificar el proceso de ajuste preciso de los recursos lingüísticos, puede realizar tareas de diccionario comunes directamente desde la pestaña Conceptos . Puede ajustar otros recursos lingüísticos en la pestaña Editor de recursos .
Panel Conceptos
Esta área presenta los resultados de la extracción. Los conceptos y tipos aparecen con codificación de color. Puede hacer clic en el icono Filtro para filtrar los conceptos que se muestran o buscar conceptos específicos haciendo clic en el icono Buscar.
Cuando selecciona una fila (un concepto) en el panel, puede ver información sobre los documentos y registros correspondientes en el panel Vista previa .
Para ver los términos subyacentes de un concepto, pulse el concepto en el panel Conceptos y, a continuación, pulse el menú de desbordamiento y seleccione Mostrar términos subyacentes. No todos los conceptos tienen términos subyacentes. Por ejemplo, car
manufacturing
y manufacturing of cars
son sinónimos, pero car manufacturing
se ha extraído como concepto con manufacturing
of cars
como término subyacente. Si desea utilizar uno de estos conceptos como descriptor de una categoría, el mejor término que puede utilizar es car manufacturing
porque también coincide con documentos o registros con manufacturing of
cars
.
Para cambiar cómo se extraen los conceptos, haga clic en el icono Configuración sin ningún concepto seleccionado. Para obtener más información sobre la configuración, consulte Opciones de configuración.
panel de presentación preliminar
Cuando selecciona un concepto, el panel Vista previa muestra el texto de los documentos o registros que tienen el concepto. Los conceptos se resaltan para ayudarle a identificarlos fácilmente en el texto. Cuando pase el cursor por encima de las palabras codificadas por colores, aparecerá una ayuda contextual. Muestra el nombre del concepto bajo el que se ha extraído la palabra y el tipo al que se ha asignado.