0 / 0
Volver a la versión inglesa de la documentación
Cómo funciona la asignación a categorías
Última actualización: 20 dic 2024
Cómo funciona la asignación a categorías (SPSS Modeler)

Cuando se crean modelos de categorías en Text Analytics, hay varias técnicas diferentes entre las que puede elegir para crear categorías. Puesto que cada conjunto de datos es exclusivo, el número de técnicas y el orden en el que se aplican puede cambiar con el tiempo.

Puesto que su interpretación de los resultados puede ser diferente de la de otra persona, es posible que tenga que experimentar con las distintas técnicas para ver cuáles generan los mejores resultados para los datos del texto. En Text Analytics, puede crear modelos de categorías en una sesión del entorno de trabajo en la que puede explorar y ajustar mejor las categorías.

En esta documentación, generación de categorías se refiere a la generación de definiciones de categorías y su clasificación mediante el uso de una o varias técnicas incorporadas, y asignación a categorías se refiere al proceso de puntuación o etiquetado, por el que se asignan identificadores exclusivos (nombre/ID/valor) a las definiciones de categorías para cada registro o documento.

Durante la generación de categorías, se utilizan los conceptos y los tipos que se extraído como base para definir las categorías. Cuando se generan categorías, los registros o documentos se asignan automáticamente a categorías si contienen texto que coincide con un elemento de la definición de una categoría.

Text Analytics ofrece varias técnicas automáticas de generación de categorías para ayudarle a asignar a categorías sus documentos o registros con rapidez.

Técnicas de agrupación

Cada una de las técnicas disponibles resulta más adecuada para ciertos tipos de datos y situaciones, pero a menudo resulta útil combinar técnicas en el mismo análisis para capturar toda la gama de registros de los documentos. Puede ver un concepto en diversas categorías o detectar categorías redundantes.

Red semántica. Esta técnica comienza identificando los posibles sentidos de cada concepto a partir de un amplio índice de relaciones de palabras, y luego crea categorías agrupando los conceptos relacionados. Esta técnica resulta idónea cuando los conceptos son conocidos en la red semántica y no son muy ambiguos. Resulta menos adecuada si el texto contiene terminología específica o jerga desconocida para la red. En un ejemplo, el concepto granny smith apple se podría agrupar con gala apple y winesap apple ya que son hermanos de Granny Smith. En otro ejemplo, el concepto animal podría agruparse con cat y kangaroo ya que son hipónimos de animal. Esta técnica solo está disponible para el texto en inglés.

Inclusión de conceptos. Esta técnica genera categorías agrupando los conceptos multitérmino (palabras compuestas) en función de si contienen palabras que son subconjuntos o superconjuntos de una palabra en la otra. Por ejemplo, el concepto seat se agruparía con safety seat, seat belt y seat belt buckle.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información