SPSS Modeler utiliza un proceso de extracción que se basa en recursos lingüísticos. Estos recursos lingüísticos sirven de base para procesar los datos textuales y extraer información para obtener los conceptos, tipos y, a veces, patrones.
Los recursos lingüísticos pueden dividirse en distintos tipos:
- Conjuntos de categorías
- Las categorías son un grupo de ideas y patrones estrechamente relacionados a los que se asignan los datos del texto mediante un proceso de puntuación.
- Bibliotecas
- Las bibliotecas se utilizan como los cimientos sobre los que se basan tanto los TAP como las plantillas. Cada biblioteca se compone de varios diccionarios, que sirven para definir y gestionar términos, sinónimos y listas de exclusión. Aunque las bibliotecas también se entregan individualmente, se empaquetan juntas en plantillas y en los TAP.
- Plantillas
- Las plantillas consisten en un conjunto de bibliotecas y algunos recursos lingüísticos y no lingüísticos avanzados. Estos recursos forman un conjunto especializado que se adapta a un dominio o contexto concreto, como las opiniones sobre productos.
- Paquetes de análisis de texto (TAP)
- Un paquete de análisis de texto es una plantilla predefinida que incluye uno o varios conjuntos de categorías. Los PAT agrupan estos recursos para que las categorías y los recursos utilizados para generarlas se almacenen juntos y sean reutilizables. A continuación, puede reutilizar un TAP para aplicar las mismas categorías y recursos a otros flujos.
Recursos lingüísticos personalizados
SPSS Modeler tiene un conjunto predeterminado de recursos lingüísticos especializados. Puede utilizar estos recursos lingüísticos para beneficiarse de la investigación y el perfeccionamiento para lenguas específicas y aplicaciones concretas. Sin embargo, es posible que estos recursos lingüísticos no estén optimizados para su contexto o sus datos. Puede editar y guardar sus cambios en estos recursos lingüísticos para optimizar el proceso de extracción para su flujo.
También puede crear e importar recursos lingüísticos personalizados que se ajusten de forma exclusiva a los datos de su organización. Puede utilizar archivos locales para compartir estos recursos lingüísticos entre usuarios y proyectos. Puede añadir una plantilla, biblioteca o TAP como activo del proyecto desde un archivo local.