SPSS Modeler 从文本数据中提取概念和类型后,您就可以开始构建类别了。 在文本分析工作台中,您可以使用 类别选项卡来创建和探索类别。
在类别选项卡上,您可以使用描述符建立类别。 这些术语的定义如下。
- 类别
- 类别是一组密切相关的构想和模式,通过评分过程将文档和记录分配给这些构想和模式。 它们将相关的概念和模式组织成更大的分组,这些分组更容易使用。 类别是概念,类型,规则和模式的组合。
- 描述符
- 描述符用于标识记录或文档是否属于某个类别。 每个类别都由一组描述符 (例如概念,类型和规则) 组成。 当文档或记录中的部分或全部文本与描述符匹配时,文档或记录将与类别匹配。
在文本分析工作台中,您可以浏览模式结果并将其用作类别的描述符。 您可以使用文本挖掘节点来提取文本链接分析 (TLA) 结果,以此对数据模板进行微调。 之后,您可以直接在文本链接分析节点中使用这些模板。
您可以使用 SPSS Modeler 中内置的自动化技术(如语义网络和概念包含)自动构建类别。 或者,您也可以利用对数据的其他见解,手动创建类别。 您还可以使用这两者的组合,还可以从文本分析包装入一组预先构建的类别。
您可以在 资源编辑器选项卡上修改语言资源,从而完善提取结果。
“类别”窗格
您可以管理在 " 类别 " 窗格中构建的任何类别。 如果您想分组的概念和模式不存在类别,您可以创建新的类别。 或者,如果您希望类别包括或不包括特定的概念或模式,也可以对类别进行细化。 您可以选择窗格中的一行,以显示相应文件或描述符的信息。
您可以单击 Search 图标,搜索类别中的特定关键词。
要更改类别的构建方式,请在未选择任何类别时,从工具栏中选择 设置选项。
。 有关设置的更多信息,请参阅预览窗格
选择行时, " 预览 " 窗格将显示具有所选概念的文档或记录中的文本。 突出显示文本以帮助您在文本中轻松识别这些文本。
描述符窗格
" 描述符 " 窗格显示概念,类型,类型模式和概念模式的列表。 您还可以查看这些描述符中是否有任何描述符是类别的一部分。
搜索 "类别" 选项卡
要在特定部分中快速查找信息,请执行以下操作:
- 单击 类别 选项卡上的 查找 图标以显示搜索字段。
- 输入要搜索的字串。 您可以使用向上和向下箭头按钮来控制搜索方向。 如果找到匹配项,那么将突出显示文本。
- 要查找下一个匹配项,请再次单击箭头按钮。
定制类别集
您可以将类别集下载为 .xslx 文件。 您可以定制类别集,然后通过在 类别 选项卡上上载 .xslx 文件来复用该类别集。