Go back to the English version of the documentation文本链接的挖掘
挖掘文本链接 (SPSS Modeler)
Last updated: 2024年5月27日
“文本链接分析”(TLA) 节点新增了模式匹配技术,应用于文本挖掘的概念抽取,以便基于已知模式识别文本数据中概念之间的关系。 这些关系可以描述客户对于产品的感受、哪些公司正在合作开展业务,甚至是基因或药品代理之间的关系。
例如,您可能并不满足于只是抽取竞争对手的产品名称。 通过使用此节点,您还可以了解人们对于该产品的感受,前提是数据中存在此类意见。 通过将已知模式与您的文本数据进行匹配来识别和抽取关系和关联。
您可以使用随“文本分析”提供的特定资源模板中的 TLA 模式规则,也可以创建/编辑您自己的 TLA 模式规则。 模式规则由宏、文字列表和组成布尔值查询或与您的输入文本比较的规则的字隙组成。 每当 TLA 模式规则匹配文本时,可以将此文本作为 TLA 结果进行抽取,并将其重构为输出数据。
“文本链接分析”节点提供了更直接的方法,来识别和抽取文本中的 TLA 模式结果,然后将结果添加到流中的数据集。 但是“文本链接分析”节点并非您可执行文本链接分析的唯一方法。 您还可以在 "文本挖掘" 建模节点中使用 "文本分析工作台" 会话。
最多可在 6 个通道或部件中表示此输出。
您可以在节点选用板的“文本分析”部分中找到此节点。
需求。 "文本链接分析" 节点接受使用 "导入" 节点读取到字段中的文本数据。
强度。 “文本链接分析”节点不仅通过基本概念抽取提供有关概念之间的关系的信息,还提供数据中可能揭示的相关意见或限定符。