Go back to the English version of the documentation读入源文本
在源文本中读取 (SPSS Modeler)
Last updated: 2024年10月07日
您可以使用“语言标识”节点来标识源数据中文本字段的自然语言。 此节点的输出是一个包含检测到的语言代码的派生字段。
文本挖掘的数据可以采用 SPSS Modeler 流所使用的任何标准格式,包括以行和列表示数据的数据库或其他 "矩形" 格式。
- 要从 SPSS Modeler 流使用的任何标准数据格式 (例如,具有一个或多个文本字段用于客户注释的数据库) 中读取文本,您可以使用 "导入" 节点。
- 处理大量数据(可能包含多种不同语言的文本)时,请使用“语言标识”节点来标识特定字段中使用的语言。