Go back to the English version of the documentation高级频率设置
高级频率设置 (SPSS Modeler)
Last updated: 2024年6月07日
您可以基于直接和机械频率方法构建类别。 通过此方法,您可以为发现高于给定记录或文档计数的每个项 (类型,概念或模式) 构建一个类别。 此外,还可以针对出现频率较低的所有项构建单个类别。 计数时,我们指的是包含抽取概念(及其任何同义词)、类型或问题模式的记录或文档数,而不是整个文本中出现的总次数。
对频繁出现的项进行分组可获取相关结果,因为这可能会指示常见或重要响应。 在应用其他方法后,此方法对于未使用的抽取结果很有用。 另一种应用是在不存在任何其他类别的情况下,在抽取后将立即运行此方法,编辑结果以删除不相关的类别,然后扩展这些类别以便其匹配更多记录或文档。
您可以通过将抽取结果窗格中的记录或文档数降序来对概念或概念模式进行排序,然后将记录最多的记录拖放到类别窗格中以创建相应的类别,而不是使用此方法。
以下高级设置可用于类别设置中的使用频率构建类别选项。
在以下位置生成类别描述符。 选择描述符的输入类型。
- 概念级别。 选择此选项表示将使用概念或概念模式频率。 如果将类型选作构建类别的输入,那么将使用概念,如果选择了类型模式,那么将使用概念模式。 通常,向概念级别应用此方法将产生更具体的结果,这是因为概念和概念模式表示较低级别的度量。
- 类型级别。 选择此选项表示将使用类型或类型模式频率。 如果将类型选作构建类别的输入,那么将使用类型,如果选择了类型模式,那么将使用类型模式。 通过将此方法应用于类型级别,可以快速查看给定信息的类型。
最小记录/文档数。 要具有其自己的类别的项的计数。 通过此选项,可以从频繁出现的项构建类别。 此选项限制为仅输出以下类别:包含在至少 X 个记录或文档中出现的描述符的类别,其中 X 是将为此选项输入的值。
将所有剩余项分组到一个称为类别的类别中。 如果要将偶尔出现的所有概念或类型分组到具有所选名称的单个总类别,请使用此选项。 缺省情况下,此类别名为其他。
类别输入。 选择要向其应用方法的组:
- 未使用的抽取结果。 使用此选项,可根据任何现有类别中未使用的抽取结果构建类别。 这可最大程度降低记录匹配多个类别的趋势,并限制生成的类别数。
- 所有抽取结果。 此选项可使用任何抽取结果构建类别。 不存在任何分类或存在很少的分类时,这会很有帮助。
解析重复的类别名称依据。 选择如何处理其名称将与现有类别相同的任何新类别或子类别。 您可以将新类别(及其描述符)与具有相同名称的现有类别合并,也可以选择在现有类别中发现重复名称时跳过创建任何类别。