Go back to the English version of the documentation“扩展导入”节点
"扩展导入" 节点 (SPSS Modeler)
Last updated: 2024年11月07日
通过扩展导入节点,你可以运行用 R、Python 或Pythonfor Spark 编写的脚本来导入数据。
将该节点添加到画布之后,请双击该节点,以打开其属性。
“语法”选项卡
选择语法类型--R、Python 或Pythonfor Spark。 然后,输入或粘贴您的定制脚本,以导入数据。 语法就绪后,即可运行该节点。
“控制台输出”选项卡
控制台输出"选项卡包含 R 脚本或Python脚本运行时接收到的任何输出(例如,如果使用的是 R 脚本,则会显示语法选项卡上 R语法字段中的 R 脚本执行时从 R 控制台接收到的输出)。 该输出可能包括执行 R 或 Python 脚本时生成的 R 或 Python 错误消息或警告。 该输出主要用于调试脚本。 控制台输出选项卡还包含 R 语法或 Python 语法字段中的脚本。
每次运行 "扩展导入 "脚本时,"控制台输出"选项卡的内容都会被从 R 或Python控制台接收到的输出覆盖。 该输出不可编辑。
过滤或重命名字段
可以在流程中的任意位置重命名或排除字段。 例如,作为医学研究人员,您可能不关心患者(记录级别数据)的钾水平(字段级别数据);因此,您可以过滤掉K
(钾)字段。
- 使用“过滤”节点,可以在流程的任何位置重命名或过滤字段
- 使用“过滤”节点,可以将一个导入节点中的字段映射至另一个导入节点
查看和设置有关类型的信息
从“类型”节点,可指定对于建模和其他工作极为重要的字段元数据和属性。这些属性包括:
- 为数据中的每个字段指定用法类型,如范围、集合、有序集合或标志。
- 设置用于处理缺失值和系统空值的选项
- 设置用于建模的字段的角色
- 指定用于从数据自动读取值的字段和选项的值
- 指定值标签