Go back to the English version of the documentation扩展节点
扩展节点 (SPSS Modeler)
Last updated: 2024年12月11日
SPSS Modeler 支持语言 R 和 Apache Spark (使用 Python)。
提供了多个 "扩展" 节点,使专家用户能够输入自己的 R 脚本或 Python for Spark 脚本,以执行数据处理,模型构建和模型评分。 这些 "扩展" 节点补充了 SPSS Modeler 及其数据挖掘功能。
- 在节点选用板上的导入下,提供有“扩展导入”节点。 请参阅 "扩展导入" 节点。
- 在节点选用板上的建模下,提供有“扩展模型”节点。 请参阅 扩展模型节点 (Extension Model node)。
- 在节点选用板上的输出下,提供有“扩展输出”节点。 请参阅 扩展输出节点 (Extension Output node)。
- 在节点选用板上的导出下,提供有“扩展导出”节点。 请参阅 扩展导出节点 (Extension Export node)。
准备工作
您可以装入 R 和 Python 库以与扩展节点配合使用。 要运行 R 或 Python 脚本,必须首先安装脚本所需的任何软件包。 要安装软件包,必须在“扩展输出”节点中包含以下脚本,将其连接到“用户输入”节点,然后运行“扩展输出”节点以启动安装过程。
提示: 如果您希望安装脚本和与任务相关的脚本一起运行,那么还可以将这些脚本插入到其他脚本的前面。
要安装 R 软件包:
- 运行以下命令:
install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")
例如:install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org")
- 要验证软件包是否已成功安装,请运行以下命令:
packageVersion("$PACKAGE_NAME")
例如:packageVersion("Sequential")
注: 如果 R 软件包在存储库中不可用,那么安装可能会失败。 在这种情况下,您可以从 R 命令行环境(而不是从 R Studio)尝试相同的安装命令。
要安装 Python 软件包:
- 运行以下命令:
import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])
例如,以下命令将安装 numpy:import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input'])
- 要验证软件包是否已成功安装,请运行以下命令:
import pkgutil pkgutil.ModuleInfo('$PACKAGE_NAME')
例如,以下命令验证是否成功安装了 numpy:import pkgutil pkgutil.ModuleInfo('numpy')