Go back to the English version of the documentationPython for Spark 脚本
Python for Spark 脚本 (SPSS Modeler)
Last updated: 2024年7月05日
SPSS Modeler 支持针对 Apache Spark的 Python 脚本。
注:
- Python 节点依赖于 Spark 环境。
- 因为数据以 Spark DataFrame 的形式呈现,Python 脚本必须使用 Spark API。
- 安装 Python 时,请确保所有用户都有权访问该 Python 安装。
- 如果要使用机器学习库 (MLlib),那么必须安装包含 NumPy 的 Python 版本。
提示
您可以从 "扩展输出" 节点运行以下 Python 脚本:
- 要查看有关 SPSS Modeler随附的 Python 的分发信息,请执行以下操作:
import sys sys.version
- 要列出所有已安装的 Python 软件包:
import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
- 要从气郄环境安装 Python 软件包,请使用
--index-url
选项,该选项允许pip
从给定的 Python 存储库安装软件包 (该存储库必须符合 PEP 503)。 有关更多信息,包括所有选项的列表,请参阅 https://pip.pypa.io/en/stable/cli/pip_install/。