0 / 0
Go back to the English version of the documentation
Python for Spark 脚本
Last updated: 2024年7月05日
Python for Spark 脚本 (SPSS Modeler)

SPSS Modeler 支持针对 Apache Spark的 Python 脚本。

注:
  • Python 节点依赖于 Spark 环境。
  • 因为数据以 Spark DataFrame 的形式呈现,Python 脚本必须使用 Spark API。
  • 安装 Python 时,请确保所有用户都有权访问该 Python 安装。
  • 如果要使用机器学习库 (MLlib),那么必须安装包含 NumPy 的 Python 版本。

提示

您可以从 "扩展输出" 节点运行以下 Python 脚本:

  • 要查看有关 SPSS Modeler随附的 Python 的分发信息,请执行以下操作:
    import sys
    sys.version
  • 要列出所有已安装的 Python 软件包:
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
  • 要从气郄环境安装 Python 软件包,请使用 --index-url 选项,该选项允许 pip 从给定的 Python 存储库安装软件包 (该存储库必须符合 PEP 503)。 有关更多信息,包括所有选项的列表,请参阅 https://pip.pypa.io/en/stable/cli/pip_install/
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more