Volver a la versión inglesa de la documentaciónScripts de Python para Spark
Scripts de Python para Spark (SPSS Modeler)
Última actualización: 04 jul 2024
SPSS Modeler da soporte a scripts Python para Apache Spark.
Nota:
- Los nodos Python dependen del entorno Spark.
- Los scripts Python deben utilizar la API Spark porque los datos se presentan en un Spark DataFrame.
- Al instalar Python, asegúrese de que todos los usuarios tienen permiso para acceder a la instalación de Python.
- Si desea utilizar la biblioteca de aprendizaje de máquina (MLlib), debe instalar una versión de Python que incluye NumPy.
Consejos
Puede ejecutar los siguientes scripts de Python desde un nodo Salida de extensión:
- Para ver información sobre la distribución de Python incluida con SPSS Modeler:
import sys sys.version
- Para listar todos los paquetes de Python instalados:
import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
- Para instalar paquetes de Python desde un entorno de espacio vacío, utilice la opción
--index-url
que permite apip
instalar paquetes desde un repositorio Python determinado (el repositorio debe ser compatible con PEP 503). Para obtener más información, incluida una lista de todas las opciones, consulte https://pip.pypa.io/en/stable/cli/pip_install/.