Retourner à la version anglaise de la documentationScripts Python for Spark
Python pour les scripts Spark (SPSS Modeler)
Dernière mise à jour : 04 juil. 2024
SPSS Modeler prend en charge les scripts Python pour Apache Spark.
Remarque :
- Les noeuds Python dépendent de l'environnement Spark.
- Les scripts Python doivent utiliser l'API Spark car les données sont présentées sous la forme d'un Spark DataFrame.
- Lorsque vous installez Python, veillez à ce que tous les utilisateurs disposent des droits permettant d'y accéder.
- Si vous souhaitez utiliser Machine Learning Library (MLlib), vous devez installer une version de Python incluant NumPy.
Astuces
Vous pouvez exécuter les scripts Python suivants à partir d'un noeud Sortie d'extension :
- Pour afficher des informations sur la distribution de Python inclus avec SPSS Modeler:
import sys sys.version
- Pour répertorier tous les packages Python installés :
import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
- Pour installer des packages Python à partir d'un environnement à espace de stockage, utilisez l'option
--index-url
qui permet àpip
d'installer des packages à partir d'un référentiel Python donné (le référentiel doit être conforme à PEP 503). Pour plus d'informations, y compris une liste de toutes les options, voir https://pip.pypa.io/en/stable/cli/pip_install/.