0 / 0
Retourner à la version anglaise de la documentation
Scripts Python for Spark
Dernière mise à jour : 04 juil. 2024
Python pour les scripts Spark (SPSS Modeler)

SPSS Modeler prend en charge les scripts Python pour Apache Spark.

Remarque :
  • Les noeuds Python dépendent de l'environnement Spark.
  • Les scripts Python doivent utiliser l'API Spark car les données sont présentées sous la forme d'un Spark DataFrame.
  • Lorsque vous installez Python, veillez à ce que tous les utilisateurs disposent des droits permettant d'y accéder.
  • Si vous souhaitez utiliser Machine Learning Library (MLlib), vous devez installer une version de Python incluant NumPy.

Astuces

Vous pouvez exécuter les scripts Python suivants à partir d'un noeud Sortie d'extension :

  • Pour afficher des informations sur la distribution de Python inclus avec SPSS Modeler:
    import sys
    sys.version
  • Pour répertorier tous les packages Python installés :
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
  • Pour installer des packages Python à partir d'un environnement à espace de stockage, utilisez l'option --index-url qui permet à pip d'installer des packages à partir d'un référentiel Python donné (le référentiel doit être conforme à PEP 503). Pour plus d'informations, y compris une liste de toutes les options, voir https://pip.pypa.io/en/stable/cli/pip_install/.
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus