Torna alla versione inglese della documentazioneScript Python for Spark
Python per script Spark (SPSS Modeler)
Ultimo aggiornamento: 05 lug 2024
SPSS Modeler supporta gli script Python per Apache Spark.
Nota:
- I nodi Python dipendono dall'ambiente Spark.
- Gli script Python devono utilizzare l'API Spark perché i dati vengono presentati sotto forma di Spark DataFrame.
- Quando si installa Python, assicurarsi che tutti gli utenti abbiano l'autorizzazione ad accedere all'installazione di Python.
- Se si desidera utilizzare MLlib (Machine Learning Library), è necessario installare una versione di Python che include NumPy.
Suggerimenti
È possibile eseguire i seguenti script Python da un nodo Output di estensione:
- Per visualizzare informazioni sulla distribuzione di Python incluso con SPSS Modeler:
import sys sys.version
- Per elencare tutti i pacchetti Python installati:
import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
- Per installare i pacchetti Python da un ambiente air - gapped, utilizzare l'opzione
--index-url
che consente apip
di installare i pacchetti da un determinato repository Python (il repository deve essere compatibile con PEP 503). Per ulteriori informazioni, incluso un elenco di tutte le opzioni, consultare https://pip.pypa.io/en/stable/cli/pip_install/.