資料の 英語版 に戻るPython for Spark スクリプト
Python for Spark スクリプト (SPSS Modeler)
最終更新: 2024年7月05日
SPSS Modeler は、 Apache Spark用の Python スクリプトをサポートします。
注:
- Python ノードは Spark 環境に依存します。
- Python スクリプトでは、データが Spark DataFrame 形式で表示されるため、Spark API を使用する必要があります。
- Python をインストールする際に、必ずすべてのユーザーに Python インストール済み環境にアクセスする許可を付与してください。
- Machine Learning Library (MLlib) を使用する場合、NumPy を含む Python のバージョンをインストールする必要があります。
ヒント
拡張の出力ノードから以下の Python スクリプトを実行できます。
- SPSS Modelerに組み込まれている Python の配布に関する情報を表示するには、以下のようにします。
import sys sys.version
- すべてのインストール済み Python パッケージをリストする場合:
import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
- エアギャップ環境から Python パッケージをインストールするには、
--index-url
オプションを使用して、pip
が特定の Python リポジトリーからパッケージをインストールできるようにします (リポジトリーは PEP 503 に準拠している必要があります)。 すべてのオプションのリストを含む詳細については、「 https://pip.pypa.io/en/stable/cli/pip_install/」を参照してください。