Erweiterungsknoten

Letzte Aktualisierung: 12. Feb. 2025
Erweiterungsknoten (SPSS Modeler)

SPSS Modeler unterstützt die Sprachen R und Apache Spark (mit Python).

Es stehen mehrere Erweiterungsknoten zur Verfügung, mit denen erfahrene Benutzer ihre eigenen R-Scripts oder Python for Spark-Scripts eingeben können, um Datenverarbeitung, Modellerstellung und Modellscoring durchzuführen. Diese Erweiterungsknoten ergänzen SPSS Modeler und seine Data-Mining-Funktionen.

Vorbereitende Schritte

Sie können R-und Python-Bibliotheken laden, um sie mit den Erweiterungsknoten verwenden zu können. Um R-oder Python-Skripte auszuführen, müssen Sie zunächst alle Pakete installieren, die Ihre Scripts benötigen. Um Pakete zu installieren, müssen Sie die folgenden Scripts in einen Erweiterungsausgabeknoten einschließen, ihn mit einem Benutzereingabeknoten verbinden und anschließend den Erweiterungsausgabeknoten ausführen, um den Installationsprozess zu starten.
Tipp: Sie können diese Scripts auch vor anderen Scripts einfügen, wenn die Installation und Ihre taskbezogenen Scripts zusammen ausgeführt werden sollen.
Um R-Pakete zu installieren:
  1. Führen Sie den folgenden Befehl aus:
    install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")
    Beispiel:
    install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org")
  2. Führen Sie den folgenden Befehl aus, um zu überprüfen, ob das Paket erfolgreich installiert wurde:
    packageVersion("$PACKAGE_NAME")
    Beispiel:
    packageVersion("Sequential")
Hinweis: Wenn das R-Paket nicht in Ihrem Repository verfügbar ist, kann die Installation fehlschlagen. In einem solchen Fall können Sie den gleichen Installationsbefehl aus der R-Befehlszeilenumgebung (nicht von R Studio) ausführen.
Um Python-Pakete zu installieren:
  1. Führen Sie den folgenden Befehl aus:
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])
    Der folgende Befehl installiert z. B. numpy:
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input'])
  2. Führen Sie den folgenden Befehl aus, um zu überprüfen, ob das Paket erfolgreich installiert wurde:
    import pkgutil
    pkgutil.ModuleInfo('$PACKAGE_NAME')
    Mit dem folgenden Befehl wird beispielsweise geprüft, ob numpy erfolgreich installiert wurde:
    import pkgutil
    pkgutil.ModuleInfo('numpy')