Python for Spark 스크립트

마지막 업데이트 날짜: 2025년 2월 11일
Python for Spark 스크립트(SPSS Modeler)

SPSS Modeler 는 Apache Spark에 대한 Python 스크립트를 지원합니다.

참고:
  • Python 노드는 Spark 환경에 의존합니다.
  • 데이터가 Spark DataFrame 양식으로 표시되므로 Python 스크립트는 Spark API를 사용해야 합니다.
  • Python을 설치하는 경우, 모든 사용자가 Python 설치에 대한 액세스 권한을 가지고 있는지 확인하십시오.
  • MLlib(Machine Learning Library)를 사용하려면 NumPy를 포함하는 Python 버전을 설치해야 합니다.

확장 출력 노드에서 다음 Python 스크립트를 실행할 수 있습니다.

  • SPSS Modeler에 포함된 Python 의 배포에 대한 정보를 보려면 다음을 수행하십시오.
    import sys
    sys.version
  • 설치된 모든 Python 패키지를 나열하려면 다음을 수행하십시오
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'list'])
  • 에어 갭 환경에서 Python 패키지를 설치하려면 pip이(가) 주어진 Python 저장소에서 패키지를 설치할 수 있도록 하는 --index-url 옵션을 사용하십시오(저장소는 PEP 503을 준수해야 함). 모든 옵션 목록을 포함한 자세한 정보는 https://pip.pypa.io/en/stable/cli/pip_install/의 내용을 참조하십시오.