watsonx.ai 에서 ML 모델 구축 및 watsonx.data 가속기에서 Spark로 일괄 채점하기
watsonx.ai 에서 ML 모델 구축 및 watsonx.data 가속기에서 Spark로 일괄 채점하기에서는 watsonx.ai 에서 ML 모델을 학습하고 지속하는 엔드투엔드 워크플로우를 안내하고 watsonx.data 에서 Spark로 해당 모델을 대규모로 일괄 채점하는 방법을 안내합니다.
이 액셀러레이터를 사용하여 watsonx.ai 에서 ML 모델을 학습하고 지속하는 엔드투엔드 워크플로를 설정한 다음 watsonx.data 에서 Spark를 사용하여 대규모로 일괄 채점해 보세요.
시작하려면 리소스 허브에 로그인한 다음 watsonx.ai 에서 ML 모델 구축 및 watsonx.data 에서 Spark를 사용한 일괄 스코어링 샘플 프로젝트를 기반으로 하는 새 프로젝트를 만듭니다.
이 가속기는 파이프라인을 사용하여 데이터 로드, 모델 학습, 최상의 결과 선택, 모델 저장소에 최상의 모델 유지에 이르기까지 엔드투엔드 AI 수명 주기를 자동화하는 확장 가능한 ML 패턴과 구현을 제공합니다. 플로우를 한 번 생성하고 구성한 다음 개별 도구 및 에셋과 상호 작용할 필요 없이 필요에 따라 또는 일정에 따라 실행할 수 있습니다.
다음 프로세스가 포함되어 있습니다:
- 트레이닝 데이터 로드
- 공통 훈련 데이터 세트에서 scikit-learn ML 모델 또는 AutoAI 모델 훈련하기
- 결과를 비교하여 가장 적합한 모델을 선택합니다. 그런 다음 모델 저장소에 모델을 유지합니다
- UDF를 사용하여 모델을 Spark 모델로 변환한 다음 이 모델에서 대규모 일괄 채점을 수행합니다
이 그래프는 이 워크플로의 파이프라인 보기를 보여줍니다:
이 그래프는 watsonx.ai 에서 ML 모델을 구축하고 watsonx.data accelerator에서 Spark를 사용하여 일괄 스코어링을 수행하는 데 사용되는 확장 가능한 ML 패턴의 자세한 아키텍처 다이어그램을 보여줍니다.
나만의 모델 가져오기
이미 학습된 모델이 있는 경우 워크플로를 쉽게 사용자 지정하여 모델 학습 단계를 건너뛰고 자체 데이터와 ML 모델을 이 watsonx.ai 프로젝트에 직접 로드할 수 있습니다. 그런 다음 Spark로 일괄 채점을 수행합니다. 지원되는 모델 유형에 대한 자세한 내용은 watsonx.ai 지원되는 소프트웨어 사양 문서 페이지에서 확인할 수 있습니다.
Spark 런타임 사용자 지정
watsonx.data 에서 사용하는 스파크 엔진을 필요에 맞게 사용자 지정할 수 있습니다. 예를 들어, 사용자 지정 분석을 위해 타사 라이브러리를 설치하거나 일부 클러스터 구성을 미세 조정하고 싶을 수 있습니다. 자세한 내용은 다음 문서 페이지에서 확인할 수 있습니다:
스파크의 유연한 사용 방법 watsonx.data
이 패턴에서 Analytics Engine 는 watsonx.data 에서 Spark 엔진으로 사용되며, 이 프로젝트의 일부인 노트북은 Spark API를 사용하여 Python 로 작성된 Spark 작업을 제출하는 예제를 보여줍니다. watsonx.data 예를 들어, R 및 Scala 에서 작성된 Spark 작업을 실행할 수 있는 다른 방법도 있습니다. 자세한 내용은 이 목록을 참조하세요:
다양한 스파크 엔진
다음에서 Spark 런타임에 연결하는 다양한 방법 watsonx.data
상위 주제: AI 솔루션 액셀러레이터