0 / 0

watsonx.ai 에서 ML 모델 구축 및 watsonx.data 가속기에서 Spark로 일괄 채점하기

마지막 업데이트 날짜: 2025년 3월 25일
watsonx.ai 에서 ML 모델 구축 및 watsonx.data 가속기에서 Spark로 일괄 채점하기

watsonx.ai 에서 ML 모델 구축 및 watsonx.data 가속기에서 Spark로 일괄 채점하기에서는 watsonx.ai 에서 ML 모델을 학습하고 지속하는 엔드투엔드 워크플로우를 안내하고 watsonx.data 에서 Spark로 해당 모델을 대규모로 일괄 채점하는 방법을 안내합니다.

이 액셀러레이터를 사용하여 watsonx.ai 에서 ML 모델을 학습하고 지속하는 엔드투엔드 워크플로를 설정한 다음 watsonx.data 에서 Spark를 사용하여 대규모로 일괄 채점해 보세요.

시작하려면 리소스 허브에 로그인한 다음 watsonx.ai 에서 ML 모델 구축 및 watsonx.data 에서 Spark를 사용한 일괄 스코어링 샘플 프로젝트를 기반으로 하는 새 프로젝트를 만듭니다.

이 가속기는 파이프라인을 사용하여 데이터 로드, 모델 학습, 최상의 결과 선택, 모델 저장소에 최상의 모델 유지에 이르기까지 엔드투엔드 AI 수명 주기를 자동화하는 확장 가능한 ML 패턴과 구현을 제공합니다. 플로우를 한 번 생성하고 구성한 다음 개별 도구 및 에셋과 상호 작용할 필요 없이 필요에 따라 또는 일정에 따라 실행할 수 있습니다.

다음 프로세스가 포함되어 있습니다:

  • 트레이닝 데이터 로드
  • 공통 훈련 데이터 세트에서 scikit-learn ML 모델 또는 AutoAI 모델 훈련하기
  • 결과를 비교하여 가장 적합한 모델을 선택합니다. 그런 다음 모델 저장소에 모델을 유지합니다
  • UDF를 사용하여 모델을 Spark 모델로 변환한 다음 이 모델에서 대규모 일괄 채점을 수행합니다

이 그래프는 이 워크플로의 파이프라인 보기를 보여줍니다:

watsonx.ai 에서 ML 모델 구축 워크플로우의 파이프라인 보기 및 watsonx.data 가속기에서 Spark를 사용한 일괄 점수 매기기

이 그래프는 watsonx.ai 에서 ML 모델을 구축하고 watsonx.data accelerator에서 Spark를 사용하여 일괄 스코어링을 수행하는 데 사용되는 확장 가능한 ML 패턴의 자세한 아키텍처 다이어그램을 보여줍니다.

watsonx.ai 에서 ML 모델 구축에 사용되는 확장 가능한 ML 패턴의 상세 아키텍처 다이어그램과 watsonx.data 가속기에서 Spark를 사용한 일괄 점수화

나만의 모델 가져오기

이미 학습된 모델이 있는 경우 워크플로를 쉽게 사용자 지정하여 모델 학습 단계를 건너뛰고 자체 데이터와 ML 모델을 이 watsonx.ai 프로젝트에 직접 로드할 수 있습니다. 그런 다음 Spark로 일괄 채점을 수행합니다. 지원되는 모델 유형에 대한 자세한 내용은 watsonx.ai 지원되는 소프트웨어 사양 문서 페이지에서 확인할 수 있습니다.

Spark 런타임 사용자 지정

watsonx.data 에서 사용하는 스파크 엔진을 필요에 맞게 사용자 지정할 수 있습니다. 예를 들어, 사용자 지정 분석을 위해 타사 라이브러리를 설치하거나 일부 클러스터 구성을 미세 조정하고 싶을 수 있습니다. 자세한 내용은 다음 문서 페이지에서 확인할 수 있습니다:

스파크의 유연한 사용 방법 watsonx.data

이 패턴에서 Analytics Engine 는 watsonx.data 에서 Spark 엔진으로 사용되며, 이 프로젝트의 일부인 노트북은 Spark API를 사용하여 Python 로 작성된 Spark 작업을 제출하는 예제를 보여줍니다. watsonx.data 예를 들어, R 및 Scala 에서 작성된 Spark 작업을 실행할 수 있는 다른 방법도 있습니다. 자세한 내용은 이 목록을 참조하세요:

다양한 스파크 엔진

다음에서 Spark 런타임에 연결하는 다양한 방법 watsonx.data

상위 주제: AI 솔루션 액셀러레이터