빠른 시작: AutoAI로 기계 학습 모델 빌드 및 배치

AutoAI 도구로 기계 학습 모델 빌드 프로세스를 자동화할 수 있습니다. AutoAI 도구에 대해 읽은 후 비디오를 시청하고 초보자에게 적합한 학습서를 사용하여 코딩이 필요하지 않습니다.

필요 서비스 Watson Machine Learning

기본 워크플로우에는 다음 태스크가 포함됩니다.

  1. 프로젝트를 작성합니다. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
  2. 프로젝트에 데이터를 추가하십시오. 연결을 통해 원격 데이터 소스에서 데이터나 CSV 파일을 추가할 수 있습니다.
  3. AutoAI 실험을 프로젝트에 작성합니다.
  4. 모델 파이프라인을 검토하고 원하는 파이프라인을 모델로 저장하여 노트북으로 배치하여 사용자 정의합니다.
  5. 모델을 배치하고 테스트하십시오.

AutoAI에 대해 알아보기

Watson Studio의 AutoAI 그래픽 도구는 자동으로 데이터를 분석하고 예측 모델링 문제에 맞게 사용자 정의된 후보 모델 파이프라인을 생성합니다. AutoAI가 데이터 세트를 분석하고 문제점 설정에 가장 적합한 데이터 변환, 알고리즘 및 매개변수 설정을 발견할 때 이러한 모델 파이프라인이 반복적으로 작성됩니다. 결과는 리더보드에 표시되며 문제점 최적화 목표에 따라 자동으로 생성된 모델 파이프라인을 표시됩니다.

AutoAI에 대해 자세히 알아보기

모델을 빌드하는 다른 방법에 대해 학습

AutoAI를 사용하여 모델 작성에 대한 동영상 보기

비디오 시청 은행 마케팅 샘플을 기반으로 AutoAI 실험을 작성하고 실행하는 방법을 보려면 이 비디오를 시청하십시오.

이 비디오는 이 문서에 기록된 단계를 수행하는 방법의 대안인 시각적 메소드를 제공합니다.

  • 시간 내용 기록
    00:00 이 비디오는 Watson Machine Learning 모델을 작성하기 위해 샘플 AutoAI 실험을 실행하는 방법을 보여줍니다.
    00:08 Watson Studio 프로젝트에서 시작하여 이 프로젝트에 새 AutoAI 실험을 추가하십시오.
    00:16 AutoAI 실험을 실행하려면 Watson Machine Learning 서비스가 필요합니다.
    00:22 여기서 Watson Machine Learning 서비스를 이 프로젝트와 연관시키는 옵션이 있습니다.
    00:29 새 서비스 인스턴스를 작성하거나 기존 서비스 인스턴스를 선택할 수 있습니다.
    00:39 실험을 작성하는 페이지로 돌아가면 페이지를 다시 로드하면 나열된 새 서비스 인스턴스가 표시됩니다.
    00:48 이 첫 번째 실험에서는 샘플을 선택합니다.
    00:52 은행 마케팅 샘플에는 마케팅 캠페인에 대한 응답으로 은행에 전화 통화에서 수집된 텍스트 데이터가 포함되어 있습니다.
    01:01 샘플을 선택하면 실험 이름과 설명이 입력되어 있으므로 실험을 작성할 준비가 되었습니다.
    01:11 다음으로, AutoAI 실험 빌더가 표시됩니다.
    01:15 이 실험은 샘플에서 나온 것이므로 은행 마케팅 소스 파일이 이미 선택되어 있습니다.
    01:22 또한 예측할 열도 이미 선택되어 있습니다.
    01:26 이 경우에는 "y" 열이며, 이것은 사용자가 마케팅 캠페인의 일부로서 예금에 가입할 것인지 여부를 나타냅니다.
    01:35 데이터 세트 및 예측하도록 선택된 열을 기반으로, AutoAI는 데이터의 서브세트를 분석하고 분석할 예측 유형과 메트릭을 선택합니다.
    01:47 이 경우, 예측할 열에는 "Y" 또는 "N"(예 또는 아니오)의 값이 포함되어 있으므로 2진 분류가 선택되었습니다.
    01:57 양성 클래스는 "예"이고, 최적화된 메트릭은 ROC AUC입니다.
    02:03 ROC AUC 메트릭은 정밀도, 정확도 및 리콜 균형을 맞춥니다.
    02:10 이제 실험을 실행하고 "파이프라인 리더보드"가 채워질 때까지 기다립니다.
    02:17 AutoAI 훈련 중에는 데이터 세트가 두 개의 파트(훈련 데이터 및 홀드아웃 데이터)로 분할됩니다.
    02:24 훈련 데이터는 AutoAI 훈련 스테이지에서 모델 파이프라인을 생성하는 데 사용되며 교차 검증 스코어는 훈련 후 등급을 매기는 데 사용됩니다.
    02:34 훈련 후에, 결과적인 파이프라인 모델 평가 및 ROC 곡선 및 혼동 행렬과 같은 성능 정보의 계산을 위해 홀드아웃 데이터가 사용됩니다.
    02:48 다음으로 AutoAI는 XGBoost 분류자와 같은 상이한 평가자 또는 하이퍼파라미터 최적화 및 기능 엔지니어링과 같은 개선 사항을 사용하여 파이프라인을 생성하고 파이프라인은 정확도 메트릭을 기반으로 순위가 매겨집니다.
    03:06 하이퍼매개변수 최적화는 잠재적인 하이퍼매개변수의 검색 공간을 자동으로 탐색하고, 일련의 모델을 구축하고, 관심있는 메트릭을 사용하여 모델을 비교하기 위한 메커니즘입니다.
    03:20 기능 엔지니어링에서는 가장 정확하게 예측하기 위해 문제점을 최고로 표현하는 기능 조합으로 원시 데이터를 변환하려 시도합니다.
    03:31 좋아요, 실행이 끝났습니다.
    03:34 범례에서는 관계 맵에서 데이터, 맨 위 알고리즘, 파이프라인 및 기능 변환기를 찾을 수 있는 위치를 설명합니다.
    03:44 전체 로그를 보고 전체 세부사항을 볼 수 있습니다.
    03:48 기본적으로 "관계 맵"이 표시되지만 보기를 스왑하여 "진행 맵"을 볼 수 있습니다.
    03:57 리더보드를 보려면 아래로 화면이동하십시오.
    04:01 파이프라인을 비교하여 시작할 수 있습니다.
    04:05 이 차트는 교차 검증 스코어 또는 홀드아웃 스코어로 표시되는 8개의 파이프라인에 대한 메트릭을 제공합니다.
    04:13 평균 정밀도와 같은 다른 메트릭을 기반으로 순위화된 파이프라인을 볼 수 있습니다.
    04:21 "실험 요약" 탭에서 파이프라인을 펼쳐 모델 평가 수치 및 ROC 곡선을 볼 수 있습니다.
    04:30 개별 파이프라인을 보고 혼동 행렬, 정밀도 리콜 곡선, 모델 정보, 기능 변환 및 기능 중요도에 추가로 자세한 정보를 볼 수 있습니다.
    04:49 이 파이프라인은 가장 높은 순위를 가지고 있어서 이를 머신 러닝 모델로 저장할 수 있습니다.
    04:55 기본값을 그대로 사용하고 모델을 저장합니다.
    05:01 이제 모델을 훈련했으므로 모델을 보고 배치할 준비가 되었습니다.
    05:06 "개요" 탭은 모델 요약 및 입력 스키마를 표시합니다.
    05:12 모델을 배치하려면 배치 공간으로 이를 프로모션해야 합니다.
    05:17 이 프로젝트에 아직 연관된 배치 공간이 없으므로 먼저 연관을 설정해야 합니다.
    05:25 기존 배치 공간을 선택하거나 새 배치 공간을 작성할 수 있습니다.
    05:31 새 공간을 작성할 때 이름과 설명만 제공하고 Cloud Object Storage 및 Watson Machine Learning 서비스를 선택하십시오.
    05:41 그런 다음 공간을 작성합니다.
    05:45 이제 이 새 공간을 선택하고 모델에 대한 설명을 추가한 후"프로모션"을 클릭하십시오.
    05:53 이 링크를 사용하여 배치 공간으로 이동하십시오.
    06:00 이제 방금 작성한 모델을 사용하여 배치할 수 있습니다.
    06:04 이 경우에는 온라인 배치가 됩니다.
    06:08 배치 이름을 입력하고 "작성"을 클릭하십시오.
    06:12 그런 다음 모델이 배치되는 동안 기다리십시오.
    06:16 모델 배치가 완료되면 배치를 보십시오.
    06:20 "API 참조" 탭에서 향후 참조를 위한 스코어링 엔드포인트를 찾을 수 있습니다.
    06:26 또한 애플리케이션에서 이 배치를 활용하기 위해 다양한 프로그래밍 언어에 대한 코드 스니펫을 찾을 수 있습니다.
    06:35 "테스트" 탭에서 모델 예측을 테스트할 수 있습니다.
    06:40 테스트 입력 데이터를 입력하거나 JSON 입력 데이터를 붙여넣은 후 "예측"을 클릭할 수 있습니다.
    06:52 이는 첫 번째 사람이 정기예금에 가입하지 않을 가능성이 매우 높고, 두 번째 사람이 정기예금에 가입할 확률이 매우 높다는 것을 보여줍니다.
    07:06 프로젝트에서 "자산" 탭에서 AutoAI 실험과 모델을 찾을 수 있습니다.
    07:17 Cloud Pak for Data as a Service 문서에서 더 많은 동영상을 보십시오.

튜토리얼을 시도하여 AutoAI를 사용한 모델 작성

이 튜토리얼에서는 다음을 수행합니다.

  • 프로젝트를 작성합니다.
  • Watson Machine Learning 서비스를 프로젝트와 연관시킵니다.
  • AutoAI 실험을 프로젝트에 작성합니다.
  • 모델을 빌드하고 훈련합니다.
  • 파이프라인을 모델로 저장합니다.
  • 모델을 배치하십시오.
  • 모델을 테스트하십시오.

이 튜토리얼을 완료하는 데 대략 30분 정도 소요됩니다.

샘플 데이터

안내된 경험에서 사용되는 샘플 데이터는 고객이 마케팅 프로모션에 등록할지 여부를 예측하는 데 사용되는 은행 마케팅 데이터입니다. 갤러리 샘플을 실험의 기초로 선택할 때 데이터가 자동으로 업로드되고 사용 가능합니다.

1단계: 프로젝트 작성 및 Watson Machine Learning 서비스 연관

{: #step1} AutoAI 실험을 저장할 프로젝트가 필요합니다.

  1. 기존 프로젝트가 있는 경우, 이를 여십시오. 기존 프로젝트가 없는 경우 홈 페이지에서 프로젝트 작성을 클릭하거나 프로젝트 페이지에서 새 프로젝트를 클릭하십시오.
  2. 빈 프로젝트 작성을 선택하십시오.
  3. 프로젝트 작성 화면에서 프로젝트에 대한 이름 및 선택적 설명을 추가하십시오.
  4. 기존 오브젝트 스토리지 서비스 인스턴스을(를) 선택하거나 새로 작성하십시오.

  5. 작성을 클릭하십시오.

  6. 프로젝트가 열리면 관리 탭을 클릭하고 서비스 및 통합 페이지를 선택하십시오.

  7. IBM 서비스 섹션에서 서비스 연관을 클릭하십시오.
  8. 아직 Watson Machine Learning 서비스 인스턴스가 프로비저닝되지 않은 경우 새로운 서비스를 클릭하고 머신 러닝을 선택한 후 작성을 클릭하십시오.
  9. Watson Machine Learning 인스턴스를 선택하고 서비스 연관을 클릭하십시오.
  10. 서비스 연관 대화 상자를 닫으십시오.

자세한 정보 또는 비디오를 시청하려면 프로젝트 작성을(를) 참조하십시오.
연관된 서비스에 대한 자세한 정보는 연관된 서비스 추가을(를) 참조하십시오.

2단계: 모델 빌드 및 훈련

{: #step2} AutoAI 실험을 작성하고 모델 파이프라인을 검토한 후 모델로 저장할 파이프라인을 선택하십시오.

  1. 프로젝트의 자산 탭에서 새로운 자산 > AutoAI 실험을 클릭하십시오.
  2. 열리는 페이지에서 기본 필드를 채우십시오.
    1. 갤러리 샘플을 클릭하고 은행 마케팅 샘플 데이터를 선택하십시오. 프로젝트 이름과 설명이 채워집니다.
    2. 프로젝트와 연관된 머신 러닝 서비스 인스턴스가 머신 러닝 서비스 섹션에서 선택되었는지 확인하십시오.
  3. 작성을 클릭하십시오.
  4. 이 샘플 AutoAI 경험 샘플에서는 은행 마케팅 샘플 데이터가 이미 실험에 대해 선택되어 있음을 확인할 수 있습니다.
  5. 모델에 대해 "Y"로 레이블 지정된 열이 자동으로 선택됩니다. 이 열은 고객이 마케팅 프로모션에 등록하는지 여부를 예측하는 데 사용됩니다. AutoAI는 데이터를 분석하고 Y 열에 True/False 정보가 포함되는지 판별하여 이 데이터를 2진 분류 모델에 적합하도록 작성합니다. 2진 분류의 기본 메트릭은 ROC/AUC입니다.
  6. 데이터 세트 및 예측하도록 선택된 열을 기반으로, AutoAI는 데이터의 서브세트를 분석하고 분석할 예측 유형과 메트릭을 선택합니다. 이 경우 예측 유형은 2진 분류이고, 긍정적인 클래스는 Yes이고, 최적화된 메트릭은 ROC AUC입니다.
  7. 실험 실행을 클릭하십시오. 모델이 훈련되면서 파이프라인 빌드 프로세스를 표시하는 인포그래픽이 표시됩니다.
  8. 일단 파이프라인 작성이 완료되면 리더보드에서 순위가 지정된 파이프라인을 보고 비교할 수 있습니다.
  9. 가장 높은 순위의 파이프라인을 선택하고 조치 메뉴에서 저장 모델을 선택하십시오. 그러면 파이프라인이 프로젝트에서 Machine Learning 자산으로 저장됩니다.
  10. 모델이 저장되면 알림에서 프로젝트 보기 링크를 클릭하여 프로젝트의 모델을 보십시오. 또는 프로젝트의 자산 탭으로 이동하여 머신 러닝 모델 섹션에서 모델 이름을 클릭할 수 있습니다.

3단계: 모델을 배치 영역으로 승격하고 훈련된 모델 배치

이제 모델을 배치 공간으로 프로모션하여 모델을 배치할 수 있습니다.

  1. 배치 공간으로 프로모션을 클릭하십시오.
  2. 기존 배치 영역을 선택하십시오. 배치 공간이 없는 경우 새 배치 공간을 작성할 수 있습니다.
    1. 공간 이름 및 선택적 설명을 제공하십시오.
    2. 스토리지 서비스를 선택하십시오.
    3. 기계 학습 서비스를 선택하십시오.
    4. 작성을 클릭하십시오.
    5. 닫기를 클릭하십시오.
  3. 승격을 클릭하십시오.
  4. 모델이 프로모션되면 알림에서 배치 공간 링크를 클릭하여 프로젝트의 모델을 보십시오. 또는 탐색 메뉴를 사용하여 배치로 이동하고 배치 공간 이름을 클릭할 수 있습니다.
  5. 모델 이름 옆에 있는 배치 아이콘을 클릭하십시오.
    1. Select 온라인 as the 배치 유형.
    2. 배치의 이름을 지정하십시오.
    3. 작성을 클릭하십시오.
  6. 배치 탭을 클릭하고 모델이 배치될 때까지 기다리십시오.
  7. 배치가 완료되면 배치 이름을 클릭하여 배치 세부사항 페이지를 보십시오.

4단계: 배치된 모델 테스트

{: #step4} 새 데이터로 모델을 테스트하려면 배치를 사용하십시오.

  1. 테스트 탭을 클릭하십시오. JSON 코드로 테스트 또는 형식으로 테스트의 두 가지 방식으로 배치 세부사항 페이지에서 배치된 모델을 테스트할 수 있습니다.
  2. JSON으로 입력 데이터 제공 아이콘을 클릭한 후 다음 테스트 데이터를 복사하여 JSON 텍스트의 공간에 붙여넣으십시오.

    {"input_data":[{
            "fields": ["age","job","marital","education","default","balance","housing","loan","contact","day", "month","duration","campaign","pdays","previous","poutcome"],
            "values": [[27,"unemployed", "married", "primary", "no",1787,"no", "no","cellular",19,"oct", 79, 1, -1, 0, "unknown" ]]
    }]}
    
  3. 지정된 속성을 가진 고객이 특정 유형의 계정에 등록할 가능성이 있는지 여부를 예측하려면 예측을 클릭하십시오. 결과 예측은 이 고객이 마케팅 프로모션에 등록하지 않을 확률이 매우 높음을 표시합니다.

다음 단계

이제 차후 분석을 위해 이 데이터 세트를 사용할 수 있습니다. 예를 들어, 사용자나 다른 사용자가 다음 태스크를 수행할 수 있습니다.

추가 자원

  • AutoAI에 대한 추가 비디오 보기
  • 갤러리에서 모델 빌드에 대한 작성 경험을 얻기 위해 샘플 데이터 세트 찾기{: new_window}
  • 이 추가 튜토리얼을 시도하여 노트북에서 모델을 빌드하고 AutoAI를 사용하여 추가 실제 경험을 얻으십시오.

상위 주제: 모델 작성, 배치 및 신뢰 모델 시작하기