0 / 0
영어 버전 문서로 돌아가기
빠른 시작: AutoAI로 기계 학습 모델 빌드 및 배치

빠른 시작: AutoAI로 기계 학습 모델 빌드 및 배치

AutoAI 도구로 기계 학습 모델 빌드 프로세스를 자동화할 수 있습니다. AutoAI 도구에 대해 읽은 후 비디오를 시청하고 초보자에게 적합한 학습서를 사용하여 코딩이 필요하지 않습니다.

기본 워크플로우에는 다음 태스크가 포함됩니다.

  1. 샌드박스 프로젝트를 여십시오. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
  2. 프로젝트에 데이터를 추가합니다. 연결을 통해 원격 데이터 소스에서 데이터나 CSV 파일을 추가할 수 있습니다.
  3. AutoAI 실험을 프로젝트에 작성합니다.
  4. 모델 파이프라인을 검토하고 원하는 파이프라인을 모델로 저장하여 노트북으로 배치하여 사용자 정의합니다.
  5. 모델을 배치하고 테스트하십시오.

AutoAI에 대해 알아보기

AutoAI 그래픽 도구는 자동으로 데이터를 분석하고 예측 모델링 문제점에 맞게 사용자 정의된 후보 모델 파이프라인을 생성합니다. AutoAI가 데이터 세트를 분석하고 문제점 설정에 가장 적합한 데이터 변환, 알고리즘 및 매개변수 설정을 발견할 때 이러한 모델 파이프라인이 반복적으로 작성됩니다. 결과는 리더보드에 표시되며 문제점 최적화 목표에 따라 자동으로 생성된 모델 파이프라인을 표시됩니다.

AutoAI에 대해 자세히 알아보기

모델을 빌드하는 다른 방법에 대해 학습

AutoAI를 사용하여 모델 작성에 대한 동영상 보기

비디오 보기 은행 마케팅 샘플을 기반으로 AutoAI 실험을 작성하고 실행하는 방법을 보려면 이 비디오를 시청하십시오.

참고: 이 비디오는 이 학습서의 태스크 2-5를 보여줍니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.


튜토리얼을 시도하여 AutoAI를 사용한 모델 작성

이 학습서는 고객이 마케팅 캠페인을 기반으로 예치금에 가입할 가능성이 있는지 예측하기 위해 모델을 훈련하는 과정을 안내합니다.

이 학습서에서는 다음 태스크를 완료합니다.

이 튜토리얼을 완료하는 데 대략 30분 정도 소요됩니다.

샘플 데이터

안내된 경험에서 사용되는 샘플 데이터는 UCI: 고객이 마케팅 프로모션에 등록하는지 여부를 예측하는 데 사용되는 은행 마케팅 데이터입니다.

은행 마케팅 데이터 세트의 스프레드시트





이 학습을 완료하기 위한 팁
다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.

비디오 사진 사용

팁: 비디오를 시작한 후 학습을 통해 화면이동하면 비디오가 그림 모드로 이동합니다. 픽처 인 픽처를 사용하여 최상의 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료하면서 비디오를 따라갈 수 있습니다. 각 태스크에 대한 시간소인을 클릭하여 수행하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장을 사용하는 방법

커뮤니티에서 도움 받기

이 학습서에 대한 도움이 필요한 경우 watsonx 커뮤니티 토론 포럼에서 질문하거나 응답을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.



태스크 1: 프로젝트 열기

데이터 및 AutoAI 실험을 저장할 프로젝트가 필요합니다. 샌드박스 프로젝트를 사용하거나 프로젝트를 작성할 수 있습니다.

  1. 탐색 메뉴 탐색 메뉴에서 프로젝트 > 모든 프로젝트 보기 를 선택하십시오.

  2. 샌드박스 프로젝트를 여십시오. 새 프로젝트를 사용하려면 다음을 수행하십시오.

    1. 새 프로젝트를 클릭하십시오.

    2. 빈 프로젝트 작성을 선택하십시오.

    3. 프로젝트의 이름 및 선택적 설명을 입력하십시오.

    4. 기존 오브젝트 스토리지 서비스 인스턴스를 선택하거나 새로 작성하십시오.

    5. 작성을 클릭하십시오.

  3. 프로젝트가 열리면 관리 탭을 클릭하고 서비스 및 통합 페이지를 선택하십시오.

    1. IBM 서비스 탭에서 서비스 연관을 클릭하십시오.

    2. Watson Machine Learning 인스턴스를 선택하십시오. Watson Machine Learning 서비스 인스턴스가 아직 프로비저닝되지 않은 경우 다음 단계를 수행하십시오.

      1. 새 서비스를 클릭하십시오.

      2. Watson Machine Learning을 선택하십시오.

      3. 작성을 클릭하십시오.

      4. 목록에서 새 서비스 인스턴스를 선택하십시오.

    3. 서비스 연관을 클릭하십시오.

    4. 필요한 경우 취소 를 클릭하여 서비스 및 통합 페이지로 돌아가십시오.

추가 정보나 동영상을 보려면 프로젝트 작성을 참조하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 새 프로젝트를 표시합니다.

다음 이미지는 새 프로젝트를 표시합니다.




태스크 2: 모델 빌드 및 훈련

학습서 비디오 미리보기 이 태스크를 미리보려면 00:08에 시작하는 비디오를 보십시오.

이제 프로젝트가 있으므로 AutoAI를 사용하여 모델을 빌드하고 훈련할 준비가 되었습니다. 다음 단계에 따라 AutoAI 실험을 작성하고, 모델 파이프라인을 검토하고, 모델로 저장할 파이프라인을 선택하십시오.

  1. 프로젝트에서 자산 탭을 클릭한 후 새 자산 > 자동으로 기계 학습 모델 빌드를 클릭하십시오.

  2. 자동으로 기계 학습 모델 빌드 페이지에서 기본 필드를 완료하십시오.

    1. 자원 허브 샘플 패널을 클릭하십시오.

    2. 은행 마케팅 샘플 데이터를 선택하고 다음을 클릭하십시오. 프로젝트 이름과 설명이 채워집니다.

    3. 프로젝트와 연관시킨 Machine Learning 서비스 인스턴스가 Watson Machine Learning Service 인스턴스 필드에서 선택되었는지 확인하십시오.

  3. 작성을 클릭하십시오.

  4. 이 샘플 AutoAI 실험에서는 실험에 대해 은행 마케팅 샘플 데이터 가 이미 선택되어 있음을 확인할 수 있습니다.

    예측 열 선택

  5. 사전 설정된 실험 설정을 검토하십시오. 데이터 세트 및 예측하도록 선택된 열을 기반으로, AutoAI는 데이터의 서브세트를 분석하고 분석할 예측 유형과 메트릭을 선택합니다. 이 경우 예측 유형은 2진분류이고 양의 클래스는 이며 최적화된 메트릭은 ROC AUC & 런타임입니다.

  6. 실험 실행을 클릭하십시오. 모델이 훈련할 때 파이프라인 빌드 프로세스를 보여주는 인포그래픽이 표시됩니다.
    모델 파이프라인 빌드

    AutoAI에서 각 머신 러닝 기법에 사용할 수 있는 알고리즘 또는 평가자 목록은 다음을 참조하십시오. AutoAI 구현 상세.

  7. 실험 실행이 완료되면 리더보드에서 순위가 지정된 파이프라인을 보고 비교할 수 있습니다.

    파이프라인 리더보드

  8. 파이프라인 비교 를 클릭하여 차이점을 확인할 수 있습니다.

    파이프라인 비교 메트릭 차트

  9. 파이프라인 세부사항을 보려면 가장 높은 순위의 파이프라인을 클릭하십시오.

  10. 다른 이름으로 저장을 클릭하고 모델을 선택한 후 작성을 클릭하십시오. 그러면 파이프라인이 프로젝트에 모델로 저장됩니다.

  11. 모델이 저장되면 알림에서 프로젝트 보기 링크를 클릭하여 프로젝트의 모델을 보십시오. 또는 프로젝트의 자산 탭으로 이동하여 모델 섹션에서 모델 이름을 클릭할 수 있습니다.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 모델을 표시합니다.

다음 이미지는 모델을 보여줍니다.




태스크 3: 모델을 배치 영역으로 승격하고 훈련된 모델 배치

학습서 비디오 미리보기 이 태스크를 미리 보려면 04:57에서 시작하는 비디오를 시청하십시오.

모델을 배치하려면 먼저 모델을 배치 영역으로 승격해야 합니다. 모델을 배치 영역으로 승격하여 모델을 배치하려면 다음 단계를 수행하십시오.

  1. 배치 영역으로 승격 아이콘 배치 영역으로 승격을 클릭하십시오.

  2. 기존 배치 영역을 선택하십시오. 배치 영역이 없는 경우:

    1. 새 배치 영역 작성을 클릭하십시오.

    2. 공간 이름 및 선택적 설명을 제공하십시오.

    3. 스토리지 서비스를 선택하십시오.

    4. 기계 학습 서비스를 선택하십시오.

    5. 작성을 클릭하십시오.

    6. 닫기를 클릭하십시오.

  3. 목록에서 새 배치 영역을 선택하십시오.

  4. 승격 후 공간의 모델로 이동 옵션을 선택하십시오.

  5. 승격을 클릭하십시오.

    참고: 승격 후 영역의 모델로 이동하는 옵션을 선택하지 않은 경우, 탐색 메뉴를 사용하여 배치 로 이동하여 배치 영역 및 모델을 선택할 수 있습니다.
  6. 모델이 열려 있는 상태에서 새 배치를 클릭하십시오.

    1. 배치 유형으로 온라인을 선택하십시오.

    2. 배치의 이름을 지정하십시오.

    3. 작성을 클릭하십시오.

  7. 배치가 완료되면 배치 이름을 클릭하여 배치 세부사항 페이지를 보십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 새 배치를 표시합니다.

다음 이미지는 새 배치를 표시합니다.




태스크 4: 배치된 모델 테스트

학습서 비디오 미리보기 이 태스크를 미리 보려면 06:22에서 시작하는 비디오를 보십시오.

이제 모델이 배치되었으므로 사용자 인터페이스를 사용하거나 Watson Machine Learning API를 통해 해당 온라인 배치를 테스트할 수 있습니다. 사용자 인터페이스를 사용하여 새 데이터로 모델을 테스트하려면 다음 단계를 수행하십시오.

  1. 테스트 탭을 클릭하십시오. JSON 코드로 테스트 또는 형식으로 테스트의 두 가지 방식으로 배치 세부사항 페이지에서 배치된 모델을 테스트할 수 있습니다.

  2. JSON 입력 탭을 클릭하고 다음 테스트 데이터를 복사한 후 붙여넣어 기존 JSON 텍스트를 대체하십시오.

    {
       "input_data": [
          {
             "fields": [
                   "age",
                   "job",
                   "marital",
                   "education",
                   "default",
                   "balance",
                   "housing",
                   "loan",
                   "contact",
                   "day",
                   "month",
                   "duration",
                   "campaign",
                   "pdays",
                   "previous",
                   "poutcome"
                ],
             "values": [
                   [
                   27,
                   "unemployed",
                   "married",
                   "primary",
                   "no",
                   1787,
                   "no",
                   "no",
                   "cellular",
                   19,
                   "oct",
                   79,
                   1,
                   -1,
                   0,
                   "unknown"
                   ]
                ]
          }
       ]
    }
    
  3. 지정된 속성을 가진 고객이 특정 유형의 계정에 등록할 가능성이 있는지 여부를 예측하려면 예측을 클릭하십시오. 결과 예측은 이 고객이 마케팅 프로모션에 등록하지 않을 확률이 매우 높음을 표시합니다.

  4. X 를 클릭하여 예측 결과 창을 닫으십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 배치 테스트 결과를 표시합니다. 예측 값은 다음 이미지의 값과 다를 수 있습니다.

다음 이미지는 배치 테스트 결과를 표시합니다.




태스크 5: 모델을 스코어링하기 위한 일괄처리 작업 작성

이제 단일 예측으로 배치된 모델을 테스트했으므로 일괄처리 배치를 작성하여 동시에 여러 레코드를 스코어링할 수 있습니다.

태스크 5a: 일괄처리 배치 설정

학습서 비디오 미리보기 이 태스크를 미리 보려면 07:00에서 시작하는 비디오를 시청하십시오.

일괄처리 배치의 경우, CSV 파일에서 입력 데이터(모델 페이로드로도 알려져 있음)를 제공합니다. 데이터는 동일한 열 헤더가 있는 훈련 데이터와 같이 구조화되어야 합니다. 일괄처리 작업은 각 데이터 행을 처리하고 해당 예측을 작성합니다. 페이로드 데이터를 배치 영역에 업로드하려면 다음 단계를 수행하십시오.

  1. 다음 텍스트를 복사하여 텍스트 편집기에 붙여넣고 파일을 bank-payload.csv로 저장하십시오.

    age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome
    30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown
    33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure
    35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure
    30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown
    59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown
    35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure
    36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other
    39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown
    41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown
    43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure
    39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown
    43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown
    36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown
    20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown
    31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure
    40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown
    56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown
    37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure
    25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown
    31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
    
  2. 탐색 추적에서 배치 영역을 클릭하십시오.

    탐색 추적

  3. 자산 탭을 클릭하십시오.

  4. bank-payload.csv 파일을 측면 패널로 끌고 파일이 업로드될 때까지 기다리십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 배치 영역의 자산 탭을 표시합니다.

배치 영역의 자산 탭

태스크 5b: 일괄처리 배치 작성

학습서 비디오 미리보기 이 태스크를 미리 보려면 07:30에서 시작하는 비디오를 시청하십시오.

입력 일괄처리가 처리되고 출력이 실시간으로 표시되지 않고 파일로 작성되도록 하려면 일괄처리 배치 작업을 작성하십시오.

  1. 배치 영역의 자산 탭으로 이동하십시오.

  2. 모델의 오버플로우 메뉴 오버플로우 메뉴 를 클릭하고 배치를 선택하십시오.

  3. 배치 유형에 대해 일괄처리를 선택하십시오.

  4. 배치의 이름을 입력하십시오.

  5. 가장 작은 하드웨어 스펙을 선택하십시오.

  6. 작성을 클릭하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 일괄처리 배치를 표시합니다.

일괄처리 배치

태스크 5c: 일괄처리 작업 작성

학습서 비디오 미리보기 이 태스크를 미리보려면 07:44에서 시작하는 비디오를 보십시오.

일괄처리 작업은 배치를 실행합니다. 작업을 작성하려면 입력 데이터 및 출력 파일의 이름을 지정하십시오. 스케줄대로 실행되거나 즉시 실행되도록 작업을 설정할 수 있습니다. 일괄처리 작업을 작성하려면 다음 단계를 수행하십시오.

  1. 배치 페이지에서 새 작업을 클릭하십시오.

  2. 작업의 이름을 지정하고 다음을 클릭하십시오.

  3. 가장 작은 하드웨어 스펙을 선택하고 다음을 클릭하십시오.

  4. 선택사항: 스케줄을 설정하고 다음을 클릭하십시오.

  5. 선택사항: 알림을 수신하도록 선택하고 다음을 클릭하십시오.

  6. 데이터 선택 화면에서 입력 데이터를 선택하십시오.

    1. 데이터 소스 선택을 클릭하십시오.

    2. 데이터 자산 > bank-payload.csv를 선택하십시오.

    3. 확인을 클릭하십시오.

  7. 데이터 선택 화면으로 돌아가서 출력 파일을 지정하십시오.

    1. 추가 를 클릭하십시오.

    2. 데이터 소스 선택을 클릭하십시오.

    3. 새로 작성 탭이 선택되었는지 확인하십시오.

    4. 이름의 경우 bank-output.csv을(를) 입력하십시오.

    5. 확인을 클릭하십시오.

  8. 마지막 단계로 다음 을 클릭하십시오.

  9. 설정을 검토하고 작성 및 실행 을 클릭하여 작업을 즉시 실행하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 일괄처리 배치에 대한 작업 세부사항을 표시합니다.

일괄처리 배치를 위한 작업 작성

태스크 5d: 출력 보기

학습서 비디오 미리보기 이 태스크를 미리보려면 08:42에서 시작하는 비디오를 보십시오.

일괄처리 작업의 출력 파일을 검토하려면 다음 단계를 수행하십시오.

  1. 상태를 보려면 작업 이름을 클릭하십시오.

  2. 상태가 완료됨으로 변경되면 탐색 추적에서 배치 영역 이름을 클릭하십시오.

  3. 자산 탭을 클릭하십시오.

  4. bank-output.csv 파일을 클릭하여 일괄처리를 위해 제출된 고객 정보에 대한 예측 결과를 검토하십시오. 각 케이스의 예측에서는 이러한 고객이 은행 특별 판매에 등록하지 않을 것으로 예상됩니다.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 일괄처리 배치 작업의 결과를 표시합니다.

다음 이미지는 일괄처리 배치 작업의 결과를 표시합니다.



다음 단계

이제 차후 분석을 위해 이 데이터 세트를 사용할 수 있습니다. 예를 들어, 사용자나 다른 사용자가 다음 태스크를 수행할 수 있습니다.

추가 자원

상위 주제: 빠른 시작 학습서

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기