AutoAI 는 자동으로 데이터를 준비하고 알고리즘을 적용하며 사용자의 데이터 및 유스 케이스에 가장 적합한 모델 파이프라인을 빌드합니다. 기계 학습 모델로 저장할 수 있는 모델 파이프라인을 생성하는 방법을 학습합니다.
다음 단계에 따라 데이터를 업로드하고 AutoAI가 데이터 및 유스 케이스에 대해 최고의 모델을 작성하도록 하십시오.
입력 데이터 수집
훈련 데이터를 수집하고 준비하십시오. 허용 가능한 데이터 소스에 대한 세부사항은 AutoAI 개요를 참조하십시오.
단일 훈련 데이터 소스를 사용하여 실험을 작성하는 경우, 두 번째 데이터 소스를 특별히 테스트로 사용하거나 파이프라인 유효성 검증을 위해 데이터를 검증하는 옵션이 있습니다.
AutoAI 도구 열기
사용자 편의를 위해 AutoAI 모델 작성은 프로젝트와 연관된 기본 스토리지를 사용하여 데이터를 저장하고 모델 결과를 저장합니다.
프로젝트를 여십시오.
자산 탭을 클릭하십시오.
딸깍 하는 소리 새 자산 > 자동으로 기계 학습 모델 구축 .
실험 세부사항 지정
실험의 이름 및 설명을 지정하십시오.
머신 러닝 서비스 인스턴스를 선택하고 메시지가 표시되면 작업 자격 증명을 입력합니다. 그런 다음 만들기를 클릭합니다.
프로젝트에서 데이터를 선택하거나 파일 시스템 또는 자산 브라우저에서 데이터를 업로드한 후 계속을 클릭하십시오. 데이터를 검토하려면 미리보기 아이콘을 클릭하십시오. (선택사항) 훈련된 파이프라인을 테스트하기 위한 검증 데이터로 두 번째 파일을 추가하십시오.
실험에서 예측할 데이터에 대해 예측하기 위한 열을 선택하십시오.
데이터 세트의 서브세트 분석을 기반으로 AutoAI 는 기본 모델 유형 (2진분류, 다중 클래스 분류 또는 회귀) 을 선택합니다. 대상 열에 두 개의 가능한 값이 있는 경우 2진이 선택됩니다. 다중 클래스에는 3개이상의 값으로 구성된 이산 세트가 있습니다. 회귀의 대상 열에 연속 숫자 변수가 있습니다. 선택적으로 이 선택사항을 대체할 수 있습니다.
주: 분류할 값의 한계는 200입니다. 예측 열에 많은 고유 값을 사용하여 분류 실험을 작성하는 것은 자원 집약적이며 실험의 성능 및 훈련 시간에 영향을 줍니다. 실험 품질을 유지하려면 다음을 수행하십시오.
- AutoAI 는 최적화를 위해 기본 메트릭을 선택합니다. 예를 들어, 2진 분류 모델의 기본 메트릭은 *Accuracy * 입니다.
-기본적으로 모델의 성능을 테스트하기 위해 훈련 데이터의 10%가 유지됩니다.
(선택사항): 실험 설정 을 클릭하여 AutoAI 실행에 대한 옵션을 보거나 사용자 정의하십시오. 실험 설정에 대한 세부사항은 분류 또는 회귀 실험 구성을 참조하십시오.
모델 파이프라인 작성을 시작하려면 실행 실험을 클릭하십시오.
인포그래픽에서는 데이터의 파이프라인 작성을 보여줍니다. 이 단계의 지속 기간은 데이터 세트의 크기에 따라 다릅니다. 알림 메시지는 처리 시간이 짧은지 또는 더 많은 시간이 필요한지를 사용자에게 알립니다. 파이프라인을 빌드하는 동안 제품의 다른 파트에서 작업할 수 있습니다.
인포그래픽의 노드 위에 마우스 커서를 두고 파이프라인이 공유하는 요인 및 고유 특성을 탐색하십시오. 파이프라인이 공유하는 요인과 파이프라인을 고유하게 만드는 특성을 볼 수 있습니다. 인포그래픽의 데이터에 대한 안내서를 보려면 정보 패널에서 범례 탭을 클릭하십시오. 또는 파이프라인 작성의 다른 보기를 보려면 알림 분할창의 실험 세부사항 탭을 클릭한 후 전환 보기를 클릭하여 진행 맵을 보십시오. 어느 보기에서나 파이프라인 노드를 클릭하여 리더보드에서 연관된 파이프라인을 볼 수 있습니다.
결과 보기
파이프라인 생성 프로세스가 완료되면 모델로 파이프라인을 저장하기 전에 순위 지정된 모델 후보를 보고 평가할 수 있습니다.
다음 단계
2진 분류 모델을 빌드하는 방법을 보려면 이 비디오를 보십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
이 비디오를 보고 다중 클래스 분류 모델을 빌드하는 방법을 확인하십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
상위 주제: AutoAI 개요