0 / 0
영어 버전 문서로 돌아가기

AutoAI 용어집

마지막 업데이트 날짜: 2024년 9월 23일
AutoAI 용어집

머신 러닝 모델을 빌드하고 배치하기 위해 AutoAI 에서 사용되는 용어 및 개념을 학습합니다.

집계 점수
네 가지 이상 항목 유형 (레벨 이동, 추세, 현지화된 극단값, 분산) 의 집계입니다. 높은 점수는 더 강한 점수를 표시합니다.

알고리즘
분석 문제를 해결하는 최적의 방법을 판별하기 위해 데이터에 적용되는 공식입니다.

AutoAI 실험
일련의 훈련 정의 및 매개변수를 고려하여 모델 후보로서 순위가 지정된 파이프라인 세트를 작성하는 자동화된 훈련 프로세스입니다.

일괄처리 고용
스토리지 버킷의 파일, 데이터 연결 또는 연결된 데이터에서 입력 데이터를 처리하고 선택된 대상에 출력을 씁니다.

편향성 발견 (기계 학습)
모델의 훈련 데이터 또는 예측 동작에서 불균형을 식별합니다.

2진분류 (binary classification)
두 개의 클래스가 있고 두 개의 클래스 중 하나에만 샘플을 지정하는 분류 모델입니다.

분류 모델
개별 범주의 데이터를 예측하는 예측 모델입니다.

혼동 매트릭스
모델의 긍정적 및 부정적 예측 결과와 긍정적 및 부정적 실제 결과 사이의 정확도를 판별하는 성능 측정입니다.

교차 검증 (cross validation)
기계 학습 모델의 효율성을 테스트하는 기술입니다. 또한 제한된 데이터가 있는 모델의 재샘플링 프로시저로 사용됩니다.

데이터 대체
데이터 세트의 결측값을 추정값으로 대체합니다.

외부 기능
예측 모델에 영향을 줄 수 있지만 리턴 시 영향을 받을 수 없는 기능입니다. 관련 항목: 지원 기능

공정성
모델이 참조 그룹에 대해 모니터된 그룹에 유리한 편향된 결과를 생성하는지 여부를 판별합니다. 공정성 평가는 모델이 한 그룹이 다른 그룹보다 더 자주 선호하거나 선호하는 결과를 제공하는 경향을 표시하는지 여부를 발견합니다. 일반적으로 모니터할 카테고리는 나이, 성별 및 인종입니다.

기능 상관
두 기능 간의 관계입니다. 예를 들어, 우편번호는 일부 모델에서 수입과 강력한 상관 관계를 가질 수 있습니다.

기능 인코딩
범주형 값을 숫자 값으로 변환합니다.

기능 중요도
특정 열 또는 기능이 모델의 예측 또는 예측에 미치는 상대적 영향입니다.

기능 스케일링
데이터 세트에서 독립변수 또는 기능의 범위를 정규화합니다.

기능 선택
정확한 예측 또는 스코어를 가장 잘 지원하는 데이터 열을 식별합니다.

기능 변환
AutoAI에서 모델 유형에 최상의 결과를 얻기 위해 훈련 데이터를 변환 및 최적화하기 위해 알고리즘을 적용하는 파이프라인 작성 단계입니다.

검증용 데이터
모델의 성능을 테스트하거나 유효성을 검증하는 데 사용되는 데이터입니다. 검증 데이터는 훈련 데이터의 예약된 부분이거나 별도의 파일일 수 있습니다.

하이퍼 매개변수 최적화 (HPO)
하이퍼 매개변수 값을 가장 정확한 모델을 제공하는 설정으로 설정하는 프로세스입니다.

증분 학습
이전 태스크에서 얻은 데이터를 잊지 않고 지속적으로 업데이트되는 데이터를 사용하는 모델을 훈련하는 프로세스입니다.

대형 테이블 형식 데이터
표준 처리의 한계를 초과하여 배치로 처리해야 하는 구조화된 데이터입니다. 증분 학습을 참조하십시오.

레이블 지정된 데이터
모델 훈련을 위해 가져올 적절한 데이터 벡터를 식별하기 위해 레이블 지정된 데이터입니다.

모니터되는 그룹
결과가 참조 그룹의 결과와 상당히 다른지 여부를 판별하기 위해 모니터되는 데이터 클래스입니다. 예를 들어, 신용 앱에서 특정 연령 범위의 애플리케이션을 모니터하고 결과에 편향이 있는지 여부를 평가하기 위해 긍정적인 결과를 수신할 가능성이 높은 연령 범위와 결과를 비교할 수 있습니다.

다중 클래스 분류 모델
세 개 이상의 클래스가 있는 분류 태스크입니다. 예를 들어, 2진 분류 모델이 yes 또는 no 값을 예측하는 경우 다중 클래스 모델은 yes, no, 어쩌면또는 적용할 수 없음을 예측합니다.

다변량 시계열
둘 이상의 변화량 변수를 포함하는 시계열 실험입니다. 예를 들어, 세 클라이언트의 전기 사용량을 예측하는 시계열 모델입니다.

최적화된 메트릭
모델의 성능을 측정하는 데 사용되는 메트릭입니다. 예를 들어, 정확성은 2진 분류 모델의 성능을 측정하는 데 사용되는 일반적인 메트릭입니다.

파이프라인 (모델 후보 파이프라인)
워크플로우의 단계를 설명하는 엔드-투-엔드 아웃라인입니다.

양수 클래스
목적 함수와 관련된 클래스입니다.

참조 그룹 (reference group)
예측 모델에서 긍정적 결과를 수신할 가능성이 가장 높은 것으로 식별되는 그룹입니다. 그런 다음 결과를 모니터된 그룹과 비교하여 결과에서 잠재적 편향성을 찾을 수 있습니다.

회귀 모델
종속변수를 하나 이상의 독립변수와 관련시키는 모델입니다.

스코어링
기계 학습에서 예측 결과의 신뢰도를 측정하는 프로세스입니다.

지원 기능
예측 대상에 영향을 줄 수 있는 입력 기능입니다. 관련 항목: Exo종류 기능

텍스트 분류
텍스트를 자동으로 식별하고 개별 범주로 분류하는 모델입니다.

시계열 모델 (AutoAI)
시간 경과에 따라 데이터를 추적하는 모델입니다.

훈련된 모델
배치할 준비가 된 모델입니다.

훈련
소스 데이터의 서브세트를 포함하는 모델 작성의 초기 스테이지입니다. 이후 결과가 이미 알려진 추가적인 다른 서브세트에 대해 모델을 테스트할 수 있습니다.

훈련 데이터
모델의 학습 알고리즘을 가르치고 훈련시키는 데 사용되는 데이터입니다.

일변량 시계열
변경되는 변수가 하나만 포함된 시계열 실험입니다. 예를 들어, 온도를 예측하는 시계열 모델에는 온도의 단일 예측 열이 있습니다.