0 / 0
영어 버전 문서로 돌아가기

하이퍼 매개변수 정의

마지막 업데이트 날짜: 2024년 10월 04일
하이퍼 매개변수 정의

실험 훈련에 사용되는 하이퍼 매개변수의 정의입니다. 프레임워크 및 융합 방법에 따라 이러한 하이퍼 매개변수 옵션 중 하나 이상을 사용할 수 있습니다.

하이퍼 매개변수 정의
하이퍼매개변수 설명
라운드 정수 값입니다. 집계기와 원격 시스템 사이에 완료할 훈련 반복의 수.
종료 정확성 (선택사항) 부동 소수점 값입니다. model_accuracy 를 가져와서 숫자 값과 비교합니다. 조건이 충족되면 실험이 조기에 완료됩니다.

예를 들어, termination_predicate: accuracy >= 0.8 은 참여 당사자의 모델 정확도 평균이 80% 이상일 때 실험을 완료합니다. 현재 연합 학습은 분류 모델에 대해서만 한 가지 유형의 조기 종료 조건 (모델 정확도) 을 승인합니다.
쿼럼 (선택사항) 부동 소수점 값입니다. 집계기가 특정 비율의 당사자 응답에 도달한 후 모델 훈련을 계속합니다. 0-1사이의 10진수값을 사용합니다. 기본값은 1입니다. 모델 교육은 당사자 응답이 표시된 비율 값에 도달한 후에만 시작됩니다.
예를 들어, 이 값을 0.5 로 설정하면 등록된 당사자의 50%가 집계자 호출에 응답한 후 교육이 시작됩니다.
최대 제한시간 (선택사항) 정수 값입니다. 당사자 응답 대기 시간이 이 값(초)을 초과하면 연합 학습 실험을 종료합니다. 최대 43200으로 숫자 값을 사용합니다. 이 값이 초 단위로 전달되고 quorum 비율에 도달하지 않으면 실험이 종료됩니다.

예를 들어, max_timeout = 1000 는 당사자가 해당 시간에 응답하지 않으면 1000초후에 실험을 종료합니다.
스케치 정확도 대 개인정보 보호정책 (선택사항) 부동 소수점 값입니다. XGBoost 훈련과 함께 사용되어 집계자에 전송되는 스케치된 데이터의 상대적 정확도를 제어합니다. 0-1사이의 10진수값을 사용합니다. 값이 높을수록 품질이 높은 모델이 되지만 데이터 개인정보 보호가 감소하고 자원 소비가 증가합니다.
클래스 수 정수 값입니다. 분류 모델에 대한 대상 클래스의 수입니다. "손실" 하이퍼매개변수가 다음일 경우 필요함:
- auto
- binary_crossentropy
- categorical_crossentropy
학습 비율 10진값입니다. 수축이라고도 하는 학습 비율입니다. 리프 값에 대한 승법적 요인으로 사용됩니다.
손실 문자열 값. 부스팅 프로세스에서 사용할 손실 함수입니다.
- binary_crossentropy(물류 손실이라고도 함)은 2진 분류에 사용됩니다.
- categorical_crossentropy은(는) 다중 클래스 분류에 사용됩니다.
- auto 문제점의 특성에 따라 손실 함수를 선택합니다.
- least_squares이(가) 회귀에 사용됩니다.
최대 반복 정수 값입니다. Scikit-learn 모델을 훈련시키기 위해 로컬 훈련 데이터 세트를 통과하는 총 패스의 수.
N 클러스터 정수 값입니다. 형성할 군집 수 및 생성할 중심값 수입니다.
Epoch (선택사항) 정수 값입니다. 각 라운드에 대해 각 원격 당사자가 수행할 로컬 훈련 반복 수입니다. 예를 들어, Rounds를 2로 설정하고 Epochs를 5로 설정하는 경우, 모든 원격 당사자는 모델이 집계자에게 전송되기 전에 로컬로 5번훈련합니다. 라운드 2에서 집계자 모델은 모든 당사자에 의해 로컬로 다시 훈련되고 집계자에게 다시 전송됩니다.
시그마 부동 소수점 값입니다. 로컬 모델 뉴런이 글로벌 모델에서 허용되는 정도를 결정합니다. 값이 클수록 추가 일치를 허용하며 더 작은 글로벌 모델을 생성합니다. 기본값은 1입니다.
sigma0 부동 소수점 값입니다. 글로벌 네트워크 뉴런의 허용된 파생을 정의합니다. 기본값은 1입니다.
감마 부동 소수점 값입니다. 각 관측에서 예상된 수의 기능을 제어하는 Indian Buffet Process 매개변수입니다. 기본값은 1입니다.

상위 주제: 프레임워크, 연합 메소드 및 Python 버전