연합 학습은 서로 다른 지리적 위치 또는 클라우드 제공자의 서로 다른 엔티티가 해당 데이터를 공유하지 않고 분석 모델을 훈련하려는 모든 상황에 적합합니다.
연합 학습을 시작하려면 다음을 수행하십시오.
용어집
IBM Federated Learning 교육 프로세스에서 사용되는 용어입니다.
기간 | 정의 |
---|---|
당사자 | 서로 다른 데이터 소스를 제공하여 모델을 협업으로 훈련시키는 사용자입니다. 연합 학습은 여러 당사자 간에 데이터 노출 위험 없이 학습이 이루어지도록 보장합니다. 당사자는 watsonx.ai Studio 연합 학습 프로젝트에서 최소 Viewer 권한이 있어야 합니다. |
관리자 | 허용되는 당사자 수, 사용할 프레임워크를 지정하고 RTS (Remote Training Systems) 를 설정하도록 연합 학습 실험을 구성하는 당사자 구성원입니다. 연합 학습 실험을 시작하고 끝까지 확인합니다. 관리자는 watsonx.ai Studio 연합 학습 프로젝트에서 최소한 편집자 권한이 있어야 합니다. |
원격 교육 시스템 | 집계자에 대해 당사자를 인증하는 데 사용되는 자산입니다. 프로젝트 구성원은 훈련 전에 원격 훈련 시스템 (RTS) 에 등록합니다. 구성원 중 한 명만 하나의 RTS를 사용하여 당사자로서 실험에 참여할 수 있습니다. 여러 컨트리뷰션 당사자가 실험을 위해 하나의 RTS를 사용하여 각각 인증해야 합니다. |
집계자 | 집계기는 당사자 간에 모델 결과를 융합하여 하나의 모델을 빌드합니다. |
Fusion 메소드 | 당사자가 집계자에게 리턴하는 결과를 결합하는 데 사용되는 알고리즘입니다. |
데이터 핸들러 | IBM Federated Learning에서 Data Handler는 데이터를 로드하고 사전 처리하는 데 사용되는 클래스입니다. 또한 여러 소스에서 수집된 데이터가 훈련을 위해 균일하게 형식화되도록 하는 데 도움이 됩니다. Data Handler에 대한 자세한 정보는 Data Handler를 참조하십시오. |
글로벌 모델 | 서로 다른 당사자 간에 연합되는 결과 모델입니다. |
교육 라운드 | 훈련 라운드는 로컬 데이터 훈련, 글로벌 모델 융합 및 업데이트의 프로세스입니다. 훈련은 반복적입니다. 관리자는 훈련 라운드 수를 선택할 수 있습니다. |
아키텍처
IBM Federated Learning에는 집계자와 원격 교육 당사자의 두 가지 기본 구성요소가 있습니다.
집계자
집계기는 모델 융합 프로세서입니다. 관리자가 집계자를 관리합니다.
집계자는 다음 태스크를 실행합니다.
- 댈러스, 프랑크푸르트, 런던 또는 도쿄 지역에서 플랫폼 서비스로 실행됩니다.
- 연합 학습 실험으로 시작합니다.
당사자
당사자는 연합 학습 실험 수집자에게 모델 입력을 제공하는 사용자입니다. 당사자는 다음과 같을 수 있습니다.
를 실행할 수 있는 모든 시스템에서 watsonx.ai 런타임 Python 클라이언트를 실행할 수 있으며 watsonx.ai 런타임 프레임워크와 호환됩니다.
참고:시스템은 특별히 Cloud Pak for Data as a Service일 필요가 없습니다. 시스템 요구사항 목록은 시스템 설정을 참조하십시오.
모든 지리적 위치의 시스템에서 실행 중입니다. 서로 다른 지역에서 데이터가 추출되지 않도록 데이터가 있는 동일한 지역에서 각 당사자를 찾는 것이 좋습니다.
이 그림은 IBM Federated Learning의 아키텍처를 보여줍니다. 원격 교육 시스템은 교육 중에 집계자에 대한 당사자의 ID를 인증하는 데 사용됩니다. 다양한 데이터 소스를 가진 여러 당사자가 원격 교육 시스템에 연결됩니다. 데이터 과학자는 훈련을 모니터링합니다. 마지막으로, 집합적으로 훈련된 데이터를 기반으로 모델이 생성됩니다.
사용자 워크플로우
- 데이터 과학자는 다음을 수행합니다.
- 데이터 소스를 식별합니다.
- 초기 "훈련되지 않은" 모델을 작성합니다.
- 데이터 핸들러 파일을 작성합니다.
이러한 태스크는 교육 당사자 엔티티와 겹칠 수 있습니다. - 최종 모델의 점수를 매깁니다.
- 당사자는 원격일 수 있는 해당 시스템의 집계자에 연결합니다.
- 관리자는 다음을 수행하여 연합 학습 실험을 제어합니다.
- 원격 당사자를 수용하도록 실험을 구성합니다.
- 집계자를 시작하는 중입니다.
- 모델 저장 및 배포
이 그림은 연합 학습 프로세스의 각 역할과 연관된 조치를 표시합니다.
상위 주제: IBM 연합 학습