Go back to the English version of the documentation开始
开始
Last updated: 2024年11月21日
Federated Learning 适用于来自不同地理位置或云提供者的不同实体希望在不共享其数据的情况下训练分析模型的任何情况。
要开始使用 Federated Learning:
- 熟悉 术语。
- 查看 体系结构 以创建 Federated Learning 试验。
- 遵循有关创建 Federated Learning 试验 或复审样本的逐步指示信息的教程。
术语
IBM Federated Learning 训练过程中使用的术语。
术语 | 定义 |
---|---|
参与方 | 提供不同数据源以协同训练模型的用户。 Federated Learning(联合学习)可确保在各方之间进行训练时不会有数据暴露的风险。 各方必须至少拥有watsonx.aiStudio 联合学习项目中的Viewer权限。 |
管理员 | 配置 Federated Learning 试验以指定允许的参与方数量,要使用的框架以及设置远程培训系统 (RTS) 的参与方。 他们开始联合学习实验,并将其进行到底。 管理员必须至少拥有watsonx.aiStudio 联合学习项目的编辑权限。 |
远程训练系统 | 用于向聚集器认证参与方的资产。 项目成员在培训前在远程培训系统 (RTS) 中注册。 只有其中一个成员可以使用一个 RTS 作为参与方参与实验。 多个参与方必须各自向一个试验的 RTS 进行认证。 |
聚集器 | 聚集器将模型结果在参与方之间进行保险以构建一个模型。 |
融合方法 | 用于组合各方返回到聚集器的结果的算法。 |
数据处理程序 | 在 IBM Federated Learning 中,数据处理程序是用于装入和预处理数据的类。 它还可帮助确保对从多个源收集的数据设置统一格式,以便进行训练。 可以在 数据处理程序中找到有关数据处理程序的更多详细信息。 |
全局模型 | 在不同参与方之间融合的结果模型。 |
训练回合 | 训练轮是本地数据训练,全局模型融合和更新的过程。 训练是迭代的。 管理员可以选择训练轮数。 |
体系结构
IBM Federated Learning 具有两个主要组件: 聚集器和远程培训方。
聚集器
聚集器是模型融合处理器。 管理员管理聚集器。
聚集器运行以下任务:
- 在达拉斯,法兰克福,伦敦或东京等区域作为平台服务运行。
- 从 Federated Learning 试验开始。
参与方
参与方是向 Federated Learning 试验聚集器提供模型输入的用户。 参与方可以是:
可在任何能运行watsonx.aiRuntimePython客户端并兼容watsonx.aiRuntime 框架的系统上运行。
注:系统不必专门是 Cloud Pak for Data as a Service。 有关系统需求的列表,请参阅 设置系统。
在任何地理位置的系统上运行。 建议您在数据所在的同一区域中查找每个参与方,以避免从不同区域中抽取数据。
此图显示了 IBM Federated Learning 的体系结构。 远程培训系统用于在培训期间向聚集器认证参与方的身份。 多方以不同的数据源连接到远程培训系统。 数据科学家对培训进行监控。 最后,根据集体训练的数据创建一个模型。
用户工作流程
- 数据科学家:
- 标识数据源。
- 创建初始 "未训练" 模型。
- 创建数据处理程序文件。
这些任务可能与培训参与方实体重叠。 - 给最终模型打分。
- 一方连接到其系统上的聚集器,该聚集器可以是远程的。
- 管理员通过以下方式控制 Federated Learning 试验:
- 配置试验以容纳远程参与方。
- 正在启动聚集器。
- 保存和部署模型。
此图显示了与 Federated Learning 过程中的每个角色相关联的操作。