Go back to the English version of the documentation启动聚集器 (管理)
启动聚集器 (管理)
Last updated: 2024年7月05日
管理员完成以下步骤以启动试验并训练全局模型。
步骤 1:设置 Federated Learning 试验
从项目设置 Federated Learning 试验。
- 在项目中,单击 新建资产> 在分布式数据上训练模型。
- 命名试验。
可选: 添加可选描述和标记。 - 添加新合作者 到项目。
- 在里面配置选项卡,选择训练框架和模型类型。 请参阅 框架,融合方法和 Python 版本 ,以获取列出受支持的框架,融合方法及其属性的表。 可选: 您可以选择启用同构加密功能。 有关更多详细信息,请参阅 应用加密。
- 单击 模型规范 下的 选择 ,然后上载包含初始模型的
.zip
文件。 - 在 定义超参数 选项卡中,可以选择可用于框架和融合方法的超参数选项来调整模型。
步骤 2:创建远程训练系统
创建用于认证实验参与方的远程培训系统 (RTS)。
在 选择远程训练系统上,单击 添加新系统。
配置 RTS。
配置 RTS 字段名称 定义 示例 名称 用于标识此 RTS 实例的名称。 Canada Bank Model: Federated Learning Experiment
描述
(可选)培训系统的描述。 此远程培训系统用于
Federated Learning 试验,用于训练模型以
使用来自加拿大银行的数据预测信用卡欺诈。系统管理员
(可选)指定对此 RTS 具有只读访问权的用户。 他们可以查看系统详细信息,日志和脚本,但不一定参与实验。 如果在运行试验时发生问题,应与他们联系。 Admin ([email protected])
允许的身份 列出可以参与 Federated Learning 试验培训的项目合作者。 可以在此 RTS 中注册多个合作者,但只有一个可以参与实验。 需要多个 RTS 来认证所有参与合作者。 John Doe ([email protected])
Jane Doe ([email protected])
允许的 IP 地址
(可选)限制各个参与方在指定 IP 地址外部连接到 Federated Learning。
1。 要对此进行配置,请单击 配置。
2。 对于 允许的身份,选择要对其施加 IP 约束的用户。
3。 对于 允许用户使用的 IP 地址,输入可连接到远程训练系统的 IP 和/或 CIDR 的逗号分隔列表。 注: 支持 IPv4 和 IPv6 。John
1234:5678:90ab:cdef:1234:5678:90ab:cdef: (John 's office IP) , 123.123.123.123 (John 's home IP) , 0987.6543.21ab.cdef (Remote VM IP)
Jane
123.123.123.0/16 (Jane 's home IP) , 0987.6543.21ab.cdef (Remote machine IP)标记
(可选)将关键字与远程训练系统相关联以方便查找。 Canada
Bank
Model
Credit
Fraud
单击 添加 以保存 RTS 实例。 如果要创建多个远程训练实例,可以重复这些步骤。
单击 添加系统 以将 RTS 另存为项目中的资产。
提示: 您可以将 RTS 定义用于将来的实验。 例如,在 __Select 远程训练 system__ 选项卡中,可以选择先前创建的任何远程训练系统。每个 RTS 只能认证其允许的其中一个参与方身份。 为每个新的参与部件创建一个 RTS。
步骤 3:启动试验
启动 Federated Learning 聚集器以启动全局模型的训练。
- 单击复查并创建以查看当前 Federated Learning 试验的设置。 然后,单击 创建。
- 在聚集器启动时, Federated Learning 试验将处于
Pending
状态。 聚集器启动时,状态将更改为Setup – Waiting for remote systems
。