統合学習は、さまざまな地理的位置やクラウド・プロバイダーのさまざまなエンティティーが、データを共有せずに分析モデルをトレーニングする必要がある場合に適しています。
統合学習を開始するには、以下のようにします。
- 用語をよく理解してください。
- 統合学習エクスペリメントを作成するための アーキテクチャー を確認します。
- 統合学習エクスペリメント を作成したり、サンプルを確認したりするためのステップバイステップの説明については、チュートリアルに従ってください。
用語
IBM Federated Learning トレーニング・プロセスで使用される用語。
用語 | 定義 |
---|---|
当事者名 | モデルを共同でトレーニングするためにさまざまなデータ・ソースを提供するユーザー。 Federated Learning は、異なる関係者間でデータ暴露のリスクを負うことなくトレーニングが行われることを保証します。 当事者には、watsonx.aiStudio Federated Learning プロジェクトで少なくともViewer権限が必要です。 |
Admin | 統合学習エクスペリメントを構成して、許可されるパーティーの数、使用するフレームワークを指定し、リモート・トレーニング・システム (RTS) をセットアップするパーティー・メンバー。 管理者は Federated Learning の実験を開始し、最後まで見届ける。 管理者は少なくともwatsonx.aiStudio Federated Learning プロジェクトのEditor権限が必要です。 |
リモート・トレーニング・システム | アグリゲーターに対してパーティーを認証するために使用される資産。 プロジェクト・メンバーは、トレーニングの前にリモート・トレーニング・システム (RTS) に登録します。 1 人のメンバーのみが、1 つの RTS を使用して 1 つのパーティーとして実験に参加することができます。 複数のコントリビュート・パーティーはそれぞれ、1 つのテストに対して 1 つの RTS で認証する必要があります。 |
Aggregator | アグリゲーターは、関係者間でモデル結果を融合して、1 つのモデルを作成します。 |
融合方式 | 関係者がアグリゲーターに返す結果を結合するために使用されるアルゴリズム。 |
データ・ハンドラー | IBM Federated Learning では、データ・ハンドラーは、データのロードおよび前処理に使用されるクラスです。 また、複数のソースから収集されたデータが、トレーニング対象として一様にフォーマット設定されるようにすることもできます。 データ・ハンドラーについて詳しくは、 データ・ハンドラーを参照してください。 |
グローバル・モデル | 異なるパーティー間で融合された結果のモデル。 |
トレーニング・ラウンド | トレーニング・ラウンドは、ローカル・データのトレーニング、グローバル・モデルの融合、および更新のプロセスです。 トレーニングは反復的です。 管理者は、トレーニング巡回の数を選択できます。 |
アーキテクチャー
IBM Federated Learning には、アグリゲーターとリモート・トレーニング・パーティーという 2 つの主要なコンポーネントがあります。
Aggregator
アグリゲーターは、モデル・フュージョン・プロセッサーです。 管理者がアグリゲーターを管理します。
アグリゲーターは、以下のタスクを実行します。
- ダラス、フランクフルト、ロンドン、または東京の各地域でプラットフォーム・サービスとして実行されます。
- 統合学習エクスペリメントから開始します。
当事者名
パーティーは、統合学習エクスペリメント・アグリゲーターにモデル入力を提供するユーザーです。 パーティーには、以下のものがあります。
watsonx.aiRuntimePythonクライアントを実行でき、watsonx.aiRuntime フレームワークと互換性のあるシステムであれば、どのようなシステムでも利用できます。
注:システムは、特に Cloud Pak for Data as a Serviceである必要はありません。 システム要件のリストについては、 システムのセットアップを参照してください。
任意の地理的位置にあるシステム上で実行されます。 異なる地域からのデータ抽出を回避するために、データが存在する地域と同じ地域に各パーティーを配置することをお勧めします。
この図は、 IBM Federated Learning のアーキテクチャーを示しています。 リモート・トレーニング・システムは、トレーニング中にアグリゲーターに対してパーティーの ID を認証するために使用されます。 異なるデータ ソースを持つ複数の当事者がリモート トレーニング システムに接続します。 データ サイエンティストがトレーニングを監視します。 最後に、集合的にトレーニングされたデータに基づいてモデルが作成されます。
ユーザー・ワークフロー
- データ・サイエンティスト:
- データ・ソースを識別します。
- 初期の「トレーニングされていない」モデルを作成します。
- データ・ハンドラー・ファイルを作成します。
これらのタスクは、トレーニング・パーティー・エンティティーとオーバーラップする可能性があります。 - 終了モデルにスコアを付けます。
- パーティーはシステム上のアグリゲーターに接続しますが、これはリモートにすることができます。
- 管理者は、以下の方法で統合学習エクスペリメントを制御します。
- リモート・パーティーに対応するためのエクスペリメントの構成。
- アグリゲーターを開始しています。
- モデルを保存してデプロイします。
この図は、統合学習プロセスの各役割に関連付けられたアクションを示しています。
親トピック: IBM 統合学習