Federated Learning è appropriato per qualsiasi situazione in cui entità diverse da diverse ubicazioni geografiche o provider cloud desiderano formare un modello analitico senza condividere i propri dati.
Per iniziare con Federated Learning:
- Familiarizzare con Terminologia.
- Rivedi l' Architettura per la creazione di un esperimento Federated Learning.
- Seguire un'esercitazione per istruzioni dettagliate per la creazione di un esperimento di apprendimento federato o esaminare gli esempi.
Terminologia
Terminologia utilizzata nei processi di formazione IBM Federated Learning.
Termine | Definizione |
---|---|
Parte | Utenti che contribuiscono con diverse fonti di dati per formare un modello in modo collaborativo. L'apprendimento federato garantisce che la formazione avvenga senza rischi di esposizione dei dati tra le diverse parti. Una parte deve avere almeno l'autorizzazione di Viewer nel progetto watsonx.ai Studio Federated Learning. |
Amministratore | Un membro del gruppo che configura l'esperimento di apprendimento federato per specificare quante parti sono consentite, quali framework utilizzare e imposta RTS (Remote Training Systems). Iniziano l'esperimento di apprendimento federato e lo portano a termine. amministratore deve avere almeno i permessi di Editor nel progetto watsonx.ai Studio Federated Learning. |
Sistema di addestramento remoto | Un asset utilizzato per autenticare una parte nell'aggregatore. I membri del progetto si iscrivono al Remote Training System (RTS) prima della formazione. Solo uno dei membri può utilizzare un RTS per partecipare a un esperimento come partito. Più parti che contribuiscono devono autenticarsi con un RTS per un esperimento. |
Aggregatore | L'aggregatore fonde i risultati del modello tra le parti per creare un modello. |
Metodo di fusione | L'algoritmo utilizzato per combinare i risultati che le parti restituiscono all'aggregatore. |
Gestore dati | In IBM Federated Learning, il gestore dati è una classe utilizzata per caricare e pre - elaborare i dati. Consente inoltre di garantire che i dati raccolti da più origini siano formattati in modo uniforme per essere addestrati. Ulteriori dettagli sul gestore dati sono disponibili in Gestore dati. |
Modello globale | Il modello risultante viene fuso tra diverse parti. |
Round di addestramento | Un round di formazione è il processo di formazione dei dati locali, fusione di modelli globali e aggiornamento. L'addestramento è iterativo. L'amministratore può scegliere il numero di cicli di formazione. |
Architettura
IBM Federated Learning ha due componenti principali: l'aggregatore e le parti di formazione remote.
Aggregatore
L'aggregatore è un processore di fusione modello. L'amministratore gestisce l'aggregatore.
L'aggregatore esegue le attività riportate di seguito:
- Viene eseguito come servizio di piattaforma nelle regioni Dallas, Francoforte, Londra o Tokyo.
- Inizia con un esperimento di apprendimento federato.
Parte
Una parte è un utente che fornisce un input modello all'aggregatore di esperimenti Federated Learning. La festa può essere:
su qualsiasi sistema in grado di eseguire il client Python di watsonx.ai Runtime e compatibile con i framework di watsonx.ai Runtime.
Nota:Il sistema non deve essere specificamente Cloud Pak for Data as a Service. Per un elenco dei requisiti di sistema, vedere Impostazione del sistema.
in esecuzione sul sistema in qualsiasi posizione geografica. Si consiglia di individuare ciascuna parte nella stessa regione in cui i dati devono evitare l'estrazione dei dati da regioni differenti.
Questa illustrazione mostra l'architettura di IBM Federated Learning. Un sistema di addestramento remoto viene utilizzato per autenticare l'identità della parte all'aggregatore durante l'addestramento. Più soggetti con diverse origini dati si connettono al proprio sistema di formazione remota. I data scientist monitorano la formazione. Alla fine, viene creato un modello basato su dati addestrati collettivamente.
Flusso di lavoro utente
- Lo scienziato dei dati:
- Identifica le origini dati.
- Crea un modello iniziale "non addestrato".
- Crea un file gestore dati.
Queste attività potrebbero sovrapporsi a un'entità parte di addestramento. - Segna il modello finale.
- Una parte si connette all'aggregatore sul proprio sistema, che può essere remoto.
- Un amministratore controlla l'esperimento Federated Learning tramite:
- Configurazione dell'esperimento per accogliere le parti remote.
- Avvio dell'aggregatore.
- Salvataggio e distribuzione del modello.
Questa figura mostra le azioni associate a ciascun ruolo nel processo di apprendimento federato.
Argomento principale IBM Federated Learning