0 / 0
Retourner à la version anglaise de la documentation
Premiers pas
Dernière mise à jour : 21 nov. 2024
Premiers pas

L'apprentissage fédéré convient à toute situation dans laquelle différentes entités provenant de différents emplacements géographiques ou de différents fournisseurs de cloud souhaitent entraîner un modèle analytique sans partager leurs données.

Pour commencer à utiliser l'apprentissage fédéré:

Terminologie

Terminologie utilisée dans les processus d'entraînement IBM Federated Learning.

Terme Définition
Fête Utilisateurs qui fournissent différentes sources de données pour entraîner un modèle en collaboration. L'apprentissage fédéré garantit que la formation se déroule sans risque d'exposition des données entre les différentes parties.
Une partie doit avoir au moins l'autorisation Viewer dans le projet watsonx.ai Studio Federated Learning.
Administrateur Membre de partie qui configure l'expérimentation d'apprentissage fédéré pour spécifier le nombre de parties autorisées, les infrastructures à utiliser et configure les systèmes d'entraînement à distance (RTS). Ils commencent l'expérience de l'apprentissage fédéré et la mènent jusqu'à la fin.
Un administrateur doit avoir au moins la permission Editor dans le projet Federated Learning de watsonx.ai Studio.
Système d'entraînement à distance Actif utilisé pour authentifier une partie auprès de l'agrégateur. Les membres du projet s'inscrivent dans le système de formation à distance (RTS) avant la formation. Un seul des membres peut utiliser un RTS pour participer à une expérimentation en tant que partie. Plusieurs parties de contribution doivent chacune s'authentifier avec un serveur RTS pour une expérimentation.
Regroupeur L'agrégateur fusionne les résultats du modèle entre les parties pour créer un modèle.
Méthode de fusion Algorithme utilisé pour combiner les résultats renvoyés par les parties à l'agrégateur.
Gestionnaire de données Dans IBM Federated Learning, le gestionnaire de données est une classe utilisée pour charger et prétraiter des données. Il garantit également que les données collectées à partir de plusieurs sources sont formatées de manière uniforme pour pouvoir être entraînées. Pour plus de détails sur le gestionnaire de données, voir Gestionnaire de données.
Modèle global Modèle résultant fusionné entre différentes parties.
Cycle d'entraînement Un cycle d'entraînement est le processus d'entraînement des données locales, de fusion de modèles globaux et de mise à jour. L'entraînement est itératif. L'administrateur peut choisir le nombre de cycles d'entraînement.

Architecture

IBM Federated Learning comporte deux composants principaux: l'agrégateur et les parties d'entraînement à distance. 

Regroupeur

L'agrégateur est un processeur de fusion de modèle. L'administrateur gère l'agrégateur.

L'agrégateur exécute les tâches suivantes:

  • S'exécute en tant que service de plateforme dans les régions Dallas, Francfort, Londres ou Tokyo.
  • Commence par une expérimentation d'apprentissage fédéré.

Fête

Une partie est un utilisateur qui fournit une entrée de modèle à l'agrégateur d'expérimentation d'apprentissage fédéré. La partie peut être:

  • sur tout système pouvant exécuter le client Python de watsonx.ai Runtime et compatible avec les frameworks de watsonx.ai Runtime.

    Remarque :

    Il n'est pas nécessaire que le système soit spécifiquement Cloud Pak for Data as a Service. Pour obtenir la liste de la configuration système requise, voir Configuration de votre système.

  • exécution sur le système dans n'importe quel emplacement géographique. Il est recommandé de localiser chaque partie dans la même région où se trouvent les données afin d'éviter l'extraction de données à partir de différentes régions.

Cette illustration montre l'architecture d' IBM Federated Learning. Un système d'entraînement à distance est utilisé pour authentifier l'identité de la partie auprès de l'agrégateur lors de l'entraînement. Plusieurs parties avec différentes sources de données se connectent à leur système de formation à distance. Les data scientists surveillent la formation. À la fin, un modèle est créé sur la base de données formées collectivement.

Illustration de l'architecture d'apprentissage fédéré

Flux de travaux utilisateur

  1. Le spécialiste des données:
    1. Identifie les sources de données.
    2. Crée un modèle initial "non entraîné".
    3. Crée un fichier de gestionnaire de données.
      Ces tâches peuvent chevaucher une entité de partie de formation.
    4. Marque le modèle final.
  2. Une partie se connecte à l'agrégateur sur son système, qui peut être distant.
  3. Un administrateur contrôle l'expérimentation d'apprentissage fédéré en:
    1. Configuration de l'expérimentation pour qu'elle s'adapte aux parties distantes.
    2. Démarrage de l'agrégateur.
    3. Sauvegarde et déploiement du modèle.

Cette illustration montre les actions associées à chaque rôle dans le processus d'apprentissage fédéré.

Illustration du processus de flux de travaux du groupe d'apprentissage fédéré

Rubrique parent: IBM Federated Learning

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus