0 / 0
Volver a la versión inglesa de la documentación
Cómo empezar
Última actualización: 21 nov 2024
Cómo empezar

El aprendizaje federado es adecuado para cualquier situación en la que distintas entidades de distintas ubicaciones geográficas o proveedores de nube deseen entrenar un modelo analítico sin compartir sus datos.

Para empezar con Federated Learning:

Terminología

Terminología que se utiliza en los procesos de formación de IBM Federated Learning.

Plazo Definición
Fiesta Usuarios que aportan distintas fuentes de datos para entrenar un modelo de forma colaborativa. Federated Learning garantiza que la formación se produzca sin riesgo de exposición de datos entre las distintas partes.
' Una parte debe tener al menos permiso de Visualizador en el proyecto watsonx.ai Studio Federated Learning.
Administrador Miembro de parte que configura el experimento de aprendizaje federado para especificar cuántas partes están permitidas, qué infraestructuras utilizar y configura los sistemas de entrenamiento remoto (RTS). Comienzan el experimento de Aprendizaje Federado y lo ven hasta el final.
' Un administrador debe tener al menos permiso de Editor en el proyecto watsonx.ai Studio Federated Learning.
Sistema de entrenamiento remoto Activo que se utiliza para autenticar una parte en el agregador. Los miembros del proyecto se registran en el sistema de entrenamiento remoto (RTS) antes del entrenamiento. Sólo uno de los miembros puede utilizar un RTS para participar en un experimento como partido. Varias partes contribuyentes deben autenticarse cada una con un RTS para un experimento.
Agregador El agregador fusiona los resultados del modelo entre las partes para crear un modelo.
Método de fusión El algoritmo que se utiliza para combinar los resultados que las partes devuelven al agregador.
Manejador de datos En IBM Federated Learning, el manejador de datos es una clase que se utiliza para cargar y preprocesar datos. También ayuda a garantizar que los datos recopilados de varios orígenes se formateen de forma uniforme para el entrenamiento. Puede encontrar más detalles sobre el manejador de datos en Manejador de datos.
Modelo global El modelo resultante que se fusiona entre distintas partes.
Ronda de entrenamiento Una ronda de entrenamiento es el proceso de entrenamiento de datos locales, fusión de modelos globales y actualización. El entrenamiento es iterativo. El administrador puede elegir el número de rondas de entrenamiento.

Arquitectura

IBM Federated Learning tiene dos componentes principales: el agregador y las partes de entrenamiento remotas. 

Agregador

El agregador es un procesador de fusión de modelos. El administrador gestiona el agregador.

El agregador ejecuta las tareas siguientes:

  • Se ejecuta como un servicio de plataforma en las regiones de Dallas, Frankfurt, Londres o Tokio.
  • Empieza con un experimento de aprendizaje federado.

Fiesta

Una parte es un usuario que proporciona entrada de modelo al agregador de experimentos de aprendizaje federado. La parte puede ser:

  • en cualquier sistema que pueda ejecutar el cliente ' watsonx.ai Runtime ' Python y compatible con los frameworks ' watsonx.ai Runtime.

    Nota:

    No es necesario que el sistema sea específicamente Cloud Pak for Data as a Service. Para obtener una lista de los requisitos del sistema, consulte Configurar el sistema.

  • ejecución en el sistema en cualquier ubicación geográfica. Se recomienda localizar cada parte en la misma región donde se encuentran los datos para evitar la extracción de datos de distintas regiones.

Esta ilustración muestra la arquitectura de IBM Federated Learning. Un sistema de entrenamiento remoto se utiliza para autenticar la identidad de la parte en el agregador durante el entrenamiento. Varias partes con diferentes fuentes de datos se conectan a su sistema de capacitación remota. Los científicos de datos supervisan la formación. Al final, se crea un modelo basado en datos entrenados colectivamente.

Ilustración de la arquitectura de aprendizaje federado

Flujo de trabajo de usuario

  1. El experto en datos:
    1. Identifica los orígenes de datos.
    2. Crea un modelo inicial "no entrenado".
    3. Crea un archivo de manejador de datos.
      Estas tareas pueden solaparse con una entidad de parte de entrenamiento.
    4. Puntúa el modelo final.
  2. Una parte se conecta al agregador en su sistema, que puede ser remoto.
  3. Un administrador controla el experimento de aprendizaje federado mediante:
    1. Configuración del experimento para acomodar partes remotas.
    2. Iniciando el agregador.
    3. Guardar e implementar el modelo.

Esta ilustración muestra las acciones que están asociadas con cada rol en el proceso de aprendizaje federado.

Ilustración del proceso de flujo de trabajo del grupo de aprendizaje federado

Tema principal: IBM Federated Learning

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información