0 / 0
Volver a la versión inglesa de la documentación
Aprendizaje automático continuo
Última actualización: 07 oct 2024
Aprendizaje automático continuo (SPSS Modeler)

Como resultado de la investigación de IBM, e inspirado en la selección natural en biología, el aprendizaje automático continuo está disponible para el nodo Clasificador automático y el nodo Autonumérico.

Un inconveniente de la modelado es que los modelos queden obsoletos debido a los cambios en los datos a lo largo del tiempo. Esto se conoce comúnmente como deriva del modelo o desviación conceptual. Para ayudar a superar la desviación del modelo de forma efectiva, SPSS Modeler proporciona un aprendizaje automático automatizado continuo.

¿Qué es la desviación del modelo? Cuando se genera un modelo basado en los datos históricos, puede estancarse. En muchos casos, siempre llegan nuevos datos - nuevas variaciones, nuevos patrones, nuevas tendencias, etc.- que los antiguos datos históricos no capturan. Para resolver este problema, IBM se inspiró en el famoso fenómeno de la biología llamado selección natural de las especies. Piense en los modelos como especies y en los datos como naturaleza. Al igual que la naturaleza selecciona las especies, debemos dejar que los datos seleccionen el modelo. Hay una gran diferencia entre los modelos y las especies: las especies pueden evolucionar, pero los modelos son estáticos después de construirse.

Hay dos condiciones previas para que las especies evolucionen; la primera es la mutación de genes y la segunda es la población. Ahora, desde una perspectiva de modelado, para satisfacer la primera precondición (mutación de genes), debemos introducir nuevos cambios de datos en el modelo existente. Para satisfacer la segunda precondición (población), debemos utilizar varios modelos el lugar de uno solo. ¿Qué puede representar un número de modelos? Un conjunto de modelos de conjunto (EMS).

En la siguiente figura se muestra cómo puede evolucionar un EMS. La parte superior izquierda de la figura representa los datos históricos con particiones híbridas. Las particiones híbridas aseguran un EMS inicial abundante. La parte superior derecha de la figura representa un nuevo fragmento de datos que está disponible, con barras verticales a cada lado. La barra vertical de la izquierda representa el estado actual y la barra vertical de la derecha el estado cuando hay riesgo de desviación del modelo. En cada nueva ronda de aprendizaje automático continuo, se realizan dos pasos para hacer evolucionar su modelo y evitar la deriva del mismo.

En primer lugar, se crea un conjunto de modelos de conjunto (EMS) utilizando datos de entrenamiento. Después, cuando se dispone de un nuevo fragmento de datos, se construyen nuevos modelos a partir de esos nuevos datos y se añaden al EMS como modelos de componentes. Los pesos de los modelos de componentes existentes en el SME se vuelve a evaluar utilizando los nuevos datos. Como resultado de esta reevaluación, los modelos de componentes que tienen mayor peso se seleccionan para la predicción actual, y los modelos de componentes que tienen menor peso pueden ser suprimidos del EMS. El proceso renueva el EMS tanto para los pesos del modelo como para las instancias del mismo, evolucionando así de forma flexible y eficiente para abordar los inevitables cambios de sus datos a lo largo del tiempo.

Figura 1. Aprendizaje automático continuo
Aprendizaje automático continuo

El conjunto de modelos de conjunto (EMS) es un nugget de modelos generado automáticamente y hay un enlace de renovación entre el nodo de modelado automático y el nugget de modelado automático generado que define la relación de renovación entre ellos. Al habilitar aprendizaje automático continuo, los nuevos activos de datos se alimentan continuamente hacia los nodos de modelado automático para generar nuevos modelos de componentes. El nugget de modelos se actualiza en lugar de sustituirse.

En la siguiente figura se proporciona un ejemplo de la estructura interna de un EMS en un escenario de aprendizaje automático continuo. Solo se seleccionan los tres modelos de componentes principales para la predicción actual. Para cada modelo de componente (etiquetado como M1, M2 y M3), se mantienen dos tipos de pesos. El peso actual del modelo (CMW) describe el rendimiento de un modelo de componentes con un nuevo fragmento de datos, y el peso acumulado del modelo (AMW) describe el rendimiento global de un modelo de componentes con fragmentos de datos recientes. El AMW se calcula iterativamente a través del CMW y los valores anteriores de sí mismo, y hay un hiperparámetro beta para equilibrarlos. La fórmula para calcular AMW se denomina media móvil exponencial.

Cuando un nuevo fragmento de datos pasa a estar disponible, primero SPSS Modeler lo utiliza para crear algunos nuevos modelos de componentes. En esta figura de ejemplo, el modelo cuatro (M4) se crea con CMW y AMW calculados durante el proceso de generación del modelo inicial. A continuación, SPSS Modeler utiliza el nuevo fragmento de datos para reevaluar las medidas de los modelos componentes existentes (M1, M2 y M3) y actualizar su CMW y AMW en función de los resultados de la reevaluación. Por último, SPSS Modeler puede reordenar los modelos de componentes basándose en el CMW o AMW y seleccionar los tres modelos de componentes principales según corresponda.

En esta figura, CMW se describe utilizando el valor normalizado (sum = 1) y AMW se calcula basándose en CMW. En SPSS Modeler, el valor absoluto (igual a la medida ponderada de evaluación seleccionada - por ejemplo, la precisión) se elige para representar CMW y AMW por simplicidad.

Figura 2. Estructura de EMS
Estructura de EMS
Tenga en cuenta que hay dos tipos de ponderaciones definidas para cada modelo de componente EMS, que se pueden utilizar para seleccionar los N primeros modelos y el descarte del modelo de componente:
  • El Peso del modelo actual (CMW) e calcula mediante la evaluación frente al nuevo fragmento de datos (por ejemplo, la precisión de la evaluación en el nuevo fragmento de datos).
  • El Peso del modelo acumulado (AMW) se calcula combinando CMW y AMW existente (por ejemplo, media móvil ponderada exponencialmente (EWMA).

    Fórmula de media móvil exponencial para calcular AMW:
    Fórmula de media móvil exponencial para calcular AMW

En SPSS Modeler, después de ejecutar un nodo Clasificador automático para generar un nugget de modelo, las siguientes opciones de modelos están disponibles para el aprendizaje automático continuo:

  • Habilitar el aprendizaje automático continuo durante la renovación del modelo. Seleccione esta opción para habilitar el aprendizaje automático continuo. Hay que tener en cuenta que se deben utilizar metadatos consistentes (modelo de datos) para entrenar el modelo automático continuo. Si selecciona esta opción, se habilitarán otras opciones.
  • Habilitar reevaluación de pesos de modelos automáticos. Esta opción controla si las medidas de evaluación (precisión, por ejemplo) se calculan y actualizan durante la renovación del modelo. Si selecciona esta opción, se ejecutará un proceso de evaluación automático después del EMS (durante la actualización del modelo). Esto se debe a que normalmente es necesario reevaluar los modelos de componentes existentes utilizando nuevos datos para reflejar el estado actual de sus datos. A continuación, se asignan los pesos de los modelos componentes de EMS según los resultados de la reevaluación, y los pesos se utilizan para decidir la proporción en que un modelo componente contribuye a la predicción final del conjunto. Esta opción está seleccionada de forma predeterminada.
    Figura 3. Valores del modelo
    Valores del modelo
    Figura 4. Objetivo de marca
    Objetivo de marca
    A continuación se detallan los CMW y AMW soportados para el nodo Clasificador automático:
    Tabla 1. CMW y AMW soportados
    Tipo de destino CMW AMW
    objetivo de marca Precisión general
    Área bajo curva
    Exactitud acumulada
    AUC acumulada
    establecer destino Precisión global Precisión acumulada

    Las tres opciones siguientes están relacionadas con AMW, que se utiliza para evaluar el rendimiento de un modelo de componentes durante los períodos de fragmentos de datos recientes:

  • Habilitar factor acumulado durante reevaluación de ponderaciones de modelo. Si selecciona esta opción, el cálculo del AMW se habilitará durante la reevaluación de ponderaciones de modelo. AMW representa el rendimiento completo de un modelo de componente EMS durante los períodos de fragmentos de datos recientes, relacionados con el factor acumulado β definido en la fórmula AMW listada anteriormente, que puede ajustar en las propiedades del nodo. Si no se selecciona esta opción, solo se calculará CMW. Esta opción está seleccionada de forma predeterminada.
  • Ejecutar reducción de modelo basada en el límite acumulado durante la renovación de modelo. Seleccione esta opción si desea que los modelos de componentes con un valor de AMW inferior al límite especificado se eliminen del modelo automático EMS durante la actualización del modelo. Esto puede ser útil para descartar los modelos de componentes que son inútiles para evitar que el modelo automático EMS se vuelva demasiado pesado.
    La evaluación del valor límite acumulado está relacionada con la medida ponderada utilizada cuando se selecciona Evaluación - Votación ponderada como método de conjunto. Consulte lo siguiente.
    Figura 5. Objetivos de marca y conjunto
    Objetivos de marca y conjunto

    Tenga en cuenta que si selecciona Precisión de modelo para la medida ponderada de evaluación, se suprimirán los modelos con una Precisión acumulada inferior al límite especificado. Y si selecciona Área debajo de la curva para la medida ponderada de evaluación, los modelos con una AUC acumulada debajo del límite especificado se suprimirán.

    De forma predeterminada, Precisión de modelo se utiliza para la medida ponderada por evaluación para el nodo Clasificador automático y hay una medida AUC ROC opcional en el caso de objetivos de marca.

  • Utilizar votación ponderada por evaluación acumulada. Seleccione esta opción si desea utilizar AMW para la puntuación/predicción actual. De lo contrario, CMW se utilizará de forma predeterminada. Esta opción está habilitada cuando selecciona Votación ponderada por evaluación para el método de conjunto.

    Tenga en cuenta que para los objetivos de marca, al seleccionar esta opción, si selecciona Precisión de modelo para la medida ponderada por evaluación, Precisión acumulada se utilizará como el AMW para realizar la puntuación actual. O, si selecciona Área debajo de curva para la medida pondera por evaluación, AUC acumulada se utilizará como AMW para realizar la puntuación actual. Si no selecciona esta opción y selecciona Precisión de modelo para la medida ponderada por evaluación, Precisión global se utilizará como el CMW para realizar la puntuación actual. Si selecciona Área debajo de la curva, Área de la curva se utilizará como el CMW para realizar la puntuación actual.

    Para establecer objetivos, si selecciona esta opción Utilizar votación ponderada por evaluación acumulada,Precisión acumulada se utilizará como el AMW para realizar la puntuación actual. De lo contrario, Precisión global se utilizará como CMW para realizar la puntuación actual.

Con el aprendizaje automático continuo, el nugget de modelo automático evoluciona todo el tiempo recreando el modelo automático, lo que le garantiza obtener la versión más actualizada que refleje el estado actual de los datos. SPSS Modeler proporciona la flexibilidad necesaria para que los diferentes modelos de los N componentes principales del EMS se seleccionen de acuerdo con sus pesos actuales, así se mantiene al día con la variación de datos durante diferentes períodos.

Nota: El nodo Autonumérico es un caso mucho más sencillo, que proporciona un subconjunto de las opciones del nodo Clasificador automático.

Ejemplo

En este ejemplo, el aprendizaje automático continuo se utiliza en el sector de las telecomunicaciones para predecir el comportamiento y mantener a los clientes.

En el flujo siguiente, el activo de datos incluye información sobre los clientes que se han ido durante el último mes (columna Churn). Dado que cada mes habrá nuevos datos, este escenario es adecuado para el aprendizaje automático continuo. En este ejemplo, los datos de enero (Jan) se utilizan para construir un modelo automático inicial y, a continuación, los datos de febrero (Feb) se utilizan para mejorar el modelo automático mediante el aprendizaje automático continuo.

Figura 6. Flujo de ejemplo
Flujo de ejemplo
En la rama superior del flujo, después del nodo Activo de Datos, hay un nodo Filtro para filtrar algunos campos sin importancia. Al final de la rama, hay un nodo de terminal de modelado Clasificador automático. En la configuración de experto del nodo, seleccionamos los algoritmos que queremos utilizar para el proceso de entrenamiento. En este ejemplo, seleccionados tres algoritmos: Regresión logística, Red bayesiana y Red neuronal. Después ejecutamos el flujo para generar un nugget de modelo automático.

Ahora echemos un vistazo a lo que hay dentro del nugget del modelo automático. Podemos ver si contiene tres modelos de componentes para los tres algoritmos seleccionados. Para cada modelo de componente, se generan varias medidas de evaluación (como la precisión y el área bajo la curva). Estas medidas de evaluación describen el rendimiento de un modelo de componentes frente a los datos de entrenamiento (el conjunto de datos de enero). Puede seleccionar qué modelos de componente utilizar en la predicción de conjunto actual.

Figura 7. Medidas de evaluación
Medidas de evaluación

También puede ver medidas de evaluación acumuladas. Estas medidas acumuladas son para el aprendizaje automático continuo, ya que describen cómo se comporta un modelo de componentes con los cambios de datos recientes, para que se conozca el rendimiento global del modelo durante un período de tiempo. Como este es nuestro modelo automático inicial, vemos que los valores iniciales para las medidas acumuladas son los mismos que las medidas actuales relacionadas. De forma predeterminada, las medidas de evaluación se calculan respecto a los datos de entrenamiento, por lo que podría haber cierto grado de desajuste. Para evitar esto, el nodo Clasificador automático proporciona una opción de generación que calcula medidas de evaluación más estables a través de la validación cruzada.

A continuación, veamos cómo se genera la predicción final del conjunto. Si abrimos las propiedades de un modelo automático, bajo Objetivos de marca de conjunto, el campo de abandono de objetivo de entrenamiento es un objetivo de marca sí/no. Bajo Objetivos de conjunto de conjunto (para campos de objetivos de conjunto que contienen más de dos valores), hay un menú desplegable Método de conjunto. Hay varias opciones disponibles en el menú desplegable (por ejemplo, Votación por mayoría significa que cada modelo de componente dispone un tiquet para votar y Votación ponderada por confianza significa que el campo de confianza de la predicción de cada modelo de componente se utiliza como peso electoral, con una mayor confianza que tiene más influencia en la predicción final del conjunto). De forma parecida, para habilitar un mejor soporte para el aprendizaje automático continuo, la Votación ponderada por evaluación está disponible por lo que la medida de evaluación del modelo de componente (por ejemplo, más precisión o área bajo la curva) se utilizará como peso electoral. En el caso de un objetivo de marca, también hay una opción para seleccionar una medida de evaluación específica como peso electoral cuando se utiliza Votación ponderada por confianza. En el caso de un objetivo de conjunto, actualmente solo se da soporte a Precisión.

Figura 8. Objetivos de marca y conjunto
Objetivos de marca y conjunto

En los valores de Conjunto común es dónde se activa el aprendizaje automático continuo. Luego podemos utilizar los datos de febrero para ver lo que está ocurriendo. Podríamos seleccionar dos algoritmos diferentes para distinguir entre los algoritmos de modelos de componentes existentes. A continuación, tras regenerar el flujo y ver el contenido del modelo automático, vemos que se añaden dos nuevos modelos de componentes (C5 y C&RT). También observamos que se han vuelto a calcular las medidas de evaluación de los modelos de componentes existentes. Tanto las medidas CMW como las AMW son diferentes a las anteriores. Ahora podemos compararlas con las medidas correspondientes en el modelo automático original.

Figura 9. Medidas de evaluación
Medidas de evaluación

¿Ahora qué? Con el modelo automático mejorado, podemos seleccionar una medida de evaluación prioritaria y obtener los N mejores modelos de componentes ordenados por esa medida. A continuación, podemos utilizar los N mejores modelos de componentes para participar en la predicción final del conjunto para las solicitudes de análisis predictivo entrantes. Y si se selecciona Votación ponderada por evaluación para el Método de conjunto, podemos utilizar medidas acumuladas como pesos electorales simplemente seleccionando la opción Utilizar votación ponderada por evaluación acumulada en los valores Conjunto común. Si se deselecciona, de forma predeterminada se utilizarán las medidas CMW en la votación poderada por evaluación.

Con el aprendizaje automático continuo, el modelo automático evoluciona todo el tiempo, ya que se reconstruye continuamente con nuevos fragmentos de datos, lo que garantiza que su modelo sea la versión más actualizada que refleje el estado actual de los datos. Esto permite la flexibilidad de seleccionar los N mejores modelos de componentes distintos en el EMS según sus medidas de evaluación actuales o acumuladas, para mantenerse al día con los datos variables durante distintos períodos.

De forma periódica, puede optar por desplegar el modelo automático más actualizado en Watson Machine Learning periódicamente para mayor comodidad.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información