Come risultato della ricerca IBM e ispirato dalla selezione naturale in biologia, apprendimento automatico continuo è disponibile per i nodi Classificatore automatico e Numerico automatico.
Un inconveniente con la modellazione è che i modelli diventano obsoleti a causa di modifiche ai dati nel tempo. Ciò viene comunemente indicato come deviazione del modello o deviazione del concetto. Per aiutare a superare in modo efficace la deviazione del modello, SPSS Modeler fornisce l'apprendimento automatico continuo.
Cos' è la deriva del modello? Quando si crea un modello basato su dati cronologici, può diventare stagnante. In molti casi, nuovi dati sono sempre in arrivo - nuove variazioni, nuovi modelli, nuove tendenze, ecc. - che i vecchi dati storici non catturano. Per risolvere questo problema, IBM è stato ispirato dal famoso fenomeno della biologia chiamato selezione naturale delle specie. Pensate ai modelli come specie e pensate ai dati come natura. Proprio come la natura seleziona le specie, dovremmo lasciare che i dati selezionino il modello. C'è una grande differenza tra i modelli e le specie: le specie possono evolvere, ma i modelli sono statici dopo che sono stati costruiti.
Ci sono due precondizioni per l'evoluzione delle specie; la prima è la mutazione genica, e la seconda è la popolazione. Ora, da una prospettiva di modellazione, per soddisfare la prima precondizione (mutazione genica), dovremmo introdurre nuovi cambiamenti di dati nel modello esistente. Per soddisfare la seconda precondizione (popolazione), dovremmo usare una serie di modelli piuttosto che uno solo. Che cosa può rappresentare un certo numero di modelli? Un insieme di modelli di ensemble (EMS)!
La seguente figura illustra come un EMS può evolvere. La parte superiore sinistra della figura rappresenta i dati cronologici con partizioni ibride. Le partizioni ibride assicurano un EMS iniziale completo. La parte superiore destra della figura rappresenta un nuovo blocco di dati che diventa disponibile, con barre verticali su ciascun lato. La barra verticale sinistra rappresenta lo stato corrente e la barra verticale destra rappresenta lo stato quando c'è un rischio di deviazione del modello. In ogni nuovo ciclo di machine learning continuo, vengono eseguiti due passaggi per evolvere il tuo modello ed evitare la deriva del modello.
Per prima cosa, si crea un insieme di modelli di insieme (EMS) utilizzando i dati di addestramento esistenti. Successivamente, quando diventa disponibile una nuova porzione di dati, vengono creati nuovi modelli rispetto a tali nuovi dati e aggiunti all'EMS come modelli di componenti. I pesi dei modelli di componenti esistenti nello SME vengono rivalutati utilizzando i nuovi dati. Come risultato di questa rivalutazione, i modelli di componenti con pesi più elevati vengono selezionati per la previsione corrente e i modelli di componenti con pesi più bassi possono essere eliminati dallo SME. Questo processo aggiorna l'EMS sia per i pesi del modello che per le istanze del modello, evolvendo in modo flessibile ed efficace per affrontare le inevitabili modifiche ai dati nel tempo.
EMS (ensemble model set) è un nugget del modello automatico generato e c'è un collegamento di aggiornamento tra il nodo Modelli automatici e il nugget del modello automatico generato che definisce la relazione di aggiornamento tra di essi. Quando si abilita il machine learning automatico continuo, i nuovi asset di dati vengono continuamente alimentati ai nodi Modelli automatici per generare nuovi modelli di componente. Il nugget del modello viene aggiornato invece di essere sostituito.
La seguente figura fornisce un esempio della struttura interna di un EMS in uno scenario di machine learning continuo. Per la previsione corrente vengono selezionati solo i primi tre modelli di componenti. Per ciascun modello componente (etichettato come M1, M2e M3), vengono mantenuti due tipi di pesi. Il peso del modello corrente (CMW) descrive il modo in cui un modello del componente viene eseguito con una nuova porzione di dati e il peso del modello accumulato (AMW) descrive le prestazioni complete di un modello del componente rispetto ai blocchi di dati recenti. AMW è calcolato iterativamente tramite CMW e valori precedenti di se stesso, e c'è un iper parametro beta per bilanciare tra loro. La formula per calcolare AMW è denominata media mobile esponenziale.
Quando una nuova porzione di dati diventa disponibile, SPSS Modeler la utilizza per creare alcuni nuovi modelli di componente. In questa figura di esempio, il modello quattro (M4) viene creato con CMW e AMW calcolati durante il processo di creazione del modello iniziale. Quindi, SPSS Modeler utilizza la nuova porzione di dati per rivalutare le misurazioni dei modelli di componente esistenti (M1, M2e M3) e aggiornarne CMW e AMW in base ai risultati della rivalutazione. Infine, SPSS Modeler potrebbe riordinare i modelli di componenti basati su CMW o AMW e selezionare di conseguenza i primi tre modelli di componenti.
In questa figura, CMW viene descritto utilizzando un valore normalizzato (somma = 1) e AMW viene calcolato in base a CMW. In SPSS Modeler, il valore assoluto (uguale alla misura ponderata di valutazione selezionata, ad esempio precisione) viene scelto per rappresentare CMW e AMW per semplicità.
- Peso del modello corrente (CMW) viene calcolato tramite valutazione rispetto alla nuova porzione di dati (ad esempio, precisione della valutazione sulla nuova porzione di dati).
- Peso del modello accumulato (AMW) viene calcolato combinando sia CMW che AMW esistente (ad esempio, EWMA (exponmezzo weighted moving average).
Formula della media mobile esponenziale per il calcolo AMW:
In SPSS Modeler, dopo aver eseguito un nodo Classificatore automatico per generare un nugget del modello, sono disponibili le seguenti opzioni del modello per il machine learning continuo:
- Abilita il machine learning automatico continuo durante l'aggiornamento del modello. Selezionare questa opzione per abilitare il machine learning continuo. Tenere presente che è necessario utilizzare metadati congruenti (modello di dati) per addestrare il modello automatico continuo. Se si seleziona questa opzione, vengono abilitate altre opzioni.
- Abilita nuova valutazione automatica dei pesi del modello. Questa opzione controlla se le misure di valutazione (ad esempio, la precisione) vengono calcolate e aggiornate durante l'aggiornamento del modello. Se si seleziona questa opzione, verrà eseguito un processo di valutazione automatico dopo l'EMS (durante l'aggiornamento del modello). Questo perché di solito è necessario rivalutare i modelli di componenti esistenti utilizzando nuovi dati per riflettere lo stato corrente dei dati. Quindi, i pesi dei modelli di componenti EMS vengono assegnati in base ai risultati della rivalutazione e i pesi vengono utilizzati per decidere la proporzione che un modello di componente contribuisce alla previsione dell'insieme finale. Questa opzione è selezionata per impostazione predefinita.
Di seguito sono riportati i CMW e AMW supportati per il nodo Classificatore automatico:
Tabella 1. CMW e AMW supportati Tipo di destinazione CMW AMW destinazione flag Precisione generale
Area sotto curvaAccuratezza accumulata
AUC accumulataimposta destinazione Precisione globale Accuratezza accumulata Le seguenti tre opzioni sono correlate a AMW, che viene utilizzato per valutare il modo in cui un modello di componenti viene eseguito durante i periodi di blocco di dati recenti:
- Abilita fattore accumulato durante la rivalutazione dei pesi del modello. Se si seleziona questa opzione, il calcolo AMW verrà abilitato durante la rivalutazione dei pesi del modello. AMW rappresenta le prestazioni complete di un modello di componente EMS durante i periodi di blocco dei dati recenti, in relazione al fattore β accumulato definito nella formula AMW precedentemente elencata, che è possibile regolare nelle proprietà del nodo. Quando questa opzione non è selezionata, verrà calcolato solo CMW. Questa opzione è selezionata per impostazione predefinita.
- Eseguire la riduzione del modello basata sul limite accumulato durante l'aggiornamento del modello. Selezionare questa opzione se si desidera che i modelli componente con un valore AMW inferiore al limite specificato vengano rimossi dall'EMS del modello automatico durante l'aggiornamento del modello. Ciò può essere utile per eliminare i modelli di componenti che sono inutili per evitare che l'EMS del modello automatico diventi troppo pesante.La valutazione del valore limite accumulato è correlata alla misura ponderata utilizzata quando si seleziona Voto ponderato per la valutazione come metodo dell'insieme. Vedere quanto segue.
Notare che se si seleziona Precisione del modello per la misura ponderata di valutazione, i modelli con una precisione accumulata inferiore al limite specificato verranno eliminati. E se si seleziona Area sotto la curva per la misura ponderata di valutazione, i modelli con un'AUC accumulata al di sotto del limite specificato verranno eliminati.
Per impostazione predefinita, la Precisione del modello viene utilizzata per la misura ponderata di valutazione per il nodo Classificatore automatico ed è disponibile una misura AUC ROC facoltativa nel caso di obiettivi flag.
- Utilizza la valutazione ponderata accumulata. Selezionare questa opzione se si desidera che AMW venga utilizzato per il punteggio / previsione corrente. Altrimenti, CMW verrà utilizzato per impostazione predefinita. Questa opzione è abilitata quando si seleziona Valutazione ponderata per il metodo dell'insieme.
Notare che per gli obiettivi flag, selezionando questa opzione, se si seleziona Accuratezza del modello per la misura ponderata di valutazione, Accuratezza accumulata verrà utilizzata come AMW per eseguire il calcolo del punteggio corrente. Oppure, se si seleziona Area sotto la curva per la misura ponderata di valutazione, verrà utilizzato AUC accumulata come AMW per eseguire il calcolo del punteggio corrente. Se non si seleziona questa opzione e si seleziona Accuratezza del modello per la misura ponderata di valutazione, verrà utilizzata la Accuratezza generale come CMW per eseguire il calcolo del punteggio corrente. Se si seleziona Area sotto la curva, Area sotto la curva verrà utilizzato come CMW per eseguire il calcolo del punteggio corrente.
Per gli obiettivi impostati, se si seleziona questa opzione Utilizza valutazione ponderata accumulata , come AMW verrà utilizzato Precisione accumulata per eseguire il calcolo del punteggio corrente. Altrimenti, Precisione generale verrà utilizzata come CMW per eseguire il punteggio corrente.
Con il machine learning automatico continuo, il nugget del modello automatico si evolve continuamente ricostruendo il modello automatico, il che garantisce di ottenere la versione più aggiornata che riflette lo stato corrente dei propri dati. SPSS Modeler fornisce la flessibilità per i diversi modelli dei primi N componenti nello SME da selezionare in base ai loro pesi correnti, che tiene il passo con i dati variabili durante periodi differenti.
Esempio
In questo esempio, il machine learning continuo viene utilizzato nel settore delle telecomunicazioni per prevedere il comportamento e mantenere i clienti.
Nel seguente flusso, l'asset di dati include informazioni sui clienti che hanno lasciato nell'ultimo mese (colonnaChurn
). Poiché i nuovi dati saranno disponibili ogni mese, questo scenario è adatto per l'apprendimento automatico continuo. In questo esempio, i dati di gennaio (Jan
) vengono utilizzati per creare un modello automatico iniziale e quindi i dati di febbraio (Feb
) vengono utilizzati per migliorare il modello automatico tramite il machine learning continuo.
Ora diamo un'occhiata a cosa c'è all'interno del nugget del modello automatico. Possiamo vedere che contiene tre modelli di componenti per i tre algoritmi selezionati. Per ogni modello di componente, sono state generate diverse misure di valutazione (come precisione e area sotto la curva). Queste misure di valutazione descrivono il modo in cui un modello componente viene eseguito rispetto ai dati di addestramento (il dataset di gennaio). È possibile selezionare quali modelli di componenti utilizzare nella previsione dell'insieme corrente.
È anche possibile visualizzare le misure di valutazione accumulate. Queste misure accumulate sono per l'apprendimento automatico continuo, in quanto descrivono il modo in cui un modello di componente viene eseguito con le recenti modifiche dei dati, in modo da essere consapevoli delle prestazioni complete del modello in un periodo di tempo. Poiché questo è il nostro modello automatico iniziale, vediamo che i valori iniziali per le misure accumulate sono gli stessi delle misure correnti correlate. Per impostazione predefinita, le misure di valutazione vengono calcolate rispetto ai dati di addestramento, quindi potrebbe esserci un certo grado di sovradattamento. Per evitare ciò, il nodo Classificatore automatico fornisce un'opzione di creazione che calcola misure di valutazione più stabili tramite convalida incrociata.
Successivamente, diamo un'occhiata a come viene generata la previsione dell'insieme finale. Se si aprono le proprietà di un modello automatico, in Obiettivi indicatore ensemble, il campo del tasso di abbandono dell'obiettivo di addestramento è un obiettivo indicatore sì/no. In Serie di destinazioni ensemble (per i campi obiettivo impostati che contengono più di due valori), è disponibile un menu a discesa Metodo ensemble . Nell'elenco a discesa sono disponibili diverse opzioni (ad esempio, Voto di maggioranza significa che ogni modello componente contiene un ticket per il voto e Voto ponderato in base alla confidenza indica che il campo di confidenza di ogni previsione del modello componente viene utilizzato come peso di voto, con una confidenza più elevata che ha maggiore influenza sulla previsione dell'insieme finale). Allo stesso modo, per consentire un migliore supporto per il machine learning continuo, è disponibile la votazione ponderata di valutazione in modo che la misura di valutazione del modello del componente (ad esempio, precisione del modello o area sotto la curva) venga utilizzata come peso di voto. Nel caso di un obiettivo flag, esiste anche un'opzione per selezionare una misura di valutazione specifica come peso di voto quando viene utilizzato il voto ponderato per l'eluizione . Nel caso di una destinazione impostata, è attualmente supportato solo Precisione .
Nelle impostazioni Ensemble Common è possibile attivare il machine learning continuo. Poi possiamo usare i dati di febbraio per vedere cosa sta succedendo. È possibile selezionare due diversi algoritmi per distinguere tra gli algoritmi del modello componente esistenti. Quindi, dopo aver rigenerato il flusso e visualizzato il contenuto del modello automatico, vengono aggiunti due nuovi modelli di componente (C5 e C & RT). Notiamo inoltre che le misure di valutazione per i modelli di componenti esistenti sono state ricalcolate. Sia le misure CMW che le misure AMW sono diverse rispetto a prima. Ora possiamo confrontarli con le misure corrispondenti nel modello automatico originale.
E ora? Con il modello automatico potenziato, è possibile selezionare una misura di valutazione con priorità e ottenere i primi N modelli di componenti ordinati in base a tale misura. Quindi, è possibile utilizzare i modelli dei componenti principali N per partecipare alla previsione dell'insieme finale per le richieste di analisi predittiva in entrata. E se è selezionato Voto ponderato per la valutazione per il Metodo dell'insieme, è possibile utilizzare le misure accumulate come pesi di voto semplicemente selezionando l'opzione Utilizza voto ponderato per la valutazione accumulata nelle impostazioni Comune dell'insieme . Se deselezionata, le misure CMW verranno utilizzate per impostazione predefinita nel voto ponderato per la valutazione.
Con il machine learning continuo, il modello automatico è in continua evoluzione in quanto viene continuamente ricostruito rispetto a nuovi blocchi di dati, garantendo che il tuo modello sia la versione più aggiornata che riflette lo stato corrente dei dati. Ciò consente la flessibilità di selezionare diversi modelli di componenti principali nello SME in base alle misure di valutazione correnti o accumulate, per tenere il passo con i dati variabili durante periodi diversi.
Periodicamente, puoi scegliere di distribuire periodicamente il modello automatico più aggiornato in Watson Machine Learning per comodità.