Per consentire le valutazioni dei modelli, è necessario preparare i dati per la registrazione, in modo da generare approfondimenti.
È necessario fornire i dati del modello in un formato supportato per abilitare le valutazioni del modello. Le transazioni del modello vengono elaborate nel data mart. Il data mart è il database di registrazione che memorizza i dati utilizzati per le valutazioni del modello. Le seguenti sezioni descrivono i diversi tipi di dati registrati per le valutazioni del modello:
Dati di addestramento
È necessario fornire dati di formazione per generare le statistiche necessarie per configurare le valutazioni del modello. I dati di addestramento contengono colonne di caratteristiche etichettate che vengono misurate per determinare il loro impatto sui risultati del modello e una colonna di previsione che contiene il risultato che il modello è addestrato a prevedere. Il seguente esempio mostra i dati di formazione dal dataset Rischio di credito tedesco:
Per abilitare le valutazioni del modello, è necessario collegare i dati di addestramento. I dati di addestramento per il modello devono essere forniti in un formato che possa essere elaborato. Per ulteriori informazioni, vedi Gestione dei dati di addestramento.
Dati del payload
I dati del payload contengono le transazioni di input e output per la tua distribuzione. Per configurare le valutazioni, i dati del payload dal modello vengono memorizzati in una tabella di registrazione del payload. La tabella di registrazione del payload contiene la funzione e le colonne di previsione presenti nei tuoi dati di addestramento e una colonna di probabilità di previsione che contiene la confidenza del modello nella previsione che fornisce. La tabella include anche colonne data / ora e ID per identificare ogni richiesta di calcolo del punteggio che invii al servizio che stai utilizzando, come mostrato nel seguente esempio:
È necessario inviare richieste di calcolo del punteggio per fornire un log delle transazioni modello. Per ulteriori informazioni, vedi Gestione dei dati del payload.
Dati di feedback
I dati di feedback sono dati etichettati che corrispondono alla struttura dei dati di addestramento e includono risultati del modello noti che vengono confrontati con le previsioni del modello per misurare la precisione del modello. È necessario caricare regolarmente i dati di feedback per misurare costantemente l'accuratezza delle previsioni del modello. Per ulteriori informazioni, vedi Gestione dei dati di feedback.