Gestione dei dati per le valutazioni del modello | IBM Cloud Pak for Data as a Service

Torna alla versione inglese della documentazione

Gestione dei dati per le valutazioni del modello

Ultimo aggiornamento: 25 ott 2024

Gestione dei dati per le valutazioni del modello

Per consentire le valutazioni dei modelli, è necessario preparare i dati per la registrazione, in modo da generare approfondimenti.

È necessario fornire i dati del modello in un formato supportato per abilitare le valutazioni del modello. Le transazioni del modello vengono elaborate nel data mart. Il data mart è il database di registrazione che memorizza i dati utilizzati per le valutazioni del modello. Le seguenti sezioni descrivono i diversi tipi di dati registrati per le valutazioni del modello:

Dati di addestramento

È necessario fornire dati di formazione per generare le statistiche necessarie per configurare le valutazioni del modello. I dati di addestramento contengono colonne di caratteristiche etichettate che vengono misurate per determinare il loro impatto sui risultati del modello e una colonna di previsione che contiene il risultato che il modello è addestrato a prevedere. Il seguente esempio mostra i dati di formazione dal dataset Rischio di credito tedesco:

File CSV dei dati di addestramento

Per abilitare le valutazioni del modello, è necessario collegare i dati di addestramento. I dati di addestramento per il modello devono essere forniti in un formato che possa essere elaborato. Per ulteriori informazioni, vedi Gestione dei dati di addestramento.

Dati del payload

I dati del payload contengono le transazioni di input e output per la tua distribuzione. Per configurare le valutazioni, i dati del payload dal modello vengono memorizzati in una tabella di registrazione del payload. La tabella di registrazione del payload contiene la funzione e le colonne di previsione presenti nei tuoi dati di addestramento e una colonna di probabilità di previsione che contiene la confidenza del modello nella previsione che fornisce. La tabella include anche colonne data / ora e ID per identificare ogni richiesta di calcolo del punteggio che invii al servizio che stai utilizzando, come mostrato nel seguente esempio:

Output di esempio SDK Python della tabella di registrazione del payload

È necessario inviare richieste di calcolo del punteggio per fornire un log delle transazioni modello. Per ulteriori informazioni, vedi Gestione dei dati del payload.

Dati di feedback

I dati di feedback sono dati etichettati che corrispondono alla struttura dei dati di addestramento e includono risultati del modello noti che vengono confrontati con le previsioni del modello per misurare la precisione del modello. È necessario caricare regolarmente i dati di feedback per misurare costantemente l'accuratezza delle previsioni del modello. Per ulteriori informazioni, vedi Gestione dei dati di feedback.

Dati di addestramento

Dati del payload

Dati di feedback

Ulteriori informazioni