Configurare le valutazioni watsonx.governance negli spazi di distribuzione per ottenere informazioni dettagliate sulle prestazioni del modello. Quando configuri le valutazioni, puoi analizzare i risultati della valutazione e modellare i record della transazione direttamente negli spazi.
watsonx.governance valuta le distribuzioni del tuo modello per aiutarti a misurare le prestazioni e comprendere le previsioni del modello. Quando configuri le valutazioni del modello, watsonx.governance genera metriche per ogni valutazione che forniscono informazioni dettagliate differenti che puoi esaminare. watsonx.governance registra anche le transazioni elaborate durante le valutazioni per aiutarti a comprendere come vengono determinate le previsioni del tuo modello. Per ulteriori informazioni, vedi Valutazione dei modelli di intelligenza artificiale con Watson OpenScale.
Se disponi di un'istanza di watsonx.governance di cui è stato eseguito il provisioning, puoi creare senza soluzione di continuità una distribuzione online, quindi monitorare i risultati della distribuzione per la correttezza, la qualità, la deviazione e l'esplicabilità.
Uno scenario tipico segue questa sequenza:
- Crea uno spazio di distribuzione e associa un'istanza watsonx.governance allo spazio per consentire tutte le funzioni di monitoraggio. È possibile scegliere il tipo di spazio, ad esempio produzione o pre - produzione, a seconda delle proprie esigenze.
- Promuovi un modello di machine learning addestrato e i dati di input (payload) allo spazio di distribuzione e crea una distribuzione online per il modello.
- Dalla scheda Test di distribuzione, fornire i dati di input e ottenere le previsioni.
- Dalla scheda Valutazioni, configurare la valutazione per monitorare la qualità, la correttezza e l'esplicabilità della propria distribuzione. Fornire tutti i dettagli del modello richiesti in modo che Watson OpenScale possa connettersi al modello, ai dati di addestramento e payload e a un repository per l'archiviazione dei risultati della valutazione.
- Configurare un monitor per la correttezza per assicurarsi che il modello stia producendo risultati non distorti. Selezionare i campi da monitorare per la correttezza, quindi impostare le soglie per misurare le previsioni per un gruppo monitorato rispetto a un gruppo di riferimento. Ad esempio, è possibile valutare il modello per assicurarsi che fornisca previsioni non distorte in base al sesso.
- Configurare un controllo della qualità per determinare le prestazioni del modello in base al numero di esiti corretti prodotti dal modello in base a dati di test etichettati denominati dati Feedback. Impostare le soglie di qualità per tenere traccia quando un valore di metrica non è compreso in un intervallo accettabile.
- Configurare un monitor per la deviazione per assicurarsi che le distribuzioni siano aggiornate e congruenti. Utilizzare l'importanza della funzione per determinare l'impatto della deviazione della funzione sul modello. Ad esempio, una piccola quantità di deviazione in una funzione importante può avere un impatto maggiore sul proprio modello rispetto a una moderata quantità di deviazione in una funzione meno importante.
- È possibile controllare i risultati della distribuzione per comprendere i fattori che hanno portato il modello a determinare una previsione. Scegliere il metodo di spiegazione più adatto alle proprie esigenze. Ad esempio, è possibile scegliere il metodo SHAP (Shapley Additive EXplanations) per spiegazioni dettagliate o il metodo LIME (Local Interpretable Model - Agnostic Explanations) per spiegazioni più rapide.
- Infine, è possibile esaminare le valutazioni del modello per individuare le aree in cui piccole modifiche a pochi input risulterebbero in una decisione diversa. Scenari di test per stabilire se la modifica degli input può migliorare le prestazioni del modello.
Le seguenti sezioni descrivono come configurare le valutazioni watsonx.governance ed esaminare gli insight del modello nei tuoi spazi di distribuzione:
Preparazione alla valutazione dei modelli negli spazi
Se non hai un database associato alla tua istanza watsonx.governance , devi associare un database prima di poter eseguire le valutazioni. Per associare un database, è necessario fare clic su Associa database nella casella di dialogo Database richiesto per collegarsi a un database. Ti deve essere assegnato il ruolo Admin per il tuo progetto e l'istanza watsonx.governance per associare i database.
Configurazione delle valutazioni Watson OpenScale negli spazi
Dopo aver associato l'istanza Watson OpenScale , è possibile selezionare le distribuzioni per visualizzare le schede Valutazioni e Transazioni che è possibile utilizzare per configurare le valutazioni ed esaminare le informazioni dettagliate sul modello. Per avviare la configurazione delle valutazioni del modello nello spazio, è possibile selezionare Configura impostazioni di valutazione OpenScale per aprire una procedura guidata che fornisce una serie guidata di passi.
È possibile valutare le installazioni in linea solo nel proprio spazio di distribuzione.
Come fornire i dettagli del modello
Per configurare le valutazioni del modello, devi fornire i dettagli del modello per consentire a watsonx.governance di comprendere come è configurato il modello. È necessario fornire i dettagli sui dati di addestramento e sull'output del modello.
Per ulteriori informazioni, vedi Fornitura dei dettagli del modello.
Configurazione dell'esplicabilità
È possibile configurare l'esplicabilità in watsonx.governance per rivelare quali funzioni contribuiscono al risultato previsto dal modello per una transazione e prevedere quali modifiche determinerebbero un risultato diverso. È possibile scegliere di configurare le spiegazioni locali per analizzare l'impatto dei fattori per specifiche transazioni del modello e configurare le spiegazioni globali per analizzare fattori generali che influiscono sui risultati del modello.
Per ulteriori informazioni, consultare Configurazione dell'esplicabilità.
Configurazione delle valutazioni di correttezza
È possibile configurare le valutazioni di correttezza per stabilire se il proprio modello produce risultati distorti per gruppi differenti. Per configurare le valutazioni di correttezza, è possibile specificare il gruppo di riferimento che si prevede rappresenti i risultati favorevoli e le metriche di correttezza che si desidera utilizzare. È possibile anche selezionare le funzioni confrontate con il gruppo di riferimento per valutarle per la distorsione.
Per ulteriori informazioni, consultare Configurazione delle valutazioni di correttezza.
Configurazione delle valutazioni di qualità
È possibile configurare valutazioni di qualità per comprendere in che modo il modello prevede risultati accurati. Per configurare le valutazioni di qualità, è necessario specificare le soglie per ogni metrica per consentire a watsonx.governance di identificare quando la qualità del modello diminuisce.
Per ulteriori informazioni, consultare Configurazione delle valutazioni della qualità.
Configurazione delle valutazioni di deviazione v2
È possibile configurare le valutazioni di deviazione v2 per misurare le modifiche nei propri dati nel tempo per assicurarsi di ottenere risultati congruenti per il modello. Per configurare le valutazioni della deviazione v2 , è necessario impostare le soglie che consentono a watsonx.governance di identificare le modifiche nell'output del modello, l'accuratezza della previsione e la distribuzione dei dati di input. È inoltre necessario selezionare funzioni importanti per abilitare watsonx.governance per misurare la modifica nella distribuzione del valore.
Per ulteriori informazioni, vedi Configurazione delle valutazioni della deviazione v2.
Configurazione delle valutazioni di deviazione
È possibile configurare le valutazioni di deviazione per abilitare watsonx.governance per rilevare diminuzioni di precisione e congruenza dei dati nel modello. Per configurare le valutazioni di deviazione, è necessario impostare le soglie per consentire a watsonx.governance di stabilire una baseline di accuratezza e congruenza per il proprio modello.
Per ulteriori informazioni, consultare Configurazione delle valutazioni della deviazione.
Esecuzione delle valutazioni
Dopo aver configurato le valutazioni, è possibile chiudere la procedura guidata per eseguire le valutazioni. Per eseguire le valutazioni, è necessario selezionare Valuta ora nel menu Azioni della scheda Valutazioni per inviare transazioni modello.
Revisione dei risultati della valutazione
È possibile analizzare i risultati della valutazione nella scheda Valutazioni per ottenere informazioni dettagliate sulle prestazioni del modello. Per analizzare i risultati della valutazione, è possibile fare clic sulla freccia in una sezione di valutazione oppure utilizzare il menu Azioni per visualizzare i dettagli sul proprio modello.
Per ulteriori informazioni, consultare Revisione dei risultati di valutazione.
Revisione delle transazioni del modello
È possibile analizzare le transazioni modello nella scheda Transazioni per comprendere in che modo il modello prevede i risultati e prevedere quali modifiche potrebbero causare risultati differenti. Per analizzare le transazioni, è possibile scegliere di visualizzare spiegazioni che forniscono dettagli su come vengono determinate le previsioni del modello.
Per ulteriori informazioni, consultare Spiegazione delle transazioni modello.
Argomento principale: Gestione delle distribuzioni predittive