È possibile configurare valutazioni di equità per determinare se il modello produce risultati distorti. Utilizzate le valutazioni di equità per identificare quando il vostro modello mostra la tendenza a fornire più spesso risultati favorevoli a un gruppo rispetto a un altro.
Configurazione delle valutazioni di equità per i modelli di apprendimento automatico
È possibile configurare manualmente le valutazioni di correttezza oppure è possibile eseguire un notebook personalizzato per generare un file di configurazione. È possibile caricare il file di configurazione per specificare le impostazioni per la valutazione.
Quando si configurano le valutazioni di correttezza manualmente, è possibile specificare il gruppo di riferimento (valore) che si prevede rappresenti i risultati favorevoli. È anche possibile selezionare gli attributi del modello corrispondenti (funzioni) per monitorare la distorsione (ad esempio, Età o Sesso), che verrà confrontata con il gruppo di riferimento. In base ai dati di addestramento, è possibile specificare la dimensione minima e massima del campione per le valutazioni.
Selezionare gli esiti favorevoli e quelli sfavorevoli
Copy link to section
È necessario specificare i risultati favorevoli e sfavorevoli quando si configurano le valutazioni di equità. I valori che rappresentano un risultato favorevole derivano dalla colonna label nei dati di addestramento. Per impostazione predefinita la colonna predictedLabel è impostata come la colonna prediction. I valori favorevoli e sfavorevoli devono essere specificati utilizzando il valore della colonna prediction come tipo di dati stringa, ad esempio 0 o 1 quando si caricano i dati di addestramento.
Seleziona funzioni
Copy link to section
È necessario selezionare le caratteristiche che rappresentano gli attributi del modello che si desidera valutare per rilevare le distorsioni. Ad esempio, è possibile valutare caratteristiche come Sex o Age per la polarizzazione. Sono supportate solo le funzioni di tipo di dati di correttezza categoriali, numerici (interi), mobili o doppi.
I valori delle funzioni vengono specificati come riferimento o come gruppo monitorato. Il gruppo monitorato rappresenta i valori più a rischio per i risultati distorti. Ad esempio, per la funzione Sex , è possibile impostare Female e Non-binary come gruppi monitorati. Per una funzione numerica, come Age, è possibile impostare [18-25] come gruppo monitorato. Tutti gli altri valori per la funzione vengono quindi considerati come gruppo di riferimento, ad esempio Sex=Male o Age=[26,100].
Impostare la soglia di equità
Copy link to section
È possibile impostare la soglia di equità per specificare una differenza accettabile tra la percentuale di risultati favorevoli per il gruppo monitorato e la percentuale di risultati favorevoli per il gruppo di riferimento. Ad esempio, se la percentuale di risultati favorevoli per un gruppo nel modello è 70% e la soglia di correttezza è impostata su 80%, il monitoraggio della correttezza rileva la distorsione nel modello.
Imposta la dimensione del campione
Copy link to section
Le dimensioni del campione vengono utilizzate per accelerare l'elaborazione del numero di transazioni da valutare. È necessario impostare una dimensione minima del campione per indicare il numero minimo di transazioni che si desidera valutare. È inoltre possibile impostare una dimensione massima del campione per indicare il numero massimo di transazioni che si desidera valutare.
Test per la distorsione indiretta
Copy link to section
Se si seleziona un campo che non è una caratteristica di addestramento, chiamato campo aggiunto, il pregiudizio indiretto viene identificato trovando i valori associati nelle caratteristiche di addestramento. Ad esempio, la professione "studente" può implicare un individuo più giovane anche se il campo Età è stato escluso dall'addestramento del modello. Per maggiori dettagli sulla configurazione delle valutazioni di equità per considerare i pregiudizi indiretti, vedere Configurazione del monitor di equità per i pregiudizi indiretti.
Attenuazione della distorsione
Copy link to section
Il debiasing passivo e attivo viene utilizzato per la valutazione dei modelli di apprendimento automatico. L'annullamento della distorsione passivo rivela la distorsione, mentre l'annullamento della distorsione attivo impedisce di portare avanti tale distorsione modificando il modello in tempo reale per l'applicazione corrente. Per i dettagli sull'interpretazione dei risultati e sulla mitigazione della distorsione in un modello, consultare Revisione dei risultati da una valutazione della correttezza.
Configurazione delle valutazioni dell'equità in watsonx.governance
Copy link to section
Quando valutate i modelli di prompt, potete esaminare un riepilogo dei risultati della valutazione dell'equità per i compiti di classificazione del testo.
Selezionare gli esiti favorevoli e quelli sfavorevoli
Copy link to section
È necessario specificare i risultati favorevoli e sfavorevoli quando si configurano le valutazioni di equità. I valori che rappresentano un risultato favorevole sono derivati dalla colonna label dei dati del test forniti dall'utente. Per impostazione predefinita la colonna predictedLabel è impostata come la colonna prediction. I valori favorevoli e sfavorevoli devono essere specificati utilizzando il valore della colonna prediction come tipo di dati stringa, ad esempio 0 o 1 quando si caricano i dati di allenamento.
Selezionare i metacampi
Copy link to section
È necessario selezionare i metacampi per consentire a watsonx.governance di identificare i campi non specificati come caratteristiche nei dati di test forniti.
Impostare le soglie di equità
Copy link to section
Per configurare le valutazioni di equità con le proprie impostazioni, è possibile impostare una dimensione minima e massima del campione per ciascuna metrica. La dimensione minima o massima del campione indica il numero minimo o massimo di transazioni del modello che si desidera valutare.
È inoltre possibile configurare i dati di base e impostare i valori di soglia per ogni metrica. I valori di soglia creano avvisi nella pagina di riepilogo della valutazione che appaiono quando i punteggi delle metriche violano le soglie impostate. I valori devono essere compresi tra 0 e 1. I punteggi delle metriche devono essere inferiori ai valori di soglia per evitare violazioni.
Imposta la dimensione del campione
Copy link to section
Watsonx.governance utilizza le dimensioni dei campioni per capire come elaborare il numero di transazioni che vengono valutate durante le valutazioni. È necessario impostare una dimensione minima del campione per indicare il numero minimo di transazioni che si desidera che watsonx.governance valuti. È inoltre possibile impostare una dimensione massima del campione per indicare il numero massimo di transazioni che si desidera che watsonx.governance valuti.