0 / 0
Torna alla versione inglese della documentazione
Configurazione delle valutazioni del modello
Ultimo aggiornamento: 25 ott 2024
Configurazione delle valutazioni del modello

È possibile configurare le valutazioni per generare approfondimenti sulle prestazioni del modello.

È possibile configurare i seguenti tipi di valutazione:

  • Qualità
    Valuta il modo in cui il modello prevede i risultati corretti che corrispondono ai dati di test etichettati.
  • Correttezza
    Valuta se il modello produce risultati distorti che forniscono risultati favorevoli per un gruppo rispetto a un altro.
  • Deriva
    Valuta come il modello cambia in termini di accuratezza e coerenza dei dati confrontando le transazioni recenti con i dati di addestramento.
  • Drift v2
    Valuta le modifiche nell'output del modello, l'accuratezza delle previsioni e la distribuzione dei dati di input.
  • Integrità del modello
    Valuta l'efficienza con cui la distribuzione del modello elabora le transazioni.
  • Qualità dell'IA generativa
    Misura il grado di esecuzione dei compiti da parte del vostro foundation model

Se state valutando modelli di apprendimento automatico tradizionali, potete anche creare valutazioni e metriche personalizzate per generare una maggiore varietà di informazioni sulle prestazioni del modello.

Ogni valutazione genera metriche che è possibile analizzare per ottenere informazioni dettagliate sulle prestazioni del modello.

Quando si configurano le valutazioni, si può scegliere di eseguirle continuamente ai seguenti intervalli predefiniti:

Valutazione Programma predefinito di abbonamento online Pianificazione predefinita dell'abbonamento batch
Qualità 1 ora 1 settimana
Equità 1 ora 1 settimana
Deviazione 3 ore 1 settimana
Deviazione v2 1 giorno ND
Esplicabilità 1 settimana 1 settimana
Integrità del modello 1 ora ND
Qualità dell'AI generativa 1 ora ND

Argomento principale: Valutazione dei modelli AI con Watson OpenScale

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni