L'SDK (Software Development Kit) " ibm-watsonx-gov Python " è una libreria di " Python " che puoi utilizzare per monitorare, gestire e governare programmaticamente modelli di apprendimento automatico e risorse di IA generativa. È possibile utilizzare l'SDK di " Python " per calcolare metriche e algoritmi in un ambiente di runtime per notebook o scaricarli come lavori Spark contro " IBM Analytics Engine " per valutazioni di modelli.
Utilizzare il ibm-watsonx-govPython SDK, per calcolare metriche di valutazione e generare approfondimenti. È possibile automatizzare queste attività utilizzando i moduli e integrandoli con l'applicazione. È inoltre possibile utilizzare i quaderni campione per calcolare le metriche.
Moduli
Copy link to section
L'SDK di Python, che può aiutarti ad automatizzare le attività per le valutazioni dei modelli e generare approfondimenti, supporta i seguenti moduli:
L'SDK di Machine Learning ( Python ) supporta metriche che aiutano a valutare le tradizionali valutazioni dei modelli di apprendimento automatico e a richiedere valutazioni dei modelli per le risorse di IA generativa. Per ulteriori informazioni, vedere Metriche di valutazione.
Le seguenti metriche sono attualmente disponibili solo con l'SDK di " Python ":
Tabella 13. Python Descrizioni metriche di valutazione SDK
Rileva gli errori ortografici in lingua inglese nelle domande di input del modello
Anche la seguente categoria metrica è disponibile solo con l'SDK ( Python ):
Metriche di convalida dei contenuti
Copy link to section
Le metriche di convalida dei contenuti utilizzano funzioni basate sulle stringhe per analizzare e convalidare il testo di output LLM generato. L'input deve contenere un elenco di testi generati dal vostro LLM per generare metriche di validazione dei contenuti.
Se l'input non contiene record di transazioni, le metriche misurano il rapporto tra le convalide del contenuto effettuate con successo e lo confrontano con il numero totale di convalide. Se l'input contiene record di transazioni, le metriche misurano il rapporto tra le convalide del contenuto riuscite rispetto al numero totale di convalide e calcolano i risultati della convalida con il valore specificato record_id.
È possibile calcolare le seguenti metriche di convalida dei contenuti:
Tabella 14. Descrizioni metriche di valutazione della convalida dei contenuti