Descrizione
La contaminazione dei dati si verifica quando per l'addestramento vengono utilizzati dati non corretti. Ad esempio, i dati che non sono in linea con lo scopo del modello o quelli che sono già stati accantonati per altre attività di sviluppo, come i test e le valutazioni.
Perché la contaminazione dei dati è un problema per i modelli di fondazione?
I dati che differiscono dai dati di addestramento previsti potrebbero alterare l'accuratezza del modello e influenzarne i risultati.
Argomento principale: Atlante del rischio AI
Facciamo degli esempi che sono stati trattati dalla stampa per aiutare a spiegare molti dei rischi dei modelli di fondazione. Molti di questi eventi trattati dalla stampa sono ancora in evoluzione o sono stati risolti, e fare riferimento ad essi può aiutare il lettore a comprendere i rischi potenziali e a lavorare per mitigarli. L'evidenziazione di questi esempi è solo a scopo illustrativo.