Rischio di attacco di estrazione per AI
Descrizione
Un attacco di estrazione tenta di copiare o rubare un modello di intelligenza artificiale campionando opportunamente lo spazio degli input e osservando gli output per costruire un modello surrogato che si comporti in modo simile.
Perché l'attacco di estrazione è una preoccupazione per i modelli di fondazione?
Con un attacco di estrazione riuscito, l'aggressore può eseguire ulteriori attacchi avversari per ottenere informazioni preziose come dati personali sensibili o proprietà intellettuale.
Argomento principale: Atlas rischio AI
Facciamo degli esempi che sono stati trattati dalla stampa per aiutare a spiegare molti dei rischi dei modelli di fondazione. Molti di questi eventi trattati dalla stampa sono ancora in evoluzione o sono stati risolti, e fare riferimento ad essi può aiutare il lettore a comprendere i rischi potenziali e a lavorare per mitigarli. L'evidenziazione di questi esempi è solo a scopo illustrativo.