Descripción
Un ataque de inferencia de atributos consulta repetidamente un modelo para detectar si se pueden inferir ciertas características sensibles sobre los individuos que participaron en el entrenamiento de un modelo. Estos ataques se producen cuando un adversario tiene algún conocimiento previo sobre los datos de entrenamiento y utiliza ese conocimiento para inferir los datos confidenciales.
¿Por qué el ataque de inferencia de atributos es una preocupación para los modelos de base?
Con un ataque exitoso, el atacante puede obtener información valiosa como información personal sensible o propiedad intelectual.
Tema principal: Atlas de riesgo de IA
Proporcionamos ejemplos cubiertos por la prensa para ayudar a explicar muchos de los riesgos de los modelos de fundación. Muchos de estos sucesos de los que se ha hecho eco la prensa siguen evolucionando o ya se han resuelto, y hacer referencia a ellos puede ayudar al lector a comprender los riesgos potenciales y a trabajar para mitigarlos. Resaltar estos ejemplos son sólo para fines ilustrativos.