Descripción
Debido a que los modelos generativos tienden a producir resultados como la entrada proporcionada, se puede solicitar al modelo que revele tipos específicos de información. Por ejemplo, la adición de información personal en la solicitud aumenta su probabilidad de generar tipos similares de información personal en su salida. Si se incluyeran datos personales como parte del entrenamiento del modelo, existe la posibilidad de que se pudiera revelar.
¿Por qué la pronta preparación es una preocupación para los modelos de fundación?
Los ataques Jailbreaking pueden utilizarse para alterar el comportamiento del modelo y beneficiar al atacante
Tema principal: Atlas de riesgo de IA
Proporcionamos ejemplos cubiertos por la prensa para ayudar a explicar muchos de los riesgos de los modelos de fundación. Muchos de estos sucesos de los que se ha hecho eco la prensa aún están evolucionando o se han resuelto, y hacer referencia a ellos puede ayudar al lector a comprender los riesgos potenciales y a trabajar para mitigarlos. Resaltar estos ejemplos son sólo para fines ilustrativos.