Riesgo de contaminación de datos para la IA
Descripción
La contaminación de datos se produce cuando se utilizan datos incorrectos para el entrenamiento. Por ejemplo, datos que no se ajustan a la finalidad del modelo o datos que ya se han reservado para otras tareas de desarrollo, como pruebas y evaluaciones.
¿Por qué preocupa la contaminación de datos en los modelos de cimentación?
Los datos que difieren de los datos de entrenamiento previstos pueden sesgar la precisión del modelo y afectar a sus resultados.
Tema principal: Atlas de riesgo de la IA
Proporcionamos ejemplos cubiertos por la prensa para ayudar a explicar muchos de los riesgos de los modelos de fundación. Muchos de estos sucesos de los que se ha hecho eco la prensa aún están evolucionando o se han resuelto, y hacer referencia a ellos puede ayudar al lector a comprender los riesgos potenciales y a trabajar para mitigarlos. Resaltar estos ejemplos son sólo para fines ilustrativos.