Riesgo de contaminación de datos para la IA

Última actualización: 10 feb 2025
Riesgo de contaminación de datos para la IA
Alineación Icono que representa los riesgos de alineación.
Precisión
Riesgos de los datos de formación
Amplificado por la IA generativa

Descripción

La contaminación de datos se produce cuando se utilizan datos incorrectos para el entrenamiento. Por ejemplo, datos que no se ajustan a la finalidad del modelo o datos que ya se han reservado para otras tareas de desarrollo, como pruebas y evaluaciones.

¿Por qué preocupa la contaminación de datos en los modelos de cimentación?

Los datos que difieren de los datos de entrenamiento previstos pueden sesgar la precisión del modelo y afectar a sus resultados.

Tema principal: Atlas de riesgo de la IA

Proporcionamos ejemplos cubiertos por la prensa para ayudar a explicar muchos de los riesgos de los modelos de fundación. Muchos de estos sucesos de los que se ha hecho eco la prensa aún están evolucionando o se han resuelto, y hacer referencia a ellos puede ayudar al lector a comprender los riesgos potenciales y a trabajar para mitigarlos. Resaltar estos ejemplos son sólo para fines ilustrativos.