Riesgo de procedencia incierta de los datos para la IA

Última actualización: 10 feb 2025
Riesgo de procedencia incierta de los datos para la IA
Transparencia Icono que representa los riesgos de transparencia.
Transparencia
Riesgos de los datos de formación
Amplificado por IA generativa

Descripción

La procedencia de los datos se refiere a la trazabilidad de la historia de los datos, que incluye su propiedad, origen y transformaciones. Sin métodos normalizados y establecidos para verificar la procedencia de los datos, no hay garantías de que los datos sean los mismos que los de la fuente original y tengan los términos de uso correctos.

¿Por qué la procedencia incierta de los datos preocupa a los modelos de cimentación?

No todos los orígenes de datos son fiables. Los datos pueden recogerse, manipularse o falsificarse de forma poco ética. Verificar la procedencia de los datos es un reto debido a factores como el volumen de datos, la complejidad de los datos, la variedad de fuentes de datos y la mala gestión de los datos. El uso de estos datos puede dar lugar a comportamientos no deseados en el modelo.

Tema principal: Atlas de riesgo de IA

Proporcionamos ejemplos cubiertos por la prensa para ayudar a explicar muchos de los riesgos de los modelos de fundación. Muchos de estos sucesos de los que se ha hecho eco la prensa siguen evolucionando o ya se han resuelto, y hacer referencia a ellos puede ayudar al lector a comprender los riesgos potenciales y a trabajar para mitigarlos. Resaltar estos ejemplos son sólo para fines ilustrativos.