Descriptif
La contamination des données se produit lorsque des données incorrectes sont utilisées pour la formation. Par exemple, les données qui ne correspondent pas à l'objectif du modèle ou les données qui sont déjà mises de côté pour d'autres tâches de développement telles que les essais et l'évaluation.
Pourquoi la contamination des données est-elle un problème pour les modèles de fondation ?
Des données différentes des données d'apprentissage prévues peuvent fausser la précision du modèle et affecter ses résultats.
Thème parent: Atlas des risques de l'IA
Nous fournissons des exemples couverts par la presse pour expliquer de nombreux risques liés aux modèles de fondation. Nombre de ces événements couverts par la presse sont encore en cours ou ont été résolus, et le fait d'y faire référence peut aider le lecteur à comprendre les risques potentiels et à s'efforcer de les atténuer. La mise en évidence de ces exemples n'a qu'un but illustratif.