Risque lié à la provenance incertaine des données pour l'IA
Descriptif
La provenance des données fait référence à la traçabilité de l'historique des données, qui comprend leur propriété, leur origine et leurs transformations. En l'absence de méthodes normalisées et établies pour vérifier l'origine des données, il n'y a aucune garantie que les données soient identiques à celles de la source originale et que les conditions d'utilisation soient correctes.
Pourquoi la provenance incertaine des données est-elle un problème pour les modèles de fondation ?
Toutes les sources de données ne sont pas fiables. Les données peuvent être collectées, manipulées ou falsifiées de manière contraire à l'éthique. La vérification de la provenance des données est difficile en raison de facteurs tels que le volume et la complexité des données, la diversité des sources de données et une mauvaise gestion des données. L'utilisation de ces données peut entraîner des comportements indésirables dans le modèle.
Rubrique parent: Atlas des risques liés à l'IA
Nous fournissons des exemples couverts par la presse pour expliquer de nombreux risques liés aux modèles de fondation. Nombre de ces événements couverts par la presse sont encore en cours ou ont été résolus, et le fait de s'y référer peut aider le lecteur à comprendre les risques potentiels et à travailler à leur atténuation. La mise en évidence de ces exemples n'a qu'un but illustratif.