Descriptif
Le manque de transparence des données est dû à une documentation insuffisante des détails des ensembles de données de formation ou de réglage
Pourquoi le manque de transparence des données est-il une préoccupation pour les modèles de base?
La transparence est importante pour la conformité juridique et l'éthique de l'IA. Des informations sur la collecte et la préparation des données d'entraînement, y compris la manière dont elles ont été étiquetées et par qui, sont nécessaires pour comprendre le comportement et l'adéquation du modèle. Les détails sur la manière dont les risques liés aux données ont été déterminés, mesurés et atténués sont importants pour évaluer la fiabilité des données et des modèles. L'absence de détails sur les données peut rendre plus difficile l'évaluation des préjudices liés à la représentation, à la propriété des données, à la provenance et à d'autres risques liés aux données. L'absence d'exigences normalisées pourrait limiter la divulgation, car les organisations protègent les secrets commerciaux et tentent d'empêcher les autres de copier leurs modèles.
Rubrique parent: Atlas des risques liés à l'IA
Nous fournissons des exemples couverts par la presse pour expliquer de nombreux risques liés aux modèles de fondation. Nombre de ces événements couverts par la presse sont encore en cours ou ont été résolus, et le fait d'y faire référence peut aider le lecteur à comprendre les risques potentiels et à s'efforcer de les atténuer. La mise en évidence de ces exemples n'a qu'un but illustratif.