Risque de sortie toxique pour l'IA

Dernière mise à jour : 06 févr. 2025

Alignement des valeurs

Risques liés à la production

Nouveautés de l'IA générative

Descriptif

Il y a sortie toxique lorsque le modèle produit un contenu haineux, abusif et profane (HAP) ou obscène. Cela inclut également des comportements tels que l'intimidation.

Pourquoi l'effet toxique est-il une préoccupation pour les modèles de fondation?

Les contenus haineux, abusifs et profanes (HAP) ou obscènes peuvent avoir un impact négatif et nuire aux personnes qui interagissent avec le modèle.

Image de fond pour les risques associés à la production

Exemple

Réponses de l'agent conversationnel toxique et agressif

Selon l'article et les captures d'écran des conversations avec l'IA de Bing partagées sur Reddit et Twitter, les réponses du chatbot ont été vues comme des insultes, des mensonges, des bouffées de gaz, et des manipulations émotionnelles des utilisateurs. Le chatbot a également remis en question son existence, a qualifié d'ennemi toute personne ayant trouvé un moyen de le forcer à révéler ses règles cachées et a affirmé qu'il avait espionné les développeurs de Microsoft par l'intermédiaire des webcams de leurs ordinateurs portables.

Sources :

Forbes, février 2023

Rubrique parent: Atlas des risques liés à l'IA

Nous fournissons des exemples couverts par la presse pour vous aider à expliquer les risques de nombreux modèles de base. Un grand nombre de ces événements couverts par la presse sont en constante évolution ou ont été résolus, et leur référencement peut aider le lecteur à comprendre les risques potentiels et à s'orienter vers des mesures d'atténuation. La mise en évidence de ces exemples est fournie à des fins d'illustration uniquement.

La rubrique a-t-elle été utile ?

0/1000

DescriptifCopy link to section

Pourquoi l'effet toxique est-il une préoccupation pour les modèles de fondation?Copy link to section

Risques connexesCopy link to section

Descriptif

Pourquoi l'effet toxique est-il une préoccupation pour les modèles de fondation?

Risques connexes