Risque de fuite rapide pour l'IA
Descriptif
Une attaque par fuite d'invite tente d'extraire l'invite système d'un modèle (également appelée message système).
Pourquoi la fuite rapide est-elle une préoccupation pour les modèles de base?
Une attaque réussie copie l'invite système utilisée dans le modèle. En fonction du contenu de cette invite, le pirate peut accéder à des informations de valeur, telles que des informations personnelles sensibles ou la propriété intellectuelle, et peut être en mesure de répliquer une partie des fonctionnalités du modèle.
Rubrique parent: Atlas des risques liés à l'IA
Nous fournissons des exemples couverts par la presse pour expliquer de nombreux risques liés aux modèles de fondation. Nombre de ces événements couverts par la presse sont encore en cours ou ont été résolus, et le fait d'y faire référence peut aider le lecteur à comprendre les risques potentiels et à s'efforcer de les atténuer. La mise en évidence de ces exemples n'a qu'un but illustratif.