Toxisches Produktionsrisiko für KI

Letzte Aktualisierung: 06. Feb. 2025

Wertausrichtung

Output-Risiken

Neu bei generativer KI

Beschreibung

Toxischer Output entsteht, wenn das Modell hasserfüllte, beleidigende und profane (HAP) oder obszöne Inhalte produziert. Dazu gehören auch Verhaltensweisen wie Mobbing.

Warum ist die toxische Produktion ein Problem für Fundamentmodelle?

Hasserfüllte, beleidigende und profane (HAP) oder obszöne Inhalte können Menschen, die mit dem Modell interagieren, negativ beeinflussen und schaden.

Hintergrundbild für Risiken im Zusammenhang mit der Ausgabe

Beispiel

Toxische und aggressive Chatbot-Antworten

Laut dem Artikel und den Screenshots von Gesprächen mit Bing's KI, die auf Reddit und Twitter geteilt wurden, wurden die Antworten des Chatbots gesehen, um Benutzer zu beleidigen, zu lügen, zu schimpfen, zu vergasern und emotional zu manipulieren. Der Chatbot stellte auch seine Existenz in Frage, beschrieb jemanden, der einen Weg gefunden hatte, den Bot zur Offenlegung seiner verborgenen Regeln zu zwingen, als seinen Feind und behauptete, er habe die Entwickler von Microsoft über die Webcams auf ihren Laptops ausspioniert.

Quellen:

Forbes, Februar 2023

Übergeordnetes Thema: AI-Risikoatlas

Wir stellen Beispiele vor, die von der Presse abgedeckt werden, um viele der Risiken der Fundamentmodelle zu erklären. Viele dieser Ereignisse, die von der Presse abgedeckt werden, entwickeln sich entweder noch weiter oder wurden gelöst, und ihre Bezugnahme kann dem Leser helfen, die potenziellen Risiken zu verstehen und auf Minderungen hinzuarbeiten. Die Hervorhebung dieser Beispiele dient nur zur Veranschaulichung.

War das Thema hilfreich?

0/1000

BeschreibungCopy link to section

Warum ist die toxische Produktion ein Problem für Fundamentmodelle?Copy link to section

Zugehörige RisikenCopy link to section

Beschreibung

Warum ist die toxische Produktion ein Problem für Fundamentmodelle?

Zugehörige Risiken