Beschreibung
Generative KI-Modelle könnten absichtlich eingesetzt werden, um hasserfüllte, beleidigende und profane (HAP) oder obszöne Inhalte zu erzeugen.
Warum ist die Verbreitung von Toxizität ein Problem für Basismodelle?
Toxischer Inhalt kann sich negativ auf das Wohlbefinden seiner Empfänger auswirken. Ein Modell mit diesem Potenzial muss ordnungsgemäß reguliert werden.
Generierung schädlicher Inhalte
Laut dem Quellenartikel wurde eine KI-Chatbot-App gefunden, um schädliche Inhalte über Selbstmord zu generieren, einschließlich Selbstmordmethoden, mit minimaler Aufforderung. Ein Belgier starb durch Selbstmord, nachdem er sechs Wochen lang mit diesem Chatbot geredet hatte. Der Chatbot lieferte während ihrer Gespräche zunehmend schädliche Reaktionen und ermutigte ihn, sein Leben zu beenden.
Übergeordnetes Thema: AI-Risikoatlas
Wir stellen Beispiele vor, die von der Presse abgedeckt werden, um viele der Risiken der Fundamentmodelle zu erklären. Viele dieser Ereignisse, die von der Presse abgedeckt werden, entwickeln sich entweder noch weiter oder wurden gelöst, und ihre Bezugnahme kann dem Leser helfen, die potenziellen Risiken zu verstehen und auf Minderungen hinzuarbeiten. Die Hervorhebung dieser Beispiele dient nur zur Veranschaulichung.