Beschreibung
Datenverunreinigungen treten auf, wenn falsche Daten für das Training verwendet werden. Zum Beispiel Daten, die nicht mit dem Zweck des Modells übereinstimmen, oder Daten, die bereits für andere Entwicklungsaufgaben wie Tests und Bewertungen vorgesehen sind.
Warum ist die Datenverunreinigung ein Problem für Stiftungsmodelle?
Daten, die sich von den vorgesehenen Trainingsdaten unterscheiden, können die Modellgenauigkeit verzerren und die Modellergebnisse beeinträchtigen.
Übergeordnetes Thema: AI-Risikoatlas
Anhand von Beispielen, über die in der Presse berichtet wurde, erläutern wir viele der Risiken der Stiftungsmodelle. Viele dieser Ereignisse, über die in der Presse berichtet wurde, sind entweder noch im Gange oder wurden bereits aufgeklärt, und ein Verweis darauf kann dem Leser helfen, die potenziellen Risiken zu verstehen und auf Abhilfemaßnahmen hinzuarbeiten. Die Hervorhebung dieser Beispiele dient nur der Veranschaulichung.