0 / 0
Zurück zur englischen Version der Dokumentation
Evaluierungsknoten
Letzte Aktualisierung: 04. Okt. 2024
Evaluierungsknoten (SPSS Modeler)

Der Evaluierungsknoten bietet eine unkomplizierte Möglichkeit, Vorhersagemodelle auszuwerten und miteinander zu vergleichen, um so das am besten geeignete Modell für die Anwendung zu ermitteln. Evaluierungsdiagramme zeigen die Leistung der Modelle beim Vorhersagen bestimmter Ergebnisse an. Sie sortieren Datensätze auf der Basis der vorhergesagten Werte und der Konfidenz der Vorhersage, teilen die Datensätze in Gruppen gleicher Größe (Quantile) auf und stellen anschließend den Wert des Geschäftskriteriums für jedes Quantil in absteigender Reihenfolge dar. Mehrere Modelle werden als separate Linien im Plot dargestellt.

Zur Handhabung der Ergebnisse wird ein bestimmter Wert oder Wertebereich als Treffer definiert. Ein Treffer weist in der Regel auf einen gewissen Erfolg hin (z. B. auf einen Verkauf an einen Kunden) oder auf ein relevantes Ereignis (z. B. auf eine bestimmte medizinische Diagnose). Im Abschnitt OPTIONEN der Knoteneigenschaften können Sie Trefferkriterien definieren oder Sie können die Standardtrefferkriterien verwenden:

  • Ausgabefelder des Typs Kennzeichnen sind unkompliziert; ein Treffer steht für wahre Werte.
  • Bei Ausgabefeldern des Typs Nominal definiert der erste Wert im Set einen Treffer.
  • Bei Ausgabefeldern des Typs Stetig entspricht ein Treffer einem Wert, der größer ist als der Mittelpunkt des Bereichs für das betreffende Feld.

Es stehen sechs Typen von Evaluierungsdiagrammen zur Auswahl, bei denen der Schwerpunkt jeweils auf einem anderen Auswertungskriterium liegt.

Gewinndiagramme

Gewinne sind definiert als der Anteil an allen Treffern, der in den einzelnen Quantilen vorliegt. Gewinne werden als (number of hits in quantile / total number of hits) × 100%berechnet.

Abb. 1. Gewinndiagramm (kumulativ) mit Basis, bester Linie und Geschäftsregel
Gewinndiagramm (kumulativ) mit Basis, bester Linie und Geschäftsregel

Liftdiagramme

Lift vergleicht den Prozentsatz der Datensätze in jedem Quantil, bei denen es sich um Treffer mit dem Gesamtprozentsatz an Treffern in den Trainingsdaten handelt. Sie wird als (hits in quantile / records in quantile) / (total hits / total records)berechnet.

Abbildung 2: Liftdiagramm (kumulativ) mit Punkten und bester Linie
Liftdiagramm (kumulativ) mit Punkten und bester Linie

Trefferdiagramme

Treffer bezeichnen einfach den Prozentsatz der Datensätze im Quantil, die die Auswahlkriterien erfüllen. Die Antwort wird als (hits in quantile / records in quantile) × 100%berechnet.

Abb. 3 Trefferdiagramm (kumulativ) mit bester Linie
Trefferdiagramm (kumulativ) mit bester Linie

Profitdiagramme

Der Profit entspricht dem Umsatz für jeden Datensatz abzüglich der Kosten für den betreffenden Datensatz. Die Profite für ein Quantil entsprechen einfach der Summe der Profite für alle Datensätze im Quantil. Umsätze gelten definitionsgemäß nur für Treffer, Kosten dagegen für alle Datensätze. Die Profite und Kosten können fest sein oder auch durch Felder in den Daten definiert werden. Profite werden als (sum of revenue for records in quantile − sum of costs for records in quantile)berechnet.

Abbildung 4. Profitdiagramm (kumulativ) mit bester Linie
Profitdiagramm (kumulativ) mit bester Linie

ROI-Diagramme

ROI (Return-on-Investment- Investitionsertrag) ist dem Profit ähnlich, weil auch hier Umsatz und Kosten definiert werden. ROI vergleicht die Profite mit den Kosten für das Quantil. Der ROI wird wie folgt berechnet: (profits for quantile / costs for quantile) × 100%.

Abbildung 5. ROI-Diagramm (kumulativ) mit bester Linie
ROI-Diagramm (kumulativ) mit bester Linie

ROC-Diagramme

ROC (Receiver Operator Characteristic) kann nur mit binären Klassifikationsmerkmalen verwendet werden. Mithilfe von ROC können Klassifikationsmerkmale auf der Basis ihrer Leistung visualisiert, organisiert und ausgewählt werden. In einem ROC-Diagramm wird die "Wahr Positiv"-Rate (oder Sensitivität) gegenüber der "Falsch positiv"-Rate des Klassifikationsmerkmals dargestellt. In einem ROC-Diagramm werden die relativen Kompromisse zwischen Vorteilen (wahr positiv) und Kosten (falsch positiv) dargestellt. "Wahr positiv" ist eine Instanz, die einen Treffer darstellt und als Treffer klassifiziert wird. Daher wird die "Wahr positiv"-Rate als Anzahl der als "wahr positiv" erkannten Instanzen geteilt durch die Anzahl der Instanzen, die tatsächlich Treffer darstellen, berechnet. "Falsch positiv" ist eine Instanz, die ein Fehlschlag ist und als Treffer klassifiziert wird. Daher wird die "Falsch positiv"-Rate als Anzahl der als "falsch positiv" erkannten Instanzen geteilt durch die Anzahl der Instanzen, die tatsächlich Fehlschläge darstellen, berechnet.

Abbildung 6. ROC-Diagramm mit bester Linie
ROC-Diagramm mit bester Linie

Auch Evaluierungsdiagramme können kumulativ sein, sodass jeder Punkt dem Wert für das entsprechende Quantil zuzüglich aller höheren Quantile entspricht. Kumulative Diagramme geben die Gesamtleistung von Modellen in der Regel besser wieder; nicht kumulative Diagramme weisen dagegen häufig auf bestimmte Problembereiche in den Modellen hin.

Hinweis: Der Evaluierungsknoten unterstützt nicht die Verwendung von Kommas in Feldnamen. Wenn Ihre Feldnamen Kommas enthalten, müssen Sie entweder die Kommas entfernen oder den Feldnamen in Anführungszeichen einschließen.
Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen