Simulationsanpassungsknoten

Letzte Aktualisierung: 12. Feb. 2025
Simulationsanpassungsknoten (SPSS Modeler)

Der Simulationsanpassungsknoten passt ein Set möglicher statistischer Verteilungen an die einzelnen Felder in den Daten an. Die Anpassung der einzelnen Verteilungen an ein Feld wird mithilfe eines Kriteriums für die Anpassungsgüte bewertet. Wenn ein Simulationsanpassungsknoten ausgeführt wird, wird ein Simulationsgenerierungsknoten erstellt (oder ein vorhandener Knoten aktualisiert). Jedes Feld wird seiner am besten angepassten Verteilung zugewiesen. Mit dem Simulationsgenerierungsknoten können dann simulierte Daten für jedes Feld generiert werden.

Der Simulationsanpassungsknoten ist zwar ein Endknoten, jedoch fügt er weder der Anzeige "Ausgaben" eine Ausgabe hinzu, noch exportiert er Daten.

Hinweis: Wenn die historischen Daten dünn besetzt sind (d. h., wenn viele Werte fehlen), kann es für die Anpassungskomponente schwierig sein, genügend gültige Werte zu finden, um Verteilungen an die Daten anzupassen. In Fällen, in denen die Daten dünn besetzt sind, sollten Sie vor der Anpassung entweder die dünn besetzten Felder entfernen, wenn sie nicht erforderlich sind, oder die fehlenden Werte imputieren. Mithilfe der Optionen QUALITÄT im Data Audit-Knoten können Sie die Anzahl vollständiger Datensätze anzeigen, ermitteln, welche Felder dünn besetzt sind und eine Imputationsmethode auswählen. Wenn nicht genügend Datensätze für die Verteilungsanpassung vorhanden sind, können Sie die Anzahl der Datensätze mithilfe eines Balancierungsknotens erhöhen.

Simulationsgenerierungsknoten automatisch mithilfe eines Simulationsanpassungsknoten erstellen

Wenn der Simulationsanpassungsknoten zum ersten Mal ausgeführt wird, wird ein Simulationsgenerierungsknoten mit einem Aktualisierungslink zum Simulationsanpassungsknoten generiert. Wenn der Simulationsanpassungsknoten erneut ausgeführt wird, wird nur ein neuer Simulationsgenerierungsknoten generiert, wenn der Aktualisierungslink entfernt wurde. Mit einem Simulationsanpassungsknoten kann auch ein verbundener Simulationsgenerierungsknoten aktualisiert werden. Das Ergebnis hängt davon ab, ob in beiden Knoten dieselben Felder vorhanden sind und ob die Felder im Simulationsgenerierungsknoten entsperrt sind. Weitere Informationen finden Sie unter Sim-Gen-Knoten .

Ein Simulationsanpassungsknoten kann nur einen Aktualisierungslink zu einem Simulationsgenerierungsknoten aufweisen. Führen Sie die folgenden Schritte aus, um einen Aktualisierungslink zu einem Simulationsgenerierungsknoten zu definieren:

  1. Klicken Sie mit der rechten Maustaste auf den Simulationsanpassungsknoten und wählen Sie Aktualisierungslink definierenaus.
  2. Klicken Sie auf den Simulationsgenerierungsknoten, zu dem Sie einen Aktualisierungslink definieren möchten.

Um einen Aktualisierungslink zwischen einem Simulationsanpassungsknoten und einem Simulationsgenerierungsknoten zu entfernen, klicken Sie mit der rechten Maustaste auf den Aktualisierungslink und wählen Sie Verknüpfung entfernen aus.

Verteilungsanpassung

Eine statistische Verteilung ist die theoretische Häufigkeit für das Vorkommen von Werten, die eine Variable annehmen kann. Im Simulationsanpassungsknoten wird ein Set theoretischer statistischer Verteilungen mit jedem Datenfeld verglichen. Die Parameter der theoretischen Verteilung werden angepasst, um die beste Anpassung an die Daten gemäß einem Maß für die Anpassungsgüte zu erhalten; entweder das Kriterium Anderson-Darling oder das Kriterium Kolmogorov-Smirnov . Die Ergebnisse der Verteilungsanpassung durch den Simulationsanpassungsknoten zeigen, welche Verteilungen angepasst wurden, die besten Schätzungen der Parameter für die einzelnen Verteilungen und wie gut jede Verteilung an die Daten angepasst ist. Während der Verteilungsanpassung werden auch Korrelationen zwischen Feldern mit numerischen Speichertypen und Kontingenzen zwischen Feldern mit einer kategorialen Verteilung berechnet. Die Ergebnisse der Verteilungsanpassung werden für die Erstellung eines Simulationsgenerierungsknotens verwendet.

Bevor Verteilungen an Ihre Daten angepasst werden, werden die ersten 1000 Datensätze auf fehlende Werte überprüft. Wenn zu viele Werte fehlen, ist keine Verteilungsanpassung möglich. Ist dies der Fall, müssen Sie entscheiden, ob eine der folgenden Optionen angemessen ist:
  • Verwendung eines vorgeordneten Knotens, um Datensätze mit fehlenden Werten zu entfernen
  • Verwendung eines vorgeordneten Knotens, um Werte für fehlende Werte zu imputieren
Die Verteilungsanpassung schließt benutzerdefiniert fehlende Werte nicht aus. Wenn Ihre Daten "benutzerdefiniert fehlende" Werte aufweisen und diese Werte aus der Verteilungsanpassung ausgeschlossen werden sollen, sollten Sie diese Werte als "systemdefiniert fehlend" festlegen.

Die Rolle eines Felds wird nicht berücksichtigt, wenn die Verteilungen angepasst werden. Felder mit der Rolle Ziel werden beispielsweise genauso wie Felder mit den Rollen Eingabe, Keine, Beide, Partition, Aufteilen, Häufigkeit und ID behandelt.

Felder werden während der Verteilungsanpassung entsprechend ihrem Speichertyp und Messniveau unterschiedlich behandelt. Die Behandlung von Feldern während der Verteilungsanpassung wird in der folgenden Tabelle beschrieben.

Tabelle 1. Verteilungsanpassung entsprechend Speichertyp und Messniveau von Feldern
Speichertyp     Messniveau      
  Fortlaufend Kategorisch Markierung Nominal Ordinalzahl Typlos
Zeichenfolge Unmöglich   Kategoriale Verteilungen, Dice-Verteilungen und feste Verteilungen werden angepasst.      
Ganzzahl          
Reell          
Zeit Alle Verteilungen werden angepasst. Korrelationen und Kontingenzen werden berechnet. Die kategoriale Verteilung wird angepasst. Korrelationen werden nicht berechnet.   Binomial-, negative Binomial- und Poisson-Verteilungen werden angepasst und Korrelationen werden berechnet. Feld wird ignoriert und nicht an den Simulationsgenerierungsknoten übergeben.
Datum          
Zeitmarke          
Unbekannt   Entsprechender Speichertyp wird aus den Daten bestimmt.    

Felder mit dem Messniveau "ordinal" werden wie stetige Felder behandelt und werden in die Korrelationstabelle im Simulationsgenerierungsknoten eingefügt. Wenn eine andere Verteilung als eine Binomial-, negative Binomial- oder Poisson-Verteilung an ein ordinales Feld angepasst werden soll, müssen Sie das Messniveau des Felds in "stetig" ändern. Wenn Sie zuvor für jeden Wert eines ordinalen Felds eine Beschriftung definiert haben und dann das Messniveau in "stetig" ändern, gehen die Beschriftungen verloren.

Felder mit Einzelwerten werden während der Verteilungsanpassung nicht anders als Felder mit mehreren Werten behandelt. Felder mit dem Speichertyp "Zeit", "Datum" oder "Zeitmarke" werden als numerische Felder behandelt.

Verteilungen an Aufteilungsfelder anpassen

Wenn Ihre Daten ein Aufteilungsfeld enthalten und die Verteilungsanpassung für jede Aufteilung gesondert ausgeführt werden soll, müssen Sie die Daten mithilfe eines vorgeordneten Umstrukturierungsknotens transformieren. Generieren Sie mithilfe des Umstrukturierungsknotens für jeden Wert des Aufteilungsfelds ein neues Feld. Diese umstrukturierten Daten können Sie dann für die Verteilungsanpassung im Simulationsanpassungsknoten verwenden.