0 / 0
Zurück zur englischen Version der Dokumentation
Eigenschaften für Abläufe festlegen
Letzte Aktualisierung: 20. Dez. 2024
Eigenschaften für SPSS Modeler-Datenflüsse festlegen

Sie können Eigenschaften angeben, die auf den aktuellen Ablauf angewendet werden.

Klicken Sie zum Festlegen von Flow-Eigenschaften auf das Symbol Flow-Eigenschaften .

Sie können die folgenden Eigenschaften konfigurieren:

Optionen

Allgemein
Maximale Anzahl an Zeilen in Datenvorschau
Wenn Sie eine Vorschau der Daten für einen Knoten anzeigen, können Sie die Anzahl der anzuzeigenden Zeilen angeben.
Mitglieder für nominale Felder begrenzen
Der Datentyp der nominalen (Satz-) Felder wird Ohne Typ , wenn die Anzahl der Mitglieder die maximale Anzahl der Mitglieder überschreitet, die Sie unter Maximale Anzahl Mitgliederfestgelegt haben. Diese Option ist nützlich, wenn Sie mit großen nominalen Feldern arbeiten. Wenn das Messniveau eines Felds auf Ohne Typgesetzt ist, wird seine Rolle automatisch auf Keinegesetzt. Felder, die auf Keine gesetzt sind, sind für die Modellierung nicht verfügbar.
Datum/Uhrzeit
Datum/Zeit/Zeitmarke importieren als
Wählen Sie aus, ob Sie ein Datums-und Zeitformat zum Speichern von Daten in Datums-und Zeitfeldern verwenden oder als Zeichenfolgevariablen importieren möchten.
Mikrosekunden in Zeitmarkenfeldern verwenden
Wenn Sie Zeitmarkendaten haben, die in Mikrosekunden gemessen werden, können Sie diese Option aktivieren, um genauere Daten in Ihren Datenflüssen zu verwenden. Um die Option zu aktivieren, wählen Sie dieses Kontrollkästchen und Zeichenfolge für die Einstellung Datum/Uhrzeit/Zeitmarke importieren als aus.
Hinweis: Diese Option funktioniert nur bei Konnektoren, die SQL-Pushback unterstützen.
Datumsformat
Wählen Sie ein Datumsformat aus, das für die Datumsspeicherfelder verwendet werden soll oder wenn Zeichenfolgen von den CLEM-Datumsfunktionen als Datumsangaben interpretiert werden.
Zeitformat
Wählen Sie ein Zeitformat aus, das für die Zeitspeicherfelder verwendet werden soll oder wenn Zeichenfolgen von den CLEM-Zeitfunktionen als Zeitangaben interpretiert werden.
Tage/Minuten übertragen
Wählen Sie für Zeitformate aus, ob negative Zeitunterschiede so interpretiert werden, dass sie sich auf den vorherigen Tag bzw. die vorherige Stunde beziehen.
Datumsbasis (1. Jan.)
Wählen Sie die Basisjahre (immer 1. Jan.), die von den CLEM-Datumsfunktionen verwendet werden sollen, die mit einem einzelnen Datum arbeiten.
Zweistellige Datumsangaben ab
Geben Sie das Schwellenjahr an, ab dem Jahrhundertziffern für Jahre hinzugefügt werden, die mit lediglich zwei Ziffern angegeben sind. Wenn Sie beispielsweise 1930 als Schwellenjahr festlegen, wird angenommen, dass das Datum 05/11/02 im Jahr 2002 liegt. Für Datumsangaben nach 30 wird das 20. Jahrhundert verwendet, d. h., bei 05/11/73 wird angenommen, dass es sich um ein Datum aus dem Jahr 1973 handelt.
Zeitzone
Wählen Sie aus, wie die Zeitzone für die Verwendung mit dem CLEM-Ausdruck datetime_now ausgewählt wird.
  • Wenn Sie Serverauswählen, wird die Zeitzone verwendet, in der die Laufzeit von SPSS Modeler ausgeführt wird (manchmal ist diese Zeit mit der Option Client identisch). Wenn Ihr Ablauf Daten aus einer Datenbank verwendet und die unterstützte Datenbank SQL-Pushback verwendet, verwendet der Ausdruck datetime_now die Zeit der Datenbank.
  • Wenn Sie Client auswählen, wird die Zeitzone von der Maschine verwendet, auf der SPSS Modeler installiert ist.
  • Alternativ können Sie einen beliebigen UTC-Wert für die Zeitzone auswählen.
Zahlenformate
Sie können die Anzahl der Dezimalstellen angeben, die verwendet werden sollen, wenn SPSS Modeler reelle Zahlen in Standardformaten, wissenschaftlichen Formaten oder Währungsformaten anzeigt.
Optimierung
Verwenden Sie diese Einstellungen, um die Ablaufleistung zu optimieren.
Ablaufneuerstellung aktivieren
Bei der Ablaufneuerstellung werden die Knoten in einem Ablauf für eine effizientere Operation im Hintergrund neu angeordnet, ohne das die Ablaufsemantik geändert wird.
CLEM-Ausdrücke optimieren
Mit dieser Option kann das Optimierungsprogramm nach CLEM-Ausdrücken suchen, die vor der Ausführung des Ablaufs vorverarbeitet werden können, um die Verarbeitungsgeschwindigkeit zu erhöhen. Wenn Sie beispielsweise einen Ausdruck wie log(salary)haben, berechnet das Optimierungsprogramm den tatsächlichen Gehaltswert und übergibt diesen zur Verarbeitung. Diese Option kann verwendet werden, um die Leistung von SQL-Pushback und SPSS Modeler zu verbessern.
Syntaxausführung optimieren
Diese Methode zum Umschreiben von Abläufen erhöht die Effizienz von Operationen, die mehrere Knoten mit SPSS Statistics -Syntax haben. Die Optimierung wird durch die Zusammenfassung der Syntaxbefehle in einer einzigen Operation erreicht, anstatt jeden einzelnen Syntaxbefehl als separate Operation auszuführen.
Andere Ausführung optimieren
Diese Methode der Ablaufneuerstellung erhöht die Effizienz von Operationen, die nicht an die Datenbank delegiert werden können. Eine Optimierung wird dadurch erreicht, dass die Datenmenge im Ablauf so früh wie möglich reduziert wird. Der Ablauf wird neu geschrieben, um Operationen näher an die Datenquelle zu bringen, während die Datenintegrität erhalten bleibt. Diese Änderung reduziert die nachgelagerten Daten für kostenintensive Operationen, wie z. B. Joins.
Parallele Verarbeitung aktivieren
Bei Ausführung auf einem Computer mit mehreren Prozessoren ermöglicht diese Option dem System, die Last auf diese Prozessoren zu verteilen, was zu einer schnelleren Leistung führen kann. Die Verwendung mehrerer Knoten oder die Verwendung der folgenden einzelnen Knoten kann von der Parallelverarbeitung profitieren: C5.0, Merge (nach Schlüssel), Sort, Bin (Rangordnungsmethoden und Kachelmethoden) und Aggregate (mit einem oder mehreren Schlüsselfeldern).
SQL generieren
  • Mit dieser Option wird die SQL-Verarbeitung wieder in die Datenbank verlagert. Das Aktivieren oder Inaktivieren dieser Option wirkt sich nur auf die neuen Datenflüsse aus, die Sie erstellen. Sie können die Einstellung für einen vorhandenen Flow nicht ändern. Weitere Informationen zur Verwendung dieser Option mit Datenflüssen finden Sie unter SQL-Optimierung.
    • Datenbankcaching (nur SQL). Bei Abläufen, die in der Datenbank auszuführendes SQL generieren, muss nicht das Dateisystem als Cache verwendet werden, sondern die Daten können mitten im Ablauf in einer temporären Tabelle in der Datenbank zwischengespeichert werden. In Kombination mit SQL-Optimierung kann diese Option zu einer deutlichen Leistungssteigerung führen. So kann beispielsweise die Ausgabe aus einem Ablauf, der mehrere Tabellen zusammenfasst, um eine Data-Mining-Ansicht zu erstellen, im Cache gespeichert und bei Bedarf wieder verwendet werden. Bewegen Sie bei aktiviertem Datenbankcaching den Mauszeiger über einen beliebigen Knoten ohne Terminal in Ihrem Flow, klicken Sie dann auf das Überlaufmenü und wählen Sie Cache > Aktivierenaus. Die Daten werden jetzt auf diesem Knoten zwischengespeichert und der Cache wird automatisch direkt in der Datenbank erstellt, wenn der Nachrichtenfluss das nächste Mal ausgeführt wird. Dadurch kann SQL für nachgeordnete Knoten generiert werden, was zu weiteren Leistungsverbesserungen führt. (Alternativ kann diese Option bei Bedarf inaktiviert werden, beispielsweise wenn es aufgrund von Richtlinien oder Berechtigungen nicht möglich ist, Daten in die Datenbank zu schreiben. Wenn das Datenbankcaching oder die SQL-Optimierung nicht aktiviert ist, wird der Cache stattdessen in das Dateisystem geschrieben.
    • Gelockerte Konvertierung verwenden (nur SQL) Mit dieser Option können Daten von Zeichenfolgen in Zahlen oder von Zahlen in Zeichenfolgen konvertiert werden, sofern sie in einem geeigneten Format gespeichert sind. Wenn die Daten beispielsweise als Zeichenfolge in der Datenbank gespeichert sind, tatsächlich jedoch eine sinnvolle Zahl enthalten, können die Daten beim Eintreten des Pushbacks zur Verwendung konvertiert werden.
Protokollierung
SQL zur Laufzeit im Nachrichtenprotokoll anzeigen
Gibt an, ob die während der Ausführung des Ablaufs generiertes SQL an das Nachrichtenprotokoll übergeben wird.
SQL-Generierung im Nachrichtenprotokoll während der Vorbereitung anzeigen
Legt während der Ablaufvorschau fest, ob eine Vorschau des SQL, das generiert werden würde, an das Nachrichtenprotokoll übergeben wird.
SQL-Format
Gibt an, ob eine im Protokoll angezeigte SQL native SQL-Funktionen oder ODBC -Standardfunktionen des Formats {fn FUNC(…)}enthalten soll, wie von SPSS Modelergeneriert. Ersteres richtet sich nach den ODBC-Treiberfunktionen, die u. U. nicht implementiert werden.
SQL zur Verbesserung der Lesbarkeit neu formatieren
Gibt an, ob im Protokoll angezeigtes SQL zur Verbesserung der Lesbarkeit formatiert werden soll.
Status für Datensätze anzeigen
Gibt an, ob Datensätze gemeldet werden sollen, wenn sie an Endknoten ankommen. Geben Sie eine Zahl für die Aktualisierung des Status alle N Datensätze an.

Parameter

Parameter sind benutzerdefinierte Variablen, die mit dem aktuellen Ablauf oder SuperNodegespeichert und als persistent definiert werden. Parameter werden häufig beim Scripting verwendet, um das Verhalten des Scripts zu steuern, und sie können auch über die Benutzerschnittstelle aufgerufen werden.

Sie können Parameter für die Verwendung in CLEM-Ausdrücken und in Scripts definieren. Parameter, die in den Flow-Eigenschaften definiert sind, stehen allen Knoten im Flow zur Verfügung. Parameter für einen SuperNode sind außerhalb des SuperNodenicht verfügbar. Wenn Sie einen Flow speichern, werden auch alle für diesen Flow festgelegten Parameter gespeichert.

Weitere Informationen zu Parametern finden Sie unter Flow-und SuperNode.

Klicken Sie auf Wert hinzufügen und geben Sie die folgenden Informationen für den neuen Parameter ein:

Ihren Namen
Mit diesem Namen wird in Ausdrücken auf diesen Parameter verwiesen. Um beispielsweise einen Parameter für eine Mindesttemperatur zu erstellen, können Sie minvalueeingeben.

Wenn Parameter in CLEM-Ausdrücken verwendet werden, werden sie in einfache Anführungszeichen gesetzt, z. B. '$P-minvalue'. Geben Sie nicht das Präfix $P- ein. Sie bezeichnet einen Parameter in CLEM-Ausdrücken.

Bezeichnung (Label)
Listet einen beschreibenden Namen für die einzelnen erstellten Parameter auf.
Speicher
Der Speichertyp gibt an, wie die Datenwerte im Parameter gespeichert werden. Wenn Werte beispielsweise führende Nullen haben, die Sie beibehalten möchten (z. B. 008), wählen Sie Zeichenfolge als Speichertyp aus. Andernfalls werden die Nullen aus dem Wert entfernt.
Wert
Listet den aktuellen Wert für jeden Parameter auf, den Sie nach Bedarf ändern können Werte für Datumsparameter müssen in ISO-Standardnotation (JJJJ-MM-TT) angegeben werden.
Maß
Wählen Sie das Messniveau aus, das zur Beschreibung der Merkmale des Parameters verwendet wird. Sie können diesen Wert ändern, um die Art und Weise widerzuspiegeln, wie Sie den Parameter verwenden möchten. Beispiel: Ohne Typ gibt an, dass der Parameter einen beliebigen Wert haben kann, der mit seinem Speicher kompatibel ist.
Eingabeaufforderung?
Wählen Sie diese Option aus, wenn Benutzer beim Starten der Laufzeit zur Eingabe eines Werts für diesen Parameter aufgefordert werden sollen. Sie können diese Option verwenden, wenn Sie möglicherweise bei verschiedenen Gelegenheiten unterschiedliche Werte für denselben Parameter eingeben müssen.

Globalwerte

Auf der Registerkarte Globale der Flow-Eigenschaften können Sie die globalen Werte anzeigen, die für den aktuellen Flow festgelegt wurden. Globale Werte werden mithilfe eines Knotens Globalwerte festlegen erstellt, um Statistiken wie Mittelwert, Summe oder Standardabweichung für ausgewählte Felder zu ermitteln.

Nach der Ausführung eines Knotens Set Globals werden diese Werte für verschiedene Verwendungen in Ablaufoperationen verfügbar.

Sie können die globalen Werte in der Tabelle hier in den Flow-Eigenschaften nicht bearbeiten, aber Sie können alle globalen Werte für einen Flow löschen.

Anmerkungen

Wenn Sie einen Ablauf für andere Personen in Ihrer Organisation beschreiben müssen, können Sie erklärende Kommentare zu Abläufen, Knoten und Modellnuggets hinzufügen. Andere können dann diese Kommentare auf dem Bildschirm anzeigen oder sogar ein Bild des Ablaufs drucken, das Ihre Kommentare enthält.

Verwenden Sie die Registerkarte Anmerkungen der Ablaufeigenschaften, um Ihrem Ablauf Textanmerkungen hinzuzufügen. Diese Hinweise sind nur sichtbar, wenn die Registerkarte Anmerkungen geöffnet ist. Flow-Anmerkungen können jedoch auch als Kommentare auf dem Bildschirm angezeigt werden.

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen