autonumericnode, Eigenschaften

Letzte Aktualisierung: 11. Feb. 2025
autonumericnode, Eigenschaften

Symbol für Knoten "Autonumerisch"Der Knoten "Auto-Numerisch" schätzt und vergleicht mit einer Reihe verschiedener Methoden Modelle für die Ergebnisse stetiger numerischer Bereiche. Der Knoten arbeitet auf dieselbe Weise wie der Knoten "Automatisches Klassifikationsmerkmal": Sie können die zu verwendenden Algorithmen auswählen und in einem Modellierungsdurchlauf mit mehreren Optionskombinationen experimentieren. Folgende Algorithmen werden unterstützt: C&RT-Baum, CHAID, lineare Regression, verallgemeinerte lineare Regression und Support Vector Machines (SVM). Modelle können anhand von Korrelation, relativem Fehler bzw. Anzahl der verwendeten Variablen verglichen werden.

Beispiel

node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)
Tabelle 1. autonumericnode, Eigenschaften
autonumericnodeEigenschaften Werte Eigenschaftsbeschreibung
custom_fields Markierung Bei "True" werden anstelle der Typknoteneinstellungen Einstellungen aus benutzerdefinierten Feldern verwendet.
target Feld Für den Knoten "Autonumerisch" sind ein einzelnes Ziel und eines oder mehrere Eingabefelder erforderlich. Außerdem können Gewichtungs- und Häufigkeitsfelder angegeben werden. Weitere Informationen finden Sie unter Allgemeine Eigenschaften von Modellierungsknoten .
inputs [field1 … field2]  
partition Feld  
use_frequency Markierung  
frequency_field Feld  
use_weight Markierung  
weight_field Feld  
use_partitioned_data Markierung Wenn ein Partitionsfeld definiert ist, werden nur die Trainingsdaten für die Modellerstellung verwendet.
ranking_measure Correlation NumberOfFields  
ranking_dataset Test Training  
number_of_models Ganze Zahl Anzahl der Modelle, die in das Modellnugget aufgenommen werden sollen. Geben Sie eine Ganzzahl zwischen 1 und 100 an.
calculate_variable_importance Markierung  
enable_correlation_limit Markierung  
correlation_limit Ganze Zahl  
enable_number_of_fields_limit Markierung  
number_of_fields_limit Ganze Zahl  
enable_relative_error_limit Markierung  
relative_error_limit Ganze Zahl  
enable_model_build_time_limit Markierung  
model_build_time_limit Ganze Zahl  
enable_stop_after_time_limit Markierung  
stop_after_time_limit Ganze Zahl  
stop_if_valid_model Markierung  
<algorithm> Markierung Aktiviert oder inaktiviert die Verwendung eines bestimmten Algorithmus.
<algorithm>.<property> Zeichenfolge Legt einen Eigenschaftswert für einen bestimmten Algorithmus fest. Weitere Informationen finden Sie unter Algorithmuseigenschaften festlegen .
use_cross_validation Boolesch Anstelle einer einzelnen Partition wird eine Kreuzvalidierungspartition verwendet.
number_of_folds Ganze Zahl N-Fold-Parameter für Kreuzvalidierung mit einem Bereich von 3 bis 10.
set_random_seed Boolesch Durch Einstellen eines Startwerts für den Zufallsgenerator können Analysen reproduziert werden. Geben Sie eine ganze Zahl ein oder klicken Sie auf Generieren. Dadurch wird eine pseudozufällige Ganzzahl zwischen 1 und 2147483647 (einschließlich) erstellt. Standardmäßig werden Analysen mit dem Startwert 229176228 reproduziert.
random_seed Ganze Zahl Startwert für Zufallszahlen
filter_individual_model_output Boolesch Entfernt alle zusätzlichen Felder aus der Ausgabe, die von den einzelnen Modellen generiert wurden, die dem Ensembleknoten Daten zuführen. Wählen Sie diese Option aus, wenn Sie nur am kombinierten Score aller Eingabemodelle interessiert sind. Diese Option muss inaktiviert sein, wenn Sie beispielsweise einen Analyseknoten oder einen Evaluierungsknoten verwenden möchten, um die Genauigkeit des kombinierten Score mit der Genauigkeit bei den einzelnen Eingabemodellen zu vergleichen.
calculate_standard_error Boolesch Für ein stetiges Ziel (numerischer Bereich) wird standardmäßig eine Standardfehlerberechnung ausgeführt, um die Differenz zwischen den gemessenen oder geschätzten Werten und den wahren Werten zu berechnen und anzuzeigen, wie nahe diese Schätzungen übereinstimmten.