autoclassifiernode, Eigenschaften

Letzte Aktualisierung: 11. Feb. 2025
autoclassifiernode, Eigenschaften

Symbol für Knoten "Automatisches Klassifikationsmerkmal"Mit dem Knoten "Autom. Klassifikationsmerkmal" können Sie eine Reihe verschiedener Modelle für binäre Ergebnisse ("Ja" oder "Nein", "Abwanderung" oder "Keine Abwanderung" usw.) erstellen und vergleichen, um den besten Ansatz für die jeweilige Analyse auszuwählen. Es wird eine Reihe von Modellierungsalgorithmen unterstützt, sodass Sie die gewünschten Methoden, die spezifischen Optionen für die jeweilige Methode und die Kriterien zum Vergleich der Ergebnisse auswählen können. Der Knoten generiert eine Gruppe von Modellen, die auf den angegebenen Optionen beruhen, und erstellt anhand der von Ihnen angegebenen Kriterien eine Rangordnung der besten Kandidaten.

Beispiel

node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
Tabelle 1. autoclassifiernode, Eigenschaften
autoclassifiernodeEigenschaften Werte Eigenschaftsbeschreibung
target Feld Für Flagziele verlangt der Knoten "Automatisches Klassifikationsmerkmal" ein einzelnes Ziel und eines oder mehrere Eingabefelder. Außerdem können Gewichtungs- und Häufigkeitsfelder angegeben werden. Weitere Informationen finden Sie unter Allgemeine Eigenschaften von Modellierungsknoten .
ranking_measure Accuracy
Area_under_curve
Profit
Lift
Num_variables
 
ranking_dataset Training
Test
 
number_of_models Ganze Zahl Anzahl der Modelle, die in das Modellnugget aufgenommen werden sollen. Geben Sie eine Ganzzahl zwischen 1 und 100 an.
calculate_variable_importance Markierung  
enable_accuracy_limit Markierung  
accuracy_limit Ganze Zahl Ganzzahl zwischen 0 und 100.
enable_area_under_curve_limit Markierung  
area_under_curve_limit Zahl Reelle Zahl zwischen 0,0 und 1,0.
enable_profit_limit Markierung  
profit_limit Zahl Ganzzahl größer als 0.
enable_lift_limit Markierung  
lift_limit Zahl Reelle Zahl größer als 1,0.
enable_number_of_variables_limit Markierung  
number_of_variables_limit Zahl Ganzzahl größer als 0.
use_fixed_cost Markierung  
fixed_cost Zahl Reelle Zahl größer 0.0.
variable_cost Feld  
use_fixed_revenue Markierung  
fixed_revenue Zahl Reelle Zahl größer 0.0.
variable_revenue Feld  
use_fixed_weight Markierung  
fixed_weight Zahl Reelle Zahl größer als 0,0
variable_weight Feld  
lift_percentile Zahl Ganzzahl zwischen 0 und 100.
enable_model_build_time_limit Markierung  
model_build_time_limit Zahl Ganzzahl für die Anzahl der Minuten, die maximal für die Erstellung jedes einzelnen Modells aufgewendet werden.
enable_stop_after_time_limit Markierung  
stop_after_time_limit Zahl Reelle Zahl für die Anzahl der Stunden, die als Obergrenze für die insgesamt verstrichene Zeit für den Durchlauf eines automatischen Klassifikationsmerkmals verwendet wird.
enable_stop_after_valid_model_produced Markierung  
use_costs Markierung  
<algorithm> Markierung Aktiviert oder inaktiviert die Verwendung eines bestimmten Algorithmus.
<algorithm>.<property> Zeichenfolge Legt einen Eigenschaftswert für einen bestimmten Algorithmus fest. Weitere Informationen finden Sie unter Algorithmuseigenschaften festlegen .
use_cross_validation Feld Felder, die dieser Liste hinzugefügt wurden, können entweder die Bedingungs- oder die Vorhersagerolle in Regeln übernehmen, die vom Modell generiert werden. Dies erfolgt regelweise, sodass ein Feld in einer Regel eine Bedingung und in einer anderen Regel eine Vorhersage sein könnte.
number_of_folds Ganze Zahl N-Fold-Parameter für Kreuzvalidierung mit einem Bereich von 3 bis 10.
set_random_seed Boolesch Durch Einstellen eines Startwerts für den Zufallsgenerator können Analysen reproduziert werden. Geben Sie eine ganze Zahl ein oder klicken Sie auf Generieren. Dadurch wird eine pseudozufällige Ganzzahl zwischen 1 und 2147483647 (einschließlich) erstellt. Standardmäßig werden Analysen mit dem Startwert 229176228 reproduziert.
random_seed Ganze Zahl Startwert für Zufallszahlen
stop_if_valid_model Boolesch
filter_individual_model_output Boolesch Entfernt alle zusätzlichen Felder aus der Ausgabe, die von den einzelnen Modellen generiert wurden, die dem Ensembleknoten Daten zuführen. Wählen Sie diese Option aus, wenn Sie nur am kombinierten Score aller Eingabemodelle interessiert sind. Stellen Sie sicher, dass diese Option abgewählt ist, wenn Sie beispielsweise einen Analyseknoten oder einen Evaluierungsknoten verwenden möchten, um die Genauigkeit des kombinierten Scores mit dem der einzelnen Eingabemodelle zu vergleichen
set_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"HighestConfidence"
Ensemble-Methode für festgelegte Ziele.
set_voting_tie_selection "Random"
"HighestConfidence"
Wenn die Abstimmung gebunden ist, wählen Sie den Wert zufällig oder unter Verwendung der höchsten Konfidenz aus.
flag_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"RawPropensityWeightedVoting"
"HighestConfidence"
"AverageRawPropensity"
Ensemble-Methode für Flagziele.
flag_voting_tie_selection "Random"
"HighestConfidence"
"RawPropensity"
Wenn die Abstimmung gebunden ist, wählen Sie den Wert zufällig, mit der höchsten Konfidenz oder mit Raw Propensity aus.