Zurück zur englischen Version der Dokumentationrfnode, Eigenschaften
rfnode, Eigenschaften
Letzte Aktualisierung: 07. Okt. 2024
Der Random Forest-Knoten verwendet eine erweiterte Implementierung eines Bagging-Algorithmus mit einem Baummodell als Basismodell. Dieser Random Forest-Modellierungsknoten in SPSS Modeler ist in Python implementiert und erfordert die Bibliothek scikit-learn© Python .
rfnode Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
custom_fields |
Boolesch | Diese Option weist den Knoten an, die hier angegebenen Feldinformationen anstelle der in einem vorgeordneten Typknoten angegebenen zu verwenden. Geben Sie nach Auswahl dieser Option nach Bedarf die folgenden Felder an. |
inputs |
Feld | Liste der Feldnamen für die Eingabe. |
target |
Feld | Ein Feldname für das Ziel |
fast_build |
Boolesch | Verwenden Sie mehrere CPU-Kerne, um die Modellerstellung zu verbessern. |
role_use |
Zeichenfolge | Geben Sie predefined an, um vordefinierte Rollen zu verwenden, oder custom , um angepasste Feldzuweisungen zu verwenden. Der Standardwert ist "predefined". |
splits |
Feld | Liste der Feldnamen für die Aufteilung. |
n_estimators |
Ganze Zahl | Zu erstellende Anzahl Bäume. Der Standardwert ist 10 . |
specify_max_depth |
Boolesch | Geben Sie die benutzerdefinierte maximale Tiefe an. Bei false werden Knoten erweitert, bis alle Blattelemente rein sind oder bis alle Blattelemente weniger als min_samples_split Stichproben enthalten. Der Standardwert ist false . |
max_depth |
Ganze Zahl | Die maximale Tiefe des Baums. Der Standardwert ist 10 . |
min_samples_leaf |
Ganze Zahl | Mindestgröße der Blattknoten. Der Standardwert ist 1 . |
max_features |
Zeichenfolge | Die Anzahl der Merkmale, die bei der Suche nach der besten Aufteilung berücksichtigt werden sollen:
auto . |
bootstrap |
Boolesch | Bootstrap-Stichproben beim Erstellen von Bäumen verwenden. Der Standardwert ist true . |
oob_score |
Boolesch | OOB-Stichproben (Out-of-Bag) zum Schätzen der Generalisierungsgenauigkeit verwenden. Der Standardwert istfalse . |
extreme |
Boolesch | Extrem randomisierte Bäume verwenden. Der Standardwert ist false . |
use_random_seed |
Boolesch | Geben Sie dies an, um replizierte Ergebnisse zu erhalten. Der Standardwert ist false . |
random_seed |
Ganze Zahl | Der beim Erstellen von Bäumen zu verwendende Startwert für Zufallszahlen. Geben Sie eine beliebige Ganzzahl an. |
cache_size |
FLOAT | Die Größe des Kernel-Cache in MB. Der Standardwert ist 200 . |
enable_random_seed |
Boolesch | Aktiviert den Parameter random_seed . Geben Sie true oder false an. Der Standardwert ist false . |
enable_hpo |
Boolesch | Geben Sie true oder false an, um die HPO-Optionen zu aktivieren oder zu inaktivieren. Wenn der Wert auf true gesetzt ist, wird Rbfopt angewendet, um das "beste" Random Forest-Modell automatisch zu ermitteln, das den vom Benutzer mit dem folgenden Parameter target_objval definierten Zielwert erreicht. |
target_objval |
FLOAT | Der Zielfunktionswert (Fehlerrate des Modells für die Stichproben), der erreicht werden soll (z. B. der Wert des unbekannten Optimums). Setzen Sie diesen Parameter auf den entsprechenden Wert, wenn das Optimum unbekannt ist (z. B. 0.01 ). |
max_iterations |
Ganze Zahl | Maximale Anzahl Iterationen zum Testen des Modells. Der Standardwert ist 1000 . |
max_evaluations |
Ganze Zahl | Maximale Anzahl Funktionsauswertungen zum Testen des Modells, wobei der Fokus weniger auf der Geschwindigkeit, sondern eher auf der Genauigkeit liegt. Der Standardwert ist 300 . |