Zurück zur englischen Version der Dokumentationpartitionnode, Eigenschaften
partitionnode, Eigenschaften
Letzte Aktualisierung: 07. Okt. 2024
Der Partitionsknoten erstellt ein Partitionsfeld, das Daten in getrennte Subsets für die Trainings-, Test- und Validierungsphase der Modellerstellung aufteilt.
Beispiel
node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")
partitionnode Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
new_name |
Zeichenfolge | Der vom Knoten erstellte Name des Partitionsfelds. |
create_validation |
Markierung | Gibt an, ob eine Validierungspartition erstellt werden soll. |
training_size |
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Trainingspartition zugeordnet werden sollen. |
testing_size |
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Testpartition zugeordnet werden sollen. |
validation_size |
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Validierungspartition zugeordnet werden sollen. Wird ignoriert, wenn keine Validierungspartition erstellt wird. |
training_label |
Zeichenfolge | Beschriftung der Trainingspartition. |
testing_label |
Zeichenfolge | Beschriftung der Testpartition. |
validation_label |
Zeichenfolge | Beschriftung der Validierungspartition. Wird ignoriert, wenn keine Validierungspartition erstellt wird. |
value_mode |
System SystemAndLabel Label |
Gibt die Werte an, die für die einzelnen Partitionen in den Daten verwendet werden. Die Trainingsstichprobe kann beispielsweise durch die Systemganzzahl1 , die Bezeichnung Training oder eine Kombination aus beiden,1_Training , dargestellt werden. |
set_random_seed |
Boolesch | Gibt an, ob ein benutzerdefinierter Startwert für den Zufallsgenerator verwendet werden soll. |
random_seed |
Ganze Zahl | Ein benutzerdefinierter Startwert für den Zufallsgenerator festlegen. Damit dieser Wert verwendet werden kann, muss set_random_seed auf True gesetzt sein. |
enable_sql_generation |
Boolesch | Gibt an, ob SQL-Pushback für die Zuweisung von Datensätzen zu Partitionen verwendet werden soll. |
unique_field |
Gibt das Eingabefeld an, mit dessen Hilfe sichergestellt werden soll, dass Datensätze auf zufällige, aber wiederholbare Weise zu Partitionen zugeordnet werden. Damit dieser Wert verwendet werden kann, muss enable_sql_generation auf True gesetzt sein. |