partitionnode, Eigenschaften
Letzte Aktualisierung: 11. Feb. 2025
Der Partitionsknoten erstellt ein Partitionsfeld, das Daten in getrennte Subsets für die Trainings-, Test- und Validierungsphase der Modellerstellung aufteilt.
Beispiel
node = stream.create("partition", "My node") node.setPropertyValue("create_validation", True) node.setPropertyValue("training_size", 33) node.setPropertyValue("testing_size", 33) node.setPropertyValue("validation_size", 33) node.setPropertyValue("set_random_seed", True) node.setPropertyValue("random_seed", 123) node.setPropertyValue("value_mode", "System")
Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
|
Zeichenfolge | Der vom Knoten erstellte Name des Partitionsfelds. |
|
Markierung | Gibt an, ob eine Validierungspartition erstellt werden soll. |
|
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Trainingspartition zugeordnet werden sollen. |
|
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Testpartition zugeordnet werden sollen. |
|
Ganze Zahl | Prozentsatz der Datensätze (0-100), die der Validierungspartition zugeordnet werden sollen. Wird ignoriert, wenn keine Validierungspartition erstellt wird. |
|
Zeichenfolge | Beschriftung der Trainingspartition. |
|
Zeichenfolge | Beschriftung der Testpartition. |
|
Zeichenfolge | Beschriftung der Validierungspartition. Wird ignoriert, wenn keine Validierungspartition erstellt wird. |
|
|
Gibt die Werte an, die für die einzelnen Partitionen in den Daten verwendet werden. Die Trainingsstichprobe kann beispielsweise durch die Systemganzzahl , die Bezeichnung oder eine Kombination aus beiden, , dargestellt werden. |
|
Boolesch | Gibt an, ob ein benutzerdefinierter Startwert für den Zufallsgenerator verwendet werden soll. |
|
Ganze Zahl | Ein benutzerdefinierter Startwert für den Zufallsgenerator festlegen. Damit dieser Wert verwendet werden kann, muss auf gesetzt sein. |
|
Boolesch | Gibt an, ob SQL-Pushback für die Zuweisung von Datensätzen zu Partitionen verwendet werden soll. |
|
Gibt das Eingabefeld an, mit dessen Hilfe sichergestellt werden soll, dass Datensätze auf zufällige, aber wiederholbare Weise zu Partitionen zugeordnet werden. Damit dieser Wert verwendet werden kann, muss auf gesetzt sein. |
War das Thema hilfreich?
0/1000