Retourner à la version anglaise de la documentationpropriétés de partitionnode
propriétés de partitionnode
Dernière mise à jour : 07 oct. 2024
Le noeud Partitionner génère un champ de partition qui répartit les données dans des sous-ensembles distincts pour les étapes d'apprentissage, de test et de validation de la création d'un modèle.
Exemple
node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")
partitionnode propriétés |
Type de données | Description de la propriété |
---|---|---|
new_name |
chaîne | Nom du champ de partition généré par le noeud. |
create_validation |
option | Indique si une partition de validation doit être créée. |
training_size |
Integer | Pourcentage des enregistrements (0 à 100) à allouer à la partition d'apprentissage. |
testing_size |
Integer | Pourcentage des enregistrements (0 à 100) à allouer à la partition de test. |
validation_size |
Integer | Pourcentage des enregistrements (0 à 100) à allouer à la partition de validation. Ignoré si aucune partition de validation n'est créée. |
training_label |
chaîne | Libellé de la partition d'apprentissage. |
testing_label |
chaîne | Libellé de la partition de test. |
validation_label |
chaîne | Libellé de la partition de validation. Ignoré si aucune partition de validation n'est créée. |
value_mode |
System SystemAndLabel Label |
Indique les valeurs utilisées pour représenter chaque partition dans les données. Par exemple, l'échantillon de formation peut être représenté par l'entier système 1 , le libellé Training ou une combinaison des deux, 1_Training . |
set_random_seed |
Booléen | Indique si vous devez utiliser une valeur de départ aléatoire définie par l'utilisateur. |
random_seed |
Integer | Valeur de départ aléatoire définie par l'utilisateur. Pour que cette valeur soit utilisée, set_random_seed doit être défini sur True . |
enable_sql_generation |
Booléen | Spécifie s'il faut utiliser la répercussion SQL pour affecter des enregistrements à des partitions. |
unique_field |
Spécifie le champ d'entrée utilisé pour vérifier que des enregistrements sont attribués à des partitions de manière aléatoire mais répétitive. Pour que cette valeur soit utilisée, enable_sql_generation doit être défini sur True . |