Retourner à la version anglaise de la documentationpropriétés de smotenode
propriétés de smotenode
Dernière mise à jour : 07 oct. 2024
Le noeud SMOTE (Minority Over-sampling Technique) fournit un algorithme de suréchantillonnage qui traite les jeux de données déséquilibrés. Il fournit également une méthode avancée d'équilibrage des données. Le noeud de traitement SMOTE de SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque imbalanced-learn© Python .
smotenode propriétés |
Type de données | Description de la propriété |
---|---|---|
target |
Zone | Champ cible. |
sample_ratio |
chaîne | Active une valeur de rapport personnalisée. Les deux options sont Auto (sample_ratio_auto ) ou Set ratio (sample_ratio_manual ). |
sample_ratio_value |
Float | Le rapport est le nombre d'échantillons dans la classe minoritaire sur le nombre d'échantillons dans la classe majoritaire. Il doit être supérieur à 0 et inférieur ou égal à 1 . La valeur par défaut est auto . |
enable_random_seed |
Booléen | Si elle est définie sur true , la propriété random_seed est activée. |
random_seed |
Integer | Valeur de départ utilisée par le générateur de nombres aléatoires. |
k_neighbours |
Integer | Nombre de voisins les plus proches à utiliser pour la construction d'échantillons synthétiques. La valeur par défaut est 5 . |
m_neighbours |
Integer | Le nombre de voisins les plus proches à utiliser pour déterminer si un échantillon minoritaire est en danger. Cette option est uniquement activée avec les types d'algorithme SMOTE borderline1 et borderline2 . La valeur par défaut est 10 . |
algorithm |
chaîne | Type de l'algorithme SMOTE: regular , borderline1 ou borderline2 . |
use_partition |
Booléen | Si la valeur est true , seules les données d'apprentissage seront utilisées pour la génération de modèles. La valeur par défaut est true . |