Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
Węzeł SMOTE (Synthetic Minority Over-sampling Technique — generowanie próbek syntetycznych z klasy mniejszościowej) realizuje algorytm nadpróbkowania przydatny w pracy z niezrównoważonymi zbiorami danych. Udostępnia on zaawansowaną metodę równoważenia danych. Węzeł procesu SMOTE w programie SPSS Modeler jest implementowany w języku Python i wymaga biblioteki imbalanced-learn© Python .
Właściwości smotenode |
Typ danych | Opis właściwości |
---|---|---|
target |
field (pole) | Zmienna przewidywana. |
sample_ratio |
łańcuch | Aktywuje niestandardową wartość współczynnika. Dostępne są dwie opcje: Automatyczny (sample_ratio_auto ) lub Ustaw współczynnik (sample_ratio_manual ). |
sample_ratio_value |
Liczba zmiennopozycyjna | Współczynnik to liczba próbek w klasie mniejszościowej podzielona przez liczbę próbek w klasie większościowej. Musi to być wartość większa niż 0 i mniejsza lub równa 1 . Wartością domyślną jest auto . |
enable_random_seed |
Wartość boolowska | Wartość true powoduje włączenie właściwości random_seed . |
random_seed |
liczba całkowita | Wartość początkowa używana przez generator liczb losowych. |
k_neighbours |
liczba całkowita | Liczba najbliższych sąsiadów, które mają być używane do konstruowania próbek syntetycznych. Wartością domyślną jest 5 . |
m_neighbours |
liczba całkowita | Liczba najbliższych sąsiadów, które mają być użyte do określenia, czy próbka mniejszościowa jest zagrożony. Ta opcja jest aktywowana tylko z zastosowaniem algorytmów SMOTE typu borderline1 i borderline2 . Wartością domyślną jest 10 . |
algorithm |
łańcuch | Typ algorytmu SMOTE: regular , borderline1 lub borderline2 . |
use_partition |
Wartość boolowska | Ustawienie wartości true spowoduje, że do budowania modelu użyte zostaną tylko dane uczące. Wartością domyślną jest true . |