Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
Sposób traktowania braków danych należy ustalić, biorąc pod uwagę znajomość uwarunkowań biznesowych lub wiedzę specjalistyczną z dziedziny będącej przedmiotem analizy. Aby skrócić czas szkolenia i zwiększyć dokładność, celowe może być usunięcie wartości pustych ze zbioru danych. Z drugiej strony obecność wartości pustych może doprowadzić do ujawnienia nowych szans biznesowych lub dodatkowych spostrzeżeń.
Wybierając technikę, należy wziąć pod uwagę następujące cechy danych:
- wielkość zbioru danych;
- liczbę zmiennych zawierających wartości puste;
- ilość brakujących informacji.
Można wskazać zasadniczo dwie strategie postępowania:
- Można wykluczyć zmienne lub rekordy z brakami danych.
- Można podstawić, zastąpić lub wymusić wartości brakujące, stosując w tym celu różne metody.