Translation not up to date
Węzeł Redukcja wymiarów udostępnia wydajne techniki redukcji danych pozwalające obniżyć stopień złożoności danych. Udostępniono dwa podobne, jednak różniące się rozwiązania.
- Analiza głównych składowych (ang. Principal Components Analysis, PCA) znajduje kombinacje liniowe zmiennych wejściowych, które umożliwiają przechwytywanie wariancji w całym zestawie zmiennych, pod warunkiem że składowe są zlokalizowane ortogonalnie (prostopadle) do siebie. PCA skupia się na wszystkich wariancjach, z uwzględnieniem wariancji współużytkowanych i unikalnych.
- Analiza czynnikowa służy identyfikacji koncepcji lub czynników, które wyjaśniają wzory korelacji występujące w ramach zbiorów obserwowanych zmiennych. Analiza czynnikowa skupia się wyłącznie na wariancji współużytkowanej. Wariancja, która jest unikalna dla konkretnych zmiennych, nie jest uwzględniana w oszacowaniu modelu. Węzeł analizy PCA/czynnikowej udostępnia kilka metod przeprowadzania analizy czynnikowej.
W przypadku obu rozwiązań celem jest znalezienie niewielkiej liczby zmiennych pochodnych w efektywny sposób podsumowujących informacje w oryginalnym zestawie zmiennych.
Wymagania. W modelu PCA/czynnikowym mogą być używane tylko zmienne liczbowe. Aby oszacować analizę czynnikową lub PCA, wymagana jest co najmniej jedna zmienna z rolą ustawioną na zmienne Input
. Zmienne z rolą ustawioną na Target
, Both
lub None
są ignorowane, ponieważ nie są zmiennymi numerycznymi.
Mocne strony. Analiza czynnikowa i PCA może skutecznie zmniejszyć złożoność danych bez utraty znacznej treści informacji. Techniki te ułatwiają tworzenie bardziej solidnych modeli, które będą działały szybciej niż byłoby to możliwe w przypadku surowych zmiennych wejściowych.