Le noeud ACP/Analyse factorielle propose des techniques de factorisation puissantes qui vous permettent de réduire la complexité de vos données. Deux approches similaires mais distinctes sont disponibles.
- L'analyse en composantes principales (ACP) recherche les combinaisons linéaires des champs d'entrée qui permettent de capturer au mieux la variance dans l'ensemble de champs, où les composantes sont orthogonales (perpendiculaires) les unes par rapport aux autres. La technique ACP se concentre sur tous les types de variance, y compris les variances partagée et unique.
- L'analyse factorielle a pour but d'identifier les concepts sous-jacents, appelés facteurs, qui expliquent la tendance des corrélations dans un ensemble de champs observés. L'analyse factorielle se concentre uniquement sur la variance partagée. Une variance unique propre à certains champs n'est pas prise en compte dans l'estimation du modèle. Le noeud Analyse factorielle/ACP comporte plusieurs méthodes d'analyse factorielle.
Quelle que soit l'approche choisie, le but consiste à trouver un nombre limité de champs dérivés récapitulant les informations contenues dans l'ensemble de champs d'origine.
Conditions requises. Seuls les champs numériques peuvent être utilisés dans un modèle factoriel-ACP. Pour estimer une analyse factorielle ou PCA, vous avez besoin d'un ou de plusieurs champs dont le rôle est défini sur les champs Input
. Les champs dont le rôle est défini sur Target
, Both
ou None
sont ignorés, tout comme les champs non numériques.
Force. L'analyse factorielle et l'analyse ACP permettent de réduire la complexité de vos données sans pour autant sacrifier leur contenu informatif. Elles génèrent des modèles robustes, dont l'exécution est plus rapide qu'avec des champs d'entrée bruts.