0 / 0
Retourner à la version anglaise de la documentation
Noeud Règles d'association
Dernière mise à jour : 04 oct. 2024
Nœud des règles d'association (SPSS Modeler)

Les règles d'association associent une conclusion particulière (l'achat d'un produit particulier, par exemple) à un ensemble de conditions (l'achat de plusieurs autres produits, par exemple).

Par exemple, la règle

beer <= cannedveg & frozenmeal (173, 17.0%, 0.84)

indique que beer se produit souvent lorsque cannedveg et frozenmeal se produisent ensemble. La règle est fiable à 84 % et s'applique à 17 % des données ou à 173 enregistrements. Les algorithmes des règles d'association recherchent automatiquement les associations que vous pouvez trouver manuellement à l'aide de techniques de visualisation, telles que le nœud Relations.

L'avantage des algorithmes de règle d'association sur les algorithmes d'arbre de décision standard (C5.0 et C & R Trees) est que les associations peuvent exister entre n'importe quel des attributs. Un algorithme d'arbre de décisions peut construire une règle uniquement avec une seule conclusion. En revanche, les algorithmes d'association tentent d'en trouver plusieurs, chaque règle pouvant avoir une conclusion différente.

L'inconvénient des algorithmes d'association est qu'ils recherchent des éléments dans un espace de recherche très grand, nécessitant ainsi beaucoup plus de temps qu'un algorithme d'arbre de décisions. Les algorithmes utilisent une méthode de type générer et tester pour la recherche de règles. Tout d'abord, des règles simples sont générées, puis elles sont validées par rapport à l'ensemble de données. Les bonnes règles sont stockées et toutes les règles, soumises à diverses contraintes, sont alors spécialisées. Spécialisation est le processus d'ajout de conditions à une règle. Ces nouvelles règles sont confrontées aux données pour être validées et lors de ce processus, les meilleures règles, ou les plus intéressantes, sont systématiquement conservées. L'utilisateur apporte généralement certaines limites au nombre possible d'antécédents pour savoir si une règle doit être conservée ou pas. Plusieurs techniques reposant sur la théorie de l'information ou des plans d'indexation efficaces sont utilisées pour réduire significativement l'espace de recherche.

A la fin du traitement, une table contenant les meilleures règles apparaît. A la différence d'un arbre de décisions, cet ensemble de règles ne peut pas être utilisé directement pour faire des prévisions comme pourrait l'être un modèle standard (tel qu'un arbre de décisions ou un réseau de neurones). Ceci est dû aux différentes conclusions possibles pour chaque règle. Un autre niveau de transformation est requis pour transformer les règles d'association en un ensemble de règles de classification. C'est pourquoi les règles d'association produites par les algorithmes d'association sont désignées sous le nom de modèles bruts. Même si l'utilisateur peut parcourir ces modèles, il ne peut pas les utiliser explicitement en tant que modèles de classification à moins de demander au système de générer un modèle de cluster à partir du modèle brut. Cette opération est réalisée à partir du navigateur via l'option de menu Générer.

Deux algorithmes de règles d'association sont pris en charge :

  • Le noeud Aprioriextrait un ensemble de règles à partir des données et retient les règles contenant la plus grande quantité d'informations. Le noeud Apriori fournit cinq méthodes de sélection de règles et utilise un modèle d'indexation sophistiqué pour traiter efficacement les volumes de données importants. Pour les problèmes importants, l'apprentissage du noeud Apriori est généralement plus rapide ; il n'existe aucune limite quant au nombre de règles pouvant être conservées et il peut prendre en charge des règles faisant l'objet de 32 pré-conditions. Le noeud Apriori exige que les champs d'entrée et de sortie soient tous catégoriels, mais fournit de meilleures performances car il est optimisé de ce type de données.
  • Le noeud Séquence recherche des règles d'association dans les données séquentielles ou temporelles. Une séquence est une liste de jeux d'éléments ayant tendance à survenir dans un ordre prévisible. Par exemple, un client qui achète un rasoir et une lotion après-rasage achètera vraisemblablement de la crème à raser. Le noeud Séquence est basé sur l'algorithme de règles d'association CARMA, qui utilise une méthode efficace de double lecture pour rechercher des séquences.
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus