Le noeud Réseau bayésien permet de créer un modèle de probabilité en combinant les preuves observées et enregistrées avec les connaissances réelles "de bon sens" pour établir la probabilité des occurrences en utilisant des attributs apparemment sans lien. Le noeud est axé sur le Tree Augmented Naïve Bayes (TAN) et sur les réseaux Couverture de Markov qui servent principalement à la classification.
Les réseaux bayésiens permettent d'effectuer des prédictions dans de nombreuses situations, par exemple :
- La sélection des opportunités de prêt avec des risques par défaut peu élevés.
- L'évaluation du moment auquel le matériel aura besoin d'être vérifié, remplacé ou nécessitera de nouvelles pièces, en fonction des données du capteur et des enregistrements existants.
- La résolution des problèmes client à l'aide des outils de dépannage en ligne.
- Le diagnostic et le dépannage des réseaux de téléphones cellulaires en temps réel.
- L'évaluation des risques et des bénéfices potentiels de projets de recherche et de développement afin de concentrer les ressources sur les meilleures opportunités.
Un réseau bayésien est un modèle graphique qui présente des variables (souvent appelées noeuds) dans un de l'ensemble de données et les indépendances probabilistes ou conditionnelles qui les relient. La relation causale entre les noeuds peut être représentée par un réseau bayésien ; cependant, les liens dans le réseau (également appelés arcs) ne représentent pas nécessairement un lien direct de cause à effet. Par exemple, un réseau bayésien peut être utilisé pour calculer la probabilité d'une maladie spécifique chez un patient, en fonction de la présence ou de l'absence de certains symptômes et d'autres données importantes, si les indépendances probabilistes entre les symptômes et la maladie apparaissent comme valides dans le graphique. Ces réseaux restent très solides lorsque des informations sont manquantes et font les meilleures prédictions possibles à l'aide des informations disponibles.
Lauritzen et Spiegelhalter (1988) ont créé un exemple général et basique d'un réseau bayésien. Il est généralement appelé le modèle "asiatique" et est une version simplifiée d'un réseau qui peut être utilisé pour diagnostiquer les nouveaux patients d'un médecin ; la direction des liens correspond grossièrement à la causalité. Chaque noeud représente une facette qui peut être liée à l'état du patient ; par exemple, "Fumeur" indique que le patient est un fumeur confirmé et "AVisitél'Asie" indique qu'il est récemment allé en Asie. La relation de probabilité est indiquée par les liens entre les noeuds ; par exemple, fumer augmente les risques que le patient développe à la fois des bronchites et un cancer des poumons, alors que l'âge semble être uniquement associé à la possibilité de développer un cancer des poumons. De la même façon, les anomalies sur une radiographie des poumons peuvent provenir de la tuberculose ou d'un cancer des poumons, alors que les risques qu'un patient ait des problèmes respiratoires (dyspnée) augmentent s'il souffre également soit d'une bronchite ou d'un cancer des poumons.
Il existe plusieurs raisons pour lesquelles vous pourriez décider d'utiliser un réseau bayésien :
- Cela vous permet de connaître les relations causales. Ainsi, vous pouvez comprendre le contexte de la problématique et prédire les conséquences de toute intervention.
- Le réseau offre une approche efficace permettant d'éviter le surajustement des données.
- Une visualisation claire des relations impliquées est facilement accessible.
Conditions requises. Les champs cible doivent être de type catégoriel et ils peuvent comporter un niveau de mesure Nominal, Ordinal, ou Indicateur. Les données peuvent être des champs de tout type. Les champs de données continues (intervalle numérique) seront automatiquement discrétisés ; mais, si la proportion est asymétrique, il est possible d'obtenir de meilleurs résultats en discrétisant manuellement ces champs à l'aide du noeud Discrétiser avant d'utiliser le noeud Réseau Bayésien. Par exemple, utilisez la Création d'intervalles optimale où le champ de superviseur est le même que le champ Cible du noeud Réseau Bayésien.
Exemple. L'analyste d'une banque souhaite pouvoir prédire quels clients, ou clients potentiels, risquent de ne pas être capables de rembourser leur prêt. Vous pouvez utiliser un modèle de réseau bayésien pour identifier les caractéristiques des clients les plus susceptibles de par défaut, et construire plusieurs types de modèles différents pour établir qui est le meilleur pour prédire les défauts potentiels.
Exemple. Un opérateur de télécommunications souhaite réduire le nombre de clients qui le quittent (appelé " attrition ") et mettre à jour le modèle chaque mois en utilisant les données du mois précédent. Vous pouvez utiliser un modèle de réseau bayésien pour identifier les caractéristiques des clients les plus susceptibles de partir et continuer à renseigner chaque mois le modèle avec de nouvelles données.