通过“贝叶斯网络”节点,您可以结合所观察和记录的证据与现实“常识性”知识,通过使用看似不相关的属性确立事件发生的可能性,从而构建概率模型。 该节点重点应用了树扩展简单贝叶斯 (TAN) 和马尔可夫覆盖网络,这些算法主要用于分类问题。
贝叶斯网络可用于在许多不同的情况下进行预测,示例如下:
- 选择违约风险较低的贷款时机。
- 根据传感器输入数据和现有记录,估算设备是否需要维修、增加零配件或更换。
- 借助在线故障排除工具解决客户问题。
- 实时诊断并排除移动电话网络故障。
- 评估研发项目的潜在风险和回报,以将资源集中到最佳时机。
贝叶斯网络是一种图形模型,可显示数据集中的变量(通常称之为节点)以及概率,还可以显示这些变量之间的条件和独立性。 贝叶斯网络可呈现节点之间的因果关系;但是,网络中的链接(也称为 arcs)不一定呈现直接因果关系。 例如,如果图形中所显示的症状和疾病之间的概率独立性成立,贝叶斯网络可根据特定症状和其他相关数据是否存在,计算患者患有某种特殊疾病的几率。 这种网络非常稳健,即使在信息缺失时,也可以利用现有的任何信息作出最佳预测。
标准的基础贝叶斯网络示例由 Lauritzen 和 Spiegelhalter 于 1988 年创建。 该网络示例是一种简化的网络版本,通常称作“Asia”模型,医生可用它来诊断新患者的病情,所有链接的方向可大体指示因果关系。 每个节点代表与患者状况相关的一个方面,例如“吸烟”表示这些患者确为吸烟者,而“VisitAsia”表示他们最近是否去过亚洲。 概率关系由所有节点之间的链接指示,例如,吸烟会增大患者患有支气管炎和肺癌的几率,而年龄仅与肺癌的患病率相关。 同样地,肺部 x 光检查出的异常可能由肺结核或肺癌引起。同时,如果患者本身患有支气管炎或肺癌,那么他们更有可能出现呼吸急促(呼吸困难)的症状。
以下是您有可能决定使用贝叶斯网络的几点原因:
- 它可帮助您了解因果关系。 由此,您可以了解出现问题的地方并可预测任何干涉可能引发的后果。
- 该网络可提供避免数据过度拟合的有效方法。
- 可以轻松地观测到所涉及关系的清晰视图。
需求。 目标字段必须为分类且测量级别为名义、有序或标志。 输入内容可以为任何类型的字段。 连续(数值范围)输入字段将自动分级;但是,如果分布出现不对称,则可使用贝叶斯网络节点之前的分级节点对字段进行手动分级,从而获得更佳的效果。 例如,在主管字段与贝叶斯网络节点目标字段相同的位置处,使用最优分级。
示例。 银行分析师希望可以预测可能拖欠偿还贷款的客户或潜在客户。 您可以使用贝叶斯网络模型来识别最有可能违约的客户的特征,并构建多种不同类型的模型来建立最适合预测潜在违约者的模型。
示例。 一位电信运营商希望减少中断服务(又称为“流失”)的客户数量,并使用上一个月的数据对模型每月进行更新。 您可以使用贝叶斯网络模型识别最有可能流失的客户的特征,然后每月使用新数据继续训练该模型。