베이지안 네트워크 노드를 사용하면 관측 증거와 기록한 증거를 "상식적인" 실세계 지식과 결합하여 연결되지 않은 것처럼 보이는 속성을 통해 발생 가능성을 설정함으로써 확률 모델을 작성할 수 있습니다. 이 노드는 주로 분류에 사용하는 TAN(Tree Augmented Naïve Bayes) 및 Markov Blanket 네트워크에 초점을 맞춥니다.
베이지안 네트워크는 여러 다양한 상황에서 예측을 수행하는 데 사용됩니다. 다음은 몇 가지 예입니다.
- 채무 불이행 위험이 낮은 대출 기회 선택.
- 센서 입력 및 기존 레코드를 기준으로 하여 설비의 서비스, 부품 또는 교체가 필요한 시기 추정.
- 온라인 문제점 해결 도구를 통한 고객 문제점 해결.
- 실시간으로 휴대 전화 네트워크 문제점 진단 및 해결.
- 최상의 기회에 자원을 집중시키기 위한 연구 개발 프로젝트의 잠재적 위험 및 보상 평가.
베이지안 네트워크는 데이터 세트의 변수(종종 노드라 부름)와 이 변수 사이의 확률적 또는 조건부 독립성을 표시하는 그래픽 모델입니다. 노드 간의 인과 관계를 베이지안 네트워크를 통해 표시할 수 있지만 네트워크의 링크(아크로도 알려짐)가 반드시 직접적인 원인과 결과를 표시하지는 않습니다. 예를 들어, 그래프에 표시된 증상과 질병 간의 확률적 독립성이 참인 경우 특정 증상 및 기타 관련 데이터의 유무가 제공되면 베이지안 네트워크를 사용하여 특정 질병이 있는 환자의 확률을 계산할 수 있습니다. 네트워크는 정보가 누락된 지점에서 매우 강력하며 존재하는 정보를 사용하여 가능한 최상의 예측을 수행합니다.
베이지안 네트워크의 공통 기본 예는 Lauritzen 및 Spiegelhalter에 의해 작성되었습니다(1988). 이 예는 종종 "아시아" 모델이라 불리며 의사의 새 환자를 진단(대략 인과 관계에 해당하는 링크의 방향)하는 데 사용할 수 있는 네트워크의 단순화된 버전입니다. 각 노드는 환자의 조건에 관련시킬 수 있는 패싯을 나타냅니다. 예를 들어, "Smoking"은 환자가 확실한 흡연자임을 나타내고 "VisitAsia"는 환자가 최근에 아시아를 방문했음을 표시합니다. 확률 관계는 노드 간의 링크로 표시됩니다. 예를 들어, 흡연은 기관지염과 폐암이 모두 진행 중인 환자의 발생을 늘리는 반면 나이는 폐암 발생 가능성에만 연관된 것처럼 보입니다. 이와 마찬가지로, 폐 x-레이 상의 이상은 결핵 또는 폐암으로 인한 것이 수 있는 반면에 환자가 기관지염이나 폐암도 앓는 경우에는 숨가쁨(호흡 곤란)으로 고통받는 환자의 발생이 증가합니다.
베이지안 네트워크의 사용을 결심할 수 있는 여러 원인이 있습니다.
- 인과 관계에 대해 훈련하도록 돕습니다. 이를 통해 문제 영역을 이해하고 개입 결과를 예측할 수 있습니다.
- 네트워크는 데이터 과적합을 피할 수 있는 효과적인 접근법을 제공합니다.
- 관련된 관계의 명확한 시각화를 쉽게 관측할 수 있습니다.
요구사항. 대상 필드는 범주형이어야 하며 측정 수준은 명목, 순서 또는 플래그가 가능합니다. 입력은 임의의 유형의 필드일 수 있습니다. 연속(수치 범위) 입력 필드는 자동으로 구간화되지만 분포가 왜곡될 경우 베이지안 네트워크 노드 이전에 구간화 노드를 사용하여 수동으로 필드를 구간화해서 더 나은 결과를 얻을 수 있습니다. 예를 들어, 수퍼바이저 필드가 베이지안 네트워크 노드 목표 필드와 동일한 최적 구간화를 사용하십시오.
예. 한 은행의 분석가는 대출 상환을 불이행할 것 같은 잠재적 고객 또는 고객을 예측할 수 있기를 원합니다. 베이지안 네트워크 모델을 사용하여 채무 불이행 가능성이 높은 고객의 특성을 식별하고 잠재적인 채무 불이행자를 예측하는 데 가장 적합한 모델을 설정하기 위해 여러 다른 유형의 모델을 작성할 수 있습니다.
예. 한 통신 사업자는 사업을 그만두려는("이탈"이라 함) 고객 수를 줄이고 전월의 각 데이터를 사용하여 매월 모델을 업데이트하려 합니다. 베이지안 네트워크 모델을 사용하여 이탈할 것 같은 고객의 특성을 식별하고 매월 새 데이터로 모델 훈련을 계속할 수 있습니다.