El nodo Red bayesiana le permite crear un modelo de probabilidad combinando pruebas observadas y registradas con conocimiento del mundo real de "sentido común" para establecer la probabilidad de instancias utilizando atributos aparentemente no vinculados. El nodo se centra en las redes Naïve Bayes aumentado a árbol (TAN) y de manto de Markov que se utilizan principalmente para la clasificación.
Las redes bayesianas se utilizan para realizar predicciones en diferentes situaciones; algunos ejemplos son los siguientes:
- Selección de oportunidades de crédito con poco riesgo de fracaso.
- Estimación cuando se necesite reparar el equipo o piezas de recambio, en función de los datos de los sensores y los registros existentes.
- Solución de problemas de los clientes mediante herramientas de solución de problemas en línea.
- Diagnóstico y solución de problemas de redes de telefonía móvil en tiempo real.
- Evaluación de los riesgos potenciales y recompensas de proyectos de investigación y desarrollo para centrar los recursos en las mejores oportunidades.
Una red bayesiana es un modelo gráfico que muestra variables (que se suelen denominar nodos) en un conjunto de datos y las independencias probabilísticas o condicionales entre ellas. Las relaciones causales entre los nodos se pueden representar por una red bayesiana; sin embargo, los enlaces en la red (también denominados arcos) no representan necesariamente una relación directa de causa y efecto. Por ejemplo, una red bayesiana se puede utilizar para calcular la probabilidad de un paciente con una enfermedad concreta, con la presencia o no de algunos síntomas y otros datos relevantes, si las independencias probabilísticas entre síntomas y enfermedad son verdaderas, tal y como se muestra en el gráfico. Las redes son muy robustas en los puntos en los que falta información y realizan las mejores predicciones posibles utilizando la información disponible.
Lauritzen y Spiegelhalter crearon un ejemplo común y básico de una red bayesiana en 1988. También se conoce como modelo "Asia" y es una versión simplificada de una red que se puede utilizar para diagnosticar a los nuevos pacientes de un médico; la dirección de los enlaces corresponde por lo general a la causalidad. Cada nodo representa una faceta que se puede relacionar con el estado de un paciente; por ejemplo, "fumador" indica que se trata de un fumador habitual y "VisitaAsia" muestra que recientemente ha viajado a Asia. Los enlaces entre los nodos muestran las relaciones probabilísticas; por ejemplo, fumar aumenta las posibilidades de que el paciente padezca bronquitis y cáncer de pulmón, mientras que la edad parece estar relacionada únicamente con la posibilidad de desarrollar cáncer de pulmón. De la misma forma, las anomalías detectadas en una radiografía de los pulmones pueden estar causadas por tuberculosis o cáncer de pulmón, mientras que las posibilidades de que un paciente tenga dificultades respiratorias (disnea) aumentan si también padece bronquitis o cáncer de pulmón.
Existen diferentes razones para elegir utilizar una red bayesiana:
- Es de gran ayuda para obtener información acerca de las relaciones causales. Permite conocer un área problemática y predecir las consecuencias de cualquier intervención.
- La red proporciona un método eficaz sin ajustar los datos en exceso.
- Puede obtener una vista clara de las relaciones que intervienen.
Requisitos. Los campos objetivo deben ser categóricos y pueden tener un nivel de medición Nominal, Ordinal o Marca. Las entradas pueden ser campos de cualquier tipo. Los campos de entrada continuos (rangos numéricos) se clasifican en intervalos de forma automática; sin embargo, si la distribución es asimétrica, puede obtener mejores resultados clasificando los campos en intervalos de forma manual, utilizando un nodo Intervalos antes del nodo Red bayesiana. Por ejemplo, utilice Intervalos óptimos si Campo Supervisor es el mismo que el campo Objetivo del nodo Red bayesiana.
Ejemplo. Un analista de un banco quiere poder predecir clientes o clientes potenciales, con posibilidades de impago de sus créditos. Puede utilizar un modelo de red bayesiana para identificar las características de los clientes con más posibilidades de impago y generar varios tipos diferentes de modelo para establecer el mejor método para predecir los clientes con más posibilidades de impago.
Ejemplo. Un operador de telecomunicaciones quiere reducir el número de clientes que dejan el negocio (denominado "abandono") y actualizar el modelo mensualmente utilizando los datos del mes anterior. Puede utilizar un modelo de red bayesiana para identificar las características de los clientes con más posibilidades de abandono y continuar formando el modelo cada mes con nuevos datos.