El análisis discriminante genera un modelo predictivo para la pertenencia a un grupo. El modelo está formado por una función discriminante (o, para más de dos grupos, un conjunto de funciones discriminantes) basándose en combinaciones lineales de las variables de predictor que proporcionan la mejor discriminación entre los grupos. Las funciones se generan a partir de una muestra de casos cuya pertenencia al grupo se conoce; las funciones se pueden aplicar entonces a nuevos casos con mediciones para las variables de predictor pero con una pertenencia a grupo desconocida.
Ejemplo. Una empresa de telecomunicaciones puede usar el análisis discriminante para clasificar a los clientes en grupos basados en datos de uso. Esto les permite puntuar clientes potenciales y apuntar a aquellos que son más propensos a estar en los grupos más valiosos.
Requisitos. Son necesarios uno o más campos de entrada y exactamente un campo de objetivo. El objetivo debe ser un campo categórico (con un nivel de medición de Flag
o Nominal
) con almacenamiento de serie o entero. (El almacenamiento se puede convertir utilizando un nodo Rellenar o Derivar si es necesario.) Los campos establecidos en Both
o None
se ignoran. Los tipos de los campos utilizados en el modelo deben estar completamente instanciados.
Puntos fuertes. Análisis discriminante y Regresión logística son modelos de clasificación adecuados. Sin embargo, el análisis discriminante realiza más supuestos sobre los campos de entrada, por ejemplo que suelen distribuirse y deben ser continuos, y ofrecen mejores resultados si se cumplen esos requisitos, especialmente si el tamaño de muestra es pequeño.